Инструменты пользователя

Инструменты сайта


python:parsers:ua-footbal

Это старая версия документа!


ua-football.com

# https://pypi.org/project/beautifulsoup4/ - установить сторонний пакет с помощью пакетного менеджера pip
 
# pip freeze - список установленных пакетов
# pip install beautifulsoup4  установить пакет
 
from bs4 import BeautifulSoup
import urllib.request
 
# Создаем запрос к сайту
req = urllib.request.urlopen('https://www.ua-football.com/sport')
# Читаем ответ
html = req.read()
 
# Парсим страницу, features='html.parser' - модификатор (что парсим)
soup = BeautifulSoup(html, features='html.parser')
# Ищем новости
news = soup.find_all('li', class_='liga-news-item')
results = []
 
for item in news:
    # find - выбрать эдемент, getText - получить содержимое тега(strip=True - убрать пробелы)
    title = item.find('span', class_='d-block').getText(strip=True)
    desc =  item.find('span', class_='name-dop').getText(strip=True)
    link = item.a.get('href')
    results.append({
        'title': title,
        'desc': desc,
        'link': link
        }
    )
f = open('news.txt', 'w', encoding='utf-8')
i=1
for item in results:
    # Запись в файл
    f.write(f'Новость №: {i}\n\n Название: {item["title"]} \n Описание: {item["desc"]}\n Ссылка: {item["link"]}\n\n*********\n\n')
    i += 1
python/parsers/ua-footbal.1580074322.txt.gz · Последние изменения: 2023/01/12 12:16 (внешнее изменение)