Project stack
- Python 3.10
- BeautifulSoup4
- lxml
- argparse
- logging
- GitHub Actions
Данный код представляет собой парсер документации Python. Он предоставляет возможность получить информацию о новых версиях Python, скачать архив с документацией, получить информацию о PEP (Python Enhancement Proposal) и их статусах.
Клонируйте репозиторий:
git clone [email protected]:ThatCoderMan/bs4_parser_pep.git
Активируйте вертуальное окружение:
- для Linux/MacOS
source venv/bin/activate
- для Windows
venv\Scripts\activate
Установите зависимости, указанные в файле requirements.txt
:
pip install -r requirements.txt
Перейти в папку src
:
cd src
Для запуска парсера необходимо выполнить команду:
python main.py [-h] [-c] [-o {pretty,file}] {whats-new,latest-versions,download,pep}
Позиционный аргумент - один из режимов работы парсера (whats-new
, latest-versions
, download
, pep
)
-
whats-new
Парсинг последних обновлений с сайта
python main.py whats-new <args>
-
latest-versions
Парсинг последних версий документации
python main.py latest_versions <args>
-
download
Загрузка и сохранение архива с документацией
python main.py download <args>
-
pep
Парсинг статусов PEP
python main.py pep <args>
-h
, -help
- вывести информацию о парсере
-c
, --clear-cache
- флаг для очистки кэша запросов
-o
, --output-format
- формат вывода результата (pretty
- в табличном формате в консоли или file
- в CSV файл)
python parser.py whats-new --output-format table
python parser.py latest-versions --output-format pretty
python parser.py download --clear-cache
python parser.py pep