BeautifulSoup4を使ってPythonでスクレイピングを実施するテンプレートプロジェクトです。 次の処理を試しながらBeautifulSoupの基本を学習できます。
- Webページのタイトルを取得する。
- 要素をひとつ取得する。
- 複数の要素をを取得する。
- 要素の属性を取得する。
- 子要素を取得する。
- 【応用】JavaScriptが処理された後の要素を取得する。
.
├── README.md
├── scraping # projectファイル
│ └── main.py # discordpyスクリプト
├── html # スクレイピング対象のサンプルHTMLファイル一式
├── .devcontainer # Docker Remote Container用ファイル一式
├── docker-compose # Docker Compose用ファイル
├── poetry.lock # poetry依存関係
└── pyproject.toml # pythonプロジェクトにおける開発設定ファイル
- python
- beautifulsoup4
- selene
- requests
- isort
- black
- flake8
- vscode
- github codespace または remote conteiner(docker)