Python用Webスクレイピングモジュール「beautifulsoup4」でCSSセレクタで指定したデータを取得する方法についてソースコード付きでまとめました。
CSSセレクタで指定したデータを取得
PythonのWebスクレイピングモジュール「beautifulsoup4」を用いて、CSSセレクタで指定したデータを取得してみます。
サンプルコード(Python3)
サンプルプログラムのソースコードです。
# -*- coding: utf-8 -*-
import urllib.request
from bs4 import BeautifulSoup
# urlのHTMLを取得
url = 'https://python.joho.info/'
html = urllib.request.urlopen(url)
# htmlをBeautifulSoupでパース
soup = BeautifulSoup(html, "html.parser")
# CSSセレクタで指定したタグ内のコンテンツを表示
print(soup.select_one(".entry-snippet").text)
| – | 関連記事 |
|---|---|
| 1 | ■【Python/BeautifulSoup4】Webスクレイピング入門 ■【Python】Webスクレイピング入門 ■Python入門 基本文法 ■【Python】ネットワークプログラミング入門 |

コメント