Python用Webスクレイピングモジュール「beautifulsoup4」でCSSセレクタで指定したデータを取得する方法についてソースコード付きでまとめました。
CSSセレクタで指定したデータを取得
PythonのWebスクレイピングモジュール「beautifulsoup4」を用いて、CSSセレクタで指定したデータを取得してみます。
サンプルコード(Python3)
サンプルプログラムのソースコードです。
# -*- coding: utf-8 -*- import urllib.request from bs4 import BeautifulSoup # urlのHTMLを取得 url = 'https://python.joho.info/' html = urllib.request.urlopen(url) # htmlをBeautifulSoupでパース soup = BeautifulSoup(html, "html.parser") # CSSセレクタで指定したタグ内のコンテンツを表示 print(soup.select_one(".entry-snippet").text)
– | 関連記事 |
---|---|
1 | ■【Python/BeautifulSoup4】Webスクレイピング入門 ■【Python】Webスクレイピング入門 ■Python入門 基本文法 ■【Python】ネットワークプログラミング入門 |
コメント