Python用Webスクレイピングモジュール「feedparser」でRSSの情報を取得する方法についてソースコード付きでまとめました。
RSSの取得(記事タイトルとURL)
PythonのWebスクレイピングモジュール「feedparser」を用いて、RSSの情報を取得します。
そして、RSSに記載されている記事タイトルとURLを表示してみます。
※「feedparser」は外部モジュールなので下記のコマンド等でインストールする必要があります。
pip install feedparser
サンプルコード(Python3)
サンプルプログラムのソースコードです。
# -*- coding: utf-8 -*- import feedparser rss_url = "https://headlines.yahoo.co.jp/rss/trendy-all.xml" # urlからRSSを取得 feed = feedparser.parse(rss_url) # 記事の情報を表示 for entry in feed.entries: # 記事のタイトルとリンクを表示 print(entry.title) print(entry.link)
関連記事
【Python】Webスクレイピング入門(BeautifulSoup4編)
Pythonモジュール「BeautifulSoup4」を用いたWebスクレイピングについて入門者向けにまとめました。
【Python】Webスクレイピング入門・ライブラリ比較
Pythonを用いたWebスクレイピングと便利なライブラリの比較について入門者向けにまとめました。
【Python超入門】使い方とサンプル集
Pythonの使い方について、基礎文法から応用例まで入門者向けに解説します。
【Python】ネットワークプログラミング入門
Pythonを用いたネットワークプログラミングについて、ソースコード付きで入門者向けにまとめました。
コメント