Python用Webスクレイピングモジュール「feedparser」でRSSの情報を取得する方法についてソースコード付きでまとめました。
RSSの取得(記事タイトルとURL)
PythonのWebスクレイピングモジュール「feedparser」を用いて、RSSの情報を取得します。
そして、RSSに記載されている記事タイトルとURLを表示してみます。
※「feedparser」は外部モジュールなので下記のコマンド等でインストールする必要があります。
pip install feedparser
サンプルコード(Python3)
サンプルプログラムのソースコードです。
# -*- coding: utf-8 -*- import feedparser rss_url = "https://headlines.yahoo.co.jp/rss/trendy-all.xml" # urlからRSSを取得 feed = feedparser.parse(rss_url) # 記事の情報を表示 for entry in feed.entries: # 記事のタイトルとリンクを表示 print(entry.title) print(entry.link)
関連記事
【Python】Webスクレイピング入門(BeautifulSoup4編)
Pythonモジュール「BeautifulSoup4」を用いたWebスクレイピングについて入門者向けにまとめました。
【Python】Webスクレイピング入門・ライブラリ比較
Pythonを用いたWebスクレイピングと便利なライブラリの比較について入門者向けにまとめました。
【Python超入門】使い方とサンプル集
Pythonとは、統計処理や機械学習、ディープラーニングといった数値計算分野を中心に幅広い用途で利用されている人気なプログラミング言語です。 主な特徴として「効率のよい、短くて読みやすいコードを書きやすい」、「ライブラリが豊富なのでサクッと...
【Python】ネットワークプログラミング入門
Pythonを用いたネットワークプログラミングについて、ソースコード付きで入門者向けにまとめました。
コメント