PythonモジュールScrapyでWebスクレイピング・クローリングする方法をソースコード付きでまとめました。
【Scrapyとは】概要とインストール方法
「Scrapy」は、Webスクレイピング・クローリングできるPythonモジュールです。
| 用語 | 意味 |
|---|---|
| クローリング | Webページのリンク先へ自動でアクセスし、リンク先のWebページの情報をダウンロードします。クローリングを行うプログラムを巡回クローラーといいます。 |
| スクレイピング | ダウンロードしたWebページの情報(htmlファイルなど)をパース(解析)し、欲しい情報を抽出することです。 |
インストール
以下のpipコマンドでインストールできます。
$ pip install scrapy
| – | 関連記事 |
|---|---|
| 1 | ■【Python】Webスクレイピング入門(BeautifulSoup4編) |
| 2 | ■【Python入門】使い方とサンプル集 |


コメント