【Scikit-learn】インストールする方法(pip)

Pythonライブラリ「Scikit-learn」をパッケージ管理ツール「pip」でインストールする方法について解説します。

Scikit-learnとは

Scikit-learn(読み:サイキットラーン)は、Pythonで機械学習を行うための代表的なライブラリです。シンプルかつ一貫性のあるAPIで使いやすく、学習から実務まで幅広く活用されています。主な特徴は以下のとおり。

  • 幅広いアルゴリズムに対応
    • 線形回帰、SVM、ランダムフォレスト、k-NN、クラスタリング(k-meansなど)といった様々なアルゴリズムを扱っています。
  • データ構造が扱いやすい
    • NumPy配列やPandasデータフレームに対応しているため、他のライブラリとデータの受け渡しがしやすい
  • 学習コストが低い
    • シンプルかつ一貫性がある(「学習→予測→評価」の流れでAPIを呼び出して使用する)ため、直感的で使いやすいです。
    • 日本語の情報量も多く、公式ドキュメントや解説書なども充実しています。
  • 商用利用可能
    • BSDライセンスなので、条件を満たせば商用利用可能

今回は、Scikit-learnのインストール方法を解説します。

Scikit-learnのインストール手順(pip利用)

pipを使ったScikit-learnのインストール手順を解説します。pipの使い方がよくわからない方は、以下ページをご確認ください。

【pipとは】使い方から応用例まで入門者向けに徹底解説
pipとは?使い方から様々なオプションを活用した応用例までについて詳しく解説します。

① コマンドプロンプトを起動します。

② 以下のコマンドを入力して実行すると、「scikit-learn」と依存ライブラリ(numpy、scipy、joblib、threadpoolctl)のインストールが開始されるのでしばらく待ちます。

pip install scikit-learn
■実行例
PS C:\Users\XXX> pip install scikit-learn
Collecting scikit-learn
  Using cached scikit_learn-1.7.1-cp313-cp313-win_amd64.whl.metadata (11 kB)
Collecting numpy>=1.22.0 (from scikit-learn)
  Using cached numpy-2.3.2-cp313-cp313-win_amd64.whl.metadata (60 kB)
Collecting scipy>=1.8.0 (from scikit-learn)
  Using cached scipy-1.16.1-cp313-cp313-win_amd64.whl.metadata (60 kB)
Requirement already satisfied: joblib>=1.2.0 in c:\users\XXX\appdata\local\programs\python\python313\lib\site-packages (from scikit-learn) (1.5.1)
Requirement already satisfied: threadpoolctl>=3.1.0 in c:\XXX\yuich\appdata\local\programs\python\python313\lib\site-packages (from scikit-learn) (3.6.0)
Using cached scikit_learn-1.7.1-cp313-cp313-win_amd64.whl (8.7 MB)
Using cached numpy-2.3.2-cp313-cp313-win_amd64.whl (12.8 MB)
Using cached scipy-1.16.1-cp313-cp313-win_amd64.whl (38.5 MB)
Installing collected packages: numpy, scipy, scikit-learn
Successfully installed numpy-2.3.2 scikit-learn-1.7.1 scipy-1.16.1

上記のように、「Successfully installed numpy-2.3.2 scikit-learn-1.7.1 scipy-1.16.1」などと表示されたらインストール成功です。

③ 「scikit-learn」と併せて使うことの多い「pandas」「matplotlib」 は一緒にインストールされませんので、個別にpipでインストールする必要があります。以下のコマンドを入力して実行すると、「pandas」「matplotlib」をインストールできます。

pip install pandas matplotlib
ライブラリ 役割
numpy 配列・数値演算の基盤。scikit-learnのほぼすべての処理で使われます。
scipy 線形代数や統計処理などの高度な数値計算に使用。
joblib モデルの保存・読み込みや並列処理に使われます。
threadpoolctl 並列処理の制御に使われます。
pandas scikit-learnのコア機能には不要。データ前処理や読み込みに便利ですが、scikit-learn自体は依存していません。
matplotlib / seaborn 可視化ライブラリ。scikit-learnの中では使われていません。

関連ページ

Scikit-learnの使い方については、以下の記事で解説しています。

【Scikit-learn超入門】使い方をサンプルコード付きで解説
Pythonライブラリ「Scikit-learn」で機械学習を行う方法を入門者向けに解説します。
この記事を書いた人
西住技研

プログラミング言語「Python」を研究、仕事、趣味でデータ分析や作業自動化などに活用してきたノウハウを情報発信しています。
筆者の詳しいプロフィールやお問合せはこちらのページまで。
YoutubeX(旧Twitter)でも情報発信中です!

西住技研をフォローする
Scikit-learn

コメント