【Scikit-learn】インストールする方法(pip)

Pythonライブラリ「Scikit-learn」をパッケージ管理ツール「pip」でインストールする方法について解説します。

Scikit-learnとは

Scikit-learn(読み:サイキットラーン)は、Pythonで機械学習を行うための代表的なライブラリです。シンプルかつ一貫性のあるAPIで使いやすく、学習から実務まで幅広く活用されています。主な特徴は以下のとおり。

  • 幅広いアルゴリズムに対応
    • 線形回帰、SVM、ランダムフォレスト、k-NN、クラスタリング(k-meansなど)といった様々なアルゴリズムを扱っています。
  • データ構造が扱いやすい
    • NumPy配列やPandasデータフレームに対応しているため、他のライブラリとデータの受け渡しがしやすい
  • 学習コストが低い
    • シンプルかつ一貫性がある(「学習→予測→評価」の流れでAPIを呼び出して使用する)ため、直感的で使いやすいです。
    • 日本語の情報量も多く、公式ドキュメントや解説書なども充実しています。
  • 商用利用可能
    • BSDライセンスなので、条件を満たせば商用利用可能

今回は、パッケージ管理ツール「pip」を用いたScikit-learnのインストール方法を解説します。
pipの使い方がよくわからない方は、以下ページをご確認ください。

【pipとは】使い方から応用例まで入門者向けに徹底解説
pipとは?使い方から様々なオプションを活用した応用例までについて詳しく解説します。

動画で見る

Scikit-learnの導入手順

パッケージ管理ツール「pip」を用いた導入手順は以下のとおりです。

① コマンドプロンプトを起動します。

② 以下のコマンドを入力して実行すると、「scikit-learn」と依存ライブラリ(numpy、scipy、joblib、threadpoolctl)のインストールが開始されるのでしばらく待ちます。

pip install scikit-learn

■実行例

 pip install scikit-learn
Collecting scikit-learn
  Using cached scikit_learn-1.7.1-cp313-cp313-win_amd64.whl.metadata (11 kB)
Collecting numpy>=1.22.0 (from scikit-learn)
  Using cached numpy-2.3.2-cp313-cp313-win_amd64.whl.metadata (60 kB)
Collecting scipy>=1.8.0 (from scikit-learn)
  Using cached scipy-1.16.1-cp313-cp313-win_amd64.whl.metadata (60 kB)
Requirement already satisfied: joblib>=1.2.0 in c:\users\XXX\appdata\local\programs\python\python313\lib\site-packages (from scikit-learn) (1.5.1)
Requirement already satisfied: threadpoolctl>=3.1.0 in c:\XXX\yuich\appdata\local\programs\python\python313\lib\site-packages (from scikit-learn) (3.6.0)
Using cached scikit_learn-1.7.1-cp313-cp313-win_amd64.whl (8.7 MB)
Using cached numpy-2.3.2-cp313-cp313-win_amd64.whl (12.8 MB)
Using cached scipy-1.16.1-cp313-cp313-win_amd64.whl (38.5 MB)
Installing collected packages: numpy, scipy, scikit-learn
Successfully installed numpy-2.3.2 scikit-learn-1.7.1 scipy-1.16.1

上記のように、「Successfully installed numpy-2.3.2 scikit-learn-1.7.1 scipy-1.16.1」などと表示されたらインストール成功です。
ちなみに、scikit-learnをpipでインストールすると、以下の依存ライブラリも自動的にインストールされます。

ライブラリ名 役割
NumPy 数値計算の基盤。配列操作や線形代数など、scikit-learnの内部処理に使われている
SciPy 高度な数学計算(最適化、統計、信号処理など)をNumPyと連携して行う
joblib 並列処理やモデルの保存・読み込みに使用。
threadpoolctl マルチスレッド制御。BLASやOpenMPなどの低レベルライブラリのスレッド数管理。

③ 「scikit-learn」と併せて使うことの多い「pandas」「matplotlib」を、以下のコマンドを実行してインストールします。

pip install pandas matplotlib
ライブラリ名 役割
pandas データ前処理や読み込みに便利。
matplotlib 可視化ライブラリ。データのグラフ化などに用いる。

関連ページ

Scikit-learnの使い方については、以下の記事で解説しています。

【Scikit-learn超入門】使い方をサンプルコード付きで解説
Pythonライブラリ「Scikit-learn」で機械学習を行う方法を入門者向けに解説します。
この記事を書いた人
西住技研

プログラミング言語「Python」を研究、仕事、趣味でデータ分析や作業自動化などに活用してきたノウハウを情報発信しています。
筆者の詳しいプロフィールやお問合せはこちらのページまで。
YoutubeX(旧Twitter)でも情報発信中です!

西住技研をフォローする
Scikit-learn

コメント