Pythonモジュール「NumPy」でコサイン類似度を計算する方法についてまとめました。
【NumPy】コサイン類似度の計算①
コサイン類似度とは、ベクトル同士の角度の近さが表現したもので、以下の式で計算されます。
(1) ![]()
1に近いほどベクトル同士の類似度が高く、0に近ければ類似度が低いことになります。
Pythonモジュール「NumPy」では、以下のスクリプトで簡単に計算できます。
import numpy as np
def cos_similarity(v1, v2):
return np.dot(v1, v2) / (np.linalg.norm(v1) * np.linalg.norm(v2))
x = np.array([1, 1])
y = np.array([0.9, 0.9])
z = np.array([0.5, 0.5])
print(cos_similarity(x, y))
| – | 関連記事 |
|---|---|
| 1 | ■Python入門 サンプル集 |
| 2 | ■NumPy入門 サンプル集 |

コメント