かずきち。の日記

サーバサイドエンジニアのつぶやき

ベクトル空間モデル

人×単語で協調フィルタリングをかけて…

その行列の成分を一つずつ抽出して、内積取って距離を計算。

そうすれば、座標平面上に乗るんじゃないか。

tf-idfで文書中の出現回数を計算しておこう。

参考までに

ベクトル空間モデルによる検索は高次元のベクトル空間上に配置した検索対象のベクトル表現と検索語のベクトル表現の相関量をコサイン、内積、距離等によって計算して関連度を求める。