かずきち。の日記

サーバサイドエンジニアのつぶやき

2009-05-25から1日間の記事一覧

Pythonで形態素分析

import MeCab m = MeCab.Tagger('-Ochasen') print m.parse ("明日は晴れです。") n = m.parseToNode('明日は晴れです。') n = n.next while n: print n.surface print n.feature n = n.next

転置インデックス

エンジンのアルゴリズムの動作ステップについて考えよう。行列×転置行列で相関性を計算する。まぁ早い話が、1と1の組み合わせを探すようなこと。表現ベクトルで空間的表示にしてみよう。

Ubuntuにmecabをインストールする

MeCab本家 http://mecab.sourceforge.net/ ダウンロード http://sourceforge.net/project/showfiles.php?group_id=177856 からmecab、mecab-ipadic、mecab-pythonをダウンロードする。 mecab-0.97.tar.gzを解凍する。 # tar zxvf mecab-0.97.tar.gz 展開した…