20090423 - 武田研ミーティング
丹さん
データベースはメモリ上で動かす??
SSDとやらを使うといいらしい
データベースの容量は36GBくらいあるようだ
浜崎さん
暗黙知の共有をしよう
それが以外と大事である
気づいた瞬間、気づいたものをどう落とし込むか
インタビュー、センサーなどいろいろ試してどんな時に気づくかやってみる
福原さん
ジャンル付の自動化を考えている
手作業でジャンル付をする方法→95%くらいで精度がいい
出演者と番組内容で変えてみる
mecabで形態素分析
地上波で流れている情報を使ってジャンル分け方法→30%などで精度が悪い
地上波とケーブルで出演者のジャンルが違う
さんま=ドラマ
さんま=バラエティ
共演者ネットワークを使えば精度が高くなるのでは??
平面からの距離、サポート度
渋滞の定義は交通工学でも異なる
信号で止まったら渋滞、前の車が見えたら渋滞
信号があるなしでも異なる
テレビ
世帯の構成人数はわかっている
実際のデータをもらって分析して、いろいろなランキングを作ってみよう
価値関数を定義してみよう
推薦の限界
クエリ
どんなクエリがあったかを探してきて、逆引
グループによるワードの推薦ができるのでは??
研究室の内部ではコンピュータ系のワードを持っているはず
役に立ったか、おもしろかったか
良い推薦とは何か??
7月下旬に発表会
まとめ買いシステム
履修登録を取り込めば
授業リストの部分にAmazon、Ciniiのリンクを張ってみよう
論文には複数の著者が乗っているのでそれから関連授業を出したら?
popがあったら、pushがある