かずきち。の日記

Pythonエンジニア&元東大生のつぶやき

読まないと損するウェブ学会シンポジウム

昨日は第1回ウェブ学会シンポジウム@東京大学安田講堂に行ってきました。
準備委員会の6人中4人は面識ある人で、これは行くしかないなーと思って行きました。
13時から結局7時間ぶっ続けで、懇親会の最後までいました。
すごく刺激的な環境にいると思うし、日本で最先端な人たちと触れ合えていると思います。
いつの間にかウェブ系の学会で有名どころの先生や企業の人はだいぶ押さえてきた気がします。
自分の参加するモチベはいかにビジネスにつなげられるかってことで参加してて、あんまり学術的モチベがあまりないかもしれません。
だって就職してどんなに残業しててもコンピュータは1人で何かをしてくれるでしょ。
そんなことを学生中に作れたら楽しいなーって思ってます。
自分がウェブ系の研究にしたのも、他の機械とかの研究だと何か素晴らしいものを開発しても生産ラインとか必要になるけど…
ウェブならいらないっていうのが、楽したい自分にあってるなって思います。
だから他の工学系分野に比べて、資本もいらないし、人的リソースもあまりいらないしね。
CEO兼CIOもいけるかもしれませんw


最近はウェブ×金融って熱いんじゃないかって思います。
金融機関にある入出金のトランザクションデータとか、借金の返済状況のデータの解析って統計的に行われてないんですね。
それら過去30年なりのデータを解析すれば、絶対面白い特徴量出てくるだろうし、新しい金融商品やサービスが作れると思います。
うーんと、なんだろう、住宅ローンにおける固定金利と変動金利の切り替えのオプションなどを計算して売っても面白いんじゃないかなって思います。


Twitter、ust、RSS、はてぶと…
毎日自分に入ってくる情報は半端ないです。
だから毎日が楽しくして仕方ないです。
なんかこの魅力というか面白さをもっと伝えたいというか話したいですw


ではでは、情報爆発っぷりがやばかったので、面白いと思ったことを書いときます。
もう超適当に書きます。


screenshot

  • ウェブ×長尾館長

Wikimediaカンファレンスでも同じことをおっしゃっていましたが…
Googleページランクアルゴリズムがいかに優秀でも、そのランキングが正しいという保証はもはやないんですね。
これからはいかに信頼性という要素をデータに付与できるか。
そんなことが課題なんですね。
そういった意味で図書館は信頼性を担保する機関であるべきだって言ってました。

  • ウェブ×政治

近い未来、ネット投票になるよね。みたいな。
ネット献金オバマでは何百億と集まってるよーって。
日本では36件くらいしかまだないみたい。


新しい投票形式として1票を分配して投票するデモ。
自民党もいいけど、社民党もいいな…
って思ったら0.6票を自民党、0.4票を社民党って分けるんです。
そういった思考に陥ることはよくあるはずだしね。


また自分の1票を他人に委任するというシステム。
政治って俺、よくわからないな。だからこの人なら任せてもいいや。
そんな人に自分の1票を任せて投票してもらうんです。
それがループし、いつかどこかに終着して政治を決めようみたいな感じです。


初音ミクが政治に参加する??
人々が仮想的に作り上げた初音ミクが政治家に。
決められたマインドに従って、政治を着々とこなすよみたいな。
アイディアだけは面白い。


民主党政権に移り、今まで東大法学部が牛耳っていた政治が再び民に戻ろうとする。
そんな歴史的一幕を今、迎えている。
裁判員制度事業仕訳けなどありますね。
そして今はmixiアプリが出てきています。
ということは、mixi事業仕訳けアプリが登場してくるんですねー
有識者だけだはなく、一般人が行うとどうなるのか見ものだし、絶対面白いです。
一般意思2.0っていう言葉も生まれてきます。

  • ウェブ×GoogleIME

GoogleIME開発者が来ました。超タイムリーです。
もともとMecabの開発に携わっていたみたいです。形態素解析エンジンです。
圧縮技術であったり、シンプルなアルゴリズムを使っている、そんな技術的な話をしていただきました。
ものすごく網羅的にアルゴリズムを理解していて、Googleのエンジニアになれる気がなくなりました。
普段の生活は9時-20時で健康そうで良かったです。

なぜTwiterが流行ったのか。
140字がタイムラインで流れる仕組み、どんなことを書いても流されてつっこまれない。
もはや何かを書こうとすると、調べないといけないし迂闊に発言できない。
そんな心配をTwitterは解消しました。


Twittermixiボイスの比較。
Twitterはルソー的、mixiはロック的。
そう哲学的に解釈もできます。

はてなブックマークのリコメンドの逸話。
ネットワーク化してみたり、いろいろやったけど…
時間軸というパラメータを入れたら面白いものになりましたと。
個人的にははてなキーワード正規表現をいかにして作っているか、そんなことを聞きたかったです。

世界カメラはもうタグがつけられていて面白くないよね。
だって遊びに行ったら、もう書かれている。
だから時間軸っていうのはキーかもしれない。

  • ウェブ×140億の日本語ページ

数年間かけて、ローカルに蓄積した140億のウェブページ。
それをクラスタリングしたら、スパムページはすぐに分かる。
幾何学的な図形から、すーっと出てくるあのクラスタはなんとも芸術的。
Google八分も一瞬で見分けられますw
インチキなSEOもびっくりです。

広告を非表示にする