インターネット上のオリンピックの関心を時系列にまとめてみた
今回は2004年から日本でオリンピックがどのような関心だったのか、検索エンジンの検索ボリュームで見ていきます。
データセットはウェブ全体の検索クエリを使用していますが、このデータを見る前に
まず各言語を使用する人たちの「人数」について言及しておきます。
検索エンジンの検索ボリュームには「言語」の差があるということを留意したい
英語を話す人は 17.5億人
日本語を母国語にする人は1.2億人います。
なので英語と日本語を比較することはそもそもおかしいですが、
今回は言語間の差は無視します。
そうすると2004年から遡って世界のオリンピック関心度を見てみます。
オリンピックは4年に一回なので各オリンピック開催時に検索ボリュームが伸びていることがわかります。
まだ閉会式を終えていないのでデータセットは閉会式後に更新しますが…
東京五輪はやはりもろにコロナの影響を受けた形になりました。
オリンピック開催の7月にはオリンピックトレンドがコロナトレンドに勝てるかな?
検索エンジンでは検索ボックスにどんな単語をどんな言語でどんな年齢の人が入力したかの統計を取っている。
マーケティングデータにも使えます。
人々の興味関心がわかりますからね。
コロナ:41
オリンピック:20
なので、ダブルスコアでコロナでした。
開会式で負けてしまっているので、やはりコロナはすごいですね。
日本人はオリンピックとどんな言葉を一緒に検索してきたか?
こんな言葉で一緒に検索されてきました。
「チケット販売情報」とかのが注目されています。
オリンピックと一緒に検索されているワードネットを可視化してみました
検索エンジンに入力される単語はもろに人々の関心を表しています。
専門用語で検索エンジンに入力される言葉と一緒に使われる言葉を「共起語」といいます。
それらを用いてクラスタリング(clustering)ができます。
「クラスター」聞き覚えがある言葉ですね?
コロナで何度もクラスターが発生しているという報道は聞いてきたかと思います。
でもみなさんクラスターの本来の意味はご存知ですか?
別にコロナ専門用語ではないです。
クラスターとはブドウなどの果実や花の房のことで、ブドウの粒のような個が連携した集合体の呼称。化学におけるクラスターは、原子や分子が数個から数千個程度集まったものを指す。金属結合や共有結合などの強い化学結合で形成された安定なクラスターは、ナノテクノロジーの構成材料として注目されている。例えば炭素を放電などで蒸発させて再凝集させると、炭素原子60個で構成されたクラスターが特異的に多数生成する。これは炭素原子が五角形と六角形に結合して約1nm(n〈ナノ〉は10億分の1)の安定な球状になったもので、バックミンスター・フラーレンと呼ばれる。管状構造のカーボンナノチューブなど様々なナノサイズの炭素素材が研究されている。一方、ファンデルワールス力や水素結合といった弱い結合で構成されたクラスターは、溶液の局所構造やDNA対などのモデルとして重要。
(市村禎二郎 東京工業大学教授 / 2007年)
ぶどうの房を表しています。
よく「病院でクラスターが発生」などの報道を耳にしますが、そこを中心にした感染発生源が発生しているということです。
学級の「3-A」みたいなクラスではないので気をつけてくださいね。
クラスターです。
人々が検索ボックスに入力する言葉は収集されている
検索エンジンは人間が何の単語でどこで検索しているか。
何の単語でページに流入しているかカウントしているので、非常にマッチした広告が出る。
検索エンジンの収益源は広告
ただで検索させてあげてる慈善事業ではないです。
あなたが「ダイエット」という言葉で検索したら、
「痩せるサプリ」「家の近くのジム」の広告が表示されます。
あなたがこっそり検索してる言葉も検索エンジンには丸見えですし、どのページを見て、何分間滞在して、どこのページでユーザが離脱したかカウントしています。
オリンピック・パラリンピックは7/23から立て続けに行われます
せっかく高いお金を誘致したので、見ないと損な大会になりますね!