かずきち。の日記

Pythonエンジニア&元東大生のつぶやき

インデックスの魔術

MySQLでレコード数1000以下の場合シーケンシャルで検索した方が早いけれど…
それ以上の場合はインデックスを付与した方がいいみたいだ。
検索時間が0.01秒と0.80秒で80倍の差が出るのはかなり大きい。
10万のレコードを扱うと3600時間の検索時間が45時間に圧縮されるという奇跡。
うれしくて涙が出そう。

explain クエリ

create index インデックス名 on テーブル(フィールド名)


MYDがデータ、MYIがインデックス、FRMがスキーマっと…


もうちょっと計算を早くしたいので、HADDOPかMySQLクラスタを使って分散処理でもさせてみよう♪
あとベイズ推定を行って、ある確率以上になったときに演算処理するのも考える。

広告を非表示にする