これだけ使っていると、スピード指数の良い点、悪い点がはっきりと見えてくる。私だけでなく誰でも、何日、何年とスピード指数を使っていれば、遅かれ早かれ限界は感じるはずだ。そして10数年を経過してようやく、この疑問点を解消しようとする気になった。これから少し数字が多く、難しい話が続くかもしれないが、興味があれば一読して頂きたい。また、その時思いついたことを検証する様なスタイルで書き進めていきたいので、話の流れからすると順序が逆に感じることもあるかもしれないがご容赦頂きたい。
まずは西田式スピード指数のおさらいをしてみる。西田式スピード指数とは、競馬評論家・西田和彦氏が1992年に発表した競走馬の走破タイムを指数化した物である。その基となったのはアンドリュー・ベイヤー氏のベイヤー指数と呼ばれる物だが、それを日本の競馬場に合う様にアレンジしたのが西田式である。今現在、殆どの競馬予想ソフトは西田式スピード指数、或いはその亜流で計算していると思われる。
西田式スピード指数(以下単に西田式)をはじめとするタイム理論の大前提とは、競走馬の強さはタイムに表れるというものである。ただ、競馬新聞などに出ている各馬の過去走タイムを単純に比較するだけでは、競馬場の差、馬場の差、斤量の差などが考慮されていない為、馬の強さの比較にならない。 そこで、「仮想的に全ての馬が同じ条件で走った場合に、その走破タイムがどの位のタイムに相当するかを指数で表すことで、その数値の大小だけで各馬の強さの比較が出来る」というのが西田式を代表とするタイム理論の根本的な原理である。西田式指数の計算方法はこちらに少し詳しい記事があるのでそちらを参照して欲しい。
さて、ここから先は個人的に気付いた西田式の問題点を挙げてみたい。
西田式には、指数を計算する為の基本的なのパラメータがある。各競馬場、距離毎に算出される基準タイム、タイム差を距離に応じて考慮する距離指数、レースの条件を考慮したクラス指数、そして馬場状態を指数化した馬場指数などである。細かな項目はまだ少しあるが、主立ったのはこの4つである。
ここから先は、まずはこの4つのパラメータの検証から始める。どういう結論になるか、どういう方向で話が進んで行くかは、正直今の時点では私にも分からない。大発見があるかもしれないし、何もなく終わるかもしれない。ともかく、興味がある方はこれから先も読み進めて欲しい。
検証するデータは、JRA主催の2004〜2008年の5年分のレースを計算対象とした(ただし、障害レースは除く)。全部で13334レースあった。データはJRA-VANのデータを利用し、コードで示されている内容も実際の内容に変換せずそのまま表示しているので注意して欲しい。例えば、JyoCDで"01"となっているのは"札幌"競馬場のことで、本来なら"札幌"と表示すべきのところを"01"のまま表示している。文章の内容によっては適宜変換してあるが、基本的にはコードそのままを表示していることを念頭に置いて頂きたい。