Talkin’ about !!!!!!!!!!!!!

行く先不明の競馬blog

オッズの意味するところ

色々ある。

・強い馬を示す
・人気馬を示す
・確定オッズへ向かうまでの途中経過
・競馬メディアの印を参考に馬券を買うプレイヤーが作る集合知

どうもノイズを取り除くと「強い馬」を単純に示しているように思える。台風が来た日のぐちゃくちゃ馬場のときの「印をつけたいと思った時」の1番人気馬の強さったらなかった。「印をつけたいとき」って「=オッズが収束したとき」なのでこれはレースによる。軸馬決定法は36レース予想するときは一斉に36タスク走ってるのである。コレが人力でやる上でめんどくさいことこの上なく、機械化したい。。。

カノンについて

カノンの概略はいいとして、このモジュール(最初はモジュールではなくてこれ自体が軸馬決定法だった)は今年のはじめくらいから作り始めて、たまたま第二回電脳賞があってそこで松風さんをほんとうに偶然知って、それが参加しているどの人工知能よりも「自分に必要な情報を出力してくれている予測機だ」というのがあって、さらにAlphaimpactさんの予測精度がこの頃から滅茶苦茶安定し始めてて、それで「この2つに追いつくような予測アルゴリズムを作ることができたら」「自分の予測機は自分にとって使える予測機になるなぁ」という「正解」が見えたので、まずAlphaimpactさんをターゲットにそこに向けてひたすら精度を上げていったら、なんでかしらないけどちゃんと精度が上がってしまって、おそらくこれで頭打ちだろう、というか実用上充分なものになったはず、というのが9月に数字として出てきて、育てたら育ったという、なんで育ったのか育てた本人にもよくわからないものだった。

Alphaimpactさんの理論解説ページが本当に役に立った。特に、決定木やランダムフォレストという概念はオッズを見るときに「これはなにを表現している数字なんだろう」という解釈をするときに鬼のように役に立った。また、松風さんの「人気下位でも来る馬は来るしそれはわかるはず」と言う驚異的な穴馬検出力にも励まされた。

オッズを見たときに「誰かが異常投票している」とか「これは単なる人気投票」とかそういう考え方を去年までは持っていたけれども、今はもう全然違った視点でオッズを見ている。それはなにかというのは書いていいのかどうかちょっと迷うところもあって常にぼやかしているのだけど、繰り返し書いていることは「オッズにはノイズが常に乗っていて」「ノイズを取り除くか」「ノイズが乗る前のデータを入手するか」がこの軸馬決定法の「キー」だった。この問題を解決するのに1年近くかかった。完全解決する必要はないので実用上充分なところまで解決できればいいということで9月いっぱいでカノンを育てるのをやめてシランやマリーゴールドの作成(モジュールを作るだけだから開発というのとは少し違う)に取り掛かったけれど、的中精度が日ごと乱高下する実験ユニットに対して、10月以降もカノンの安定度は度を越していた。


一応、開発に成功したんだと思う。万馬券が一日に複数本当たるようになったんだから、成功したんだと思う。万馬券のときだけ変な買い方をしているとかそういうのもなくなった。資金途絶寸前に開発が間に合ったような手応えを感じている。あとはサブモジュール群がいかに設計通りにに働き、いかに安定して動いてくれるかどうかなんだ。



とりあえす、年内はカノンと心中だ。いや、来年もこれで勝負したい。せっかく完成したんだから、長く使わなきゃね!

モジュール別の(簡単に)

軸馬決定法(名前はないから仮にこの軸馬を公開している競馬予想支援サービスの名前を取ってKlanとしよう。読み方は「クラン」である)の下にぶら下がるモジュールについて簡単にメモする。

メインモジュール「Kanone(カノン)」
公開アドレスはhttp://klan.jp/u02/51670

軸馬決定法のメインモジュール。このモジュールが決定した馬が軸馬となる。今年ここまでの1着入線率が30.4%、複勝圏内率が60.7%と、どんな日でもそこそこきちんとした予測を出力してくれる。たまに大負けすることもあるけどあるけど大勝ちすると1着入線率が63%越えてるとか、複勝圏内率が90%越えてるとか気が違ったような働きを見せる。なぜか台風や集中豪雨の日がめちゃめちゃ強いw 前半ダメでも後半必ず息を吹き返すしぶとさが身上。

予測法を簡単に書くと「印をつけたいと思ったとき」にオッズを参照して、その時の1番人気に印をつけてるだけ。確定オッズでそれが2番人気になろうが18番人気になろうがどうなろうがそこは関係ない。そもそも異常オッズ検知用のアルゴリズムが紆余曲折の果てにこんな変なアルゴリズムになったものなので、印を打ったあとどんどん人気が下がってくれることが回収率向上のための前提条件になるという変な仕組みになってる。その他の細かい仕様は書くと長くなるので省略。

サブモジュール「Sirane(シラン)」
公開アドレスはhttp://klan.jp/u02/90590

カノンが安定したので、カノンのパフォーマンスを補おうとして10月から稼働を開始した実験機。実験機なので挙動は不安定。10月は的中率回収率のバランスが良く(月間回収率100%以上)、これが使えるならカノンは止めていいかなと思わせてくれたが、11月に入った瞬間に全く役に立たなくなった。細かい理屈は置いといて、「競馬の着順は排他的論理和」という無茶な前提に立ち、カノンと重ならない買い目を選択する仕組み。細かいことをすっ飛ばすと「印をつけたいと思ったとき」の2番人気に印を打つ。カノンとシランと印をウチたいときが必ずしも重なるとは限らないので、本来は印がかぶることもあるのが正常な挙動。いまは意図的にずらしているのでこれが本機の的中率を大きく落としている原因だと思う。それにしても挙動が安定しないのは面白い。

そもそもは「1番人気はおおまか3割しか的中しないのだからそれ以外を買えば的中率は7割、そこから1割はある大穴を除くと残り6割なら容易に的中することができる」というアルゴリズム(これは5点買う前提)から始まったもの。的中率を落とす代わりに回収率を上げたいという目論見で10月はきちんとその通りになったが、なぜか11月は統計から導かれる的中率と比較して著しく的中しなくなったので、そのうち平均回帰が起こって当たりまくるようになるだろうと思われる。どうかな。だめかな。

シランの役割は「カノンが取りこぼす馬券を取る」ことにあるので、あまりシビアに的中率とか回収率とか言っても仕方ないと思われ。

検証モジュール「Marigold (マリーゴールド)」
公開アドレスはhttp://klan.jp/u02/92415

マリーゴールドの綴り、ずっとMarrygoldと書いてたけど、これ西日本にある結婚式場チェーンの名前じゃんか! 

それはともかく、初代マリーゴールドは異常オッズ検知機として11月第二週だけ稼働してお蔵入りしたブツだったので、今週から稼働しているのは2代目。異常オッズなんて幻想だったので、2代目マリーゴールドは「謎の1頭検出器」として生み出された。

マリーゴールドのルールはカノンやシランとは異なり3頭選んでそれぞれに◎◯▲の印を打つという方式。選び方は◎は3番人気、◯は7番人気、▲は9番人気に自動で印を打つ。もちろん「印をつけたいと思ったとき」に。ここが重要で、ここ間違うとデタラメに印打ってるのと何も変わらないので回収率どころか的中率も限りなく0%に近づいていくので「印をつけても意味が無いなぁ」と思う時間帯に印を打ったらいけない!ここ絶対に守ること!

なんで7番人気と9番人気なのというのは、詳細書くと長くなるから省略。

そもそもは謎の1頭とはなんぞやということを考えたときに、「自分が重要視しているファクターでは順位が低いが、実は強い馬」がそれに該当するのではないかという推論があり、それらの馬は人気では下位だし、1着になることもないが、実力では2番人気や3番人気の馬を凌駕しているため、普通に走るとそれらの馬に先着してしまうためではなないのかという仮定を立てて探しているというのがあった。これはデータ派である自分がタイム理論やら前走上がり重視派やいろんな「別の考え方」に負けるところから「自分に見えていないファクターがかならず何処かにあるはず」と言う考えに至ったところから来ていて、しかし、どうしたら「別の考え方で馬に序列を付けられるのか」が皆目わからなかった。

で、これをこの軸馬決定法に落とし込んだときに、それらの馬は上位人気ではないがどん底の人気でもないだろうというところから、オッズの上から何番目が候補となるのかを探したところそれは、7番人気と9番人気だったという。3番人気を選んでいるのは単純に、1番と2番人気いずれかが飛んでいる時、来ているのは3番人気だろうと言う安易な発想から来ているもので、ここは確定オッズから導いた統計的な事実しか根拠はない。

実際に土日の二日間で謎の1頭をどのくらい検知してくれたかというと、おおまか83%程度の検知率となった。あくまでも3頭のうちの1頭を見つけているにすぎないので見つけたからどうだということはないのだけど、シランとカノンが見つけてくる軸馬と組み合わせると、とりあえず土日で万馬券を4本あててくれる程度には機能してくれた。ビギナーズラックにしてもありがたい。




というわけでひとつの軸馬決定法から3種類の買い目を取り出すことで高回収率を得られるといいなぁというのが目下の課題。とりあえず今月末まで様子を見てもっと改善の余地があれば改善するということで。

マイルチャンピオンシップ(G1 1600m 芝 京都競馬場)

試作品のマリーゴールドがあまりに不出来で驚いたので一週間で夢の島に投棄して、今週から二代目マリーゴールドを回し始めた。二代目マリーゴールドは原則「謎の馬検知器」である。土曜日だけは理由は分からないが単勝を的中し続けてなにが起きたのかと思ったが、日曜日はほとんど単勝複勝も的中せず、淡々と「謎の1頭」を検出し続けてくれた。

代表的な的中例は福島2Rの3連複32,690円、京都10Rの馬単13,180円、マイルチャンピオンシップ3連複9,300円と言ったところをメインである「カノン」サブである「シラン」との組み合わせで的中させることができた。

「謎の1頭」問題はかねてから多くの競馬予想者の頭を悩ませてきた問題だが、マリーゴールドは謎の1頭が「1頭だけ」ならかなりの検出精度を発揮してくれることがわかった。日曜日の福島で9/10(頭/予想レース数)、東京で9/12、京都で12/12と言う結果である。同じレースで2頭見つけることもあるのでそこは注意が必要だが、9番人気くらいまでの謎の1頭を「1頭」だけ見つけることはほとんどのレースでできていた。残念ながら日曜日は謎の馬が「2頭」いるレースが非常に多く、マリーゴールドが検出する馬は同じ傾向の馬を強い順番に頭から3頭だけ拾うことしかできないので、別の傾向を持った「もう1頭」はなにをしても見つからなかった。偶然入っているということさえなかった。途中でバカバカしくなって馬券を買うのをやめてしまうくらい「もう1頭」はわからなかった。わかるように作ってないんだからわかるわけはないんのだけどここまではっきりわからないとむしろ清々しい(意訳:腸が煮えくり返るくらい悔しい)

というわけで2代目マリーゴールドは好調な出足である。だが問題はある。マリーゴールドはカノンやシランとは異なり3頭検出する仕組みになっているのだが、ウチは天然無能による人力予測である。はっきりいってめんどくさい!土曜日とか1R始まってるのにまだ予想が終わらなかった!

そういったわけでマイルチャンピオンシップである。カノンの軸馬はイスラボニータ、シランの軸馬はエアスピネルマリーゴールドの軸馬はレッドファルクスである。マリーゴールドの謎の1頭はマルターズアポジー、グランシルク。アルゴリズムではなくデータ派としてこのレースを検証した結果、軸としてペルシアンナイト、謎の1頭にサングレーザーが浮上した。

そこで馬券作戦は⑦⑪⑫⑱-⑦⑪⑫⑱-④⑧⑬と言うフォーメーションである。今年のG1は軸馬2頭+謎の馬で決まっていることが傾向的に明らかであるので、3着候補に軸馬は不要であるという判断である。ていうか外人外人神福永馬券である。もっとはっきりと言えば「デムーロを買え!」である。

レースはマルターズアポジーが予想通り突っ走り、ペルシアンナイトは押しているのに後方からという嫌な展開。だが直線に入ろうかというところでペルシアンナイトが次元の違う脚色でするすると上がっていき、抜け出すとソラを使うエアスピネルに慣れてないムーアが早く出しすぎたところをめがけてゴール前差し切った。神福永は走る公務員として「ようするに3着までに来ればいいんでしょ」と言う安定の神騎乗。これでめでたく3連複9300円ゲットであった。

てなわけで。やっとG1で予想が噛み合ったー!やったー!これも2Rと言う早い段階で3万馬券が当たっていたから、ケチらずにやりたい作戦を実行できたことが大きい!やっぱり種銭重要!余裕重要!ケチって何度泣いたことか。数百円ケチって何の意味があるのだ!当たれば万馬券!ケチケチすんな!


というわけで、新モジュール「マリーゴールド」が設計通りのパフォーマンスを出してくれたおかげで非常に助かった1日となりました。帰りの野毛で飲んで帰ったよ!来週はジャパンカップ、合言葉は「デムーロを買え!」 またね!

追記

 ペルシアンナイト。。。マイルCSの枠有利は478枠。ペルシアンナイトは8枠で該当。前走有利は富士ステークス。これも該当。脚質は差し有利でこれも該当、人気順では2~5番人気が圧倒的に有利でこれも該当。唯一3歳馬は来ないジンクスがあったが今年の3歳馬の古馬相手の強さは際立っておりここが不利になることは考えられなかった。また鞍上デムーロは今年のG1の鉄板だった。すべてが揃っていた。後方から行って道中ポジションを上げるのは皐月賞、ダービーでも使ったこの馬の必勝法でやっとうまく行った。いずれにせよデータ的にはこの馬しかいないと言う結論だった。

 エアスピネル。。。鞍上ムーアはデータからは鉄板だったが早く抜け出しすぎてデムーロの目標にされた。運がなかった。

 サングレーザー。。。差しを得意とする「強い3歳馬」の1頭だった。前走鉄板のスワンSを重馬場で快勝。勝ち負けの状態で望んだレースであることは間違いなかった。問題は鞍上がデムーロから神福永に乗り替わり。得意の走る公務員走法で3着までは届いたがデムーロだったらなぁ。。。


データ的に富士SとスワンSが鉄板で、今年の2着3着もこれらレースの1着馬なんだからヒモはこの二頭しかないでしょ?そして富士S 負け組でも可能性のある馬はピックアップ。それでよかった。データ派の勝利だ!

軸馬決定法その後

Marrygoldの検証始めた。調整後の複勝圏内率がたったの6割で死んだ。今のモジュールは放棄ということで。いやあ、この数字はないわ。Kanoneとか素でやって6割普通に超えるからね。。。

エリザベス女王杯

モズカッチャンとクロコスミアは鉄板だった。特に後者は絶対に複勝圏内は外さないと思った。だが、ミッキークイーンはわからなかった。。。。前走宝塚記念、5歳馬。。。全部来ない馬のパターンだった。これは買えんわ。強い馬なんだろうなぁ。


で、この敗戦を機に新モジュール「マリーゴールド」の開発が始まるのだった。テーマは「謎の馬検出器」

軸馬決定法の名前

軸馬決定法っていつも書いてるこれですけど、特別な名前がないのでわかりにくい。そこでメインアカウントで使っている軸馬決定法を「カノン方式」実験アカウントで使っている軸馬決定法を「シラン方式」としました。カノンは決勝着順と相関の強いオッズを時系列的に追って最終的に決定する方法を理論込みで話すときの名前、シランは1番人気を避けることで高回収率と高的中率を実現しつつ、カノンの抜けを補完する軸馬決定法の理論込みの名前になります。カノンの理論的なベースになっているのがここまで「軸馬決定法」と呼んでいた時系列オッズによる軸馬決定法で、シランの理論的なベースになっているのが名称がそもそも意味不明と評判の「決定的気づき馬券」による軸馬決定法です。

もう一つ、2着率を精度高く予測する連下決定法を用意する予定でいるのですが、これの名前がマリーゴールド方式。今週から実験アカウント2で検証を開始する予定です(ただし非公開)


ちなみにマリーゴールドって、このblogのアイコンの子ですねw