ある試合の打撃成績を予測するには?(1)
更新時のみ呟くtwitterアカウントがあるので、よければフォローお願いします。
(追記)
今回、予測に用いるデータに、「相手チーム、相手投手、球場」等の要素は含まれていません。データの量がそこまで多くないため、その条件で有意に成績が異なるかを判別することが難しいためです。
そのため、「日付、選手名、打席、打数、1B、... 、HR、四死球」の要素をもったデータを使用しています。
直近5試合の成績がよければ期待できる?
TV中継等でよく「直近5試合の成績」が紹介されることがあります。しかし、この5という数字に、何か根拠があるのでしょうか?おそらくは、区切りがいいという理由で直近5試合の成績が使われているものと思われます。
「直近5試合の成績」がよければ、「この打席は期待できるな」と思うし、悪ければ、「期待できないな」と思うでしょう。
今回は、「ある試合の直近n試合の成績」と「ある試合の成績」との相関を計算することによって、「直近n試合の成績」からある程度「ある試合の成績」が予測できるのかを検証していきたいと思います。
まず何をもって「成績」とするのかですが、今回もwOBAを「成績」としたいと思います。
すなわち、「ある試合の直近n試合の成績から算出したwOBA」と「ある試合の成績から算出したwOBA」との相関を求めるということになります。
なお、対象にしたのは2018年の規定打席到達打者60人です。「直近n試合」ですが、そのn試合のうちどの試合にも、最低1打席は立っていることを条件にします。
今回は、n = 1, 5, 10, 30の場合を調べることにします。
まず直近1試合について調べてみました。
相関係数は0.04程度でした。そのため、「ある試合」と「ある試合の直近1試合」の成績は相関がほぼないということが分かりました。
直近5試合の場合の結果がこちらです。
こちらも相関係数は0.07程度で相関がありませんでした。
次に10試合の場合、
相関係数は0.09でした。
最後に30まで試合数を増やしてみました。
相関係数は0.11程度で、こちらも相関はほとんどありません。
まとめ
wOBAに限定した話ですが、「直近n試合の成績」と「その試合での成績」に相関はありませんでした。「直近n試合の成績」が良ければ「その試合の成績」もよくなったり、逆のことが起きたりということは、ないのかもしれません。
しかし、この考察では2つ考慮しておきたいことがあります。
1つ目は、「直近5試合の成績」等がTVなどで紹介されるときは、たいていの場合、「直近5試合の成績」がその選手のシーズン成績から大きく外れているとき、ということです。今回の相関係数の計算では、大きく外れていようがいまいが、すべて計算の対象に含んでいます。計算の対象をもっと絞り、シーズン成績から大きく外れたときのみを対象として相関係数を求めれば、もっと違った結果が得られるかもしれません。
2つ目は、「その試合( = 1試合)での成績」を予測するのは無理があるということです(元も子もないですが)。
5試合⇒1試合、10試合⇒1試合ではなく、5試合⇒5試合、10試合⇒5試合という風に、打撃成績を予測する対象の試合数をもっと増やしてみると、相関係数を大きくできるのかもしれません。
この2つを考慮して、次回は検証したいと思います。