BBANALY プロ野球データ分析

NPBのデータから、野球に関する議論や迷信を検証していくブログです。

高校野球をFIPとDERで評価できるのか

はじめに

この記事は以前、やきうのおじさん()さんが紹介されていた、高校野球における投手、打撃、守備の重要性について述べられた論文から着想を得たものです。高校野球に携わっている方はもちろん、高校野球が好きな方にも興味深い内容です。

www.jstage.jst.go.jp

 

今回はセイバー系指標の中でも有名どころであろうFIPとDERが持つ性質を整理し、データ分析の最前線にも触れながら、「FIPやDERで高校野球(甲子園)を評価することの意味」について書いていこうと思います。

もはや「プロ野球データ分析」ではありませんが、FIPやDER、高校野球の持つ性質を深く理解することは、プロ野球の理解に多少なりとも繋がってくる部分があるかと思います。

 

本記事の構成

前回の記事同様、書いているうちに長くなってしまったので、はじめに記事の構成を示しておきます。

  1. FIP、DERの定義
  2. 野球データ分析の最前線から見る、FIPとDERの特徴
  3. FIPとDERを使って高校野球(甲子園)を評価するということ
  4. まとめ

可能ならば全て読んでいただきたいのですが、1は飛ばして頂いてもかまいません。

 

1, FIP、DERの定義

まず今回の主役であるFIP、DERとは何か、(一般的に)どのような意味を持つデータなのかを整理しておきます。

(1)FIP(Fielding Independent Pitching)

MLB公式サイトではこう説明されています。

FIP is similar to ERA, but it focuses solely on the events a pitcher has the most control over -- strikeouts, unintentional walks, hit-by-pitches and home runs. It entirely removes results on balls hit into the field of play.

(FIP防御率に似ていますが、投手が最もコントロールしやすい打席結果である、「奪三振・与四死球・被本塁打」にのみ焦点を当てて算出されます。つまり「打たれたヒット、2塁打、3塁打」を一切考慮しません。)

What is a Fielding Independent Pitching (FIP)? | Glossary | MLB.com

 

FIPを求める式は以下の通りです。

FIP = {(13 × 被本塁打) + (3 x 与四死球) - (2 x 奪三振)} ÷ 投球回

   + (防御率にスケールを合わせるための定数).

 

FIPは野球統計の研究によって明らかになった、「フィールド内に飛んだ打球がヒットになるかどうかを投手がコントロールすることは難しい」という事実をもとに作られた指標の1つです。投手の能力が反映されやすい打席結果のみに注目することで、より投手能力を反映した数値を出すことができます。事実、あるシーズンの投手成績を予測する際、前シーズンの防御率ではなくFIPを用いた方が、高い精度で成績を予測できるみたいです(Tango Tiger氏がブログのどこかに書いていましたが、どこにあるか忘れてしまいました)。

FIPの存在を初めて知った、もしくは既に知っている方でも、「そんな無茶苦茶な話あるか」と感じている方は多くいらっしゃると思います。そのモヤモヤについては後述します。

 

(2)DER(Defensive Efficiency Ratio)

MLB公式の説明は以下の通りです。

Defensive Efficiency Ratio is a statistic used to evaluate team defense by finding out the rate of times batters reach base on balls put in play.

(DERは、フィールド内に飛んだ打球をどれくらいの割合でアウトにできたのかを計算することによって、チームの守備能力を評価する指標です。)

What is a Defensive Efficiency Ratio (DER)? | Glossary | MLB.com

 

計算式は次のようになります。

DER = 1 - {(本塁打以外の被安打 + 失策出塁 - 被本塁打) / (打席 - 与四死球 - 奪三振 - 被本塁打)}.

 

DERはFIPに比べると、シンプルで理解しやすい指標のように思います。が、FIP同様、この指標で守備能力を測ることにモヤモヤ感を抱いている方は一定数いるでしょう。これも後で述べたいと思います。

 

 

2, 野球データ分析の最前線から見る、FIPとDERの特徴

(いかにもそれっぽいタイトルをつけていますが、「最前線」は筆者のインプットの中での最前線であり、研究の最前線とは必ずしも一致しない可能性がある(高い)ことをご了承ください。)

 さて、近年日本のプロ野球チームにおいてもデータ分析が活発に行われるようになってきていますが、その背景には「詳細なデータを収集することが可能になった」ことが関係しているでしょう。trackman等の高度なレーダー弾道測定器が多くの球団の本拠地に設置されたことによって、これまでとは比べものにならないくらいの質と量を兼ね備えたデータを採ることが可能になりました。

そんな中、今回注目したいのは「打球角度」と「打球速度」のデータです。打球角度と打球速度を高精度で計測できるようになったことにより、「打球の質」を定量的に評価することが可能になりました。この打球の質を用いた指標も開発されており、xwOBA(expected wOBA)は選手の真の打撃・投球能力を高い精度で表現した指標として活用されています。

(xwOBAについては、近日中に簡単な解説記事を書いてみたいと思います)

m.mlb.com

 

ここでFIPとDERに話を戻します。計算式を見て明らかなように、FIPとDERにはこの「打球の質」が式の中に直接組み込まれていません。この「打球の質を考慮していない」という点が、FIPやDERの考え方に対して抵抗を生む、最たる要因ではないかと思います(前述したモヤモヤがこれに該当します)。

例えば、「本塁打は打たれないけど、痛烈な打球を打ち込まれる投手」はFIPによって本来の能力よりも高く評価されてしまうし、「ヒット性の打球ばかりを打たれたチームの守備」はDERによって本来の能力より低く評価されてしまいます。

そのため、FIPを投手の総合能力として扱うためには、「打球の質」がその数値に反映されやすい環境が必要であり、DERをチームの守備能力として扱うためには、「打球の質」がその数値に反映されにくい環境が必要になります。それぞれにとって望ましい環境はどのようなものでしょうか。

 

(1)FIPの場合

FIPの計算式の中で、「打球の質」を表せそうな項は「被本塁打」のみでしょう。「奪三振」、「与四死球」はそもそもバットに当たらない打席結果であることから、「打球の質」を表しているとは言い難いからです。そのため、「打球の質」と「被本塁打」の相関が高いほど、FIPとの相性が良い環境ということがいえます。

「打球の質」と「(被)本塁打」の相関が高い環境とはどのようなものが想定されるでしょうか。高い打球の質が本塁打に繋がるためには、本塁打が出やすく、打者が本塁打を打つことを理想としている環境が好ましいと考えることができます。

 

(2)DERの場合

DERの場合、FIPとは逆で「打球の質」の影響をなるべく小さく抑えたいので、「各チームが同じような質の(分布の)打球をたくさん受ける」環境がDERと相性の良い環境ということになります。また、極論質の高い打球が全て本塁打になってしまえば、「打球の質」の影響をとても小さく抑えられるので、FIPと相性が良い環境は、DERとも相性が良い環境と言えます。

「打球の質」を決定するのは、味方の投手の能力と敵チームの打撃能力であると考えられるため、試合数が多く、各チームの投手能力、打撃能力に大差がないリーグ(集団)であればあるほど、好ましい環境といえます。

 

 

3, FIPとDERを使って高校野球(甲子園)を評価するということ

ここまでの分析を踏まえると、それぞれの指標にとって相性の良い環境は、

  • FIP...本塁打が出やすく、打者が本塁打を打つことを目指している
  • DER...上の環境+ 試合数が多く、各チームの投手能力や打撃能力の差が小さい

であることが予想されます。最後にそれぞれの指標と、MLBNPB高校野球(甲子園)の相性について考えていきたいと思います。

 

(1)FIP

ここでは本塁打の出やすさを比較するために、「本塁打によってもたらされた得点 ÷ 総得点」を計算することにします。1試合当たりの本塁打数で評価しないのは、各グループによって得点スケールが違う可能性があるためです。

なお簡単のため、本塁打によってもたらされた得点 = 総本塁打数 × 1.4として計算を行い、一部のデータは平均値のみしか手に入らなかったため、総得点が小数になっています。

f:id:hihrois_1104o:20190221063001p:plain

MLBNPB夏の甲子園本塁打の出やすさ

(MLBNPBは2018年、高校野球は2015~2017年の夏の甲子園のデータを使用)

https://windy.mind.meiji.ac.jp/paper/2017/bachelor/paper/masatatsu.pdf

Major League Total Stats » 2018 » Batters » Dashboard | FanGraphs Baseball

1.02 - Essence of Baseball | DELTA Inc.

https://hsbb.tsh.jp/_statistics/10/%E6%9C%AC%E5%A1%81%E6%89%93%E6%95%B0%E3%81%AE%E6%8E%A8%E7%A7%BB

 

MLB>NPB>>高校野球の順に、本塁打によって得点が生まれやすいことが分かります。

また、「打者が本塁打を打つことを目指している」については、データで議論することが難しいのですが、本塁打の出やすさと大差ない結果が予想されます。

MLBでの使用を想定して開発されたであろうFIPは、やはりMLBと相性が良いことが分かります。一方で、各都道府県の代表校が集まった夏の甲子園ですら、MLBNPBとの乖離が大きい高校野球の得点環境では、FIPによって投手を評価することが難しいと言えます。

 

(2)DER

DERの場合、なかなか定量的な根拠を見つけるのが難しいです。しかしながら、ある高校の守備力を評価することを考えると、「打球の質のばらつき」を抑えるために十分な試合数のデータを集めることが困難であることが予想され、さらに対戦校の実力を適切に判断する基準を設定することも難しいと思われます。

 

さらに、上記で紹介した論文では、

 

チームを効率的に強化するためには、投手力より打撃力や守備力を高める指導・練習を行うべきだと考えられる

 

 という記述がありますが、高校野球における失点の責任を投手か守備のどちらかに負わせ、その尺度としてFIPとDERを用いるという形をとった場合、前述した理由から「打球の質」をFIPによって評価することが難しいため、本来投手の責任として扱われるべきである「打球の質」が守備側の責任として誤って評価されてしまうことが考えられます。

 

 

4, まとめ

MLB高校野球の構造の違いを踏まえると、FIPやDERは高校野球との相性が良くない指標といってよさそうです。

同じ野球というスポーツであっても、得点環境やプレーする選手、リーグの特性によってその構造は異なるため、それぞれにあった評価の方法を見つけることは重要なのかもしれません。

かくいう自分自身も「MLBでは」を常套句に、MLBNPBの構造の違いを軽視して日本のプロ野球についての自論を展開している傾向にあるので、十分に注意していきたいと思います。

 

長文最後までお読みいただき、ありがとうございました。twitterのフォローや、ご意見をいただけると嬉しいです。

twitter.com

 

(宣伝)

日本プロ野球のデータベースサイトを立ち上げました。wOBAやFIP等のセイバー系指標や、シーズン内での成績推移の可視化をテーマにしています。

baseball-neo.com