2017年11月18日土曜日

カウント毎の得点価値の可視化2

前回は、Jim Albertが導入したボール・ストライクの得点価値の可視化方法を、リーグ全体に対して試してみました。Albertはさらに投手や野手の個人についても計算・可視化してみています (Albert, 2017)。

今回は、ダルビッシュ、田中、カーショウの3人の投手に関して、2013-2016におけるボール・ストライクの得点価値を計算してみます。

その前にまず、これらの投手の成績をざっくり掴むために、三振/9、四球/9、HR/9をプロットしました。データはFangraphsから (注1)。


ダルビッシュは三振/9が素晴らしく、対象データの中では最高を叩き出し、四球/9は規定投球回をクリアするような投手としては平均的あるいはやや多い、といったところです。対して、田中は三振/9は平均的ですが、四球/9はトップクラスです。HR/9に関してはダルビッシュのは1.01と平均的、田中の1.14と、やや多めです。もう一人、例として計算したカーショウは、三振/9、四球/9、HR/9が全てトップクラスの、まさに完璧な成績です。

このような様々なタイプの成績を持つ投手のボール・ストライクの得点価値は、全体と比べてどう変化しているのでしょうか?実のところ以下の計算は多少問題があると思っているのですが、とりあえず計算してみます。データはRetrosheetを利用しています。

では、ダルビッシュから。

まず打席の開始である"0-0"同士を比較すると、ダルビッシュは全ての投手の場合に比べて、得点価値を下げています。"0-0"は全ての打席の得点価値を計算しているので、要するに、この低下分だけ1打席あたり失点を減らしている、ということを意味しています。

全体的な傾向を見ると、上下にかなり広がっていることが見て取れます。これは基本的には、ストライクを取ることによる得点の低下も、ボールが記録されることの得点の増加も、全選手の計算に比べてかなり大きくなっている可能性を示しています。特に、ボールが先行している時の得点価値の上昇が非常に大きいのが少し気になるところです。

ただし、先に書いた通り、この結果はそのまま受け取るのは問題があると思われます。各打席の得点価値の計算には、その年の得点環境におけるランナー・アウト状況における得点期待値 (RE24) を利用しています。しかし、投手がマウンドにいる時、その得点環境はその投手の能力の影響によって大きく変化してしまうので、前提となっている平均的な得点環境が当てはまっていないはずです。

前回示した、全体的な得点環境が年度によって変化した時の、カウントの得点価値の変化を再掲します。

得点が入りにくい状況 (2014) では、各カウント間の相対的な関係は保存されたまま、ストライクによる得点の低下、ボールによる得点の増加も小さくなるようです。

今回扱っている投手がマウンドにいる時の、得点環境の代理変数になってくれそうなものの一つとして、FIPを示します (注2)。データはRetrosheetから計算。

ダルビッシュのFIPは平均よりも約20%強ほど低く、これを考慮すると、ダルビッシュのボール・ストライクの実際の得点価値は、先に示した図よりも全体的にすこし上下の広がりが小さくなっているのではないかと思います (注3)。

次に、田中での結果を。

ダルビッシュとは対照的に、上下の広がりが小さい形状になっています。ただ、これは全体的な傾向というより、特に目立つ"3-0"と"0-2"の得点価値が特殊な値になっているためのようにも見えます。"3-0"は図の左に示した全体では"2-0"から大きく得点価値が上昇していますが、田中は"3-0"での得点価値は"2-0"と大差なく、失点を抑えることに成功していたようです。"3-2"でも"0-0"とほぼ同程度かそれよりも得点価値をマイナスにしており、これら3ボールでの失点抑止の優秀さは、四球の少なさと関連があるだろうと推測できます。"0-2"に注目すると、なぜか得点価値が"1-2"よりも高いという結果になっています。普通に考えれば、"0-2"は最も投手有利なカウントであり、全体でもダルビッシュでも最も平均得点価値のマイナスが大きいことを考えると、田中の場合では、偶然の影響が大きく実際の効果の推定としては正確でない、あるいは、攻め方に改善の余地がある、ということかもしれません (注4)。

最後にカーショウの結果です。

形状としては全体のものと似ていますが、全体的に下に大きくシフトしています。カーショウの"0-0"は全体の"1-2"とほとんど同じ得点価値であり、カーショウがマウンドに上がることそれ自体が、打者にとって平均的な投手に"1-2"で追い込まれるのと同じほどの悲劇的な状況のようです。また、既に示したようにカーショウのFIPは平均よりも著しく低く、実際の得点価値としては、これの上下の広がりをかなり小さくしたようなものになっているのではないかと思います。

という感じで投手に対してボール・ストライクの得点価値の可視化方法を適用してみました。投手の場合、得点環境が変化してしまうので異なる投手間の比較の扱いがやや難しいのではないかと思います。しかし、その投手の全カウントの相対的な関係をみるだけでも、投手によっては面白い特徴が見つかることがありそうです。この方法を使うことで、良い結果になった、あるいは悪い結果になったカウント、というようなことが簡単に把握できそうなので、それらのカウントを詳細に調べていく入り口として利用できるかもしれません。

次回は野手でやります、多分。

<参考>
Marchi and Albert, Analyzing Baseball Data with R, 2013, CRC press.
Albert, Visualizing Baseball, 2017, CRC press.
http://retrosheet.org
_________________________________________________________________________
注1.
下は単なる、使用したFangraphsのLeaderboardsへのリンクです。
投手成績
http://www.fangraphs.com/leaders.aspx?pos=all&stats=pit&lg=all&qual=y&type=8&season=2016&month=0&season1=2013&ind=0&team=&rost=&age=&filter=&players=

リーグ成績
http://www.fangraphs.com/leaders.aspx?pos=all&stats=pit&lg=all&qual=0&type=8&season=2016&month=0&season1=2013&ind=0&team=0,ss&rost=0&age=0&filter=&players=0

注2.
普通に失点率の方で良かったかもしれません。対象のイニング数も結構多めですし。

注3.
こういう問題を多少回避する方法としては、投手同士の比較には"0-0"の値が近いものだけを比較すると、得点環境は同じぐらいになっているはずなので、形状の比較はある程度正確に可能だと思います (それでも得点価値の値自体は多少ずれているはずだと思いますが)。

注4.
今回は3~4年分で計算していますが、個人のサンプルとして、「真の効果」のようなものを推定する目的のために十分かどうかは、よくわかりません。あくまで、この期間内ではこうなった、それが実際の効果か、運なのかはよくわからない、という程度で考えていただければ。1年ずつわけて描画するとかなり形も変わるので、1年ではサンプルがかなり足りていない印象でした。

オマケ.
K/9とBB/9の成績の上位から1/3ずつグループに分けて、その組み合わせで投手を分類して計算。
K1-BB1: K/9とBB/9のいずれも上位1/3
K3-BB3: K/9とBB/9のいずれも下位1/3
K1-BB3: K/9が上位1/3、BB/9は下位1/3
K3-BB1: K/9が下位1/3、BB/9は上位1/3
こういう方法ならサンプル数はかなり稼げるので、かなり正確に効果が見えてるんではないかと思います。

0 件のコメント:

コメントを投稿