2017年12月2日土曜日

カウント毎の得点価値の解釈

3週にわたってカウント毎の得点価値の可視化をやってきましたが、最後によくあるカウント毎の打撃成績との関係を整理しておきます。

カウント毎の打撃成績で最もよく見るのが、そのカウントで生じた打席結果、例えば打率、を計算したものではないかと思います。下はMLB 2013-2016のカウント別打率。
表1. カウント別打率。1列目はストライクカウントを、2-4列の上の数字はボールカウントを示す。

だいぶ遠回りになりますが、まずはこれを例にカウント別成績の基本的な性質を確認します。

上の例では以下のことが見て取れます。

  1. ストライクが増えると打率が下がる。2ストライクで特に下がる。
  2. ボールが増えると打率があがる。

何となくいかにもありそうな話ですが、これらの事実はどのようにして説明できるでしょうか?打席結果の内訳がどう変化しているのか、もう少し細かく見ていきます。


打率は安打数/打席によって計算されますが、定義上3つの要因に分解できることが知られています (注1)
  1. 三振率
  2. HR以外の打球あたりの安打率 (いわゆるBABIP) 
  3. HR率
打率の変化は、これらの数値の変化によって起きているはずです。これらのボール・ストライクのカウントによる変化を調べるため、それぞれ表にしました。

表2. カウント別の三振/打席。

あたりまえですが三振はルール上は2ストライク以後でのみ記録されます。2ストライクで特に打率が低い大きな要因は、このルールのためです。さらに、ボールカウントが少ない状態では特に三振が起こりやすくなっているようです。これは投手がボール球を投げられる余裕があるためだろうと推測できます。この計算方法では、3ボール以外でボール球を投げて打者が振らなかった場合、打席結果が生じないので、計算に含められまずに次のカウントへ移行します。そのため、ボール球を投げられる有利さを表現している一方で、ボールカウントが増加するコストは考慮できていません。

次に、カウント別BABIPを示します。
表3. カウント別のBABIP。

1, 2ストライクではストライクが増えると低下し、ボールが増えると上昇していますが、変化としてはあまり大きくはないようです。0ストライクではなぜかこの関係があまりみられません (実はこれは過去に調べられた結果と一致していない, 注2, 注3)。

表1で0ストライクでボールカウントの増加に伴って打率が上昇していましたが、これらのカウントでは三振が記録されず、また、調べた年度ではBABIPはむしろ低下していたことから、打率の上昇は本塁打の増加で起きていることがこの時点で予想できます。

下は、比較的よく使われるHR率に関連した指標としてHR/打球を示しています。

表4 カウント別のHR/打球。

ありがたいことに非常にわかりやすい傾向が出ました。ストライクが増えると低下し、ボールが増えると上昇しています。変化は絶対値で見てもBABIPに比べて非常に大きく、相対的な変化率として見ると0→2ストライクで約半分に、0→3ボールで約二倍になっています。13-16年に起こった0, 1ストライクでのボールによる打率の変化は、本塁打率の変化の影響が大きいことがわかります。

ただ、この結果はそのまま解釈すると多少問題が起こりえます。これはカウントによって、打席に立っている打者の能力が異なる可能性があるためです。例えば、3-0で考えると、振らなくても最終的に四球になる確率がかなり高いため、それを捨ててまで打ちにいけるのは相当に優れた打者だと思われます。打力の劣る打者がストライクを見逃した場合、このストライクは打席結果を生じないので、計算には含められません。結果として、打席結果を残す打者は、打者全体よりも能力が高くなると予想されます。

確認してみます。下は、3-0からのスイング率とHR/打球の関係を示しています。データはStatcastからで、15-17のデータかを使用。

図5. 3-0におけるスイング率はHR/打球と相関する。直線は単純回帰直線を示す。

そこまで顕著な傾向とは言えませんが、やはり、HR/打球が高い打者がスイング率がある程度高い傾向があるようです。

下は、各カウントについて、打席結果が生じた、かつ打者がスイングした投球について、打者の能力から期待される打撃成績を示しています。
図6. 各カウントでスイングした打者の期待打撃成績。左のBS_CTがボール-ストライクカウント。HR_bbがHR/打球。

BABIPはほとんど変わりませんが、HR/打球は特に3-0においてはかなり高くなりました。0-0と比較した時の、3-0で計測されたHR/打球の高さ (もちろん打率も) は、カウントの効果に加えて、このサンプリングバイアスの影響があり、バイアスの影響が30%程度、という感じでしょうか。 実際には投手の能力もバイアスがある可能性がありますが、どうやらHR/打球やBABIPについては影響はほとんどないです (注4)。

ここまでの結果をまとめると、カウント別打率においては、
  1. 2ストライクでは三振が記録されるので、打率が大きく下がる。
  2. HRとBABIPはおそらく全体的に影響を与えていて、どちらかというとHRの変化の影響が大きい。
  3. ただし、HRについてはバイアスが起こりやすいので要注意
といったところです。

ここまでのことから、カウント別の成績には、野球のルールの定義上、いくつかのイベントの起こる確率が全く異なること、あるいは打席結果を生じない場合は計算上カウントされないためにバイアスが生じやすいこと、などが大きく影響を与えていることがわかります。また、打席結果を生じない場合はボールやストライクは無視されることも重要な性質かもしれません。

同様に、カウントで頻度が大きく変化する特定のイベントとしては、三振以外に四球があります。下は、カウント別の出塁率を示しています。
表7. カウント別の出塁率。

0から2ボールの出塁率は打率 (表1) とほとんど変わりませんが、3ボールでは四球が記録されうるというルールによって、数値が大きく変化しています。

いろいろな打撃成績を表にまとめてみました (注5)。

表8. カウント別の打撃成績のまとめ。

三振と四球 (BB, IBB) が記録されうるかどうかによって、カウント別の成績が大きく影響を受けるというのがわかるのではないかと思います。また、故意四球が出るのはほとんど3-0からであり、3-0からの出塁率が極端に高いのは、この影響がありそうです。

これまでよくあるカウント別打撃成績の計算を見てきました。これを、カウント別得点価値の計算過程とを比較すると、一つ大きく違う点としては、得点価値の計算ではそのカウントを経由した打席における最終的な結果を評価している、という点が挙げられます。このような、最終的なイベントを考慮する計算方法では、特定のカウントでのみ起こる三振や四球の影響も、どのカウントでも取り込むことができます。また、見逃した投球を含めた全ての投球を評価対象にしているため、打席結果に直接関係しない投球も評価でき、また、ややサンプリングバイアスが生じにくくなっているはずです。

もちろん、あるカウントから最終的にどうなったか?ということを計算するのは、別に得点価値だけでなく、もっと一般的な打撃成績でも計算が可能です。実際の所、上で計算したタイプのものに比べると珍しい気がしますが、たまに見かけるのではないかと思います。

というわけで、各カウントからの最終的な打席結果を集計してみました。

表9. 各カウントにおける最終的な打撃結果のまとめ。

この場合、最終的な結果を計算するため、0ストライクでも三振が記録されますし、0ボールからでも四球が記録されます。全体的に、カウント毎の個性は、上で計算したカウント別の打席結果の計算よりも、小さくなっています。

カウント毎の打席結果に対する2つの計算方法の違いを見てきました。これらはどちらが優れている、というよりは、目的が違う、ということだろうと思います。カウントによって、その時にどういう打席結果が起こったのか、を考えるのであれば前者えばいいでしょうし、最終的に各イベントの頻度がどう変わったか、ということを考えたいのであれば、後者の計算方法を採ったほうが良さそうです。問題は、自分が何を知りたいのか、ということだろうと思います。

さて、本題は、カウント毎の得点価値とよく見る打撃成績との関係がどうなっているのか、ということでした。基本的には、表9のwOBAが、先週まで計算していた得点価値とかなり近いものだと思います。大きな違いとしては、得点価値は「状況に中立」ではないというぐらいでしょうか (注6)。サンプルサイズが十分に大きければほとんど同じと言っていいと思います。個人成績に得点価値を適用する場合にはサンプルサイズがそれほど大きくはならないので、本人の責任とはみなしにくいような、状況からの影響が大きいかもしれません。

<参考>
Marchi and Albert, Analyzing Baseball Data with R, 2013, CRC press.
Retrosheet http://retrosheet.org
Statcast  https://www.mlb.com
_________________________________________________________________________
注1.
Jim Albert, A Graph of a Batting Average, 2015.
https://baseballwithr.wordpress.com/2015/01/05/a-graph-of-a-batting-average/
このエントリで示したHR率やBABIPは向こうの計算方法には合わせていないですが、だいたい同じようなもののはずです。

注2.
実はMLBの08-10のデータを使った過去の報告では、0ストライクでもボールが増えると上昇し、1, 2ストライクよりも高いというが確認されています。
Derek Carty , How much do counts affect BABIP?, The Hardball Times, 2010.
https://www.fangraphs.com/tht/how-much-do-counts-affect-babip/
13-16のBABIP計算結果がこの記事の結果と0ストライクで一致しなかったので、これの再現を試みました。08-10の途中まで、ということだったので、近づけるために08-10全体のデータで計算した結果。
数値はリンク先の記事と結構違いますが、傾向は概ね再現できていると思います。13-16と08-10で結果が一致しなかったのが、そもそも効果が小さいのでサンプル数が足りなくて一致しなかったのか、あるいは傾向自体が変化したのか、不明です。もっと長く傾向を確認したほうが良さそうです。

向こうの記事とコチラの再計算のBABIPの値が多少違う原因は謎です。向こうの計算だと全体の平均が0.306になっているんですが、これはFangraphsの数値と比べると、ちょっと高すぎる。定義が違うとか、投手を除いている、とかかもしれない。
http://www.fangraphs.com/leaders.aspx?pos=all&stats=bat&lg=all&qual=0&type=8&season=2010&month=0&season1=2008&ind=0&team=0,ss&rost=0&age=0&filter=&players=0
こちらの計算方法はFangraphsのものに従い、投手も含めており、08-10の全体では0.299となり、また、個人成績を計算するとFangraphsのものと一致することを確認済み。

注3.
NPB2015での結果は、そすだんさんがツイートしてくれています。
https://twitter.com/sos_mei/status/837702165669916672

注4.
図6の投手版。
K/ABはちょっとバイアスめいたものがあるかもしれない。ただし、ここでは図5と同様に打者がスイングした場合に絞っているので、全体的な傾向から乖離しているかも。いずれにせよ、表2のボールカウントの増加によってK/ABが高くなっていく効果の大きさを考えると、効果全体に占めるバイアスの割合はかなり小さいでしょう。

ついでに書いておくとウチのコードでは、Statcastデータを使ったPAとABの集計は少し誤差が生じています。ほとんど影響は無いと思いますが。

注5.
ごくごくまれに、1ストライクから三振が記録されたり、2ボールから四球が記録されたりしています。これが試合中に勘違いが起きたためなのか、Retrosheetがおかしいのか不明。実は4ボールからプレイが行われていることになっている打席もある。まあ、誤差。表8と9の3-2の結果がごくわずかに一致しない (理屈から言うと一致するはず) のも、多分こういうよくわからないイベントのせい、だと思う、多分。

注6.
一応「状況に中立」かどうか、という意味をざっくり書いておきます。
下は、とあるイニングでの得点価値の計算例を示しています。

左の2列: 打席開始前と終了後のランナーとアウトカウント (110 1であれば1アウト1, 2塁)
イベント: 打席結果
RE_前: 打席開始前のランナーとアウトカウントから決まる状況の得点期待値
得点: その打席で記録された得点
RE_後: 打席終了後のランナーとアウトカウントから決まる状況の得点期待値
得点価値: [RE_後] +  [得点] - [RE_前]
データの1行目を例に説明すると、ノーアウトランナー無しから打席の結果がアウト (Generic out) だったので、1アウトランナー無しとなり、得点期待値が0.468から0.247に低下しています。このアウトの価値は
0.247 - 0.468 ≈ -0.22
となります。

データ2行目でもアウトになっていますが、ここでの得点価値は打席前後の得点期待値がアウトカウントが増えたことで変化しており、得点価値は-0.152です。これは、アウトカウントという状況によって、アウトの価値が変動した例になっています。最下段のデータでもアウトになっていますが、ここでは2アウト満塁からのアウトで、得点価値は-0.707とかなり大きなマイナスになっています。これは、ランナーが溜まっていることで上昇した得点期待値がイニングが終わって0になったことを反映しており、ランナーの影響の大きさが見て取れます。

また、データの5-8行目で単打が3つ続いていますが、それぞれの得点価値は大きく異なります。これは様々な状況の違いによって生じている可能性と考えられます。例えば、各塁のランナーの有無やアウトカウントの違い、あるいはランナーが本塁に帰ってきたかどうか (ランナーの走力の違いかもしれないし、守備の違いかもしれない) などが原因として考えられます。
(実際には、打席の結果で考慮されていないような、打球における質の違いのせいかもしれなくて、この場合なら状況のせいではないと考えた方がいい可能性はある。)

wOBAは各イベントに関して、全ての記録された得点価値を平均化したものを重み付けに使っており、それぞれのイベントの価値はランナーやアウトの状況に関わらず一定で計算します。ここで扱った期間では、平均得点価値は単打であれば0.44、アウトであれば-0.253なので、実際に動いた得点価値とは関係なく、全てのイベントの重み付けにこの数値が利用されます。これが「状況に中立」ということです。


2 件のコメント:

  1. カウントごとの得点価値や打撃成績を根拠に
    「0-0から1-0か0-1になるかでStatsがこんなに変わるから守備側は初球にストライクをとることは重要だ」と言われたりしますがこれってどうなんでしょうか?
    マネーボールに書かれてたハッゲバーグに初球の打撃成績が良いから初球をもっと積極的に打てといったエピソードみたいな感じがしますが。

    返信削除
    返信
    1. 匿名様

      コメントありがとうございます。

      上のエントリにおける、各カウントにおける最終的な打撃結果の方であれば、効果の大きさの提示としては、それほどおかしなやりかたでは無いと思います。しかし、その結果もあくまでデータを取得した期間における平均的な状況についての結果です。実際には、これまでよりも積極的にストライクを取りに来るという、これまでの平均から逸脱したアプローチが選択されることがわかっていれば、打者はそれに応じて打撃のアプローチを変えてくると思われるので、その影響を考える必要があるだろうと思います。どうやって考えればいいかというのはすぐには思いつきませんが、面白い問題だと思います。

      上のエントリにおける、カウント別の打撃成績の方をつかうのであれば、その問題に加えて、効果を過大に示しているのではないかと個人的には思います。というか、個人的にはあっちの数字を使いたい場面は思いつかないですね。

      > マネーボールに書かれてたハッゲバーグに初球の打撃成績が良いから初球をもっと積極的に打てといったエピソードみたいな感じがしますが。

      この場合、上で指摘したような問題に加えて、そもそもサンプルサイズが小さく、初球から打ちにいくことで今後もその効果が得られると考えることも無理があるだろうと思います。予測力があるような推定値を得ようとすれば、何らかの方法で全体の成績の傾向を取り入れる必要があるだろうと思います (平均への回帰など)。

      削除