2017年9月23日土曜日

失策の得点価値まわりの話

前の投稿で書いたあたりのことを確認している時に、wOBA計算時の係数について、The Bookと1.02で、失策出塁と単打の相対的な関係が結構違うことに気づきました。

The Bookで示されている係数はwikipediaで確認できます。
https://en.wikipedia.org/wiki/WOBA
1.02のものは例えばこちらにあります。
http://1point02.jp/op/gnav/glossary/intro04.aspx
一部をまとめると下のようになります。
図1. The Bookと1.02で示されているwOBAの一部のイベントの係数 (背景の緑のバーは係数の大きさを反映している)。

1.02のNPB版wOBAは、単打 (Single) に比べたときの失策出塁 (RBOE) の価値を、The Bookのものに比べてかなり高く評価しているようです。

公表されている得点価値から係数を計算してみると以下のようになります。

[係数] = ( [イベント得点価値] - [アウト得点価値] ) * [スケール補正に使用した数値]
なので、それぞれThe Bookの値を参照すると:

Single: (0.475 - (- 0.299)) * 1.15 = 0.8901
RBOE (注1): (0.508 - (- 0.299)) * 1.15 = 0.92805

出版に伴っていろいろ数値が丸められているせいか、少し元の数値と違いますが、概ね一致しています。

1.02もここにイベントごとの得点価値や出塁率へのスケール補正に使用した数値を示してくれています。
http://1point02.jp/op/gnav/column/bs/column.aspx?cid=53003
http://1point02.jp/op/gnav/glossary/intro04.aspx

1.02の単打: (0.437 - (- 0.257)) * 1.24 = 0.86056
1.02の失策出塁: (0.460 - (- 0.257)) * 1.24 = 0.88908

あれ....?


式はあってると思うんですけどね🤔

...まあ、エラーなんてそんなに頻度が高くないので全体では大した違いにはならないはずです。


<オマケ>

図2. MLB 00-16の安打と失策出塁 (打者がどの塁まで達したか別) のイベント発生回数 (N; 背景のピンクのバーはNのサイズを反映) とその得点価値。
RBOE0: 失策が記録されたが打者がアウトになったケース,
RBOE1: 打者の失策での 1塁への出塁 ...
RBOE5: 打者の失策での本塁への出塁 (注2).
(得点価値の計算はMarchi and Albertに従った (注3)。データはRetrosheetから。)

失策は安打に比べて十分に少なく、特に、打者が3塁より先に進むケースは極めてまれであることがわかります (図2のN)。3塁より先は17年分でもサンプルが少なすぎるため、得点価値の平均値は推定値としては信用できなさそうです。また、少なくともこの期間内においては、一塁への失策出塁と二塁への失策出塁は、それぞれ単打と二塁打とほぼ同等の得点価値があるようです (図2のRun_value; 注4)。

<注>
注1.
The Bookで各イベントの得点価値を示しているtable 7ではErrorと示されているがおそらくこれをRBOEとして使っていると考えて、その値を入れています。 RetrosheetのEvent type 18が"error"
http://www.retrosheet.org/datause.txt
なので、そのままの名前にしているためかと思ったんですが ... (注3) の後半に続く。
[ところでEvent type 18はごくごく稀にバッターが1塁でアウトになったケース (RBOEじゃないと思われる) も含むようですが (00-16年で n = 9)、ほとんど影響はないので気にしなくていいでしょう。]

注2.
RBOE4じゃなくて5にしたのは、Event type =  18 (error) の時のBatter destinationが 0, 1, 2, 3, 5だったため、なんとなくそれに合わせています。自責点かどうかなどで数値を変えているようです。
http://www.retrosheet.org/datause.txt

注3.
この方法ではimcomplete half-inning (要するにアウトが3つ記録されていない半イニング [= 表 or 裏]) 全てを切り捨てています。ちなみにThe Bookの方法では、imcomplete half-inningに加えて、9回裏以後のホーム側の攻撃をバッサリ切っている (実際のところ、結果的にはほとんど変わらないっぽいですが) 。

Marchi and Albertの方法でThe Bookが対象にしている年度 (99-02) での得点価値を求めると、Singleが0.472、Error (Event type 18; Bat event flagは全てTRUE)  が0.515になりました。単打はほぼThe Bookの結果と一致しましたが、Errorは結構差があります。原因はよくわかりません。

とりあえず安直にThe Bookと同様に9回裏以後のホーム側の攻撃を無視するように改変しても0.518なので、RBOEの定義が違うのかもしれません。 Event type 18には1つのプレーで複数のエラーを含んでいるものもあるので、イベント数ではなく、失策の総数を分母に使ってみた場合でも0.512🤔

注4.
Singleなどの安打系イベントには、打者走者が、エラーなどで先の塁に進んだケースも、アウトになったケースも含まれる。

<参考>
Tango, Lichtman, and Dolphin, The Book , 2007, Potomac Books.
Marchi and Albert, Analyzing Baseball Data with R, 2013, CRC press.
http://www.retrosheet.org

0 件のコメント:

コメントを投稿