2018年3月18日日曜日

フライボールの変化が得点貢献に与える影響2

前回、角度の上昇やFB%の増加は、少なくとも全体的に見れば、それほどwOBAやwOBAcon (打球についてのwOBA) の上昇につながらないことを示しました。今回はなぜ、大きな改善に繋がらなかったのかについてざっくり調べます。ここではStatcastの打球角度を使って、角度の上昇の影響について示します。データは2016と2017だけを利用しています。これは2015から2016では、おそらく75度以上の数値を許容するかどうかの仕様変更があり、打球角度の比較が困難かもしれないため。

wOBAが期待ほど上昇しない理由としては、例えばあまり価値のない打球が増えてしまった可能性や、価値のある打球が減ってしまった可能性が考えられます。とりあえず各打球タイプの価値と、角度を上昇させた時の打球タイプの変化を調べ、これらを使ってそれぞれの影響の大きさを概観してみましょう。

下はStatcastでの打球タイプごとのwOBAを示しています。

また、下はMLB全体での打球タイプ別の比率を示しています。

2017年ではFBの打球の価値 (wOBA) は2016年より大きく上昇しています。これは、主に全体的にHRが出やすくなっていることが影響していると思われます  (注1)。

次に各選手の角度変化 (ファウルは含まない) と、各打球比率の変化を示します。
当然、角度を上げるとFBは増えており、+5度で5%程度です。
同様に角度上昇5度で見るとGBは7.5%程度低下しています。非常に強い相関が見えます。
PUは角度上昇5度で2.5%程度増加しています。
LDもわずかに増加傾向ですが、効果も非常に小さく有意差も無いのでとりあえず無視します (R^2 = 0.006, p = 0.267) 。

角度を5度上げた場合の影響を、2017の平均的な選手の数字を使って概算してみます。

100の打球を打った選手を考えます。この選手の打球の構成は、2017年の打球比率から、
おおまかに
GB46, FB22, LD 25, PU7
 とします。そうすると、その打球のwOBAは平均的なwOBAを使って、
(46 * 0.23 + 22 * 0.46  + 25 * 0.67 + 7 * 0.023) / 100 ≒ 0.376
となります。これがこの選手の (そして概ねMLB全体の平均の)、wOBAconです。
角度5°の増加でFBが5%増えて、仮にその分だけGBが減るとすると、
((46-5) * 0.23 + (22 + 5) * 0.46  + 25 * 0.67 + 7 * 0.023) / 100 ≒ 0.388
となり、全てGBがFBになった場合では0.012程度の改善となると試算されます。
しかし、実際にはFBの増加5%に加えて、PU が2.5%増えて、GBが7.5%低下していました。
この比率を当てはめた場合、
((46-7.5) * 0.23 + (22 + 5) * 0.46  + 25 * 0.67 + (7+2.5) * 0.023) / 100 ≒ 0.3824
となり、PUの増加を考慮に入れると、wOBAconの改善は0.006程度なので、FBとGBだけを考えた場合の半分まで効果が低下してしまう計算になります。PUはほとんど無価値な打球であるため、40打球に1回の増加でも、かなり大きな影響を持ってしまいます。

上では2017年の平均的な打球価値を用いて概算を行いました。しかし、打球の価値は年度によっても変わっています。2017年では、2016年に比べてFBの打球価値が上昇していました。この環境の変化による打球価値の変化が、角度上昇による利益に影響するかを見てみます。2016の打球価値を使って概算してみます。
平均的な選手では
(46 * 0.23 + 22 * 0.37  + 25 * 0.73 + 7 * 0.022) / 100 ≒ 0.371
ここで同様にGBが7.5%減ってFBが5% PU が2.5%増えるとすると
(38.5 * 0.23 + 27 * 0.37  + 25 * 0.73 + 9.5 * 0.022) / 100 ≒ 0.373
0.002程度と、ただでさえ小さい2017の数値で見られた効果が、1/3まで低下するという結果です。このことは、年度間で実際に見られる程度の打球の価値の変動が、角度上昇の効果をそれなりに左右する可能性を示しています (実のところ16→17のFB価値の変化はめったに起こらないぐらい大きいと思いますが)。

ここまで平均的な打球価値の選手について見てきましたが、FBの価値が高い選手について考えてみます。
試みにFBのwOBAが0.6の打者で同様に計算してみます。Statcastの数値から計算するとFBのwOBAはStantonで0.75強、Troutで0.55程度なので、0.6はかなりのエリートです。
この打者の打球のwOBAは
(46 * 0.23 + 22 * 0.6  + 25 * 0.67 + 7 * 0.023) / 100 ≒ 0.407
GBが7.5%減ってFBが5% PU が2.5%増えると
(38.5 * 0.23 + 27 * 0.6  + 25 * 0.67 + 9.5 * 0.023) / 100 ≒ 0.420
当然角度を挙げることの価値は平均的な打者よりも高くなり、0.013と平均的な打者の2倍にもなりました。FBの価値が高い選手は、平均的な打者よりは、角度を上げることで大きな利益を得られる可能性がありそうです。しかし、この上昇の大きさは、FBの価値が高い事自体によるwOBAの上昇(0.407- 0.376 = 0.0301) に比べれば半分以下です。角度の上昇による追加的な貢献の増加は、FB自体の価値を上げるような変化に比べると影響は小さいようです。これは前回示した、打球速度の方が打球角度よりも影響が大きいという結果と一致しているのかもしれません。

上の概算では各選手が角度を変えても、各打球タイプごとの価値は変わらないことを前提としています。この点を確認するために、下は各選手の全打球の角度差と、打球タイプ別のwOBAの差をプロットしています。

FBとLDではわずかに傾きが正ですが、とりあえずほとんど変わっていないと言えると思います (FB: R ≒ 0.1, p = 0.1583; LD: R ≒ 0.07, p = 0.3316; 注2)。ちゃんとした結論を出すにはもう少しサンプルが必要なところかと思われます。

ここまでは打球の話をしてきましたが、得点への影響全体の評価を考えると、三振、四球の頻度の変化を評価しなければなりません。

下は角度の変化とK%の変化の関係を示しています。

相関は非常に弱く (r = 0.185, p = 0.007)、傾きをそのまま信じても、比較的大きな変化である角度5度の上昇でも1%弱に過ぎません。平均的には、100打席に1回、打席の価値が0になる程度の影響ということです。

これも線形回帰の傾きから影響を概算してみます。
平均的な、1打席でwOBA0.33を稼ぐ選手の100打席を考えます。
この選手のwOBAは
0.33 * 100 / 100 = 0.33
となります。ここで1%が三振 (wOBA = 0)になると、
0.33 * (100 - 1)  / 100 = 0.3267
 0.0033の低下です。

打球価値の概算で見られた影響の大きさと比較してみます。
打球は平均的には、打席数のだいたい2/3程度だと思われ、2017の平均的な価値では打球100で0.006程度の改善があったので、打席100ではwOBAは
0.006 * 2/3 = 0.004
程度の増加となります。K%の増加はこの価値の上昇から-0.0033を減じる、つまり8割程度を相殺します。打席数のたかだか1%程度の増加でも、三振は価値が0であり、さらに打席数は打球に比べて数が多いため、案外馬鹿にならない結果になってしまいました。K%の増加を考慮しても、2017の打球価値ではかろうじて打球の価値上昇がK%の増加よりも大きくなっているようですが、2016の打球価値で考えればK%の増加は打球価値の上昇 (0.002 * 2/3) よりも大きくなり、全体としてはマイナスにすらなってしまいます。

角度変化とBB%変化の関係を示します。
傾きとしてはわずかに正ですが、有意差はありませんでした。とりあえず無視してしまいますが、サンプルを増やしていけばわずかながらwOBAにも影響があるかもしれません。

2016-2017における角度増加の影響に関する概算のまとめ。

  1. 角度の増加はGBの低下とFBの増加に加えてPUの増加を伴っており、これが打球の価値の上昇をかなり抑えてしまった可能性がある
  2. 角度の増加に伴い三振もわずかに増えており、角度を上げることによる価値の大きさと比べた時に、無視できない程度に価値を下げているかもしれない
  3. 角度の増加の価値は、打者個人のFBの価値や、環境全体のFBの価値の上昇にある程度依存しうる
ここまでに示したデータの非常に大きな問題はとして、データを16-17に絞ったため、全体的にはサンプル数がかなり足りていないと考えています。正直なところ、例えばもう一度2016-2017をやり直して同じように測定した時の効果の推定としても、多少信用できないと思っています。年度ごとの癖なども多少あるでしょうし、他の年でどれぐらい同じ結果が出るかはさらに怪しいところがあります。

本稿では角度が変化した時の影響を調べて、上のような傾向が確認できました。実は、FB%を使って2010-2017で同じような解析をすると、似たようにFB以外の打球価値の低下やK%の増加が観察できましたが、やや異なります部分もあります。特に大きな違いとしては、PUの増加は認められず、代わりにLDが低下することで結果的にFB以外の打球の価値が低下していました。さらに、FB%が増加した時には、FBのwOBAが増加する傾向が確認できました。これらの違いがなぜ起きたのかは今のところ中の人はあまり理解できていませんが、後者に関してはサンプル数の違いが効いているかもしれません。このFB%を使った結果については、稿を改めてまとめて次の記事に書いています。暇な方はどうぞ。

今回調べていないパラメータでも、角度の上昇で望ましくない結果になっているようなものがある可能性もありますが、ここで示した打球の質の低下、三振の増加の影響は、打球角度を上げることで期待される効果と比較してそれなりに大きく、角度をあげても打撃成績が伸び悩んだ主要な要因であっただろうと考えています。また、ここでは基本的に両年度である程度のサンプルサイズを持つ選手について調べたので、より打席数が少ないような選手で同様なのかはわかりません。

ここまではリーグ平均的な選手への影響を見てきましたが、一部の選手では角度を上げることで特に大きな利益を得られるかもしれません。このような選手はどのようにして探すことができるでしょうか?上で行った概算では、FBの価値が高い選手選手はそうでない選手に比べて、打球角度を上げることによる得点貢献の増加が大きい可能性が示されており、このような選手は候補になるかもしれません。しかし、前回、打球の角度が上がった選手の中で、長打力 (ISO) が高い選手でも必ずしも打球のwOBAが上昇してはいないことを示しました。まずは、これを説明する必要がありそうです。

まず前提として、上の概算で示した通り、かなりFBの価値が高い選手でも角度を上げることによる追加的な利益がそれほど多くない、という結果は重要です (とはいえ、上の概算の長打力高い選手で見たように、5度の角度上昇でwOBAconが0.01改善するならば、1年単位では得点にしてプラス4点前後ぐらいの貢献になり得るため無視するにはそれなりに大きいとも言えます) 。また、他の重要な要因としては、ここまで挙げたことに加えて、実のところ一年程度のサンプルサイズでの個人のwOBAの変化はBABIP (フィールド内に飛んだ打球が安打になる確率) によって主に左右されているという事実も挙げられます。

下は打球の角度の変化とwOBAの変化をプロットし、色でBABIPの変化を示してます。

wOBAの上がった選手ではBABIPが上昇していたことがはっきりとわかります。より直接的にBABIP差とwOBA差をプロットすると下のようになります (注3)。

はっきりした相関が見えます (R = 0.822, p < 0.0001)。この結果は、少なくとも打球100以上程度のサンプルサイズをもつ選手に関しては、wOBAの違いのかなり部分はBABIPの変化で説明できる可能性を示しています。

ここでBABIPは少なくとも確率的に推測される程度の分散を示すと思われますが、このばらつきがもつ影響の大きさを考えてみます。仮に真のBABIPが0.3で打球200である選手を考えると、66%がおさまる範囲は0.3 ± 0.0325程度とざっくり推定できます (注4)。これを上の図と合せてみると、BABIPのばらつきだけでwOBAconが0.05程度は違ってくることはそれほど珍しくないことになります。概算でみた限り、打球角度の効果はそれよりも十分に小さく、そのために効果がほとんど見えないのはある意味当然です。とは言え、単年単位のサンプルの少なさに由来するばらつきの大きさを嘆いていても仕方が無いというところもあります。実際、仮にサンプルサイズを5年、あるいは10年単位程度まで大きくして、BABIPのばらつきの影響を小さくすれば、特にFBの価値が高い打者にとっては、打球角度をあげることはある程度の効果があることが確認できるかもしれません (注5)。

他にも考えるべき要因は残されています。今回の概算では打球タイプの変化が全ての打者で等しく起こることを想定していますが、仮に長打力が高い選手ではPUがより増えやすいなどというような傾向があれば、サンプルサイズを大きくしてもやはり期待ほどには上昇しない可能性も考えられます。逆に、角度を上げてもPUが増えにくいなど打球価値の低下が小さい打者がいれば、FBの価値がそれほど高くなくても、角度を上げることの利得は多少大きくなる可能性もあります。

このような、角度を上げる、あるいは下げることによる、打球価値の変化の違いをある程度考慮に入れて、各打者にとって適切な打球角度を推定する方法をTangotigerが提示してくれています。

Tangotiger, Statcast Lab: What is the ideal launch angle for every batter?, 2017.
http://tangotiger.com/index.php/site/article/statcast-lab-what-is-the-ideal-launch-angle-for-every-batter

これは打球のwOBAを、角度に関して大きめの幅で移動平均値を取っていき、その移動平均wOBAが最大になる角度を調べるという、はっきり言ってしまうと極めて単純なものです。下はTangoが例として挙げたDavid Ortizの打球について、計算してみた結果を示しています。
この図は、Ortizの打球の角度について全打球の1/3のグループとしてまとめ、wOBAの平均を取ってプロットしています。この図から、19度程度を中心とした打球1/3 (上下1/6ずつ) の打球の平均wOBAが最も高かったことがわかります。この方法では、仮にある角度を狙った時に、打球が狙った角度からずれた場合に各選手で実際に生じたペナルティーの大きさが考慮に入っています。そのため、単純ですがそれぞれの選手におけるwOBAconを最大化する角度を推定する方法として、少なくとも理屈から言えばある程度妥当性がありそうです。また、この理想角度に比べて角度が大きく低い打者は打球角度を上げる価値が高い可能性などもあるかもしれません。

正直なところ、これもいい方法とはあまり言い難いと思っていますが、次はこの方法を色々と試してみます。というわけで、もうちょっと続くんじゃよですが、今回はここまで。

<参考>
Statcast  https://www.mlb.com
____________________________________________________________________
(注1)
HRの増加に加えて、おそらくはMLBの分類系でLDの一部がFBに分類されるようになった結果も含まれているだろうと思います。後者は正直あまりありがたくない要素ですが、とりあえず目を瞑るとします。これに関しては以前このブログで説明しています。
https://sleepnowinthenumbers.blogspot.jp/2017/12/blog-post_30.html

(注2)
本文でも後で触れていますが、実はFB%の増加と、FBのwOBAが増加には相関があったようです。おそらく、打者というものはFB wOBAが高い状態では気持ちよくFBを打ちに行く生き物だということだと思いますが... (つまり、打者は打球角度を、自身の打球価値の変化に応じて以前から調整していたのかもしれない。証拠はないので妄想の域を出ないですが。) 

(注3)
本文では個人内でのBABIP差とwOBA差の関係を示しました。比較のため、異なる選手間のBABIPとwOBAの間の関係をプロットしてみます。
本文で示した個人内でのBABIP差とwOBA差のプロットを比較のため再掲。

下の個人の年度間での差に比べると、上の選手間での差は関係性が弱いことが見て取れます。これは、wOBAのBABIP以外の要素、例えば長打力の差など、が個人間では比較的大きく、個人の年度間での差では個人間で見られるほど大きな差にならないことが影響しているからだと理解できるかと。

(注4)
二項分布 (p = 0.3)の分散からSDを求めて、さらに正規分布に近似している。
つまり、mean ± sqrt(200 * 0.3 * (1-0.3)) / 200

本文での三振についての話でも触れている通り、打球はPAの2/3程度です。また、ABと比較しても3/4程度になります。このサンプルの少なさが打球の結果に関連したデータがイマイチ信用できなくなりがちな原因の一つになっていると思われます。

二項分布を使うことの妥当性について、あるいはサンプルサイズの違いによる影響の大きさについて、イメージを掴むために二項分布 (Binomial distribution) から作成したデータ (p = 0.293; n = インプレー打球 (bip) = 100, 200, 300, 400, or 500を各100,000ずつ計算) と、MLB (1980-2017) で実際に記録された投手の被BABIPを比較してみました。MLB (adjusted)は所属チームの該当年度の被BABIPに関しては補正を行っている。

要約統計量だとこんな感じ。

近いサンプルサイズの結果は、概ね似ているといっていいのではないでしょうか。実際には、実データ (MLB (adjusted)) の方が分散は少し大きくなっていると思われます。これは、少なくとも部分的には、対象の期間でBABIPに長期間での上昇傾向があったり、投手でもわずかながらBABIPをコントロールする能力が存在するであろうことが影響しているはずです。

本文で打者の話をしているのに打者のBABIPを使わなかったのは、打者はBABIPをコントロールする能力が投手よりも明らかに高いため、比較しても何を見ているかよくわからなくなりそうだったから。個人的には、投手の被BABIPは最低限を理解することに関して言えば、ある意味最も理解しやすい指標のようにも思えますがどうでしょうか。

ついでに、成功確率がpの事象をN回行った時に, 確率的にどれだけばらつくかを可視化するだけの簡単なshiny appを作っておきました。お暇な方はどうぞ。
確率的なバラツキ可視化ツール
https://snin-17.shinyapps.io/binomial_sim_app/

(注5)
ちなみに、本文での打球価値を使った概算では平均的な状況を前提にしているため、打球毎のBABIPも平均的な数値で一定となっており、BABIPのばらつきの影響が取り除かれているはずです。さらに追記しておくと、本文では説明しませんでしたが、FBはBABIPが低いので、角度を上げるとBABIPが少し下がる事自体は、当然平均的にはおそらく避けがたいはずです。BABIPのばらつきの影響の大きさに比べればかなり小さいと思いますので、本文では説明は省略しました。また、本文で行った概算ではこのBABIPが低下する点も (当然、同時にFBの長打が多いことも) 考慮に入っているはずです。

サンプルを5-10年と増やしていくのも長期的な数字にすると年齢の変化も考慮に入れないといけなくなってくるので、現実的にはそれなりに難しそうです。一番簡単なのはたまに見る偶数年 vs 奇数年とかでしょうか。

ところで前回示したwOBAconでの回帰分析での上昇の傾きと、上の概算での効果が一致しないのは、部分的には、LD%, BB%, あるいはFB価値の非常に小さい増加を無視したことが効いているはずです。しかし、これだけではまだ足りてなさそうな気もしないでもないので (ちゃんと計算していない)、ここで考慮していない要因が関連している可能性もあるかもしれません。一つの可能性は長打力の高い選手が選択的に角度を挙げた可能性なので、角度を上昇させた選手と下落させた選手で16, 17の成績を集計していみました。

むしろ16年に長打力が低かった選手が、角度を17年で上昇させた傾向が強そうです。これを見る限り、平均への回帰を見ている可能性があるかもしれません。つまり、角度を上げた選手では2016年では偶然の要素で角度が実際に打ちたい角度より低くなって、結果として理想的ではない打球になって長打力が低下してしまっていたのが元に戻ったのかも?ただし、最近のHR surgeは元々長打力がそれほど高くない選手で起こっている、という話もあるので、そうともいいきれないかも。

Albert J, On the Increase in Home Run Hitting, 2017.
https://baseballwithr.wordpress.com/2017/06/19/on-the-increase-in-home-run-hitting/

0 件のコメント:

コメントを投稿