2017年10月7日土曜日

MLBにおける各イニングごとの得点とかの話2

MLBにおける各イニングごとの得点とかの話の続きです。今回は1イニングあたりの得点のに影響をあたえる要因をいくつかまとめてみます。

図1にMLB00-16の各イニング表/裏での平均得点を示しました。得点は前回示したものと同じです。表/裏の全体の典型的得点に対する変化率を示すために、それぞれ3-5回の得点の平均で割った値をあわせて示しています。

図1.
Inn: イニング
Top_RPI: 表の平均得点
Top/mean(3-5): 表の平均得点を3-5回の得点の平均で割った値
Bot_RPI: 裏の平均得点
Bot/mean(3-5): 裏の平均得点を3-5回の得点の平均で割った値

ぱっと見て、表でも裏でも、イニング毎の平均得点がかなり変化していることがわかります。野球の試合は、メンバー表レベルで見れば、概ねずっと同じ選手が関わっていることになりますが、実際には、それぞれのイニングでは各選手が関わる程度が違ったり、あるいは前回書いたようにアウトカウントが少ないイニングがあったりします。そのため、イニングはそれぞれ異なる起こりやすい状況を持っており、イニングの得点傾向に個性が生じうる可能性が考えられます。

このデータを見て気になる点として、初回に裏の得点が多いこと、2回に得点が少ないことが挙げられると思います (注1)。2回の傾向は表、裏である程度共通しており、少なくとも2回の傾向は基本的には、ホームアドバンテージとの関連がない影響だと予想されます (初回にホームとビジターで得点の変化率が結構違うのは後で触れます)。

これらの傾向に対する最も単純な説明は打順の状況が異なること (初回は1番からの得点産生に優れた打順で、2回は得点産生に劣る下位打線に差し掛かっている可能性が特に高い) だと思われます。しかし、なんらかの他の要因、例えば初回では謎の力によって打者の能力が向上したり (あるいは2回ではお腹が空いて力が入らないとか?)、投手というものは一般に立ち上がりが悪いために初回に能力が低下したりする傾向がある、などが関わっている可能性も否定はできないかもしれません (注2)。

そこで、打順が持っている1, 2回の得点傾向への影響の程度を計算してみます。実際に計算するのは計算機 (ウチのMacBookPro Mid 2012) ですが。

打順の影響をざっくりと取り出す一つの方法として、試合をシミュレーションすることが考えられます。ここでは、打席ごとに各塁上ランナー+アウトカウントの状態がどう変化するかをモデル化します  (マルコフ連鎖モデル) 。状態が変化する確率は、MLBでにおける各打順の平均的な確率を計算して利用しています。これにより、「仮に」全てのイニングで各打順の能力や、投手の能力が一定の場合の、各イニングにおける得点を計算できるはずです。

詳細は省きます (注3にまあまあ詳しい説明あり) が、基本的なイメージは、
  1.  表/裏の打順ごとに、その打順における平均的な能力をもった打者を並べて、
  2.  1番打者から試合が始まり、9番の後は1番に戻る、という打順の性質、
  3.  3アウトでアウトカウントとランナーがリセットという野球の基本的なルール、
だけを考慮した時に、イニング毎の得点がどうなるか、を推定している感じです。投手も平均的な投手が投げているイメージです。

このシミュレーションの中では各打順は、イニングが変化しても常に一定の能力を示すため、主に打順の影響を取り出してくることができるはずです。

表と裏での各打順での能力差を示したいのですが、実際に計算で利用した各打順での状態変化の確率を全て示すのは難しいので、代わりに各打順の実際のwOBAを示します。
図2.
BAT_LINEUP_ID: 打順
wOBA_vstr: 表側の攻撃でのwOBA
wOBA_vstr: 裏側の攻撃でのwOBA

ここで示しているのは、イニングの表と裏での各打順での実際のイベントから求めたwOBAです。その年度の全打者のwOBAを集計して、その打撃成績から各打順での期待される平均wOBAを計算すると、表と裏の各打順で差はほとんどありません (データは示していない)。つまり、図2で示した、wOBAの表と裏の差はおそらくホームアドバンテージの影響です。また、表と裏いずれでも3, 4番に特に強打者がおり、1, 2番も平均以上であることが確認できます。

図3にモデルから計算された平均得点を示しました。



図3.
Inn: イニング
Avg_Top_RPI: 表の攻撃による平均得点
Top/mean(3-5): 表の攻撃による各イニングの得点を3-5回の平均得点で割ったもの
Avg_Bot_RPI: 裏の攻撃による平均得点
Bot/mean(3-5): 裏の攻撃による各イニングの得点を3-5回の平均得点で割ったもの

下は図1を比較のため再掲。


1-3回くらいの得点に注目すると、概ねモデル (図3) と現実 (図1) の傾向は一致しているようです。これはホームでもビジターでも確認できます。この結果から、初回に得点が多いこと、2回に得点が少ないことは、概ね打順による影響ということでいいのではないかと思います。しかし、1回表の得点が増えすぎているように見えるとか、4回以後の得点・3-5回の平均得点で割ったものがモデルと現実で一致していないとか、打順だけでは説明できない部分もあるようです。

これらの結果を説明できそうな過去に報告された要因として、イニングが進むにつれて、投手と打者の相対的な力関係が変化する、というものがあります。

The Bookにおいて、先発投手は全体的傾向としては、早いイニングにおいて打者に対して相対的に大きなアドバンテージをもっていることが示されています。具体的には、例えば、打順の巡りごとのwOBAを調べて、打順が回っていくたびに、3巡目までwOBAが上昇していくことを示しています (pp. 186)。
実際の数値はを引用します。
1巡目: 0.345
2巡目: 0.354
3巡目: 0.362
このような数値の変化は
1. 投手の能力の変化 (疲れ etc.)
2. 打者の能力の変化 (投手への慣れ etc.)
のいずれか、あるいは両方が関わっている可能性があります。

モデルではこのような影響は全体に等しく分配されているため、1巡目からずっと投手/打者間の相対的な力関係は一定になっているはずで、現実と比較した時に、1巡目の得点が高く、3巡目では低く、なっているはずです。実際、モデルにおいて得点は1回表の得点が増えすぎていますし、4-6回くらいでは現実よりも低いように見えます。というわけで、初回などで3-5回の平均で割った値がモデルと現実で一致しないのは、ある意味当然です。 (注7にこの傾向を使って試しに軽く補正してみた結果があります。)

この影響によって1回では得点が減っているはずにも関わらず、現実の1回表においても得点が3-6回などに比べて減っていないということは、打順による得点増加と、打者/投手の1巡目効果が偶然に釣り合っている可能性が考えられます。

もう一つ、実際のMLBの数値で気になる数値としては、初回において、ホーム側の得点がビジター側に比べて、特に高いことが挙げられます (図1; 1回では差が0.1点ぐらいなのに対し、それ2-8回では0.03-0.05点くらいの差)。実際に高いのであれば、ホームアドバンテージが特に初回において顕著に発生していることを示唆しており、なかなかおもしろい傾向ではないでしょうか。当然、昔から目をつけている人がいるようで、ぱっと調べてもいろいろ記事が出てきます。

例えば、最近だと
https://www.fangraphs.com/blogs/first-inning-home-field-advantage/
http://retrosheet.org/Research/SmithD/HomeTeamScoringAdvantageRelatedToTime.pdf
特にJeff Zimmermanによる前者はなかなかおもしろい記事だと思います (後者はちょっと...)。

大まかに言うと、ビジターの先発投手は試合に入るまでの待ち時間が長くなるとコンディションが悪くなる、ということに原因が求められているようです。

具体的には、表の攻撃が5分以上になると、裏の投手の速度がわずかながら低下するような傾向があるようです  (注8)。能力的な部分への影響に関して、実際に示されているのは速球の速度だけで、これによって初回の得点の違いを説明できるかに関しては、そこまで大きな効果は無いと考えているようです。他にも能力的な部分で変化があってもおかしくは無さそうですし、そこまで考えれば結構説明できるのかもしれません。

ホームアドバンテージ自体は様々なスポーツに広く見られますが、このようなことが起こるには、ホーム/ビジターで攻守が明確に非対称性があり、さらに一部のポジションで試合に入るまでに体を冷やすようなラグがあるスポーツに特有だと思われ、メカニズムとしては結構面白いように思います。逆にいえば一般性に乏しい可能性が高いですが、条件に当てはまるスポーツを探してみると、意外に見つかるかもしれませんし、見つからないならないで、見つからないということも含めて、ホームアドバンテージの全体の理解に繋がると思います (注9)。

というわけで、まとめです。
イニングあたりの得点のパターンに変化を与える要因としては、少なくとも以下のものがあるようです。
1. 打順
    初回の得点を増やし、2回の得点を減らす
2. 打者と先発投手間の力関係
    1-2回の得点を減らし、リリーフと交代するまで少しずつ得点を増やす
3. 初回に特に大きいホームアドバンテージ
    1回の裏の攻撃の得点を増やす
4. 3アウトになる前に試合が終わるイニング
 9回以後の裏のイニングの得点を減らす
この辺を全部考慮すると、得点の変化の大部分はまあまあ説明できてるんじゃないかなあ、といったところです (他にも代打とか、効果の大小はともかく、影響を与える要因自体は色々あるかもしれませんが)。

2, 3については、なぜそういう効果が生じるのかという部分はまだ十分理解されてないような印象です。適当にググった程度なので、そんなに詳しく調べたわけではないですが。

2は効果もそこそこ大きい (1巡目と3巡目では打席1つあたり0.015くらい平均得点が高い) 上に、先発投手を早めに降ろしてしまうといった投手起用で、好ましい効果を取り出せる可能性がある部分でもあります。Mike Petrielloは最近の記事で、プレーオフにおけるこの効果に注目しています。特にプレーオフのような、シーズン中よりも投手に多少の負担を増やすような起用法も可能な状況では注目すべき部分かもしれません。
http://m.mlb.com/news/article/256023252/starters-wont-go-deep-in-2017-playoff-games/

初回のホーム/ビジターの差については、モデルの方の結果 (図3) もなかなか興味深いんですが、少しややこしい。解釈については、いずれ書くかもしれません。

_______________________________________________________________________
注1:
孫引きで大変恐縮ですが、James Clickによると (Baseball between the Numbers, pp. 36)、Bill Jamesは1988のBaseball Abstractの中で、この2回での得点低下を示して、3番打者には出塁率の低い選手を置くべきだと書いたそうです (2回の先頭打者に最もなりにくい打者に出塁率の低い選手を配置することで、2回の先頭打者の出塁率を上げて、2回の得点を増やしたい、と考えたらしい?) 。現代風のモノサシ (PAで補正した打順毎の各イベントの得点価値) の前の前の時代の話、といったところでしょうか。

注2:
実際にはこれぐらい簡単な要因なら、計量すればすぐにある程度わかりそうですが。

注3:
今回のモデルでは、MLB00-16年の全イニング表と裏における、各塁上のランナー+アウトカウント状態 (25通り) から、次のランナー+アウトカウント状態へと移る平均的な確率を各打順で計算し、これをそれらの打順の打者の能力的なものとして利用しました (データはRetrosheetから集計)。

 実際のシミュレーションの過程は、例えば、1番打者がノーアウトランナー無しでイニング表に打席に立つと、67%で1アウトランナー無しとなり、25%でノーアウト1塁になる、といった確率が計算できるので、その確率に従って打席ごとに新しい状態をサンプリングし、二番打者がその新しい状態で打席に入る、といった具合で進んでいきます。

モデルを使う利点の一つは、非常に多くの試合数の得点を計算できるため、与えられた条件のもとでイニング毎に「得点が変化するかどうか」だけでなく、「どれほど変化するのか」を精密に推定することが原理的には可能なことです (ここでの精密さは、あくまで与えた条件の元での結果の推定を精密 (precise) にできる、ということで、現実を正確 (accurate) に表すという意味ではないです)。実データから得られた平均確率に従って得点産生過程を500,000試合分計算し、打順の影響を量的に評価しました (注4, 注5)。

各打順における遷移確率は、投手のFIPがある程度同じ値を示す1-5回での各打順での確率を用いました (各イニングのFIPについては先週の記事参照)。6回以後は、おそらくは主にリリーフ投手の影響で、投手のFIPが低いため含めなかった。使用したモデルは、Marchi and Albertで記述されたMLB平均の状態遷移確率を使って1イニングの得点を計算するモデルを書き換え、打順を実装して、それらがそれぞれ異なる遷移確率を持つようにし、1試合を計算するように書き換えたもの。ちなみにNPBだと状態遷移確率はふつう手にはいらないと思いますが、状態遷移を打撃イベントのサンプリング+進塁規則に分解して書き換えれば、ざっくりした評価ぐらいには使えると思います。モデルのもう少し具体的な説明はコチラ
https://sleepnowinthenumbers.blogspot.jp/2017/10/blog-post.html

 このモデルでは、初回は1番打者から開始して、現実に近い確率でイベントが進んでいきます  (注6)。このため、仮に初回に得点が高いことが、高い能力を持った打者が初回に集中することであれば、このモデルにおいても、初回に得点が高くなると期待できます。

また、打順以外は平均的な状況を考慮しているため、どのイニングで打順が回ってきても、与えられた状況が同じであれば、それぞれの打順は全く同じ能力を示してくれます。例えば、現実世界において初回でのみ3番打者が謎の力によって好結果が出ていることが初回の得点が多い原因であった場合、この傾向は計算上全てのイニングにおける3番打者に等しく分配されることになり、初回の高得点は見られなくなるはずです。ただ、この方法も完璧ではなく、あくまで平均を取ることでありうる効果を全打席に散らしているだけなので、ある程度効果が残る可能性があります。例えば、初回に何らかの理由で打順以外の要素で得点が入りやすくなっている場合、効果の1/4か1/5程度が初回にも残るのでそこは多少問題です。

注4:
今回は500,000試合だから、この手の計算としてはかなり少ない方だと思います。とはいえ、現実の試合数を基準とするとかなり多く、まあまあ精密なはずです。現実のMLB 00-16 (約41300試合) での点推定もそんなに正確では無いと思いますし、そんなに計算量増やすのもなあ、と。
モデルの結果を、サンプルのMLB試合数にだいたい合わせて50,000試合ずつに分けてそれらの平均を10個をプロットするとこんな感じ。
図4.

現実では、チーム間、年度間、など様々な要因で1試合ごとに戦力差があり、平均的な状態遷移確率がモデルとおなじであっても、これよりも多少ばらつきが多いはずです。実際のSEをおおまかに知りたければ、得点/イニングの分散は平均得点の2倍ぐらいであることが知られているので、
SE = mean *2 * 1 / sqrt(イニング数)
となり、40,000イニングなら平均得点の約1/100に、仮に500,000イニングなら平均得点の約1/350になってるはずです。

注5:
今回は普通の野球のルールで計算していますが、各回ランナー1, 2塁から始めてタイブレークの影響を調べても構わないし、なんなら4アウトルールへの改変だってできるはずなので、たいていの影響は調べたければある程度調べられるんじゃないかと思います。

注6:
Retrosheetの記録上で、打席と数えられたイベントによって起こった状態変化の確率を計算している。打席内で起こる変化 (SB, CS etc.) は無視していますが、1イニングの得点の計算なら、基本的に影響はあまり大きくないはずです (RE24とかだと一部少し乖離する)。
ただし、イニングで状態の遷移確率が一定、という仮定は多少間違いであることが過去に既に報告されている (注7参照) ので、現実を忠実に模しているというわけではないです。あくまで、仮にそうであったらどうなるか考えてみましょう、ということです。

注7:
実際には、The Bookの結果から考えると現実から乖離しているはずで、現実に媚びていくためにはもう少し補正が必要です。

どういう変化によって1巡目で投手から見て結果がよいことにつながるか、一応書いておくと、主にはKが増えて、四球は少し高いがHRは少し低い、という感じのようです。投手側からの数値で見て、FIPでやってもそれなりに似た結果になるような効果だと思います 。

注意点としては、4巡目ではwOBAの数値は上昇せずに、むしろ2巡目と同等まで低下することも示されています。この変化は巡目ごとの投手能力と打者能力を年度成績を使って調整をしても残っているそうなので、おそらく一部の投手では巡目が進行してもあまり変化が大きくなく、実際の起用ではこのような選手が特に4巡目で多く投げている、ということだろうと思います、多分。

引用したThe BookのwOBAの数値と、Mike Petrielloの記事中のwOBAの数値がかなり異なるのが気になったしれませんが、これはThe Bookでは投手打席、バントやIBBを除いており、Petrielloの記事ではこのあたりの処理が違うためだと思われます。

閑話休題。
モデルにおける1, 2回の得点に対して、巡目ごとのパフォーマンス変化に関するざっくりした補正を試してみます。
実際にThe Bookで報告されているwOBA値としては、
1巡目に対して0.345、
2巡目に対して0.354、
3巡目に対して0.362
です (自分が扱った期間で集計した数字の方が望ましいですが、多少面倒な上にあまりきれいな補正にはできなさそうで、やる気がしなかった)。

表と裏での違いは調べられていないので、仮に表と裏で効果が均一であるとします。
1, 2回の数値が1巡目で、補正に使った対象イニングの数値が2巡目で近似できるとすると (やや胡散臭い近似です)、モデルでは1-5回の平均値を取っているので、
(0.345 * 2 + 0.354 * 3) /5 = 0.3504
くらいのwOBAになっているはずです。そのため、
(0.3504-0.345) * 4.3 / 1.15   = 0.0202
4.3は1イニングあたりのだいたいの打者数、wOBAのスケール補正の値は1.15とした。
以上の計算から、現実の1, 2回では、モデルよりもだいたい0.0202点/イニングくらい平均得点が低くなっているはずです。

モデルにこの補正値を入れてみると、
1表: 0.513, 2表: 0.429
1裏: 0.594, 2裏: 0.468
となります。下に図1を再掲。

これにより、1表で現実の値とほぼ一致し、1裏では推定得点は少なすぎるという結果になります。これでやっと、本文で述べた1裏の投手のコンディション不良で1回の表/裏での得点差が生じる、という仮説と、整合的な結果になった、といえるかもしれません。しかし、2回の結果は下がりすぎており、全てがうまくいっているとは言い難いようです。

2回は表でも裏でも下がりすぎているのは、一つには2回は2巡目の打者が出てくるくらいイニングが進んでいるため、補正が強すぎるという可能性が考えられます。 あるいは、上の補正のやり方自体が適切でない可能性もあります。モデルと現実の差ぐらい小さい影響だと、ちょっとした補正のミスだけで結果がかなり変わります。補正を改善するなら、ここでの目的にとって扱いにくい巡目ではなく、イニングに関して現実のwOBAの変化を測定してみるといいかもしれません。しかし、根本的には、得点の点推定自体がおそらくそんなに正確ではない (特に現実の数万試合程度のデータ; 図4) ので、細かいところまで一致しないのはあんまり気にしてもしょうがない感じかな、と (4万試合というと多そうですが、イニングごとのsplitなので大した量ではないです)。

ついでに書いておくと、MLB実データ (図1) で7-8回ぐらいでそれまでのトレンドよりも得点が少ないのもおそらく、
  1. リリーフにスイッチしたことでFIP自体が低下すること、
に加えて、
  2. 年度FIPのわりに結果が悪い先発から、FIP通りの働きをするリリーフになったこと、
が大きく効いているような気がします。どれぐらい説明できそうかまでは確認してませんが。

注8:
Jeff Zimmermanのfangraphs記事中で図の軸ラベルと本文の説明が一致していないように思われるが、本文が正しいと仮定しています。

注9:
ホームアドバンテージ全体の知識はほとんどないので、こういうのが調べられているのかはわかりません。個人的にぱっと思いつくのはアメフトでしょうか。アメフトの知識は99.9%がアイシールド21由来という感じなのですが。Moskowitz and Wertheimによると、NFLではキッカーが蹴る前にタイムアウトを取るのは一般的な嫌がらせとしてわりとあるらしいですが、成功率低下を示す再現性のある結果は確認されていないようです。この場合は体を冷やすというより、精神状態を乱すという意図のようですし、時間も90秒程度らしいので体が冷えるというほどではないかもしれません。

<参考>
The Baseball Prospectus, BASEBALL between the NUMBERS, 2006, edited by Jonah Keri, Basic Books.
M. Marchi and J. Albert, Analyzing Baseball Data with R, 2013, CRC press.
T. Tango, M. Lichtman, and A. Dolphin, The Book , 2007, Potomac Books.
T. Moskowitz and J. Wertheim (邦訳 望月衛), SCORECASTING , 2011, Crown Archetype (邦訳版 ダイアモンド社).
稲垣理一郎 (原作) 村田雄一 (作画) , アイシールド21, Vol.1-37, 2002-2009, 集英社.
http://retrosheet.org

0 件のコメント:

コメントを投稿