ホームランダービーに悪影響はあるか

はじめに

ホームランダービーの季節が近づくとダービーの悪影響を憂うファンが散見され、気が向いたセイバリストがそれを検証した記事を出すというのは最早お決まりの流れとなっています。

とは言え、近年は先行研究を引用して「ダービーは後半戦の成績に影響しないよ」だけで終わっている節があると個人的に感じていますし、日本語での分析はnamikiさんのものしか認知していませんので、貴重な日本人セイバーメトリクス好きとして再検証していきます。

MLBは2015年シーズンからStatcastシステムを全面導入し、打球速度や Sprint Speed といった選手の能力に迫ることのできる指標やプレーの細部をより深く説明できる情報を入手できる環境が整いました。

そしてタイムリーなことに、MLBのホームランダービーのレギュレーションがアウト制から時間制になったのも2015年です。

アウト制の頃のホームランダービーでも"ダービーは打撃に悪影響を及ぼす"といった言説は確認できますが、時間制になったことでその勢力に加勢した方々も少なくないでしょう。

日本人的には、標高1600mで息を切らし、(休憩はありますが)5分間で68もの"ホームラン狙いの"スイングをした、2021年大谷翔平が後半戦に打撃成績を落としたことは記憶に新しい方も多いのではないでしょうか。

前説が長くなりましたが、ダービーが時間制になり、Statcastデータも入手できる2015年以降に絞ってホームランダービーの影響について調べてみたいと思います。


ダービー出場者は後半戦に成績を落としているか

はじめに、ダービー出場者が後半戦に成績を落としているかという基本的な前提を検証していきます。

念のため、下記に2015年以降のダービー出場者の一覧を記載します。

ホームランダービー出場者一覧

参考程度に前半戦のHR%とwRC+も(HR%の平均は約3%)

前後半の成績比較

まずは単純に、前後半の成績をダービーに出場していなかった選手と比較してみます。(打席数がある程度揃うようにサンプリングしています)

前後半の成績比較

色付きは統計的有意性あり(有意水準 0.05)

ダービー出場者の後半戦の成績下降が確認できます。 ただ有意な差が確認できたのはHR%とそれに付随する長打率、wRC+ の成績下降です。ダービー出場者は後半戦に打球部分の打撃成績が低下していることが確認できます。

対して、ダービー非出場者は後半戦の成績低下は確認できません。 むしろ、HR%の上昇傾向が確認できます。

ダービーの時期が毎年7月中旬であることを記憶している方は、7月下旬から8月といった気温の高い(空気密度の小さい)時期が含まれる後半に打撃成績が落ちるといった現象は観測されないと察していたでしょう。

では打球部分で成績を落としていたダービー出場者は具体的にどのような打球プロファイルの変化があったのでしょうか。

打球プロファイルの変化

色付きは統計的有意性あり(有意水準 0.05)

有意な差が確認できるのはHR/FBPull%(引っ張り率)、基本的な打球分類に変化はありませんがフライ打球がスタンドインする確率が2%ほど下がることにより、HR%が減少しています。

引っ張り打球が増加する傾向がありますが、この傾向に負の側面を感じるか、その逆を感じるかは意外と分かれる気はします。少なくともセイバーメトリクスに興味のある最近のMLBファンなら正の側面を感じるでしょう。

対して、ダービー非出場者はもちろん、夏場が多く含まれる後半戦にHR/FBが下降するといった傾向は確認できませんでした。

大きな差ではありませんが**FB%(フライ率)**が増加し、結果的にHR%も増加する傾向にあるようです。基本的にFBは打者の"勝ち"であり、打席を積み重ねていき"慣れ"てくる後半戦にそのような傾向が観察できることに意外性はありません。(対戦投手に対する慣れが蓄積されやすいNPBではもう少し強く傾向が出ているかもしれません)

と、ここまでダービー出場者と非出場者の前後半の成績を簡単に比較してきました。

実際のところ、ダービー出場者は後半戦に成績を落としています。 ただ、この結果をもってして『ホームランダービー』の悪影響として結論付けるのは早計でしょう。

成績が似ている選手との比較

では、肝にいきましょう。

どのような検証でも必要になるのが、条件を揃えるということです。

例えばテレビ視聴率からその番組の人気度を測りたいのなら、時間帯や曜日、裏番組などを揃えないと不公平ということは最低限の情報リテラシーのある方なら理解しているはずです。

ということで、ホームランダービーの影響を測りたい今回はどうでしょうか。

知りたいのはダービー非出場の成績ではありません。ダービー出場者がダービーに出場していなかった仮想世界です(もしくはその逆も)。

もちろんそんな世界は用意できないので、ダービーに出場していた"かも"しれない、ダービー出場者と前半戦の成績が似ているダービー非出場者を抽出します。

方法としては代表的なものでもいくつかありますが、今回は結果的に一番類似度が高く抽出できた、ユークリッド距離を使います。

抽出した類似選手216人の前半戦成績を以下に示します。

類似選手の前半戦成績

ではこのダービー出場者に似ているダービー非出場者は後半戦に成績を落としているのでしょうか。

類似選手との成績比較

色付きは統計的有意性あり(有意水準 0.05)

ダービー出場者と同じくHR%、長打率、wRC+で有意な差が確認できました。

エンタメ性重視で選手の健康など考えず、打撃フォームにも悪影響が出るはずのホームランダービーを欠場しても成績が下降してしまっています。

では、打球部分も見てみましょう。

類似選手の打球プロファイル

色付きは統計的有意性あり(有意水準 0.05)

ここが、今回注目するポイントです。

ダービー出場者と同じようにHR/FBが下降していますが、Pull%の増加は観察できません。

ホームランダービーはスローボールをどれだけスタンドインさせるかを競う、言わば、人外でない限りどれだけ引っ張りフライを打てるかの競技ですから、その影響と考えやすい結果ではあります。

ではダービー出場者と非出場者の前後半の成績変化の違いに統計的有意性はあるでしょうか?

成績変化の差の検定

色付きは統計的有意性あり(有意水準 0.05)

察していたとは思いますが、Pull%にのみ、有意な差が確認できます。 少なくともPull%の変化はダービー出場者とそれに類似度の高いダービー非出場者との間で有意に差がありそうです。

ちなみに、箱ひげ図でPull%の変化を比較したものが以下になります。

Pull%変化の箱ひげ図

赤がダービー出場者

Pull%の変化の集団間の差異が、偶然では説明しづらいという状態が視覚的にイメージできるかなと思います。


打球の変化の影響を考える

ここまでは FanGraphs、BIS 提供の整えられたデータを使って分析してきました。ここからは Statcast データを用いてPull%、そして水平打球角度の変化についてもう少し考えてみます。

Pull%の推移比較

まずはPull%の推移を比較してみます。

Pull%の推移比較

赤がダービー出場者

ダービー非出場者の安定感に対して、ダービー出場者は後半戦の前半にPull%が増加しています。ダービーの影響と考えやすい結果ではあります。

ただ、前半戦の前半も視界に入れると、また別の交絡因子の存在の可能性も否定できないかと思います。もちろん、もっと期間を分割することは可能ですが、それは信頼性の低下とセットではありますので、一旦次に行きます。

10分類における変化

ダービー出場者が後半戦に引っ張りが増えることは確認できました。

では、引っ張りと言ってもどのような引っ張りが増えたのでしょうか?

MLBで近年注目度が高まり、上昇傾向にある引っ張りフライが代表的ですが、ゴロやフライといった打球分類の中でも水平角度によってその打球価値には差が生まれます。

PU(ポップフライ)以外のGB(ゴロ)、LD(ライナー)、FB(フライ)を水平角度でも分割し、打球価値の違いを見ておきましょう。

PullCentOppo
PU.018
FB.870.313.237
LD.739.592.621
GB.209.277.370

wOBA by Batted Ball Type(2021 - 2024 MLB) Data: Baseball Savant

特にFBでの打球価値の差が顕著になっているのが確認できます。一口にPull%が増加したと言っても、FBのPull%が増加したのか、GBのそれかでは野球的にプラスにもマイナスにもなるということが伝わったかと思います。

では、この10分類の前後半の割合変化を見てみましょう。

10分類の前後半変化

ダービー出場者は特にPull GB%が増加していることが分かります、とするのは微妙でしょう。そもそもの発生確率の高いPull GBは後半戦に1.05倍になっていますが、Pull FBも1.08倍になっています。

野球的な価値に落とし込んでも、Pull GBが1.2%増加することによる損失は、Pull FBが0.6%増加することによる利益を相殺できないのは先に示した表で十分に分かるかと思います。

対してPull%の増加傾向が確認できなかったダービー非出場者は価値の高いPull FBが減少し、価値の低いPull GBが増加しています。

本当に『ホームランダービー』に"悪"影響はあるのでしょうか?

少なくとも打球分類的な視点では軽微とはいえ、むしろ好影響の可能性すら示唆されています。

水平角度が及ぼす打球価値の変化

では、「ホームランダービーが後半戦の水平角度に影響を及ぼす」という前提で、「ダービー出場者がダービーに出場していなかった」仮想世界と**「ダービー非出場者がダービーに出場していた」仮想世界**を作ってみましょう。

以下、今回の手法です。思ったより長い文章になったのでしんどくなったら結果まで飛ばしてください。

まず、ダービーに出場していなかった(していた)場合の後半戦の期待水平打球角度を各打球ごとに算出します。

ダービー出場者は非出場者と比べて水平打球角度が後半戦に平均して1度ほど下がります(基本的に水平打球角度は流し方向がプラスとして運用される)。

この平均値を利用しても良いんですが、局所的に水平打球角度が変化している場合にも対処するため、水平打球角度の各パーセンタイル区間の変化を適用します。

具体的にはダービー出場者、非出場者でそれぞれ水平打球角度のパーセンタイル値を取得し、各パーセンタイル区間で前後半の水平打球角度の変化を集計します。それをダービー出場者の後半戦にはダービー非出場者の変化傾向を、ダービー非出場者の後半にはダービー出場者の変化傾向を取り入れます。

そして xwOBAcon を利用します。

一般的に xwOBAcon と聞くと、Baseball Savant が公開している、打球速度と垂直打球角度の2つを説明変数とした k-NN(k近傍法)から期待される wOBAcon(にゴロや弱い打球においては GAM で Sprint Speed を考慮したもの)を思い浮かべるかと思います。

ここでは、打球速度と垂直打球角度に加えて、水平打球角度も変数に加えた 3VxwOBAcon を使います。

そして、後半戦の各打球の水平打球角度について、実際の水平打球角度とは別に先ほど述べたダービーに出場していなかった(していた)場合の期待水平打球角度も使います。

そうして求めた Adjusted(Adj.)3VxwOBAcon実際の 3VxwOBAcon を比較し、ダービー出場によって変化する水平角度による打球価値への影響を測ります。

Adjusted(Adj.)3VxwOBAcon と 3VxwOBAcon を比較したものが以下です。

1st Half 3VxwOBAcon2nd Half 3VxwOBAcon2nd Half Adj. 3VxwOBAcon
Derby.433.414.412
Non-Derby.418.403.405

ホークアイデータ(2021 - 2024)のみで学習 Data: Baseball Savant

ダービー出場者の後半戦の 3VxwOBAcon が .414に対して、ダービーに出場していなかった場合に期待される 3VxwOBAcon は .412です。

ダービー非出場者がダービーに出場していた場合の 3VxwOBAcon も実際の .403に対して .405となっています。

平均して1度程度の水平角度の変化はほとんど打球価値に影響を及ぼさないことが分かります。

むしろ、先に述べた通り、水平角度が下がることは良い影響を及ぼす可能性の方が高いでしょう。

打球速度の変化

ちなみに、ここまで触れてこなかった打球速度の変化ですが、こちらも後半戦に統計的に有意に下がるものの、高類似度のダービー非出場者も同じように下がっています。

打球速度の前後半変化

Adj. EVの前後半の変化の比較

もちろん数多の先行研究でも触れられていることではありますが、やはり随所に平均への回帰を感じることのできる結果になっています。

ホームランダービーに出場する選手は基本的に前半戦にホームランを多く打った選手であり、その"結果"には後半戦にも不変の能力以外の誤差が含まれています。あえて大衆に伝わりやすい表現を使うと、この場合の誤差は上振れ方向の誤差である可能性が高いです。その不安定な誤差により平均への回帰が起こります。

これはホームランダービーだけに限らず、“上振れた"選手が選ばれやすい WBC 等の影響を考察する際にも忘れてはいけない視点です。


まとめ

まだまだ調べ足りないですが、納期(ホームランダービー:日本時間 7/15 午前9時)も過ぎてしまったのでまとめます。

  • ダービー出場者は後半戦に成績を落とす
  • ダービーに出場していたかもしれない高類似度選手より成績を落とすとは言えない
  • ただ高類似度選手より引っ張り打球が増える傾向にある
  • この引っ張り打球の増加は打球の価値、被打球の価値に有意に悪影響を及ぼしていない

今回ホームランダービーの分析をするにあたり、改めて先行研究をザッと見返しましたが、引っ張り打球の増加について述べてある文献が少なかった(個別事例はいくつか紹介されていた程度)ので、note にまとめてみました。

ホームランダービーに限らず、ある出来事がもたらす影響、その影響の損益について分析する際にヒントとなる視点がこの note に隠れていることを願って、筆を置くことにします。


おまけ

先ほど深堀りしなかったPull%の期間推移ですが、期間を8分割するとこうなります。

Pull%の8分割推移

赤がダービー出場者

この推移を見ると、「ホームランダービーがきっかけになって引っ張りが増える」というよりは、**「引っ張りの上昇傾向がある選手ほどダービーに出場する」だったり、「ダービー出場を意識し始めてからPull%が上昇する」**といった、直接的ではないダービーの影響の可能性もあるのではないかと思えてきます。

先行研究の多いテーマではありますが、まだまだ調べる余地は残っているかもしれません。

またダービーだけに限りませんが、引っ張りが増えることの影響もまだまだ深堀りできるはずです。

予定としてはこの note で引っ張りが増えるリターンの大きい打者や逆にリスクの大きい打者の特徴まで調べる気でいました。はい。

またそれは次に気が向いたときにしますが~~(そんな分かりやすい傾向はなさそうでした)~~、ここまで読んでくださった、僕と同じAspiring Saberistにも期待しておきます( ゚∀゚ )


先行研究

トレバ-(^o^)丿
Built with Hugo
Theme Stack designed by Jimmy