解説系 on Solving Baseball Blog

ピッチモデリング指標の解説

Fri, 24 Oct 2025 00:00:00 +0000

ピッチモデリング指標の解説

Stuff+、BotCmd、PitchPro、近年よく聞くようになったこれらの指標は一般的に「Pitch Modeling（ピッチモデリング）」指標と呼ばれています。

モデリング自体は昔からある概念ですし、もちろん野球においてもモデリングの性質を持った指標は多いです。

ただ、今回解説する、主に投手の出力（プロセス）に基づいたモデリングは、長年セイバーメトリクスを支えてきた打席や投球の結果（アウトカム）に基づいたモデリングとは意味合いに違いがあります。

ピッチモデリング指標とあえて表現する背景にはこのような文脈もあり（多分）、またそれが、プロセス情報の入手が困難だった時代に構築されたモデリング指標とは一線を画す存在となる理由でもあります。

機械学習とは

ピッチモデリング指標は機械学習を活用しています。

そもそも機械学習とは『データから規則性を学習し、未知のデータに対して予測や推定を行う手法』の総称です。

これには線形回帰やロジスティック回帰といった、セイバーメトリクスの文脈で初期から活用されてきた分析手法も含まれます。

ただ、それらをわざわざ機械学習と呼称することは少なく、一般的には Random Forest（ランダムフォレスト）や Neural Network（ニューラルネットワーク）といった、より複雑なアルゴリズムを指していることが多いです。

セイバーメトリクスファンは k-Nearest Neighbor algorithm（k近傍法、k-NN）は聞き馴染みがあるでしょう。

現在主流のピッチモデリング指標は全て、機械学習の手法の一つ、Gradient Boosting Decision Tree（勾配ブースティング決定木、GBDT）を活用しています。

GBDTとは

GBDTは有り難いことに名前がその手法を表しています。『勾配』を使って『ブースティング』を行う『決定木』といった感じですね。

GBDTは初めて聞く方も多いとは思いますので、名前に沿ってできるだけ簡潔にまとめます。

Gradient（勾配）

GBDTのゴールを表しているのがこの語句です。

ここで言う勾配も屋根や道路で使われる傾きと同じような意味です（スカラーではなくベクトルですが）。

そして機械学習における勾配とは、損失関数（予測誤差の大きさを表す関数）の増加方向と大きさを表すベクトルであり、GBDTでは勾配と逆方向に進む＝誤差を減らすことをゴールとする勾配降下法をこの後紹介するブースティング決定木によって実現しています。

勾配降下法については、線形回帰をはじめとし、多くの機械学習で採用されている、言わば土台のようなものです。

GBDTはその勾配降下法の中身が特殊です、という話をこれからしていきます。

Boosting（ブースティング）

ブースティングは『弱い学習器を逐次的に学習・統合することで、全体として高性能なモデルを作る』手法です。

この手法の主眼は、前のモデルの系統的な誤差（バイアス）を後のモデルが修正していくことにあります。

また、弱い学習器を多数使用することで、それぞれのモデルが違う方向に間違ってくれるため、結果的にノイズが平準化され、過学習を防ぐことができます。

GBDTは、このブースティングの過程に先に述べた勾配降下法を取り入れたという点で、機械学習において革新的なアルゴリズムとなりました。

ちなみに、ブースティングのような複数のモデルを組み合わせる手法＝アンサンブル学習には、**モデルの安定性や信頼区間を得ることに焦点を置いている Bagging（バギング）**と呼ばれるものもあります。

逐次的に学習するブースティングとは対照的に並列に学習することで分散（バリアンス）が低減されます。

モデルの性能を高める（バイアスを低減する）ことに焦点を置いているブースティングとともに、統計学的に無視できない観点ですので記憶の片隅に入れておくことをおすすめします。

▶︎フレーミング指標の解説でバギングについても少しだけ触れています

CSAA: Baseball Prospectus

Decision Tree（決定木）

最後に弱学習器としてブースティングに使用している決定木の説明です。

決定木は一言で言うと『条件分岐の繰り返しで予測する』手法です。

上記のイメージ図からも想像できるとは思いますが、決定木は弱学習器を多数作るブースティングにかなり向いています。

分岐の数（深さ）を制限するだけで簡単かつ確実に弱学習器を作れます。上記の図で言うと、最初の pfx_z の条件で分岐を終えるだけで（全くの無能ではない）弱い予測モデルができることは想像しやすいと思います。

また、条件分岐という特徴により特徴量（≒説明変数）のスケーリングが不要になりますし、非線形な関係はもちろん、カテゴリ変数や段階的な関係も捉えやすくなります。野球分析に向いている匂いがプンプンしてきました。

GBDTはブースティングの学習器として決定木を採用し、その高い実用性を実現しています。

野球におけるGBDTの強み

では先述したGBDTの特徴は野球分析においてどのような強みを持つでしょうか。

以下に野球分析において有り難い要素を並べてみました。

特徴量のスケーリングが不要
- 決定木では特徴量の大小関係（順序）に基づいて分割する
欠損値や外れ値の処理が比較的優れている
- 分割に焦点を置く決定木では分布や外れ値の影響を受けにくい
段階的な変数に強い
- 決定木は条件分岐を繰り返す構造なので特徴量間の複雑な関係性に強い
特徴量の交互作用を捕捉できる
- 決定木は条件分岐ごとに異なる特徴量を選ぶため、モデル全体として特徴量間の主要な交互作用を捕捉できる（ライブラリによって制約はある）
カテゴリ変数に強い
- ダミー変数化せずに直接利用でき、次元の増加が抑えられ、多重共線性を起こしにくい（ライブラリによって差はある）
表形式データに強い
- 条件分岐がベースにある決定木と表形式データは相性が良い
無駄な特徴量を入れても精度が落ちにくい
- 勾配に基づいて誤差を修正するため、予測に影響を与えない特徴量は後の条件分岐で選択されにくくなる
大規模データに強い
- 現代のライブラリでは計算効率が極限まで高められている
特徴量重要度を明確に示せる
- GBDTはモデル全体で、各特徴量がどれだけ損失を減少させたか、または予測に寄与したかを累積的に評価できる
解釈性がそこまで低くはない
- 全体像を把握するのは困難だが、他の複雑なアルゴリズムと比較して、予測結果の筋道は比較的理解しやすい
多クラス分類に対応できる
- 勾配降下法の汎用性とブースティングの逐次的な修正により、複数の確率を同時に予測できる

まず注目するポイントとしては事前のデータ整形のプレッシャーが抑えられる点でしょう。

CSAA: Baseball Prospectus

Tue, 06 May 2025 00:00:00 +0000

Baseball Prospectus CSAA（ver.1）解説

捕手のフレーミング評価は野球分析の中では比較的単純で、期待されるストライク率（数）と比較して当該捕手がどの程度ストライクを増やしたかを算出するだけです。この大まかな枠組みはWOWYの時代から各投球座標にアクセスできる現代まで変わってはいませんし、これからも変わることはないでしょう。

今回は、そのストライク獲得貢献の推定について、Baseball Prospectusの手法をなぞっていけば、少し野球に詳しくなれると思うのでやっていきます。

貢献とは誤差

野球ファンの100%がご存じであるように、“理論上は”ストライク判定率は投球座標で決まります。公認野球規則にもそのような記述があるはずです。

ただ、“実際の”ストライク判定率は投球座標“だけ”で説明できないのも野球ファンの99%はご存じであると思います。

その『誤差』が捕手のフレーミング貢献ですが、当然その誤差を生み出したのは捕手のみではありません。その誤差を各要素に適切に分配することが、捕手のフレーミング貢献の精度向上にも不可欠であることも理解いただけると思います。

投球座標のみで説明できない誤差と一口に言っても、その誤差にもタイプがあります。ここでは大まかに2つに分けます。

固定効果

例えばイニングの表裏。ホームチームが守備をするイニングの表と攻撃をするイニングの裏ではストライク確率に“違い”が生じます。

イメージとしては“違い”を明示したい要素です。野球的には他にはピッチカウント、打者や投手の利き手とかですかね。

普通の線形回帰の説明変数が固定効果という認識でも大丈夫です。

ランダム（変量）効果

ここからが肝です。

例えば球審。 MLBでは1シーズンで100人ほどの審判が球審を担当します。この球審というグループの中で各球審のストライク判定率には“ブレ”が生じています。

イメージとしては個体差が存在している集団です。野球的には他には投手や打者といったところでしょう。

普通の線形回帰の変数とは違い、それぞれを集団に属する（母集団の傾向から）ブレを持った個体として扱います。

このタイプ分けがサンプルサイズの異なる変数が互いに絡み合う野球において重要になってきます。

ランダム効果の特性とGLMMの役割

Baseball Prospectusは、誤差を各要素に分配するフェーズで一般化線形混合モデル（GLMM）を利用しています。GLMMではその名の通り、固定効果とランダム効果を組み合わせたモデルを構築できます。

先ほども言ったとおり、野球分析でもよく見る普通の線形モデル（LM、GLM）では、各効果を独立した固定の効果として扱います。ただそれでは実務的な問題と理論的な問題が生じます。

実務的な問題は、捕手100人、球審100人、投手800人、打者1000人をそれぞれ固定効果として扱うような激重モデルの運用は現実的に困難ということです。

理論的な問題としては、固定効果として扱うと、言うなれば完璧な説明を遂行したがるので、それぞれの選手や審判で信頼性が異なるプロ野球において、過剰に責任を帰属してしまいます。簡単な例を挙げます。

捕手A　5000球　平均 +1% のストライク確率誤差

捕手B　2500球　平均 +2% のストライク確率誤差

捕手C　1000球　平均 +5% のストライク確率誤差

この3選手のフレーミング貢献は本当に同じなのか？

固定効果として扱うと上記の『結果』を全て捕手に“そのまま”帰属します。ただ観測される誤差には「捕手に帰属すべきか分からない」誤差も含まれています。文字通りの運や、モデルの限界や、考慮していない他の要素などです。そしてその誤差が占める割合は傾向として、サンプルサイズの小さい捕手ほど大きくなります。

GLMMでは、ランダム効果として扱うと、それぞれの捕手を捕手という（正規分布を持った）グループの中の一つの個体として扱います。これにより、サンプルサイズが小さかったり、一貫した誤差を生み出していないような個体に対して、その分布の傾向を取り入れる量を多くすることができます。いわゆる平均への回帰が、個体に合わせて合理的に働きます。

そして、LMやGLMは多重共線性への対応が上手くないというのも聞いたことがある方は多いかと思います。

現実的なプロ野球のデータ構造では、それぞれを独立した変数と仮定している固定効果のみを扱ったモデルでは、各効果の推定が不安定になります。

大きな共線性があるのは、例えば投手×捕手でしょう。投手の効果を推定したい場合に観測されている誤差には捕手の効果が相当割合混ざります。この時、固定効果として扱うモデルでは、完璧な説明を遂行したいがために各効果の切り分けが困難になります。

ランダム効果として扱うと、各効果を母集団からのブレとして扱うので上記のような信頼性の低い誤差に対して、母集団の傾向を合理的に取り入れることができます。

そして、投手より組む相手の範囲が広く、サンプルサイズも大きい、より信頼性の高い捕手の効果を投手の効果の推定に利用できる点も強みです。

Baseball Prospectus CSAA

文章ばかりで飽きてきたと思うので、モデル例を見て実感を掴んでいただければと思います。

2015年のBaseball Prospectusの記事やFanGraphsでBaseball ProspectusのCSAAについての記述がある記事を参考にします。

まず用意するのは、ベースとなるストライク確率です。記事によると、投球位置、カウント、球種、球場を効果として盛り込んだPitchInfo提供のものを利用しているので以下のようになるでしょう。

1
2
3
4
5


# ベースとなるストライク確率を算出
cs_prob_model <- gam(
 cs ~ s(relative_x, relative_z) + count + pitch_category + home_team,
 family = binomial, data = pitch_data, na.action = na.exclude
)

投球座標を利用するストライク確率予測では、GAM（一般化加法モデル）のような交互作用や非線形性を捉えられるモデルが適しています。実際のところは知りませんが、投球位置は相対的投球座標に、球種は合理性を失わない程度にカテゴリーとして分類しています。

捕手のDRS,rWARの再考(問題提起)

Sat, 02 Mar 2024 00:00:00 +0000

前回の説明系noteで逃げたRerCとそれを採用するrWAR,DRSについての説明＆感想系noteです。前回のRerC以外の守備指標の軽いまとめはこちら⬇

前回→捕手の守備指標まとめ

RerCについて

RerCとは

前回まとめた指標で異質なのはこれかなと思うんですが、後から書くのでインサイドワーク面の評価と逃げた表現をしました。RerCとは何？という部分をネットで拾える少ない情報量からまとめます。

まずは大本営BISの見解から。

The Fielding Bible FAQより(https://www.fieldingbible.com/faq)

ポイントは3つです。

捕手別防御率をもとにしていること
組んだ投手の力量をはじめ、様々な側面を考慮していること
全面的に信頼を与えず平均に回帰させていること

投手の力量や様々な側面を考慮した予想捕手防御率(自責点)が実際の捕手防御率(自責点)と乖離しているときに、その責任をある程度は捕手に負わせようということです。

これを日本ではリードやマネジメント、総じてインサイドワークと呼んでいるのでRerCの説明に使いました。ちなみにBRではRerCを「Catcher Pitch Calling Runs Above Avg」と表現しているので、文字通りリードの指標と訳しても問題ないのかなと思います。

具体的な算出式

大本営の説明で何となくなら算出方法も想像できますが、具体的な算出方法はネットの海でも見つけるのには苦労します。

Catcher Defense - Part 1 - Lee Panas

上記がRerCの具体的な算出方法が書いてある2010年のブログ記事です。The Fielding Bibleに記載のあるRerCの算出方法をまとめてあります。RerCに触れているBISの記事も複数ありますが、ここで紹介されている算出方法との相違点は確認できませんでした。

せっかくなので2023シーズンで驚異的なRerCを稼ぎゴールドグラブ賞も獲得したG.モレノで計算してみたいと思います。

①当該捕手(モレノ)が組んだ全投手のイニング、防御率を用意する

例）Z.ギャレン 210回防御率 3.47

②当該捕手(モレノ)と組んでいる時の全投手のイニング、自責点を用意する

例）Z.ギャレン 117回 40自責点

③当該捕手(モレノ)と組んでいる時の推定自責点と実際自責点との差を出す

例）Z.ギャレン 117/9*3.47-40=5.11

④平均に回帰する

43.9(③の全投手合計)*0.33=14.49

⑤当該捕手のイニング数によってさらに平均に回帰する

14.49*854/1440(フルシーズンのイニング数)=8.59

以上が算出方法ですが球場補正もされているとのこと。モレノのRerCは10.5~~11.4なので平均抑止自責点は-2~~3ほどだったんですかね。

イニング数が少ないほど平均に回帰させる算出方法なので平均抑止自責点がマイナスになるということは主力捕手ほど点を取られていたことを意味するので違和感はあります。

何か僕がミスってるかもしれないし算出方法が変わったかもしれないですけど、2010年時点の算出方法を紹介したかったのでまぁスルーで。

問題点

そもそも「捕手によって投手成績が変わったという現象の責任を捕手に負わせること」だけで濃い議論ができそうですが、一旦その論点は置いといたとしても前述の算出方法には多く疑問が生じます。

・比較対象が平等でもなく平均でもない

言ってしまえば、味方の捕手が自分より自責点抑止能力があるかどうかゲーということです。四捨五入誤差を除けばリーグ合計RerCはゼロになるように調整しているはずですが、(平均と比べているが故にゼロサムになる)他の守備指標とは合計がゼロになる意味合いが違います。厳密に言えば内野のRAAもグレーゾーンですが。

・インサイドワーク以外の守備能力でつく差を考慮していない

例えばDRS - RerC = +10の捕手が自責点を5ほど抑止していた時にも、この捕手のインサイドワーク面はプラスの評価を受けます。DRSの構成指標はもちろんそれぞれ独立していますし独立させるべきですが、このRerCだけは独立しているとは言えないわけです。

捕手の守備指標まとめ

Thu, 29 Feb 2024 00:00:00 +0000

前置き

捕手のrWARやDRSに対する疑問(文句)を書きたくて、その前説として他サイトとの相違点をまとめていたらダラダラと重い前説になってしまったので分割します。前説としては重いですが指標説明系としては特に深掘りもしていないので軽いです。

次→捕手のDRS,rWARの再考(問題提起)

三大データサイトでの捕手の守備評価指標

三大データサイトで主力として扱われている捕手の守備のセイバー指標についてまとめます。

Baseball-Reference

Baseball-Reference(以降BR)ではBaseball Info Solutions(以降BIS)提供のDefensive Runs Saved(以降DRS)の構成要素を個人ページで全て確認できます。

①P.ベイリー個人ページ(https://www.baseball-reference.com/players/b/bailepa01-field.shtml)

ジャイアンツ期待の新人P.ベイリーの個人ページを例に捕手のDRS部分についてのみ確認します。

Rpm･･･Rair,Rrange,Rthrowの合計(頭文字を取ってARTとも言われる)

Rair･･･明らかにゴロとはみなされない内野フライの処理の評価
Rrange･･･Rairに分類されない打球に対する守備範囲(到達能力)の評価
Rthrow･･･Rairに分類されない打球に到達した後の評価

Rbnt･･･バント処理の評価

Rgood･･･他で評価されない良いプレー、悪いプレーの評価

RerC･･･インサイドワーク面の評価

RsbC･･･盗塁抑止、阻止の評価

RszC･･･フレーミングの評価

Rdrs･･･上記指標(Rpm,Rbnt,Rgood,RerC,RsbC,RszC)の合計

頭文字にReferenceの？Runの？Rをつけて捕手のみの指標にはCatcherのCを末尾につけているので若干見づらいですが小文字の部分にのみ注目すれば分かりやすいとは思います(pmはプラスマイナスシステム)。

ちなみにブロッキングの評価はRgoodに含まれています。「P.ベイリーは平均的な捕手と比較してフレーミングや盗塁阻止、打球処理やインサイドワーク面で失点を17点減らし、バント処理やブロッキングを主としたその他のプレーで失点を4点増やしたと推定されている」という見方です。

FanGraphs

FanGraphs(以降FG)ではBIS提供のDRSの他にFRMというフレーミング指標を確認できます。

②P.ベイリー個人ページ(https://www.fangraphs.com/players/patrick-bailey/27478/stats#fielding)

DRSも確認できますが少し表記に違いがあります(RerCはrCERA=CatcherのERA、RgoodはrGFP=Good Fielding Plays)。打球処理に関わるRpm,Rbntは掲載されていないので合計してもズレが生じる点は注意が必要です。

また、同じフレーミング指標でもrSZの11に対してFRMは17.4と差を確認できますが、2019年3月のこの記事通りBISのフレーミング指標は他より偏差が小さくなる算出方法のようです。一応2019~2023シーズンも確認してみましたが相関係数0.93に対し標準偏差は6.6(FRM)と4.8(rSZ)とその傾向は変わっていません。

Baseball Savant

Baseball SavantではMLB Advanced Media提供のStatcastデータから算出した守備指標を捕手では現在4つ確認できます。

③P.ベイリー個人ページ(https://baseballsavant.mlb.com/savant-player/patrick-bailey-672275?stats=statcast-r-catching-mlb)

打球処理以外のフレーミング、ブロッキング、盗塁阻止の得点換算指標と平均ポップタイムの4つです。

Baseball Savantは各指標の詳細まで確認できるのが特徴です。

上記画像でもポップタイムなら握り替えの時間、フレーミングならコースごとの結果などが確認できますし、リーダーボードの方ではブロッキングのコースごとの結果や盗塁阻止のプレーごとの難易度、当該プレーの動画なども確認できます。

やっていることは同じ

一つ一つの指標の詳細算出方法をまとめるのはキリがないし、公開されていない部分も多々あるのでやりませんが共通しているのは平均的な捕手との差を推定しているということです。(RerCについては微妙ですが…)

フレーミングなら様々な側面を考慮した期待ストライク率(数)を算出し、実際のそれと比べ、その差を得点換算するという形。ブロッキングでも盗塁阻止でも同じです。差が出るのは考慮する側面の違いや得点換算の部分や測定方法の違いなどが理由でしょうが、僕個人としては意義のある差だと思っています。投手fWAR vs rWAR、OAA+UZR vs DRSのような違いではないですが。

三大WAR算出サイトの捕手WAR(守備部分)

次は捕手のWARを構成している守備指標の各サイトの違いをまとめます。

Baseball Reference

BRではDRSをWARの守備評価部分に使っていますが、捕手に関しては注意が必要です。

④P.ベイリー個人ページ(https://www.baseball-reference.com/players/b/bailepa01.shtml)