投手と打者の強さをBradley-Terryモデルで①

ある投手とある打者が対戦した時に、ヒットになる可能性はどれくらいだろう、
と考えてみると、
単純に打率を見ただけではわからない。
打率はあくまで、その打者がそれまでに対戦してきた結果でしかないからだ。

といったところで、投手の強さ、打者の強さがわかると
なんとなく計算ができるような気がする。

そこで先の記事で書いたようなデータを収集して、
打者と投手の対戦結果をまとめている。
この結果を使って、Bradley-Terryモデルを使ったら、
投手の強さ、打者の強さが推定できるのでは、とふと思ったのである。

Bradley-Terryモデルについては
[R] Bradley-Terry model を用いてプレイヤー間の勝敗予測を行う | Developers.IO

http://www.ise.chuo-u.ac.jp/ise-labs/taguchi-lab/pdf/bachelor/2006/r2006_tamura.pdf

を参照である。
正直なところ、ほとんど理解はしていない。

今回は前回収集したデータ形式を(交流戦終了時まで)
ヒット、四死球なら打者の勝ち、
凡打なら投手の勝ち、
として計算を行っている。

Bradley-Terryモデルは、
上記の論文の2.32-2.34式を実装している。

今回の対象選手は、
投手に関しては65対戦以上、打者に関しては35対戦以上、
の対戦結果が残っている選手だけとしている。
あまり対戦結果が少なすぎると変な結果になるからだが、
ここで足切りをしている根拠はあるわけではない。適当である。
(試合数が現時点で65試合程度、というのは若干ある)

計算結果の上位30選手投手編はこちら。

巨Pマシソン 0.00925779
西P牧田 和久 0.00886314
DP山﨑 康晃 0.00833788
ソPサファテ 0.00774104
中P田島 慎二 0.00767384
ソP岩嵜 翔 0.00761731
楽P美馬 学 0.00721432
広P中田 廉 0.00704321
楽P福山 博之 0.00691287
中P岩瀬 仁紀 0.00673476
ヤP秋吉 亮 0.00670174
ロP内 竜也 0.00664855
オP吉田 一将 0.00640868
西P菊池 雄星 0.00626094
楽P松井 裕樹 0.00614154
ヤP小川 泰弘 0.00594624
楽Pハーマン 0.0058464
広P床田 寛樹 0.00581362
日P鍵谷 陽平 0.0058098
ソP千賀 滉大 0.00576664
西Pシュリッター 0.00573868
広P岡田 明丈 0.00571478
巨P菅野 智之 0.0056624
DP井納 翔一 0.00564968
楽P岸 孝之 0.00564496
オP黒木 優太 0.00561143
ヤP原 樹理 0.00558502
西Pウルフ 0.00555555
阪P髙橋 聡文 0.00549512
中P又吉 克樹 0.00541012

一方打者編はこちら。

日B近藤 健介 0.00653568
西B秋山 翔吾 0.00365323
広B丸 佳浩 0.00365323
オBT-岡田 0.00323847
DB筒香 嘉智 0.00323112
ソB内川 聖一 0.00308824
阪B糸井 嘉男 0.0030629
DB宮﨑 敏郎 0.0030397
ソB柳田 悠岐 0.00299378
広B新井 貴浩 0.00297482
巨B坂本 勇人 0.00294658
ヤBバレンティン 0.00289664
広B田中 広輔 0.00289138
広Bエルドレッド 0.00288231
中B大島 洋平 0.00286667
阪B鳥谷 敬 0.0028614
巨Bマギー 0.00285822
西B渡辺 直人 0.00277986
楽B三好 匠 0.00274763
阪B上本 博紀 0.00273266
ロB井口 資仁 0.00272242
ヤB坂口 智隆 0.00270844
巨B陽 岱鋼 0.0026825
ロB角中 勝也 0.00266387
ヤB山田 哲人 0.00264073
ヤB雄平 0.00263779
広B鈴木 誠也 0.00263631
日B矢野 謙次 0.00260109
ヤB畠山 和洋 0.00258032
オBロメロ 0.0025205

今回見ているのが、単純に出塁だけなので、
はやりの「長打力」とかは反映されていない。
だからこれを「強さ」と言っていいのかというと、それは違うんではないか。
ちなみに
投手と打者とは、3打席で1回ヒットが出ればいいような力関係なので、
投手のほうが全体的に大きな値にはなっている。

たとえば、楽天の松井祐樹から、巨人のマギーが出塁する確率は

p=\frac{0.00285822}{0.00614154+0.00285822}=0.3176
と計算できる。
なんとなく、そんなもんかあ、という感じはする。

が、データ数が少なすぎるからか、選手数が多すぎるからか、
そんな有意な差が生まれにくいからか、
そもそもプログラムがどっか違っているからか、
原因はわからんが、
強さの数値がどの選手も非常に小さい。
本当にこれであっているんだろうか。

もう少し遊んでみたい。

なにかお気づきの点などございましたらご教示ねがいたい。