Morikawa Blue: Talking about Pitching Runs Created

Friday, May 05, 2006

Talking about Pitching Runs Created

最近能有這麼多的時間念書，全要歸功於 Dodgers 的比賽讓人從來不想看完全場 (詳細的 Dodger News 請至友台參考)，這裡乾脆來談談 THT 於 06 年搬出的新花樣：Pitching Runs Created (PRC) 吧。

PRC 是由 David Gassko 所發表關於投手的統計量，目前這已經成為 THT Statistics 上的一項參考指標，相關的 derivation 正如 Tradewind 兄的留言 -- THT 從來都完全公開他們的結果讓讀者檢視 -- introduction 在這裡，follow-up 則在這裡。

Gassko 在 introduction 裡提到：當一支球隊有 5-run scored with 1-run allowed 時，winning percentage 是 93.4%；但如果在 5-run allowed 之下，要 maintain 93.4% 的 winning percentage 就需要有 15.4-run scored。基於 "A run allowed is not equal to a run scored"，PRC 於是將這種投手失分的程度換算成和打者的 Runs Created 等價的東西，整個 PRC 的 ground 則是建立在 Pythagorean formula 之上。

Pythagorean formula：

Winning percentage = RS^x / ( RS^x + RA^x ),

Where RS (RA) is runs scored (allowed), x represents an adequate exponent.

Initially，x 的值是 2；historically，x 的 best fit 則是 1.82。BP 的 Clay Davenport 在這個部份則有推導出依 runs environment 的 best exponent，相關文獻在這裡找得到。

且不管 Pythagorean formula 是否為一個符合真實 RS 與 RA 環境的模型，問題在於這個式子不論在 x = 2 或 x = 1.82 都還有不錯的估計結果。在這裡我並不想去爭論關於 Pythagorean formula 的 goodness of fit，先回頭來看看在 BP 在 Mendoza Line 下所得到的啟發、也是最被廣為使用與流傳的 VORP。

在打者的部份，VORP 是基於 Runs Created (RC) 去求得的數字，以 Cubs 的 Derrek Lee 為例，他在 05 年為 Cubs 拿下 95.6 的 VORP，也就是說 Lee 在 05 年為 Cubs 比起一個 replacement level 的選手入替 lineup (Updated at May 7, corrected by Tradewind) 多了 95.6 的 RC。原則上這個 95.6 可能不是很重要，重要的是如何定義所謂的 "replacement level" 的 RC，事實上可以從 Lee 的基本打擊資料求得 05 年 NL 的 replacement level 在 700 個 PAs (這是 Lee 在 05 年的總 PAs) 下大約只有 116.326 的 RC。

還有一個很常見的講法就是 VORP 10 分約可以代表 1 勝，我一直不是很明白這是從何說起 (是不是因為我從來沒有看過 Bill James 的著作？) ，不過我「猜」它是從簡單線性迴歸 (simple linear regresion) 估算 winning percentage 時得來，它的模型是：

W%(winning percentage) = RDG*S + 0.5,

Where RDG is Runs Differential per Game, S & 0.5 represent the slope and intercept respectively.

在 RDG 為 0 時，W% 為 0.5 似乎算是合理的假設；就 all time derive 的結果來看，這個 S 大約是 0.1，換句話說這個模型的型態就可以寫成 W% = (RDG/10) + 0.5。而把這裡的 "10" 看成 runs per win 的話，也許就是 10 分等於 1 勝的主要原因。

回到主題，原始版本的 RC 計算方式很簡單，它只是利用 TB (total bases) 乘上 OBP 而已。不過講到 model reality 的話，RC 就不會是一個很好的統計量。好比說某位打者在 39 個 PAs 裡安全上壘 14 次，得到 18 個 TBs，他的 RC = (14/39) * 18 = 6.46；如果他在下一個 PA 擊出一支 single，他的 RC 立刻就變成了 (15/40) * 19 = 7.125，所以這支 single 的就有 7.125 - 6.46 = 0.665 分的價值？這當然是很詭異的結果！

即使目前的 RC 有幾種不同的版本，但無論如何，它都只是增加了一些 iteration 後得到的係數而已。基本上 RC 建立在一個不太真實的平台之上，衍生而來的 VORP 則只是一種可以拿來比較用的 scale，我可能願意寫 Lee 在 05 年 95.6 的 VORP 代表他比 Alber Pujols 的 88.3 多了 8.3 的 RC，也不願意寫 Lee 比 Pujols 多為球隊拿下 8.3 分。

換句話說，RC 只是因為簡單，所以才被廣泛使用，我們的確可以用 VORP 來評估一位球員在 RC 方面的表現，但不代表 VORP 是評估球員火力的聖經。

回頭看看投手的 VORP，它是基於 RAv (Run Average，為了和 runs allowed 區別而多加了一個 "v") 在談的，重點同樣在於定義 replacement level 的 RAv。概略的計算方式是：

VORP = ( RAvp - RAvr ) * ( inning_pitched / 9 )

Where RAvp (RAvr) is the Run Average of pitcher (replacement level pitcher).

基於 ERA 對於投手的評估過於「仁慈」同時不夠客觀 (基於 error 的判定)，我們有很好的理由在這裡使用 RAv 而不是 ERA。

相較於打者，且不論投手的 VORP 能否代表投手的真實能力，但對於評估球隊的 runs allowed 卻是相當直接。好比說 Roger Clemens 在 05 年為 Astros 拿下 80.2 的 VORP，不考慮 park adjustment、不考慮 defense efficiency，它仍然實實在在的代表 Clemens 在該年 211.1 局的投球可以比同局數 NL 的 replacement level 投手多省下球隊 80.2 分 (05 年 NL 的 replacement level RAv 大約是 5.6 左右)。也就是說，投手的 VORP 比起打者的 VORP 要「真」很多。

那麼，我們究竟有無必要將投手的 runs allowed 給 translate 成打者的 runs created？這是我看完 Gassko 的發表後首先懷疑的問題。他最初的例子也提到投手的 4 runs above average 等於打者的 9.4 runs above average、「漲價」了 235%，但這是兩種完全不同的平台，拿來相提並論實在有點奇怪。不能否認的是 Gassko 在 derive PRC 的過程中導入了像是 DIPS 與 BABIP 等等的好東西來修正，但如果這些修正是做在 RAv 之上，結果不是能更有意義的反映出投手的 performance？

當然，Gassko 的 ground 是 Pythagorean formula，但這仍然是一個大方向而已。在 runs differential 為 0 的情況下，Pythagorean formula 所計算出的 W% 永遠是 50%，但沒有人認為在平手的情況下進入 extra-inning，雙方仍然有相同的機會獲勝；而 run differential 為 1 時，Pythagorean formula 反映出在 3 : 2 時的 W% 是 0.674、5 : 4 時則是 0.599，萬一前者出現在 5th inning、後者是在 8th inning，這裡的 W% 可能也就不會長得這個樣子了。

原則上，個人對於 PRC 的看法大約就是把它當成是投手 VORP 的另一種 scale 就好，要說 PRC 的好處則不在於它本身如何看待 runs scored 與 runs allowed 相對價值，而是它被考慮的方向比起投手的 VORP 要周詳，如此而已。總之，個人不覺得 PRC 是 sabermetrics 裡的一個大發現，至少現階段不是。

5 comments:

Anonymous said...: 在打者的部份，VORP 是基於 Runs Created (RC) 去求得的數字，以 Cubs 的 Derrek Lee 為例，他在 05 年為 Cubs 拿下 95.6 的 VORP，也就是說 Lee 在 05 年為 Cubs 比起一個 replacement level 的選手多了 95.6 的 RC。

應該是Derrek Lee加上八個平均打者組成的打線的RC，比replacement player加上八個平均打者組成的打線的RC多了95.6分。並不是直接套用在單獨球員上。

不過講到 model reality 的話，RC 就不會是一個很好的統計量。好比說某位打者在 39 個 PAs 裡安全上壘 14 次，得到 18 個 TBs，他的 RC = (14/39) * 18 = 6.46；如果他在下一個 PA 擊出一支 single，他的 RC 立刻就變成了 (15/40) * 19 = 7.125，所以這支 single 的就有 7.125 - 6.46 = 0.665 分的價值？這當然是很詭異的結果！

不要用某位打者，而用整個聯盟成績來看的話，就可以用這種多一支一壘安打，多一支二壘安打的plus 1 method得到各個進攻項目的custom run value，這樣就會得到一個linear的run estimation了。不過因為RC的model reality不佳，所以出來的linear weights準不準就很難說了。

原則上，個人對於 PRC 的看法大約就是把它當成是投手 VORP 的另一種 scale 就好，要說 PRC 的好處則不在於它本身如何看待 runs scored 與 runs allowed 相對價值，而是它被考慮的方向比起投手的 VORP 要周詳，如此而已。總之，個人不覺得 PRC 是 sabermetrics 裡的一個大發現，至少現階段不是。

我的意見跟你相反，PRC和投手的VORP並沒有什麼關係，因為投手的VORP說穿了只是runs saved above replacement而已。Gassko說, "we're saying how much would a lineup have to score to win as often as a given pitcher."。PRC的用意在於找出要得幾分才有辦法達到少失分的效果，進而把runs saved轉換到runs scored的scale來，使得投打可以互相比較。

你提到同樣的比分差在不同局數意義不同，但我看不出來這會對畢式公式還有PRC造成什麼問題？; 6/5/06 05:28
Morikawa said...: 應該是Derrek Lee加上八個平均打者組成的打線的RC，比replacement player加上八個平均打者組成的打線的RC多了95.6分。並不是直接套用在單獨球員上。

我想表達的也是 Lee 比一起一個 replacement level 選手在 lineup 裡可以多 95.6 RC 的情況。不過如果算算看，其實只有因為某個 spot 安插了不同的打者所造成整個 lineup 的總 PAs 數不同的些微差距而已。BP 的 VORP (或說 MLV) 有這方面的修正，但是在 PAs 夠大的時候，即使只考慮單一球員，這樣的「偽」 VORP 其實與實際的差距不大。

不要用某位打者，而用整個聯盟成績來看的話，就可以用這種多一支一壘安打，多一支二壘安打的plus 1 method得到各個進攻項目的custom run value，這樣就會得到一個linear的run estimation了。不過因為RC的model reality不佳，所以出來的linear weights準不準就很難說了。

這也是我不覺得打者的 RC 有很大的「具體解釋意義」的問題。那麼有沒有必要將「具體意義」較好的 RA 轉譯成打者的 RC？

你提到同樣的比分差在不同局數意義不同，但我看不出來這會對畢式公式還有PRC造成什麼問題？

PRC 將投手的 runs saved 轉譯成 lineup 的 runs scored 是沒錯的。但就未轉譯前的出發點，基本精神和投手的 VORP 是差不多的，畢竟投手的 run average 不僅是投手 VORP 的基，也是 PRC 的基。

只是轉譯 "One run saved is not equal to one run scored." 的精神是建立在 Pythagorean formula 對 W% 反映出的行為之上，如果換成考慮 "One 'critical' run scored may be worth as several runs scored." 的情況，inning-insensitive 的 Pythagorean formula 的 ground 就要被懷疑。

如果一個統計量的 derivation 在過程是完美的，但結果卻不盡然令人滿意的時候，那只有一種可能：它的假設有錯誤！而最可能出錯的地方就是 Pythagorean formula 在 PRC 上的運用。

所以我認為 PRC 是將投手的 RA 轉成另一個 scale 再加上一些「必要」的校正，和單純看投手的 VORP 相比他的好處是在那些「校正」而不是如何「scale」。將 PRC 的 ranking 和投手 VORP 的 ranking 相較，呈現出來的結果很可能就是球隊的 Defense Efficiency 與投手本身的 BABIP...etc 這些 hidden variables 所造成的影響而已。; 7/5/06 02:20
walaykao said...: 不過講到 model reality 的話，RC 就不會是一個很好的統計量。好比說某位打者在 39 個 PAs 裡安全上壘 14 次，得到 18 個 TBs，他的 RC = (14/39) * 18 = 6.46；如果他在下一個 PA 擊出一支 single，他的 RC 立刻就變成了 (15/40) * 19 = 7.125，所以這支 single 的就有 7.125 - 6.46 = 0.665 分的價值？這當然是很詭異的結果！

RC 是一個非線性的 fitting model，拿它來計算小樣本失真的可能性會很高，畢竟這超出了它的適用範圍。光是看 model reality 的話，現有的數據大概也只有 BaseRuns 勝過 RC 吧。

另外，所謂的 critical run 這種跟情境相關的數據 (like WPA) 和 Pythagorean formula 的出發點完全不同，並不能因為 "critical run matters a lot" 就推翻畢氏公式。

就理論上來說，衡量 PRC 所用的方法是「對勝率的貢獻」，只不過是把它轉換到跟打擊貢獻有相同的「單位」。投手的 VORP 則是單純的計算投手的 Runs Allowed（或許我們可以稱之為 apparent runs allowed）跟 replacement player 之間的差距。兩者的出發點也很不一樣。; 10/5/06 22:16
Morikawa said...: 並不是用 critical situation 去推翻 Pythagorean formula，這的確是不正確的 approach。單純的說，我不喜歡這個東西。

PRC 的理論在於 runs saved 與 runs created 在 "Pythagorean formula" 下的關聯性，一個問題是如果沒有任何的 RS，RA 再低都無濟於事。一場 1:0 的比賽，我認為投手壓低 RA 的貢獻與打者打下致勝分的貢獻，似乎不是簡單的 Pythagorean Formula 的概念可以互通的東西。

Pythagorean formula 是由 empirical data 所 derive 出來的東西，它是挺準的一項工具，但單從長相來看，幾乎看不出什麼意義。

而 Pythagorean Formula 既然是從大環境所 fit 出來的 model，那麼它一定經過不少的 iteration 才回歸到目前的狀態，也就是說，Pythagorean 代表的是一個 regression mean 狀態下的預測。那麼，它是否適用於預測像是 Twins 的 Santana -- 這種有「勝利保証」的 Ace？

換個角度說，利用 Pythagorean Formula 預測而產生較大誤差的時候，通常都是那些 standing 在前面的球隊，相較於 Santana 的 outstanding，他的 "pitching environment" 是否適用在 Pythagorean Formula 的 cover 下，就是更令人懷疑的問題。

Pythagorean Formula 的使用似乎規範不到單一選手的表現。

Still，PRC 拿 Pythagoren Formula 的 "W%" 做為 translate RA to RC 的基準，我個人的感覺是沒有必要，也不會有很大的意義。VORP 的確立意和 PRC 不同，但兩者都是從 RA 得來，同時 VORP 的 scale 是真實的；PRC 的 scale 卻只能建立在比較之上。基本上，我覺得這樣的 translation 並沒有太大的意義。; 11/5/06 03:48
Andre said...: My 2 cents on this.

http://tinyurl.com/kg262; 4/6/06 12:28

Morikawa Blue

Friday, May 05, 2006

Talking about Pitching Runs Created

5 comments:

About This Blog

Odds and Ends

Think Google

Dodger Baseball

ML Baseball

MiL Baseball

ML Bloggers (in Chinese)

Comprehensive Sites

Chart & Tool

Miscellaneous Sites

Blog Archive

Labels

About Me