Friday, May 05, 2006

Talking about Pitching Runs Created

最近能有這麼多的時間念書,全要歸功於 Dodgers 的比賽讓人從來不想看完全場 (詳細的 Dodger News 請至 友台 參考),這裡乾脆來談談 THT 於 06 年搬出的新花樣:Pitching Runs Created (PRC) 吧。

PRC 是由 David Gassko 所發表關於投手的統計量,目前這已經成為 THT Statistics 上的一項參考指標,相關的 derivation 正如 Tradewind 兄的留言 -- THT 從來都完全公開他們的結果讓讀者檢視 -- introduction 在 這裡,follow-up 則在 這裡

Gassko 在 introduction 裡提到:當一支球隊有 5-run scored with 1-run allowed 時,winning percentage 是 93.4%;但如果在 5-run allowed 之下,要 maintain 93.4% 的 winning percentage 就需要有 15.4-run scored。基於 "A run allowed is not equal to a run scored",PRC 於是將這種投手失分的程度換算成和打者的 Runs Created 等價的東西,整個 PRC 的 ground 則是建立在 Pythagorean formula 之上。

Pythagorean formula

Winning percentage = RS^x / ( RS^x + RA^x ),

Where RS (RA) is runs scored (allowed), x represents an adequate exponent.

Initially,x 的值是 2;historically,x 的 best fit 則是 1.82。BP 的 Clay Davenport 在這個部份則有推導出依 runs environment 的 best exponent,相關文獻在 這裡 找得到。

且不管 Pythagorean formula 是否為一個符合真實 RS 與 RA 環境的模型,問題在於這個式子不論在 x = 2 或 x = 1.82 都還有不錯的估計結果。在這裡我並不想去爭論關於 Pythagorean formula 的 goodness of fit,先回頭來看看在 BP 在 Mendoza Line 下所得到的啟發、也是最被廣為使用與流傳的 VORP

在打者的部份,VORP 是基於 Runs Created (RC) 去求得的數字,以 Cubs 的 Derrek Lee 為例,他在 05 年為 Cubs 拿下 95.6 的 VORP,也就是說 Lee 在 05 年為 Cubs 比起一個 replacement level 的選手 入替 lineup (Updated at May 7, corrected by Tradewind) 多了 95.6 的 RC。原則上這個 95.6 可能不是很重要,重要的是如何定義所謂的 "replacement level" 的 RC,事實上可以從 Lee 的基本打擊資料求得 05 年 NL 的 replacement level 在 700 個 PAs (這是 Lee 在 05 年的總 PAs) 下大約只有 116.326 的 RC。

還有一個很常見的講法就是 VORP 10 分約可以代表 1 勝,我一直不是很明白這是從何說起 (是不是因為我從來沒有看過 Bill James 的著作?) ,不過我「猜」它是從簡單線性迴歸 (simple linear regresion) 估算 winning percentage 時得來,它的模型是:

W%(winning percentage) = RDG*S + 0.5,

Where RDG is Runs Differential per Game, S & 0.5 represent the slope and intercept respectively.

在 RDG 為 0 時,W% 為 0.5 似乎算是合理的假設;就 all time derive 的結果來看,這個 S 大約是 0.1,換句話說這個模型的型態就可以寫成 W% = (RDG/10) + 0.5。而把這裡的 "10" 看成 runs per win 的話,也許就是 10 分等於 1 勝的主要原因。

回到主題,原始版本的 RC 計算方式很簡單,它只是利用 TB (total bases) 乘上 OBP 而已。不過講到 model reality 的話,RC 就不會是一個很好的統計量。好比說某位打者在 39 個 PAs 裡安全上壘 14 次,得到 18 個 TBs,他的 RC = (14/39) * 18 = 6.46;如果他在下一個 PA 擊出一支 single,他的 RC 立刻就變成了 (15/40) * 19 = 7.125,所以這支 single 的就有 7.125 - 6.46 = 0.665 分的價值?這當然是很詭異的結果!

即使目前的 RC 有幾種不同的版本,但無論如何,它都只是增加了一些 iteration 後得到的係數而已。基本上 RC 建立在一個不太真實的平台之上,衍生而來的 VORP 則只是一種可以拿來比較用的 scale,我可能願意寫 Lee 在 05 年 95.6 的 VORP 代表他比 Alber Pujols 的 88.3 多了 8.3 的 RC,也不願意寫 Lee 比 Pujols 多為球隊拿下 8.3 分

換句話說,RC 只是因為簡單,所以才被廣泛使用,我們的確可以用 VORP 來評估一位球員在 RC 方面的表現,但不代表 VORP 是評估球員火力的聖經。

回頭看看投手的 VORP,它是基於 RAv (Run Average,為了和 runs allowed 區別而多加了一個 "v") 在談的,重點同樣在於定義 replacement level 的 RAv。概略的計算方式是:

VORP = ( RAvp - RAvr ) * ( inning_pitched / 9 )

Where RAvp (RAvr) is the Run Average of pitcher (replacement level pitcher).

基於 ERA 對於投手的評估過於「仁慈」同時不夠客觀 (基於 error 的判定),我們有很好的理由在這裡使用 RAv 而不是 ERA。

相較於打者,且不論投手的 VORP 能否代表投手的真實能力,但對於評估球隊的 runs allowed 卻是相當直接。好比說 Roger Clemens 在 05 年為 Astros 拿下 80.2 的 VORP,不考慮 park adjustment、不考慮 defense efficiency,它仍然實實在在的代表 Clemens 在該年 211.1 局的投球可以比同局數 NL 的 replacement level 投手多省下球隊 80.2 分 (05 年 NL 的 replacement level RAv 大約是 5.6 左右)。也就是說,投手的 VORP 比起打者的 VORP 要「真」很多。

那麼,我們究竟有無必要將投手的 runs allowed 給 translate 成打者的 runs created?這是我看完 Gassko 的發表後首先懷疑的問題。他最初的例子也提到投手的 4 runs above average 等於打者的 9.4 runs above average、「漲價」了 235%,但這是兩種完全不同的平台,拿來相提並論實在有點奇怪。不能否認的是 Gassko 在 derive PRC 的過程中導入了像是 DIPSBABIP 等等的好東西來修正,但如果這些修正是做在 RAv 之上,結果不是能更有意義的反映出投手的 performance?

當然,Gassko 的 ground 是 Pythagorean formula,但這仍然是一個大方向而已。在 runs differential 為 0 的情況下,Pythagorean formula 所計算出的 W% 永遠是 50%,但沒有人認為在平手的情況下進入 extra-inning,雙方仍然有相同的機會獲勝;而 run differential 為 1 時,Pythagorean formula 反映出在 3 : 2 時的 W% 是 0.674、5 : 4 時則是 0.599,萬一前者出現在 5th inning、後者是在 8th inning,這裡的 W% 可能也就不會長得這個樣子了。

原則上,個人對於 PRC 的看法大約就是把它當成是投手 VORP 的另一種 scale 就好,要說 PRC 的好處則不在於它本身如何看待 runs scored 與 runs allowed 相對價值,而是它被考慮的方向比起投手的 VORP 要周詳,如此而已。總之,個人不覺得 PRC 是 sabermetrics 裡的一個大發現,至少現階段不是。

5 comments:

Anonymous said...


在打者的部份,VORP 是基於 Runs Created (RC) 去求得的數字,以 Cubs 的 Derrek Lee 為例,他在 05 年為 Cubs 拿下 95.6 的 VORP,也就是說 Lee 在 05 年為 Cubs 比起一個 replacement level 的選手多了 95.6 的 RC。


應該是Derrek Lee加上八個平均打者組成的打線的RC,比replacement player加上八個平均打者組成的打線的RC多了95.6分。並不是直接套用在單獨球員上。


不過講到 model reality 的話,RC 就不會是一個很好的統計量。好比說某位打者在 39 個 PAs 裡安全上壘 14 次,得到 18 個 TBs,他的 RC = (14/39) * 18 = 6.46;如果他在下一個 PA 擊出一支 single,他的 RC 立刻就變成了 (15/40) * 19 = 7.125,所以這支 single 的就有 7.125 - 6.46 = 0.665 分的價值?這當然是很詭異的結果!


不要用某位打者,而用整個聯盟成績來看的話,就可以用這種多一支一壘安打,多一支二壘安打的plus 1 method得到各個進攻項目的custom run value,這樣就會得到一個linear的run estimation了。不過因為RC的model reality不佳,所以出來的linear weights準不準就很難說了。


原則上,個人對於 PRC 的看法大約就是把它當成是投手 VORP 的另一種 scale 就好,要說 PRC 的好處則不在於它本身如何看待 runs scored 與 runs allowed 相對價值,而是它被考慮的方向比起投手的 VORP 要周詳,如此而已。總之,個人不覺得 PRC 是 sabermetrics 裡的一個大發現,至少現階段不是。


我的意見跟你相反,PRC和投手的VORP並沒有什麼關係,因為投手的VORP說穿了只是runs saved above replacement而已。Gassko說, "we're saying how much would a lineup have to score to win as often as a given pitcher."。PRC的用意在於找出要得幾分才有辦法達到少失分的效果,進而把runs saved轉換到runs scored的scale來,使得投打可以互相比較。

你提到同樣的比分差在不同局數意義不同,但我看不出來這會對畢式公式還有PRC造成什麼問題?

Morikawa said...

應該是Derrek Lee加上八個平均打者組成的打線的RC,比replacement player加上八個平均打者組成的打線的RC多了95.6分。並不是直接套用在單獨球員上。

我想表達的也是 Lee 比一起一個 replacement level 選手在 lineup 裡可以多 95.6 RC 的情況。不過如果算算看,其實只有因為某個 spot 安插了不同的打者所造成整個 lineup 的總 PAs 數不同的些微差距而已。BP 的 VORP (或說 MLV) 有這方面的修正,但是在 PAs 夠大的時候,即使只考慮單一球員,這樣的「偽」 VORP 其實與實際的差距不大。

不要用某位打者,而用整個聯盟成績來看的話,就可以用這種多一支一壘安打,多一支二壘安打的plus 1 method得到各個進攻項目的custom run value,這樣就會得到一個linear的run estimation了。不過因為RC的model reality不佳,所以出來的linear weights準不準就很難說了。

這也是我不覺得打者的 RC 有很大的「具體解釋意義」的問題。那麼有沒有必要將「具體意義」較好的 RA 轉譯成打者的 RC?

你提到同樣的比分差在不同局數意義不同,但我看不出來這會對畢式公式還有PRC造成什麼問題?

PRC 將投手的 runs saved 轉譯成 lineup 的 runs scored 是沒錯的。但就未轉譯前的出發點,基本精神和投手的 VORP 是差不多的,畢竟投手的 run average 不僅是投手 VORP 的基,也是 PRC 的基。

只是轉譯 "One run saved is not equal to one run scored." 的精神是建立在 Pythagorean formula 對 W% 反映出的行為之上,如果換成考慮 "One 'critical' run scored may be worth as several runs scored." 的情況,inning-insensitive 的 Pythagorean formula 的 ground 就要被懷疑。

如果一個統計量的 derivation 在過程是完美的,但結果卻不盡然令人滿意的時候,那只有一種可能:它的假設有錯誤!而最可能出錯的地方就是 Pythagorean formula 在 PRC 上的運用。

所以我認為 PRC 是將投手的 RA 轉成另一個 scale 再加上一些「必要」的校正,和單純看投手的 VORP 相比他的好處是在那些「校正」而不是如何「scale」。將 PRC 的 ranking 和 投手 VORP 的 ranking 相較,呈現出來的結果很可能就是球隊的 Defense Efficiency 與投手本身的 BABIP...etc 這些 hidden variables 所造成的影響而已。

walaykao said...

不過講到 model reality 的話,RC 就不會是一個很好的統計量。好比說某位打者在 39 個 PAs 裡安全上壘 14 次,得到 18 個 TBs,他的 RC = (14/39) * 18 = 6.46;如果他在下一個 PA 擊出一支 single,他的 RC 立刻就變成了 (15/40) * 19 = 7.125,所以這支 single 的就有 7.125 - 6.46 = 0.665 分的價值?這當然是很詭異的結果!

RC 是一個非線性的 fitting model,拿它來計算小樣本失真的可能性會很高,畢竟這超出了它的適用範圍。光是看 model reality 的話,現有的數據大概也只有 BaseRuns 勝過 RC 吧。

另外,所謂的 critical run 這種跟情境相關的數據 (like WPA) 和 Pythagorean formula 的出發點完全不同,並不能因為 "critical run matters a lot" 就推翻畢氏公式。

就理論上來說,衡量 PRC 所用的方法是「對勝率的貢獻」,只不過是把它轉換到跟打擊貢獻有相同的「單位」。投手的 VORP 則是單純的計算投手的 Runs Allowed(或許我們可以稱之為 apparent runs allowed)跟 replacement player 之間的差距。兩者的出發點也很不一樣。

Morikawa said...

並不是用 critical situation 去推翻 Pythagorean formula,這的確是不正確的 approach。單純的說,我不喜歡這個東西。

PRC 的理論在於 runs saved 與 runs created 在 "Pythagorean formula" 下的關聯性,一個問題是如果沒有任何的 RS,RA 再低都無濟於事。一場 1:0 的比賽,我認為投手壓低 RA 的貢獻與打者打下致勝分的貢獻,似乎不是簡單的 Pythagorean Formula 的概念可以互通的東西。

Pythagorean formula 是由 empirical data 所 derive 出來的東西,它是挺準的一項工具,但單從長相來看,幾乎看不出什麼意義。

而 Pythagorean Formula 既然是從大環境所 fit 出來的 model,那麼它一定經過不少的 iteration 才回歸到目前的狀態,也就是說,Pythagorean 代表的是一個 regression mean 狀態下的預測。那麼,它是否適用於預測像是 Twins 的 Santana -- 這種有「勝利保証」的 Ace?

換個角度說,利用 Pythagorean Formula 預測而產生較大誤差的時候,通常都是那些 standing 在前面的球隊,相較於 Santana 的 outstanding,他的 "pitching environment" 是否適用在 Pythagorean Formula 的 cover 下,就是更令人懷疑的問題。

Pythagorean Formula 的使用似乎規範不到單一選手的表現。

Still,PRC 拿 Pythagoren Formula 的 "W%" 做為 translate RA to RC 的基準,我個人的感覺是沒有必要,也不會有很大的意義。VORP 的確立意和 PRC 不同,但兩者都是從 RA 得來,同時 VORP 的 scale 是真實的;PRC 的 scale 卻只能建立在比較之上。基本上,我覺得這樣的 translation 並沒有太大的意義。

Andre said...

My 2 cents on this.

http://tinyurl.com/kg262