Saturday, May 27, 2006

CERA Is the Last Thing You Should Buy

在 05 年時,Sporting News 的 Ken Rosenthal 曾提到 Dodgers 的 Russell Martin 擁有 Jason Varitek 的領袖氣質,但以個人的看法,如果捕手能夠吸引大眾的目光,先決條件是這個傢伙要「能打」!所謂的領袖氣質與良好的守備能力多半是捕手打擊力之下的副產品,畢竟捕手是位於攻擊光譜 (offense spectrum) 的最左邊 (left end)。Jason Varitek、Jorge Posada 和 Ivan Rodriguez 都是這樣的例子,Mike Piazza 也許是個例外,但是當一個捕手可以提供 1B 的 productivity,也沒有人會輕易否定他。

擁有 Navarro 和 Martin 兩個新星捕手的 Dodgers 在任何其它球隊的眼裡恐怕都是過於奢侈的資產,當他們兩人被期待成為未來的 Ivan Rodriguez 和 Jason Varitek,respectively 時,我們都曉得:這和 Navarro 與 Martin 的 defense、blocking、game-calling ability 都沒有太大的關係。

這一陣子關於 LA local media 的東西多半是讀讀標題、走馬看花,也不曉得自己究竟錯失了多少和 Dodgers 相關的資訊。而基於友台最近提到 Russell Martin 得到 local media 的高評價一事,我決定亡羊補牢一下,回頭找找相關的報導。

dailynews.com:Dodgers: Martin catching on

Martin 目前的表現或許足以稱為 NL 最 tough 的 8th spot hitter (OPS 0.846),不過 daily news 對於 Martin 的評價也算是別出心裁,尤其是這一段:

A statistic that is widely overlooked in baseball is catcher's ERA, which measures the ERA of a pitching staff while a particular catcher is behind the plate. Through his first 11 games, Martin's ERA (3.28) is slightly better than Navarro's (3.56) and more than two runs better than backup Sandy Alomar's (5.33). Moreover, the Dodgers are 9-2 in games started by Martin, having won each of his first five starts on the heels of a five-game losing streak that immediately preceded his callup.

這篇報導是 5 月 19 日發表的,在 Dodgers 的 7-game winning streak 下,Martin 的 CERA 大概比 3.28 更低,Tony Jackson 如果要拿 CERA 做文章,他還有得好寫!順便可以殺殺 Grady Little,因為 Little 在 5 月 26 日的比賽裡用 Sandy Alomar Jr. 先發,結果 Tomko 被 Nats 當沙包打。

CERA 並不盡然是考慮投捕手一對一的情況,可能還會提出像是將投手給 group 起來再檢視對不同捕手的 ERA,就像下面這樣的結果 (其中 C1 和 C2 分別代表兩個不同的捕手,INP 表示 inning-pitched):

Catcher\ItemPitcher 1Pitcher 2Pitcher 3
INPERERAINPERERAINPERERA
C1100403.650254.550152.7
C250203.6120604.53092.7
Total150603.6170854.580242.7

然後我們將 catcher 1 ~ 2 做個合計,就得出了以下的結果:

CatcherINPERERA
C1200803.60
C2200894.01
Total4001693.80

接著我們做出以下的結論:

Pitcher 1 ~ 3 的合計 ERA 是 3.80 (400 INP), Catcher 1 與 Catcher 2 各負擔了 200 INP,而各自的 ERA 是 3.60 與 4.01,所以面對相同的投手搭配,Catcher 1 的 CERA 比 Catcher 2 低,Catcher 1 具有較的 game calling ability。

這算是 CERA 的 "進階" 基本精神,雖然看起來仍然像投手群的 situational ERA,總是比起考慮一對一的 case 要強。但這種 appraoch 其實挺容易讓人上當,同時這也不叫 statistic。回想一下:我們時常喜歡用 situational batting results 來評斷一位打者在不同的狀況下的打擊能力,而在看打者的 situational results 時,我們都會很注意 sample size 的大小,但如果你認為這樣的 CERA 詮釋能夠解決 sample size 的問題的話,這仍然是不正確的。

如果 CERA 代表了捕手的能力,那麼我們在計算 CERA 這個應變數 (dependent variable) 時,它的自變數 (independent variables) 應該是與捕手有關的能力,好比說:

對於自變數 Xi's,其中 X1 代表捕手的配球、X2 代表擋球能力、X3 代表迷惑 umpire 對於 strike zone 判定的能力..etc,則應變數 -- 也就是 CERA -- 就應該是:

CERA = sum(ci*Xi) + intercept, where i = 1,2,3,....n

其中 intercept = 0 代表 CERA 可以完全由 Xi's (捕手的幾項能力) 來解釋;而如果將 intercept 給 offset 到 league average 的 CERA (lgCERA),那應變數就可能被 fit 成像是 Delta-CERA 的數字,也就是一個有正、負值的量 -- 用來看捕手對 lgCERA 的 pure effect。

我們可以想出更多的自變數來考慮更複雜的 model,但是像上面的例子裡所提到的 Xi's 都不是這麼容易被 well-defined 的東西。換句話說,如果 CERA 可以說明捕手的能力,那麼 CERA 不應該由投手的數字去 figure out

也許有人會覺得為什麼不能用投手的數字去 figure out?這是因為好的 statistic 的另一個要求是必須要能做預測 (prediction)。

打個比方:我們把 Dodgers 的投手當成自變數加入 model 裡,然後得出 Martin 改變投手們的 SO、BB、Hits...etc 的能力並回推投手 ERA 是否會變好。這個做法固然是比較容易,但假使 Martin 從未和 Tomko 搭配過,那這個 model 拿來預測 Tomko 與 Martin 搭配能降低 (或增加) 多少 ERA 就是無稽之談!因為對 Martin 的 model 而言,Tomko 是規範外的自變數。簡而言之,這樣的 model 沒有預測能力。

我們在看 sabermetricians 推導投手 DIPS 的過程裡,他們很少去利用一些 peripheral 的數字當成 model-fitting 的自變數。Tangotiger 的 FIPS 和 David Gassko 的 DIPS 3.0 都是很好的例子,這是因為 TTO (Three True Outcomes:SO、BB & HR) 與 batted ball tendencies 在投手的 year to year results 裡有較好的相互解釋能力,也代表這些數字是投手的 consistent abilities,用這樣的結果去 fit 出來的 model 才會有意義與預測能力。同樣的,當我們尚未找出一些足以代表捕手 game-calling 的 consistent ability 的數字前,CERA 怎麼算都不會是個有意義的 statistic,現行的 CERA 充其量只是一種 situational result、a statistically non-sense quantity。

我忘了曾經在哪裡看到過 05 年 ex-GM Paul DePodesta 將 Jason Phillips 帶進 Dodgers 來替代 David Ross 是因為 Phillips 有較好的 CERA 的說法

Update May 29, 2006:
(經 Madboy 兄指點,這段的捕手主角是 Paul Bako...)


個人主觀的認為 DePo 不可能去相信 CERA 這種鬼東西,相反的,DePo 只是單純的在賭 Phillips 能提供比 Ross 更好的火力支援而已。事實上 DePo 這一注下得不差,Phillips 當初在 batting No. 8th 時的確有不錯的表現,不過 ex-manager Jim Tracy 誤將 Phillips 移到 cleanup、甚至讓他站 1B 就是極大的錯誤,Phillips 或許就捕手的打擊力來說還不差,但畢竟也是接近 replacement level 而已,當然這個黑鍋最後應該還是 DePo 替 Tracy 揹了....

以下是一些探討 CERA 的文獻:

Field General or Backstop?
Simulating Catcher's ERA

雖然最後的結論都找不出捕手在 game-calling ability 方面的証據,但瞭解一下 sabermetricians 的想法也是不錯的。

1 comment:

madboy said...

DePo將Pillips帶進Dodgers那段錯了,那是DePo對帶Bako進Dodgers的說辭,當時還被媒體消遣:

2005 Dodgers Midterm Exam據報Bako是因為DePo認為他的CERA不錯才網羅的,不過我想不少人都知道Bako在斧幫和維尼 當過某大教授的御用助教。

至於LA媒體對Martin的praise,我個人把他們當※看(髒字消音)。

他們在季初Navarro slumping時不段攻擊他,而到Navarro打擊恢復過來後還是三五不時揶揄在他下面的AAA有Martin存在,擺明就是看Navarro不順眼,我想這應該和Navarro不善與媒體溝通有關(Navarro是委內瑞拉人)。

這叫"媒體豁免權",一旦你和LA媒體打成一片,你就能擁有此豁免權,還能獲得"leader"、"heart & soul"、"smart"等額外稱號。Tracy、Piazza、Lo Duca均如此。

當初媒體公幹DePo時把話說的那樣難聽,又消遣CERA是個※,現在怎麼又舊字重題,然後態度反而180度扭轉,一面倒讚美Martin呢?

LA媒體只是迎風便倒的牆頭草,當初DePo為DL焦頭爛額時就譴責他不若隔壁Stoneman的沉穩與建隊技巧,還說Scioscia是多麼好的manager,現在呢?轉身反罵起Stoneman來了吧。