Saturday, May 27, 2006

CERA Is the Last Thing You Should Buy

在 05 年時,Sporting News 的 Ken Rosenthal 曾提到 Dodgers 的 Russell Martin 擁有 Jason Varitek 的領袖氣質,但以個人的看法,如果捕手能夠吸引大眾的目光,先決條件是這個傢伙要「能打」!所謂的領袖氣質與良好的守備能力多半是捕手打擊力之下的副產品,畢竟捕手是位於攻擊光譜 (offense spectrum) 的最左邊 (left end)。Jason Varitek、Jorge Posada 和 Ivan Rodriguez 都是這樣的例子,Mike Piazza 也許是個例外,但是當一個捕手可以提供 1B 的 productivity,也沒有人會輕易否定他。

擁有 Navarro 和 Martin 兩個新星捕手的 Dodgers 在任何其它球隊的眼裡恐怕都是過於奢侈的資產,當他們兩人被期待成為未來的 Ivan Rodriguez 和 Jason Varitek,respectively 時,我們都曉得:這和 Navarro 與 Martin 的 defense、blocking、game-calling ability 都沒有太大的關係。

這一陣子關於 LA local media 的東西多半是讀讀標題、走馬看花,也不曉得自己究竟錯失了多少和 Dodgers 相關的資訊。而基於友台最近提到 Russell Martin 得到 local media 的高評價一事,我決定亡羊補牢一下,回頭找找相關的報導。

dailynews.com:Dodgers: Martin catching on

Martin 目前的表現或許足以稱為 NL 最 tough 的 8th spot hitter (OPS 0.846),不過 daily news 對於 Martin 的評價也算是別出心裁,尤其是這一段:

A statistic that is widely overlooked in baseball is catcher's ERA, which measures the ERA of a pitching staff while a particular catcher is behind the plate. Through his first 11 games, Martin's ERA (3.28) is slightly better than Navarro's (3.56) and more than two runs better than backup Sandy Alomar's (5.33). Moreover, the Dodgers are 9-2 in games started by Martin, having won each of his first five starts on the heels of a five-game losing streak that immediately preceded his callup.

這篇報導是 5 月 19 日發表的,在 Dodgers 的 7-game winning streak 下,Martin 的 CERA 大概比 3.28 更低,Tony Jackson 如果要拿 CERA 做文章,他還有得好寫!順便可以殺殺 Grady Little,因為 Little 在 5 月 26 日的比賽裡用 Sandy Alomar Jr. 先發,結果 Tomko 被 Nats 當沙包打。

CERA 並不盡然是考慮投捕手一對一的情況,可能還會提出像是將投手給 group 起來再檢視對不同捕手的 ERA,就像下面這樣的結果 (其中 C1 和 C2 分別代表兩個不同的捕手,INP 表示 inning-pitched):

Catcher\ItemPitcher 1Pitcher 2Pitcher 3
INPERERAINPERERAINPERERA
C1100403.650254.550152.7
C250203.6120604.53092.7
Total150603.6170854.580242.7

然後我們將 catcher 1 ~ 2 做個合計,就得出了以下的結果:

CatcherINPERERA
C1200803.60
C2200894.01
Total4001693.80

接著我們做出以下的結論:

Pitcher 1 ~ 3 的合計 ERA 是 3.80 (400 INP), Catcher 1 與 Catcher 2 各負擔了 200 INP,而各自的 ERA 是 3.60 與 4.01,所以面對相同的投手搭配,Catcher 1 的 CERA 比 Catcher 2 低,Catcher 1 具有較的 game calling ability。

這算是 CERA 的 "進階" 基本精神,雖然看起來仍然像投手群的 situational ERA,總是比起考慮一對一的 case 要強。但這種 appraoch 其實挺容易讓人上當,同時這也不叫 statistic。回想一下:我們時常喜歡用 situational batting results 來評斷一位打者在不同的狀況下的打擊能力,而在看打者的 situational results 時,我們都會很注意 sample size 的大小,但如果你認為這樣的 CERA 詮釋能夠解決 sample size 的問題的話,這仍然是不正確的。

如果 CERA 代表了捕手的能力,那麼我們在計算 CERA 這個應變數 (dependent variable) 時,它的自變數 (independent variables) 應該是與捕手有關的能力,好比說:

對於自變數 Xi's,其中 X1 代表捕手的配球、X2 代表擋球能力、X3 代表迷惑 umpire 對於 strike zone 判定的能力..etc,則應變數 -- 也就是 CERA -- 就應該是:

CERA = sum(ci*Xi) + intercept, where i = 1,2,3,....n

其中 intercept = 0 代表 CERA 可以完全由 Xi's (捕手的幾項能力) 來解釋;而如果將 intercept 給 offset 到 league average 的 CERA (lgCERA),那應變數就可能被 fit 成像是 Delta-CERA 的數字,也就是一個有正、負值的量 -- 用來看捕手對 lgCERA 的 pure effect。

我們可以想出更多的自變數來考慮更複雜的 model,但是像上面的例子裡所提到的 Xi's 都不是這麼容易被 well-defined 的東西。換句話說,如果 CERA 可以說明捕手的能力,那麼 CERA 不應該由投手的數字去 figure out

也許有人會覺得為什麼不能用投手的數字去 figure out?這是因為好的 statistic 的另一個要求是必須要能做預測 (prediction)。

打個比方:我們把 Dodgers 的投手當成自變數加入 model 裡,然後得出 Martin 改變投手們的 SO、BB、Hits...etc 的能力並回推投手 ERA 是否會變好。這個做法固然是比較容易,但假使 Martin 從未和 Tomko 搭配過,那這個 model 拿來預測 Tomko 與 Martin 搭配能降低 (或增加) 多少 ERA 就是無稽之談!因為對 Martin 的 model 而言,Tomko 是規範外的自變數。簡而言之,這樣的 model 沒有預測能力。

我們在看 sabermetricians 推導投手 DIPS 的過程裡,他們很少去利用一些 peripheral 的數字當成 model-fitting 的自變數。Tangotiger 的 FIPS 和 David Gassko 的 DIPS 3.0 都是很好的例子,這是因為 TTO (Three True Outcomes:SO、BB & HR) 與 batted ball tendencies 在投手的 year to year results 裡有較好的相互解釋能力,也代表這些數字是投手的 consistent abilities,用這樣的結果去 fit 出來的 model 才會有意義與預測能力。同樣的,當我們尚未找出一些足以代表捕手 game-calling 的 consistent ability 的數字前,CERA 怎麼算都不會是個有意義的 statistic,現行的 CERA 充其量只是一種 situational result、a statistically non-sense quantity。

我忘了曾經在哪裡看到過 05 年 ex-GM Paul DePodesta 將 Jason Phillips 帶進 Dodgers 來替代 David Ross 是因為 Phillips 有較好的 CERA 的說法

Update May 29, 2006:
(經 Madboy 兄指點,這段的捕手主角是 Paul Bako...)


個人主觀的認為 DePo 不可能去相信 CERA 這種鬼東西,相反的,DePo 只是單純的在賭 Phillips 能提供比 Ross 更好的火力支援而已。事實上 DePo 這一注下得不差,Phillips 當初在 batting No. 8th 時的確有不錯的表現,不過 ex-manager Jim Tracy 誤將 Phillips 移到 cleanup、甚至讓他站 1B 就是極大的錯誤,Phillips 或許就捕手的打擊力來說還不差,但畢竟也是接近 replacement level 而已,當然這個黑鍋最後應該還是 DePo 替 Tracy 揹了....

以下是一些探討 CERA 的文獻:

Field General or Backstop?
Simulating Catcher's ERA

雖然最後的結論都找不出捕手在 game-calling ability 方面的証據,但瞭解一下 sabermetricians 的想法也是不錯的。

Sunday, May 21, 2006

Drew-topsy

在 04 年的 offseason,Ex-GM DePodesta 用 5-year 55M 將 J.D. Drew 請到 Dodgers 來,但受傷的緣故使得他在 05 年只得到了 311 個 PAs。在剩下的球季裡,Drew 的表現在 Dodgers 屢戰屢敗的情況下被個人淡忘。

撇去 Drew 的傷病史,他是一個很棒的傢伙,一個 complete package。我尤其喜歡 Drew 那種 "沈靜的殺氣",更不用提他充滿美感的 fullswing。對任何一個投手而言,Drew 都不會是個 easy out。

在 06 年球季,我十分注意 Drew 的表現,除了不想錯過他的演出,也擔心他在 06 年能夠於 active roster 待多久。在觀察的結果下,我發現 Drew 是一個時常改變 stroke 的打者。具體的說,Drew 在 base empty 與 runners on 的情況下,他的 approach 有明顯的不同,而我對於在 Kent 的 early struggle 下將 Drew 移到 clean-up spot 的動作不覺得很舒服。

這不盡然是因為 clutch hitting ability 的緣故。個人不否認也不承認 clutch hitting ability 的存在的原因在於這玩意兒是 "What you define and estimate it to be."。舉例來說,Adrew Dolphin 的 Analysis 和 BP 的 Nate Silver 在 "Baseball between the Numbers" 一書對於 clutch hitting 的詮釋就完全不同,而 Dodgers 的 broadcaster Steve Lyons 則單純的認為 clutch hitting 就是指 RISP 的打擊能力。也因此接觸 sabermetrics 越久,就越覺那些數字結果大部份都不是 zero-sum game,我比較想做的反而是盡可能去瞭解那些 sabermetricians 的想法。

在 Moneyball 的問世下,"OBP is life" 的觀念就越來越為人所接受。大原則下,(1-OBP) 粗略的代表了打者在一次 PA 裡可能出局的機會,出局數越少,球隊就更有機會拿下分數,也就更有機會獲勝,因此 Billy Beane 這麼重視 BB 是合理的。但實際上 BB 並沒有太多 move runner over 的價值,我們甚至可以說:當 runners on 的時候,Hit 的價值是超過 BB 的,而 extra-base hit 就更不用說了,這其實就扯出另一個現象:The importance of SLG。

BP 的 Dayn Perry 在他的 Winners 一書裡提到 AVG、OBP 與 SLG 對 run scoring 的 correlation:

YearsAVGOBPSLG
1871 ~ 19000.8880.8920.901
1901 ~ 19250.8460.8780.861
1926 ~ 19500.8340.8980.914
1951 ~ 19750.7740.8410.897
1976 ~ 20000.7520.8110.868
1871 ~ 20030.8280.8660.890

即使 SLG 過份強調了 extra-base hit 的價值 (因為 SLG 像是把一支 HR 的價值計為一支 single 的 4 倍),它仍然是三項基本打擊指標裡與 run scoring 擁有最高 correlation 的一個,更是唯一一個可能與 run scoring 達到 90% 相互解釋程度的數據。不只如此,BP 的 Clay Davenport 在 Create EQA 中的 deduction 也有提到與 Perry 相似的結論,moreover,Raw EqA 式子中其實隱藏了一個的訊息:Hit 的價值高過 BB 與 HBP (2 to 1.5, maybe)。

這也是我一直很希望 Joel Guzman 能夠成為未來的 long ball specialist 的原因,Dodgers 拿不到分數的情況已經持續很久了。雖然現階段 Guzman 看起來很像是回到台灣打混的 CCF (陳金鋒),但 CCF 在 21 歲時可沒有 Guzman 這種水準;同時沿著 "SLG 是三項基本打擊指標中與球隊得分有最高 correlation" 的結論,不難讓人懷疑 Billy Beane 的 Athletics 在失去了 Jason Giambi 與 Miguel Tejada (The so-called "Mr. Swing at Everything") 兩位 power hitters 之後,無法像 01、02 年有那麼瘋狂的戰績演出恐怕不是運氣或巧合。

講得具體一點,任何一支球隊的 cleanup hitters 會 generally 擁有最多 runners on 的打擊機會,如果球隊需要得分,這些 cleanup hitters 的 SLG 其實應該要比 OBP 更重要。舉例來說,如果 runners on 2B,守備方給予攻擊方的 power hitter 一個 free pass 把 1B 填滿的動作固然是增加了攻擊方的 expected runs,但守備方所受到的 "相對傷害" 其實是較小的。

那麼對於現在 Dodgers No.4 Spot 的 Drew -- 這位可能是 Moneyball Theorem 下最佳的打者 -- 而言,他的表現又如何呢?就個人在 06 年的觀察,Drew 的 fullswing 在 runners on 之後就很少出現,相對的,他的 "slicing" 的變得很多,你可以很容易發現 Drew 和 Kent 在破壞投手的 corner pitches 時,stroke 是完全不一樣的。Simply put,即使 off-balance,Kent 仍然 maintain 了 fullswing。

如果我們單看 Drew 的 Career Stats 在 Base empty 與 runners on 的情況下,其實並沒有什麼太大的差別 (Last updated: May 20, 2006):

Drew's Situational Stats (1999 ~ 2006)

SituationPAAVGOBPSLG
Base Empty1835.285.390.518
Runners On1471.291.397.512
Overall3306.288.393.515

但是以 03 年做為一個分界點將 Drew 的資料切開,卻發現了一項改變:

SituationYearPAAVGOBPSLG
Base Empty99 ~ 031232.273.363.465
04 ~ 06603.307.438.611
Runners On99 ~ 03951.289.391.521
04 ~ 06520.288.408.481

很明顯的,在 04 年以前,Drew 在 runners on 的時候是打得比較猛的,而 04 年之後,Drew 在 base empty 的表現比以前更好,但 runners on 時就下滑了不少。雖然 Drew 在不同的情況下 maintain 了相當 decent 的 OBP,只是以一個 cleanup hitter 而言,他的 SLG 就掉得太多了!

另一點,Drew 在 06 年 base empty 與 runners on 的 PA 是 75 與 92 (5 月 20 日止),somehow 說明了 06 年 Dodgers 的 top spots 其實累積了不少的 bases 給 cleanup hitters。事實上享有這種 "待遇" 的 cleanup hitter 並不多,05 年的 Manny Ramirez 是個例子。該年的 Manny 在 base empty 與 runners on 的 SLG 分別是 0.442 與 0.743,那麼 Red Sox 在 05 年整年炸下 910 分 (AL 1st) 其實也不是這麼意外的事;反觀 Drew 與 Manny 的 SLG 表現在 base empty 與 runners on 時正好相反,假使 Drew 維持 04 年以來的 approach,對 Dodgers 而言,Top spots 累積 runners 給 Drew 來 bat in 是不是有點 ineffective?

不要誤會,我指的不是 Drew 的揮棒不夠 aggressive 或是 Drew 應該做 "Mr. swing at everything"。而是既然 base empty 的時候 Drew 有本事揮出很好的 power stroke,runners on 的時候,他沒有必要刻意改變原有的 approach。

我不曉得新任的 hitting coach Eddie Murray 有沒有發現 Drew 在不同的 situation 下有不同的 approach 的現象,如果 Drew 已經成型而難以改變,顯然 Dodgers 讓 Drew 打 No.4 spot 不僅降低 Drew 本身的 PAs、壓縮了他高 OBP 的價值,同時 SLG 無法有效發揮也影響到 Dodgers 的 run scored,這就是讓我覺得不舒服的原因。

如果讓我來安排目前的 Dodger lineup,我可不會買什麼 "double lead-off" 的理論。理想的情況應該是讓 Drew 移到 No.2 Spot -- 既能發揮他的高 OBP,製造更多的機會給 cleanup,同時提供一定程度的 power,將上壘的 lead-off hitter 一棒直接打回家的位置。

Thursday, May 18, 2006

Confederal Inferiorities

NL West 被認定為最弱的一個 division 不知是從什麼時候開始的事。

就 05 年的戰績來看的確如此,NL West 只有一支球隊的 W% 超過 0.500。而在 05 的 offseason 裡,除了 Dodgers 燒了大把的鈔票,NL West 的其餘四隊並沒有什麼顯著的補強動作 (這裡指的是「動作」而不問是否把錢花在刀口上) ,也因此在進入 06 season 後,NL West 理所當然的持續被認定為是 ML 歡樂區。只是最近有越來越多的聲音開始為這個 "West-land" 做出辯護。

截至 5 月 17 日為止,各 division 的總成績排名如下:

DivisionWinLossW%
NL West106930.533
AL East100910.524
NL Central1171170.500
AL Central97970.500
AL West73820.471
NL East891020.466

看起來有點不可思議,事實上 Jon Weisman 於 Dodger Thoughts 早在 5 月 10 日就 PO 出了 類似的數字;5 月 17 日在 Coors Field、Dodgers 與 Rockies 的 rubber game 裡,場邊的記者甚至提到:

NL West is the only division with all teams over 0.500. I did the math, the NL West teams committed a 49-49 record against their own division rivals and 13 games above 0.500 against the others. It's NOT the weakest division.

這種論調要戳破並不難,NL West 目前的成績應該算一種 "peripheral blind spot",很簡單的道理:打贏 Red Sox 和打贏 Royals 的難度可能有天壤之別,但不論贏了誰,紀錄上都是一勝。

如果把 NL West 的五支球隊與 NL 其它分區的戰績 (W-L) 拆開來看:

TeamEastCentralWest
ARI0-08-814-9
SDN5-59-18-12
COL6-66-510-7
LAN3-39-78-10
SFN4-67-39-11
Total18-2039-2449-49

可以發現的是,NL West teams 的 "above 0.500" 的 wins 幾乎都由 NL Central 所貢獻。不過這可不是 Ex-manager Jim Tracy 的 Pirates 讓 NL West 佔了便宜 (Pirates 目前對上 NL West 是 3-3),最大的貢獻者其實是 Cubs。

最近很熱的 Padres 可是把 Cubs 啃得連骨頭都不剩 (06 年對 Cubs 七戰全勝)。除了 Cubs 不太穩定的 rotation 以外,主砲 Derrek Lee 在 4 月 19 日於 Dodger Stadium 賠掉後,用「人畜無傷」來形容整個 Cubs 的 offense lineup 可能不會比被破解密碼的 ATM 來得適當。別忘了 Padres 在 5 月 17 日前的 team OPS 不足 0.7,要說這樣的 Padres 有本事對 NL Central 拿下 9-1 的成績,除了他們的對手實在太慘,似乎找不到更好的理由。

其它像是 Astros 到了 5 月後就不對勁,rotation 和 bullpen 手牽手 struggle 的結果被 Dodgers 與 Giants 拿回一些 advantages;Rockies 如果不是季初將重建中的 Marlins 給 swept 的話,他們對上 NL East 的戰績不會持平....etc。

整理了一下,單單 Astros、Brewers、Cubs 與 Marlins 對上 NL West 就交出了 16-37 的悲慘成績,但 NL West teams 目前的總成績只有 13 games above 0.500,要說這是個 good division....是否有些牽強呢?

以下是 NL West teams 幾項 raw 的投打指標 (5 月 17 日前):

TeamAVGOBPSLGOPSERARA
ARI.272.342.428.7704.134.39
SDN.245.321.369.6903.813.98
COL.268.334.441.7754.214.57
LAN.262.350.419.7694.094.52
SFN.265.340.413.7534.985.28
NL ALL.262.335.422.7574.374.80

看起來,NL West 最多只是 5 支接近 NL 平均水準的球隊所組成的 division 而已,這個 division 沒有 outstanding 的球隊,如果 06 season 維持了眼下的趨勢,除了 Wild Card 不可能在這個 division 出現,拿下 NL West title 的球隊大概也是 NL 所有 division titles 裡戰績最差的一個,換句話說,NL West 的 division champion team 會 most likely 不是一支有 competency 的球隊。

再用 RS (runs socred) 與 RA (runs allowed) 加上 Pythagorean Formula (with exponent 1.82) 來看目前的 NL West (5 月 17 日前):

TeamRSRAWinLossP_WinDelta
ARI195168221722.13-0.13
SDN179163221821.700.30
COL185186221819.902.10
LAN202180202022.10-2.10
SFN194208202018.731.27

其中 P_Win 代表利用 Pythagorean Formula 所估出來的 Wins,Delta 則是 (Win - P_Win)。現階段看來 Dodgers 也許有些 bad luck,這支球隊其實應該有更好的表現,沒有理由認為 Dodgers 在 NL West 無法出線。

然而 Dodgers 身在這種 division 裡應該要感到慶幸,如果想儘快打進 playoff 以洗刷 05 年不堪的回憶,沒有比身在 NL West 裡更好的機會。儘管 NL West 現階段帳面上的戰績不差,但數字上看來,個人仍然覺得這個 division -- 毫無疑問 -- 是 ML 的放牛班,是 NL "Mild" West。

Monday, May 15, 2006

Miscellaneous Notes

Baez the Unsolved Riddle

在我們家,母親節如果不出現在老家的話,那會是一項 felony。當然,老家沒有接網路,這就代表個人在週末的預定收看的比賽至少兩場打了水飄,尤其 C.M. Wang 的先發促使 ESPN 惡搞擠掉了原本預定 live 的 West Coast Great (!?) Rivalry。

好不容易在週日的晚上「擠回」住處,5 月 13 日於 AT & T Park 的 box score 立刻成為最大的提神劑:Baez committed 4 consecutive blown saves!更糟的是這個 BS 還是在 Bottom 9th、3-run ahead -- 對任何 closer 都是 the easiest-leg -- 的情況下丟掉的。

個人曾經表示 BS 提供的訊息不足以讓我們評斷一位 closer 或 RP 的好壞,但 BS 這麼多當然也不可能是好事,Danys Baez -- 季前一度不滿擔任 Gagne 的 setup man 的安排而放過嘴砲的傢伙 -- 目前已經累計了 5 個 BS,Gagne 投 3 個 seasons 都沒這麼多,我還真想聽聽 Steve Lyons 如何評價 "目前的" Baez。

來看看 Baez 近 3 年來的幾種不同的 "Average":

YrTEAMIPsRAFIPDIPS_RADEF_EFF
06LA18.25.792.504.840.707
05TBA72.13.364.384.660.691
04TBA684.104.414.760.712
03CLE75.24.284.074.060.710

其中 RA 是一般的 run average;FIP 是 TangoFielding-Independent Pitching;DIPS_RA 是 Gassko 的 DIPS 3.0 RA;DEF_EFF 則是球隊的 Defense Efficiency;06 年的資料紀錄到美國時間 5 月 14 日為止。

Tango 的 FIP 著重於投手的 TTO (SO、BB & HR),事實上就目前的表現來看,Baez 的 TTO 是優於前 3 年的,更重要的是 Baez 目前還沒有挨到任何 long ball 的轟炸,以上翻成白話文就是 06 season 至今,Baez 的 "stuff" 表現得較前幾年好。

DIPS_RA 則著重於投手 batted balls 的 tendencies,在 Gassko 的模型裡,fly ball 對 runs allowed 的影響有較重的 weighted。換句話說,Gassko 對於 DIPS 的 concept 似乎是 投手 somehow 能控制被擊球的 tendency,也就能控制失分 。而原本就傾向 fly-ball pitcher 的 Baez 在 DIPS_RA 這項佔不了太多的便宜 (這並不盡然代表 ground-ball pitcher 對於失分的掌控較 fly-ball pitcher 要好)。

兩種不同的 DIPS 顯示 LA 和 CLE 也許在守備方面扯了 Baez 的後腿,不過這些 Baez 待過的球隊都多少 maintain 了一定程度的 DEF-EFF。

再來看看 Baez 的 batted-ball tendencies:

YrGBIFOFLDBABIP
200637.10%4.84%37.10%20.97%0.373
200546.58%3.65%29.68%20.09%0.278
200441.09%6.44%35.64%16.83%0.279
200343.32%4.15%31.34%21.20%0.275

其中 GB 代表 Ground-Ball;IF 代表 Infield-Fly;OF 是所有的 FB 扣掉 IF;LD 則是 Line Drive。

Baez 的 GB/FB 大約維持在 1.00 上下,要說改變,除了 06 年的 FB 較前 3 年增加了約 10% 以外,BABIP 也有明顯的激增。一般而言,BABIP 的 mean 大約是在 .290 左右,事實上 Baez 在過去 3 年的 BABIP 大約可以排在 ML 近 80-percentile 左右的位置,而如果以 4 月 29 日 -- Baez 拿下 8th saves 的那天 -- 為一個分界線將 Baez 的成績切開,得到的 splitted BABIP 更是嚇死人的誇張:

DateGIPsTBFBABIP
Before Apr. 29121350.256
Since Apr. 2965.232.520

根據 Tango 對 BABIP 的研究,batted ball 的命運 (fate) 有 28% 取決於投手、17% 取決於 defense、11% 是 ball park,剩下的 44% 則是 "Luck"。Statistically,這 44% 應該代表的是現有預測 BABIP 的 model 所不能解釋的部份。

Baez 的 BABIP 並不是告訴我們「等 Baez 的投球樣本夠大,BABIP 就會回到 mean 的 .290,他的表現就會回穩」的結論。如果我們真要解開 BABIP 的神秘,可能還有很多未發現的變數需要考慮。總之,我覺得 Baez 這一陣子的表現不僅荒唐,交出的數字也夠離奇。Dodger fans 曉得 Baez 沒那麼好,但也不該有這麼爛。

由於 Baez 還不滿 Veteran 的資格,Colletti 和 Little 應該要考慮把他直接弄下 minor 去殺殺農場的小朋友、恢復一下信心。我想這樣的 move 絕對不是壞事,反正他這個 4M 的 current contract 在 waiver period 的時候大概也沒人有興趣去撿。


Should Odalis Perez Head to Bullpen?

Aaron Sele 自 contract purchased 後代班的兩場 starts 都有不錯的表現,伴隨著 Odalis Perez 降格到 bullpen 一事在帳面上也就越來越成定局。

而 Perez 在 5 月 14 日對 Giants 的比賽裡首度以 RP 的身份上場,被 Durham 擊出的 double 是 belt-high 的失投球、Matheny 的 RBI single 則完全是 bad luck。雖然 Perez 領到了一個 BS,要說 Perez 不適合做一個 RP,理由並不是很充分。

不過 career stats 顯示 Perez 前 30 球所丟掉的分數 (170) 佔了生涯總失分 (459) 的 37% 左右,RP 這種「快熱快上」的工作很可能不太適合他。加上 Perez 上一回擔任 RP 可得 retroactive 到 01 年;他本身又不是很擅長搶好球數的投手,RP 這個新工作恐怕只是加速 Perez 在 Dodger Roster 裡的邊緣化,並增加 Colletti 將他交易出去的難度。

Sele 當然也不是一個合適的 RP 候選人,只是目前看來 Dodgers 於 04 年的 "Lima legend" 正在發酵,大概很難有人能阻止 Little 將 Sele 維持在 rotation 之內。不過 Sele 本身也有 2nd-half collapse 的問題,除此之外,最壞的消息還是 Dodgers 目前的 active roster 又擠上了 12 位投手,這完全是無意義的做法。

個人 prefer 讓 Perez 回到 rotation 裡,如果他能有較穩定的表現,也許能增加在 731 前將這個顧人怨的傢伙交易出去的機會。只是現在看來,Dodgers 昇格 Aaron Sele 的行為看起來像是自找麻煩而已。


"Little" Mercy

當 25 人組成的 active roster 有 12 位投手時,這就代表:

  • 有一位投手 (應該是) 永遠用不到。

  • Bench 上少了一個可用之兵。

Grady Little 可能還不太習慣如何帶一支 NL 的球隊,在投手需要打擊的情況下,Bench 上的每一個未先發的非投手球員都是有價值的,尤其現在他麾下不是 03 年 AL East 那支 SWAT Team,而是經常不曉得怎麼打才會得分的 Dodgers。

在這樣的情況下,個人是贊成適度、適時的運用一些戰術以增加球隊的得分機會的。當然,06 年最為 LA local media 所得意的就是爆增的 SBs,這當然和 Furcal、Lofton 與 Repko 這 3 位選手的表現脫不了關係,Little 似乎也頗熱衷此術。

SB 絕對不是不能使用的戰術,問題在於使用的時機與「賭本」的大小,但這不是目前個人想談的重點,我想談的是在 5 月 14 日這場 rubber game,Little 在 SB 與人員的調度上幾乎是做了最壞的示範。

Play by play 的資料在 這裡 看得到。

在 Top 7th,Ethier 在 1B、2-out,輪到投手 Seo 的 spot,這個時候 Little 換上了 Aybar 接替 Seo 的打擊。當時 Dodgers 僅以 2:1 領先,在 Saenz 先發的情況下,Aybar 無疑是 bench 上最好的 pinch hitter,另外別忘了 Dodgers 有 12 個投手,Bench player 比起一般的編制少了一個。

  • 在 2-out 的情況下,得分的機會並不是很好,在這種情況下賭上最好的 pinch hitter 並不是很聰明的 move。

  • Aybar 的守備位置 "suppose" 和 batted No.5 的 Saenz 重疊,如果 Aybar 代打失敗,讓他上場守備換下 Saenz,然後將投手塞到 No.5 spot 的 double-switch 並沒有意義,反而可能造成在 Top 8th 就要用到第二個 bench player 的窘況。

  • 假使 Aybar 擊出安打而接下來的 Furcal 出局的話,可以讓 Aybar 接替 Furcal 守 SS,並將接替的投手安插在 No.1 Spot,Top 8th 起就可以得到一輪完整的 non-pitcher spot 的進攻機會且不需動到 bench。

但結果卻是 1B 上的 Ethier 吃了個 CS,Aybar 既無法完成他的 PA,又因為找不到合適的調度方式而必須被換下,白白浪費了 Aybar 的機會;而 Top 8th 時,由於仍然從 9th Spot 開始打,迫使 Little 必須用上另一個 bench player。Matheny 在 Top 7th 的 CS 不只擋住了 Dodgers 的 potential run,更讓 Dodgers 多折了一個 bench player。

事情還沒結束,Dodgers 於 Top 9th 由 Furcal 打下追加的一分後,Little 再度「變了一次魔術」讓 Furcal 於 2B 前吃下 CS,這真是一個笨到家的調度!Little 難道沒有想到在 Worrell 投得搖搖晃晃的情況下,Furcal 的 CS 加上 Lofton 的出局等於間接的壓縮了 Garciaparra 與 Kent 的打擊機會,間接救了 Giants?

就結果而言,Little 的「戰術運用」只能解釋為對 Giants 展現了他的慈悲,Dodgers 沒有在 late-inning 把 Giants 給 blow out 也只是剛好而已。

Dodgers 在 06 年的 speed 是一項多出來的武器,但有了這項武器後,需要的是善加利用,而不是做無謂的自殺式攻擊,我不是反戰術運用者,只是運用的時機與人選是必須善加斟酌,而不是由 manager 帶頭進行「玉碎戰」....

Anyway, we grabbed the rubber game, should all Dodgers salute Steve Kline?

Thursday, May 11, 2006

On Second Thought of PRC

個人在上一篇討論 PRC 的文章裡犯了些描述上的錯誤,在 Tradewind 兄給過一些意見後,個人又花了一點時間重新檢視整個 PRC 的理論,後來 Walaykao 兄提到最重要的一點:Pythagorean Formula 並不是 situational-sensitive 的 estimator。我想不管自己是沒寫清楚或是對 Pythagorean Formula 有所誤解,都有必要再來談談 PRC。

我認為統計量有兩種:可以自我解釋實質意義 (self-explainable) 與 "No comparison, no more."。

以 RAv (run average) 為例,它屬於前者,它代表了一個投手在 9 局的投球裡可能丟掉 RAv 分,本身的意義如此,也可以拿來和其它的投手做比較。

而 RC (runs created) 可能就是後者,當提到一名打者的 RC 是 100 的時候,我們不容易知道這個 "100" 究竟是什麼意思,畢竟 RC = 100 並不代表打者為球隊掙得了 100 runs,而是 100 的 RC。這樣的統計量如果不和其它的球員相比,並沒有什麼實質上的意義與價值。

Sabermetricians 不斷的發表一些新的統計量,但最終目的都是儘可能的將這些統計量「具體化」,像是打者的 VORP 達到 10 分就可以相當於 1 win (Well, this depends on whether you believe it or not.);Keith Woolner 的 leverage 不只是定義了 situational intensity,同時也點出在 specified situation 下失分對 Win Expectancy 的衝擊。

PRC 則是從投手的 RAv 出發後轉換成另一個 scale。名義上,PRC 將投手的 performance 給「變成」打者的 RC,但是當我看到 Roger Clemens 在 05 年的 PRC 是 147 之後,我只覺得這是一個不知如何解釋的 quantity。原則上它「不太可能」代表 Clemens 為 Astros 來 05 年得到「理論上」的 14 ~ 15 勝,否則計算 Win Share 的人都得去撞牆了;拿 PRC 來做投手間的比較,產生的 ranking 看起來也就像是投手的 VORP 經過 BABIP 與 DEF-EFF 修正的 result。也因此 Gassko 推導 PRC 的結果讓我覺得這是在做倒車,不像是一個有意義的統計量。

關於 Pythagorean Formula 的部份,我曾提到 "One 'critical' run scored may be worth as several runs scored.",這並不代表我要求 Pythagorean Formula 必須 situationally 適用,而是整個 RA (runs allowed) 與 RS (runs scored) 間的關聯性問題。

不能忘記的是如果 RS = 0,W% (winning percentage) 就永遠也是 0。也就是說把 Pythagorean Formula 當成是一個 solid ground 的話,在我們利用它討論 runs saved 的相對重要性之前,是否該先給 runs scored 一些 antecedent leverage?好比說,我們在 RS 加上一個 offset 量 "B",使得整個 translate runs scored 與 run saved 的 Adjusted Pythagorean Formula 成為:

W% = (RS - B)^x / [( RS - B)^x + RA^x ]

Where RS (RA) is runs scored (allowed), x represents an adequate exponent.

這樣的作法會否更合理?

當然我不清楚 Pythagorean Formula 是怎麼得到的,原則上可能還是經過一些 multivariate regression 導出的結果,但無論如何,它的 population 是所有的 historical data。在這樣的情況下,Pythagorean Formula 的 runs environment 是穩定的。

我利用 retrosheet 的資料玩了一下 RS 與 RA,發現的是兩者之間「可能有」某種程度的關聯。以 Dodgers 為例,在不考慮那些有打入 playoff 的 seasons 下,單以 simple liner regression 來 fit,RS 與 RA 之間的相互解釋程度就大概可以提昇 10% (如果單考慮 RS 或 RA,我可能不會用 工業統計估算 MTBFWeibull distribution,而是利用 Gamma-family 那種 shape 偏左特性的 distribution 去 fit)。這樣的結論當然沒什麼太大意義,就和估計 BABIP 的不可預測性差不了太多,但這至少已經讓我產生了一種懷疑:RS 與 RA 在 mediocre performance 下可能有某種程度的相依性 (dependency)。相對的,Pythagorean Formula 在這個 mediocre 的群體裡估計也較為好。

那麼針對 Roger Clemens 或 Johan Santana -- 這些較 dominant 的 SP,Pythagorean Formula 是否能 well-covered 他們的 "pitching enviornment"?Gassko 在這個部份利用聯盟平均的 RA 與 Santana 的 RA 計算出合適的 exponent,這樣的做法固然算是躲掉了可能發生的「用 fit 好的模型去預測模型行為外的個體」的錯誤,但這樣的修正可以得到多少的 credibility?我個人的態度是懷疑的。

總之,我個人對於 PRC 的看法是:

  • 我不喜歡 Pythagorean Formula,雖然它的結果很準。

  • 我不認為利用 Pythagorean Formula 來 translate Runs Created 與 Runs Saved 是一個 solid base。

  • 我不認為投手的 runs saved 有必要與打者的 runs created 相比,畢竟討論 Barry Bonds 與 Roger Clemens 究竟誰的貢獻較大時,Win Share 的概念我「比較」能接受。

  • 我不認為 Gassko 對於 PRC 的鑽研已經告一段落,更具體的 interpretation 在未來應該仍然看得到。

有時候,真的痛恨自己在學生時代為什麼不肯多用點心,到老了碰到這麼多的疑問,卻又拿不出時間來解決...

Friday, May 05, 2006

Talking about Pitching Runs Created

最近能有這麼多的時間念書,全要歸功於 Dodgers 的比賽讓人從來不想看完全場 (詳細的 Dodger News 請至 友台 參考),這裡乾脆來談談 THT 於 06 年搬出的新花樣:Pitching Runs Created (PRC) 吧。

PRC 是由 David Gassko 所發表關於投手的統計量,目前這已經成為 THT Statistics 上的一項參考指標,相關的 derivation 正如 Tradewind 兄的留言 -- THT 從來都完全公開他們的結果讓讀者檢視 -- introduction 在 這裡,follow-up 則在 這裡

Gassko 在 introduction 裡提到:當一支球隊有 5-run scored with 1-run allowed 時,winning percentage 是 93.4%;但如果在 5-run allowed 之下,要 maintain 93.4% 的 winning percentage 就需要有 15.4-run scored。基於 "A run allowed is not equal to a run scored",PRC 於是將這種投手失分的程度換算成和打者的 Runs Created 等價的東西,整個 PRC 的 ground 則是建立在 Pythagorean formula 之上。

Pythagorean formula

Winning percentage = RS^x / ( RS^x + RA^x ),

Where RS (RA) is runs scored (allowed), x represents an adequate exponent.

Initially,x 的值是 2;historically,x 的 best fit 則是 1.82。BP 的 Clay Davenport 在這個部份則有推導出依 runs environment 的 best exponent,相關文獻在 這裡 找得到。

且不管 Pythagorean formula 是否為一個符合真實 RS 與 RA 環境的模型,問題在於這個式子不論在 x = 2 或 x = 1.82 都還有不錯的估計結果。在這裡我並不想去爭論關於 Pythagorean formula 的 goodness of fit,先回頭來看看在 BP 在 Mendoza Line 下所得到的啟發、也是最被廣為使用與流傳的 VORP

在打者的部份,VORP 是基於 Runs Created (RC) 去求得的數字,以 Cubs 的 Derrek Lee 為例,他在 05 年為 Cubs 拿下 95.6 的 VORP,也就是說 Lee 在 05 年為 Cubs 比起一個 replacement level 的選手 入替 lineup (Updated at May 7, corrected by Tradewind) 多了 95.6 的 RC。原則上這個 95.6 可能不是很重要,重要的是如何定義所謂的 "replacement level" 的 RC,事實上可以從 Lee 的基本打擊資料求得 05 年 NL 的 replacement level 在 700 個 PAs (這是 Lee 在 05 年的總 PAs) 下大約只有 116.326 的 RC。

還有一個很常見的講法就是 VORP 10 分約可以代表 1 勝,我一直不是很明白這是從何說起 (是不是因為我從來沒有看過 Bill James 的著作?) ,不過我「猜」它是從簡單線性迴歸 (simple linear regresion) 估算 winning percentage 時得來,它的模型是:

W%(winning percentage) = RDG*S + 0.5,

Where RDG is Runs Differential per Game, S & 0.5 represent the slope and intercept respectively.

在 RDG 為 0 時,W% 為 0.5 似乎算是合理的假設;就 all time derive 的結果來看,這個 S 大約是 0.1,換句話說這個模型的型態就可以寫成 W% = (RDG/10) + 0.5。而把這裡的 "10" 看成 runs per win 的話,也許就是 10 分等於 1 勝的主要原因。

回到主題,原始版本的 RC 計算方式很簡單,它只是利用 TB (total bases) 乘上 OBP 而已。不過講到 model reality 的話,RC 就不會是一個很好的統計量。好比說某位打者在 39 個 PAs 裡安全上壘 14 次,得到 18 個 TBs,他的 RC = (14/39) * 18 = 6.46;如果他在下一個 PA 擊出一支 single,他的 RC 立刻就變成了 (15/40) * 19 = 7.125,所以這支 single 的就有 7.125 - 6.46 = 0.665 分的價值?這當然是很詭異的結果!

即使目前的 RC 有幾種不同的版本,但無論如何,它都只是增加了一些 iteration 後得到的係數而已。基本上 RC 建立在一個不太真實的平台之上,衍生而來的 VORP 則只是一種可以拿來比較用的 scale,我可能願意寫 Lee 在 05 年 95.6 的 VORP 代表他比 Alber Pujols 的 88.3 多了 8.3 的 RC,也不願意寫 Lee 比 Pujols 多為球隊拿下 8.3 分

換句話說,RC 只是因為簡單,所以才被廣泛使用,我們的確可以用 VORP 來評估一位球員在 RC 方面的表現,但不代表 VORP 是評估球員火力的聖經。

回頭看看投手的 VORP,它是基於 RAv (Run Average,為了和 runs allowed 區別而多加了一個 "v") 在談的,重點同樣在於定義 replacement level 的 RAv。概略的計算方式是:

VORP = ( RAvp - RAvr ) * ( inning_pitched / 9 )

Where RAvp (RAvr) is the Run Average of pitcher (replacement level pitcher).

基於 ERA 對於投手的評估過於「仁慈」同時不夠客觀 (基於 error 的判定),我們有很好的理由在這裡使用 RAv 而不是 ERA。

相較於打者,且不論投手的 VORP 能否代表投手的真實能力,但對於評估球隊的 runs allowed 卻是相當直接。好比說 Roger Clemens 在 05 年為 Astros 拿下 80.2 的 VORP,不考慮 park adjustment、不考慮 defense efficiency,它仍然實實在在的代表 Clemens 在該年 211.1 局的投球可以比同局數 NL 的 replacement level 投手多省下球隊 80.2 分 (05 年 NL 的 replacement level RAv 大約是 5.6 左右)。也就是說,投手的 VORP 比起打者的 VORP 要「真」很多。

那麼,我們究竟有無必要將投手的 runs allowed 給 translate 成打者的 runs created?這是我看完 Gassko 的發表後首先懷疑的問題。他最初的例子也提到投手的 4 runs above average 等於打者的 9.4 runs above average、「漲價」了 235%,但這是兩種完全不同的平台,拿來相提並論實在有點奇怪。不能否認的是 Gassko 在 derive PRC 的過程中導入了像是 DIPSBABIP 等等的好東西來修正,但如果這些修正是做在 RAv 之上,結果不是能更有意義的反映出投手的 performance?

當然,Gassko 的 ground 是 Pythagorean formula,但這仍然是一個大方向而已。在 runs differential 為 0 的情況下,Pythagorean formula 所計算出的 W% 永遠是 50%,但沒有人認為在平手的情況下進入 extra-inning,雙方仍然有相同的機會獲勝;而 run differential 為 1 時,Pythagorean formula 反映出在 3 : 2 時的 W% 是 0.674、5 : 4 時則是 0.599,萬一前者出現在 5th inning、後者是在 8th inning,這裡的 W% 可能也就不會長得這個樣子了。

原則上,個人對於 PRC 的看法大約就是把它當成是投手 VORP 的另一種 scale 就好,要說 PRC 的好處則不在於它本身如何看待 runs scored 與 runs allowed 相對價值,而是它被考慮的方向比起投手的 VORP 要周詳,如此而已。總之,個人不覺得 PRC 是 sabermetrics 裡的一個大發現,至少現階段不是。