Friday, April 25, 2008

Mysterious Chad

個人在年初進行 這本書 的寫作時曾經把 Chad Billingsley -- or CBill -- 列為 08 年 Dodgers 的重點觀察投手 (打者則是 Rafael Furcal),但截至 4 月 24 日為止,CBill 交出了 ERA 6.53、0W4L 的成績,看起來個人的推測完全不對頭。

不過如果更進一步的看 CBill 的各項 stats,我們發現他在 20.2 IPs 裡交出了 32K 與 13BB,HR 也只 surrendered 2 發,如果單算 FIP,CBill 是相當不錯的 3.54,和帳面上的成績整整差了 3 分,會造成這種結果,和 Dodgers 只給了 CBill .551 的 DEF_EFF (Defense Efficiency) 脫不了太大的關係。

DEF_EFF 可以簡單的解釋為 "當球被 put into play 時,有多少比例會轉換為 outs" 的指標,事實上在 BP 的系統裡,投手的 BABIP 就被定義為 (1 - DEF_EFF),也就是說 BP 的 BABIP 包含了 ROE (Reach on Error) 的成分,在個人看來,這是合理的設定!畢竟在 MLB,球被 put into play 後會被記為 "Error" 的比率小於 3%,一個幾乎可以忽略的數字。

換句話說,CBill 的投球只要被打出去,有將近 50% 的比例會造成安全上壘,這可以從他 04/24 對上 D'Backs 的比賽主投 6 局、交出 12K、2BB 與 1HR 卻狂丟 5 分一事看得出來:他身後的 7 位野手幾乎可以當成多餘的存在。

事實上 Dodgers 08 年的 rotation 是值得期待的,但似乎某幾位仁兄在季初受到了 BABIP 的 "降頭",以下是 Dodgers 目前主投 15+ IPs 的投手的 DEF_EFF (4 月 24 日為止):

NameIPFIPERADEF_EFF
E. Loaiza16.74.344.32.774
H. Kuroda24.74.502.92.726
D. Lowe29.33.342.45.700
H.C. Kuo15.03.533.60.667
B. Penny30.32.872.67.653
C. Billingsley20.73.546.53.551

毫無疑問,CBill 的 DEF_EFF 簡直就是個謎;Penny 則也有回昇的空間;至於 Kuo 在短暫的 MLB 賽事裡事實上一直都有把持不住 BABIP 的毛病;而最有趣的是 Kuroda 與 CBill 在 ERA/FIP 的項目形成的強烈對比。

回到 CBill 的話題,他現在頂著近 .450 的 BABIP,要說這不會 regress 倒也不容易,事實上從 CBill 的 resume 裡,他的 BABIP 大約維持在 league average (.29x) 的水平,考慮 Dodgers 破爛的守備陣容,合理推估 CBill 的 BABIP 在 .320 ~ .330 附近,也就是說 CBill 目前的 BABIP 大概可以向下 regress 至少 120 ~ 130 points 左右。

我們可以從更具體的角度來看 "regress 120 ~ 130 points" 的 BABIP 該如何 translate?在這裡個人使用一個不很牢靠,但也不會太離譜的方法來玩玩。

首先從 CBill 的 career stats 開始:CBill 在 06 與 07 年一共被擊出 223 支安打,其中有 158 支 singles、39 支 doubles、4 支 triples 以及 22 支 HRs,以比例來看就是:

1B2B3BHR
71%17%2%10%

假設在這個 season 還有 600 位打者會從 CBill 手中把球 put into play,同時 BABIP 下修 120 points,這也就是說在這 600 個 put ball into play 的 ABs 裡,會少掉 72 支安打,而這 72 支安打裡是 single 的大約有 51.12 (72 * 71%) 支,以此類推,double 有 12.24 支、triple 有 1.44 支,剩下的 7.2 支則是 HR,那麼單就 SLG 來看:

(51.12 + 2 * 12.24 + 3 * 1.44 + 4 * 7.2) / 600 ~ .181

也就是 181 points 的 SLG regressed,相當於讓 Albert Pujols 變成 Orlando Hudson!

而如果您眼睛夠尖,應該不難發現個人所使用的方法其實有 Marcel 那種 regress toward the mean 的味道在內,由於一位 MLB 的投手大約需要 600+ IPs 的累積才能讓他的 stuff 較忠實的由數字來反映,因此嚴格說來,現在的 CBill 並不很適合這樣的 approach。但無論如何,個人想表達的是透過這些簡單的算術來表達 CBill 現階段的 "降頭" 有多嚴重;而一旦他的數字開始 regress,又會如何的 "功力大增"。

而現在 Dodger fans 該擔心的是:如果在 Joe Torre 的耐心用完前 CBill 的 "luck" 還回不來,那可就不太妙了。

※※※※※※※※

近兩天對上 D'Backs 的比賽讓我對一件事想了很久:一位 manager 要如何在一場 8:3 贏球的賽事裡用上 5 個投手?不過 Joe Torre 就有這個本事,事情則發生在 4 月 23 日。

即便是先發的 Derek Lowe 在投滿 5 局後退場,Dodgers 仍然以 6:1 領先,差距不可謂不小,這個時候就用 Park 這種 mop-up 投到底也就可以了!結果 Joe Beimel 卻還上場做了一回幾乎像是 LOOGY 的事!?箇中道理,還真讓人百思不得其解。

其實這是個值得觀察的環節:Joe Torre 對於 bullpen 的調度一直給個人一種 over-managed、過多的 interfere 的感覺,不曉得是不是因為這樣才讓 Scott Proctor 曾經有過單季出賽 117 場 100+ 局的紀錄?不過這也難怪 management 在 24 日這天把 DeWitt 送回 minor,由 RP 的 Cory Wade 補上 -- 以 Torre 對牛棚的調度,會造成牛棚人手不足根本只是時間問題。

如此一來,Dodgers 再度回到 12 名投手的編制,這對於 roster spot 其實已經有某種程度的浪費,不過如果您曉得 Brewers 在他們的 active roster 裡塞了 14 名投手 (如此一來,可能有助於 Ned Yost 延後 Brewers' bullpen 崩盤的時間),那麼對於 Dodgers 的情況,或許也稍微可以寬心點吧?

※※※※※※※※

提到 Scott Proctor,如果我們分析 Dodgers 是如何把他弄到手的話,可以向上 retro 到 06 年:

  • Dodgers 用 Edwin Jackson (SP) + Chuck Tiffany (SP) 向 Rays 換來了 Danys Baez (RP) 與 Lance Carter (RP)。

  • Lance Carter 被 outright 後,Danys Baez + Willy Aybar (SS、3B) + undisclosed cash 向 Braves 換來了 Wilson Betemit (SS、3B)

  • Wilson Betemit 向 Yankees 換來了 Scott Proctor

所以 Dodgers 等於是用兩位年輕的 SP prospects -- Edwin Jackson & Chuck Tiffany -- 換回了手臂已經快要投到飛出去的 Scott Proctor。

How brilliant, Ned ...

Friday, April 18, 2008

Online WPAB

THT 的 Dave Studeman 在 04/17 的 Ten things I didn’t know last week 裡發表了一個新的玩具:

  • Win Probability Above Bench

  • 簡稱 WPAB。

    原則上這是 WPA (Win Probability Added) 的延伸,由於 WPA 的意義是 WAA (Wins Above Average),WPAB 則是把 WPA 的 baseline -- 也就是 league average -- 變成讓使用者可以自行設定的東西,換句話說,可以藉由這個新玩具計算 Wins Above "Replacement Level"。

    話說回來,個人對於 replacement level 的興趣其實有點缺,畢竟無論 replacement level 如何訂都不會比直接 apply league average 為 baseline 來得直覺,不過在 WPAB 剛 "上市" 的 early stage 裡,我們不妨先來看看它的內涵。

    Studeman 的對 WPAB 的 inspiration 如下:

    WPA is the difference between a player's Win Advances and Loss Advances in each game. By subtracting one from the other, WPA compares a player's contribution to an average (.500) player.

    Well, what if you want to compare a player to another level, such as a .350 player, or .400?

    也許很多朋友的第一個問題會是:什麼叫做 "a .350 player"?這裡的 ".350" 代表什麼意思?是 OBP?還是 EQA?亦或是 wOBA?

    事實上這個 ".350" 在 07 年球季時個人曾經在幾篇討論 BP baseline 的文章裡做過一些介紹 (這裡這裡),如果你沒有看過,我們趁這個機會做個說明:以打者而言,它所代表的是 Offensive Winning Percentage,或簡稱 OW%,它的計算方式如下:

    • 計算某位特定打者的 Runs Created per 27 outs,or "RC27"。

    • 計算 league average 的 RC27,say "lgRC27"。

    • Claim: X = ( RC27 / lgRC27 )

    • OW% = (X^2) / ( 1 + X^2 )

    不難發現最後的 "X^2 / ( 1 + X^2 )" 正是 power = 2 的 Pythagorean Formula。那麼如果我們利用 Keith Woolner 在架構 VORP 時所 apply 的 ".380 OW%" baseline 來計算,一季的勝場數是:

    162 * .380 = 61.56 (wins)

    怎麼解釋 61.56 wins?這指的是一支由 Keith Woolner 的 replacement level 打者league average 的投手 所組成的球隊一季可以得到的理論勝場數,如果您長時間有 trace 這個 Blog,"61.56 wins" 應當不陌生,因為 07 年 offseason 個人做 model reality 的討論時曾經出現過。

    我們還可以計算 Woolner 的 replacement level 打者的 RC 與 league average 的比較:

    X^2 / ( 1 + X^2 ) = .380
    X = 0.783

    所以 Woolner 的 replacement level 打者的 RC (Runs Created) 是 league average 的 78.3%

    那麼投手呢?前面已經提過:OW% 是 Pythagorean Formula 的延伸,如果想知道 .380 的投手的 RA 與 league average 的比較,我們就對下面這個式子求解:

    1 / (1 + X^2 ) = .380
    X = 1.27

    因此 .380 投手的 RA 是 league average 的 127%!接下來我們進一步看 Woolner 的 "replacement level team" 一季的 WPCT -- applied by Pythagorean Formula with power = 2:

    (0.783)^2 / ( 0.783^2 + 1.27^2 ) = 0.273
    162 * 0.273 = 44.22 (wins)

    此即為 VORP 實質 baseline 為 44-win per season 的球隊的由來。而花時間解釋這個部份的目的無非是讓想玩的朋友有個可以 reference 的點,換句話說,我們將使用 WPAB 來與 VORP 做比對。

    我們以 07 年 Dodgers 的 Andre Ethier 為例,首先查到 Ethier 在 07 年的 VORP 是 13.8。接下來我們 refer to Ethier 在 Fan Graphs 的 stats,然後打開 Studeman 所提供的 新玩具

    • Win Advances 的欄位填上 9.29 (Ethier 於 07 年的 WPA+)。

    • Loss Advances 的欄位填上 8.96 (Ethier 07 年的 WPA-),注意在這裡不要加上 "負號"!

    • Target Replacement Level 的欄位填上 0.38 -- 因為先前提到 VORP 的 baseline 就是 0.38 的 OW%。

    Submit 之後,我們得到 Ethier 在 07 年的 WPAB 是 1.1,如果從 10-run equals 1-win 的角度,11 的 Runs Above Bench 與 13.8 的 VORP 並沒有差很多,right?

    這裡必須再說明一件事:選擇 Ethier 為例子純粹是因為他在 07 年的 clutch (refer to fan graphs) 只有 0.09,幾乎是 neutral、沒有受到 situation 與 context 太多影響的結果,加上 VORP 本身也沒有考慮 situation 與 context,這才能將 WPAB 與 VORP 做一個對照,如果我們找一位 clutch 距離 "0" 較遠的球員,相信兩者的結果是會差很多的!我想未來還有機會對 Fan Graphs 所定義的 clutch 做深究,這裡就先點到為止。

    Have fun!

    Saturday, April 12, 2008

    Season's Young, but...

    08 年的 Dodgers 在首週連下兩個 series (面對 Giants & Padres),之後立刻在 Chase Field 遭到 D'Backs 的 swept,雖然說球季連 1/10 都還不到,但是從 transaction 與 lineup 的安排上,個人對於 Joe Torre 的評價也正在一點一滴的往下掉。

    ◎ Offensive Slump

    先看看 Dodgers 在前 9 場比賽裡打擊 (BWPA)、先發投手 (SWPA) 與後援投手 (RWPA) 的情況,我順便把 3 個項目的 BRAA 也都帶上,其中的差別在於 situational 與 context:

    BWPA

    B_BRAA

    SWPA

    S_BRAA

    RWPA

    R_BRAA

    -0.96

    -10.39

    -0.26

    0.76

    0.75

    5.51


    以 10-run equals 1-win 的角度來看,Dodgers 之所以在前 9 場比賽打出 4W5L 的原因在於 bullpen 的 "clutchness",先發投手與打擊群受到 context 的影響頗有限,但不得不提的一點是在前 9 場比賽裡,所有的 RPs 已經累積了 27 場的出賽數 -- 平均每場比賽要上 3 個人次,且不論 Torre 是不是比較愛操 bullpen 或者是 over-managed,打擊群與先發投手沒能提供適切的支援恐怕也必須考慮,這一點需要持續的觀察。

    然而在 Dodgers 目前的打擊群裡究竟誰是元兇?以 BWPA 來看,Andruw 以 -0.58 拔得頭籌,至於有必要做上半身移植的 Juan "garbage" Pierre 則以 -0.49 緊追在後,只是別忘了:Andruw 的 PA 幾乎是 Pierre 的兩倍 (34:18),全 MLB 恐怕也只有 Pierre 這種 a*s-hole 能在短短 18 個 PA 裡就耗掉 Dodgers 0.5-win abouve average (相當於 1GB),真是不可思議....



    ◎ Joe did not hit the right button!

    坦白說,Joe Torre 在 opening day 時 dump Pierre 的做法讓個人驚訝,甚至是驚豔!至少單就 "Pierre 原本擁有 MLB 現役球員累積最多連續出場次數的頭銜 (somewhere around 434 games, I guess...)","而 Joe 在開幕戰時卻連代打或代跑 Pierre 都沒有" 一事看來,確實是很讓人過癮的!只是 Joe 此舉究竟是示威?亦或是老眼昏花加上 dugout 燈光不佳,讓 Joe 以為那是一件背號 "9" 的球衣晾在椅子上....這就不得而知了。

    無論如何,Joe 在 opening day 捨 Pierre 就 Ethier 的真正理由雖然我們不清楚,但我們希望這個理由要 "夠充分"!如果只是因為 Ethier 比 Pierre 有個較好 spring training那麼 Joe 的腦袋是有問題的!正確答案應該是:Ethier is way too much better than Pierre, So does Matt Kemp!

    顯然 Joe 在 Dodgers 的外野問題、或者說 "識人之明" 上 -- 至少現階段 -- 他的答案是錯的!



    ◎ Deja Vu?

    話說回來,原本以為會 "無事可做" 的 Ethier 似乎得到了 Joe 的信任而成為 regular,但卻使得 Matt Kemp 溫了不少場的板凳!

    Joe 在 08 年的第 2 場比賽就把 Kemp 從 starting lineup 中扯了下來,當時官網的 Ken Gurnick 說 Joe 是考慮到 Pierre 在對上 Giants 的 SP Matt Cain 時擁有比 Matt Kemp 好的 split stats。Well,Ken 所給的數字對不對個人也懶得去查証,因為 head-to-head 的 split stat -- 基於 small sample size -- 是完全沒有意義的!不過對於絕大多數 old school 的 managers 來說,split stats 卻是讓他們深信不疑的東西,這一點新生代的 fans 還必須多多忍耐!

    也因此,個人對於 Joe 在面對 Matt Cain 時以 "head-to-head split stats 較好的 Pierre" 先發沒有太多的意見。

    但接下來在 Petco Park 對上 Jake Peavy、Chase Field 對上 Dan Harren,甚至連 04/11 於自家再度面對 Peavy,Joe 也都讓 Kemp 坐了板凳,理由則是:Joe 認為 Kemp 正在 slumping,讓他面對較強悍的投手可能有損他的信心。

    Joe 這個理由讓個人覺得似曾相識,所以我把某個 famous quote 給找出來給大家看看:

    What I wonder is, if you give him too much left-handed pitching, do you mess up what he's doing against right-handed pitching?

    這是 ex-manager Jim 'Dumbo' Tracy 對 Hee-Seop Choi 的形容,當時他以此為由不讓 Choi 做 regular,甚至以 OPS capability 不到 0.700 的 Jason Phillips 去 override 1B 的位置,進而導演了 Dodgers 在 05 年的大災難。相較之下,Joe 現在對於 Kemp 的處置藉口就很像是 Tracy 在 05 年之於 Choi 的翻版,如果大家都認定 Tracy 是笨蛋,那 Joe 在球員運用這個層面上也高明不了多少。

    Dodgers 有很好的理由需要 Kemp,以 07 年來說,Dodgers 的 OFs 一整季只提供了 35 發 HRs 的輸出,在整個 NL 排名第 15,因此雖然 Kemp 有 plate discipline 的問題,卻是一個可以期待的 power 來源,要求 Kemp 一年貢獻 15 ~ 20 發或許不算太奢求,但這個數字對於 career 僅僅 12 發 HRs 的 Pierre 來說和要他的命是一樣的!Moreover,Kemp 所背負的是 Dodgers 的未來,Pierre 最容易達成的任務卻是如何致 Dodgers 於死地。

    Kemp 的確需要一些時間再 develop,即使他處於 slumping 的狀態,也該給他機會去學著克服,而不是拿 Pierre 來濫竽充數!Joe 真的必須要瞭解到 Dodgers 不是 Yankees,不是那種把 A-Rod 放在第 8 棒都可以打進 playoff 的球隊,能犯錯的 margin 很小,如果繼續執迷不悟,08 年對 Dodgers 來說依舊是前途無亮的一年。



    ◎ The intriguing part of Andruw's status quo

    Dodger Stadium 的 Dodger Fans 向來是相當溫和的一群,除了 Barry Bonds 和 umpires,很少可以聽到他們集體對著別隊的球員 "Boo ~",對於自己的球員更是不太可能,不過 Andruw 就有這個本事 -- 才不過披上 Dodgers 的 uniform 不滿兩星期,現在的他只要一出局,就可以兌換全場的噓聲一次。這也難怪,前面已經提到 Andruw 目前 "扯後腿" 的程度在 Dodgers 的野手群裡拔得頭籌,更不用提現階段不滿 .340 的 "OPS" -- 比 Blake DeWitt 的 "OBP" (.385) 還糟。除此之外,Andruw 目前的 11 次 SO 也是全隊最多,這些都是很容易讓大家不喜歡他的地方。Vin Scully 爺爺更是說 Andruw "swings at almost everything"。

    我們來看件有趣的事:到 4 月 11 為止單一打席平均用掉對方投手球數最多 (P/PA) 的 Dodger。

    在 P/PA 這項 category 裡,現階段 Dodgers 的狀元是 Russell Martin 的 4.67 -- 看起來像是為什麼 .15x 的 AVG 還能維持超過 .300 OBP 的原因;榜眼則是 Rafael Furcal 的 4.63 -- 毫無疑問,健康的 Furcal 基本上就是 NL 最好的 SS;至於探花...這個答案可能會 bring down the house -- Andruw Jones 的 4.45

    要說的是,這些結果都因為球季才剛開始不久所以參考價值很低,但提到與投手纏鬥,Andruw 實在不像是這種 type 的球員。


    ◎ The story RBI tells me ...

    我們持續 Andruw 的話題。

    由於 Andruw 有一個很糟的 07 年,使得他在 offseason 所簽下的合約並不如預期來得長。或許 05、06 年 -- 分別交出 51、41 發 HRs -- 是 Andruw 的 "career years",然而事實是否真的是這樣?Andruw 究竟是不是一個稱職的中心打者?在這裡,個人不拿 Andruw 的 OBP 做文章,也不看 EQA、不看 OPS_Win,我們來看看 RBI -- 這個大家都再熟悉不過的東西。

    我們曉得球員 RBI 的多寡和他被安插在 lineup 裡的 spot 有很大的關係。一般來說,No.3 與 No.4 都是球隊最主要進帳分數的來源,同時基於 No.3 與 No.4 都是所謂的 "power slots",No.3 與 No.4 的 "RISP" (Runners In Scoring Position) 不應該只考慮 runners 在 2B 或 3B 的情況,而是只要 runners on,對 No.3 或 No.4 來說就可以算是 RISP。

    在 Braves 的時代,Andruw 幾乎長時間的擔任 No.4 的位置,以 05 年來說,他一共打出 128 RBIs,扣除 51 發 HRs,這等於是有 77 位 ROB (Runners On Base) 被 Andruw 打回來,然而 Andruw 在 05 年整季的打席裡,壘上一共出現過 503 位 ROB。換句話說,Andruw 在 05 年把 15.3% (77/503) 的 runners 轉換為 runs。這個比例在 05 年 NL 所有滿 400 PAs 的打者裡排在第 39 名。

    我們給一個 reference point:Jeff Kent 在 05 年打進了 76 位 ROB -- 僅僅比 Andruw 少了 1 位,但 Kent 只有 435 ROB,換句話說,Kent 將 17.4% (76/435) 的 runners 轉換為 runs,在 05 年 NL 所有滿 400 PAs 的打者裡排名第 8

    想一想 NL 一共有幾隊?一隊又有幾位打者可以拿到這麼多的 ROB chances?Andruw 的表現 -- 即便有 51 發 HRs 的光環,算是個稱職的 clean-up hitter 嗎?

    如果我們繼續看 06 年,Andruw 的 129 RBIs 裡扣除 41 發 HRs 等於是 88 runners 被轉換為 runs,而整季下來他一共有 503 次 ROB,轉換率是 17.5%;相較於 06 年被 LA local media 詬病在 ROB 時 approach 不佳的 J.D. Drew 也在 437 個 chances 裡順利轉換了 80 runs,18.3% 的轉換率仍然比 Andruw 為佳。

    我不曉得這裡的 "轉換率" 是不是一個有預測能力的數字?至少這足以讓我們對 Andruw 擔任 cleanup hitter 的能力產生合理的懷疑,搞不好他只是 OF 版的 Adrian Beltre!?

    果真如此,對於一個有 power 又過於積極出棒的 Andruw,個人以為:不妨把 Andruw 放在 No.2 試個幾場,多給他一些壓力較小的打擊機會,也許有助於 Andruw 發揮應有的水準也說不定。