Friday, April 07, 2006

Crème De La Crème -- The Saves

在美國時間 4 月 7 日晚上的比賽,Dodgers 移師到 Philadelphia 作客,這是 06 年頭一次在 Dodgers 的比賽裡聽到 Charley Steiner & Steve Lyons 擔任 commentators,GM Ned Colletti 則在 Top 3rd 受邀擔任 Guest。

撇開比賽不談,Dodgers 最主要的話題就在於 Gagne 的 elbow surgery,Colletti 表示 Gagne 在 spring training 期間隱瞞了病情,所以他也無法掌握 Gagne 的真實狀況。而 Colletti 預計 Gagne 大約會離隊兩個月的時間。且不論這個評估是樂觀或悲觀,至少留給 Dodger Fans 一線在 06 年仍然能看到 Gagne 出場的希望。也因為這樣,Dodgers 並沒有考慮將 Gagne 放在 60-day DL,而是 Werth 被移到 60-day DL 以製造一個 spot 給 contract purchased 的 RP Saitoh。

既然談到 Gagne,就不可能不提到 Danys Baez。Lyons 在 Colletti 接受訪問時談到 Baez 的交易是一個 tremendous move。言下之意,Gagne 的脫隊重新定義了 Colletti 在 05 年 offseason 那筆 Tiffany + Jackson <=> Baez + Carter 最糟的交易的價值。Lyons 更在賽前肯定 Baez 在 05 年身在一支糟糕的球隊,卻仍然能拿下 41 saves 的成績。

Saves?這是一個很具有欺騙性質的數字,就像 Holds 一樣,對 sabermetricians 來說,這兩個屬於 RP 的 stats 永遠是 "Little thing means a little"。

假設某位 reliever A 在 Top 8th 時球隊落後 1 分進場沒有失分,在 Bottom 8th 時己方一口氣灌下 4 分而使得球隊倒領先 3 分,最後 A 投到比賽結束都沒有再出錯,A 將拿下 1W (Win);但如果 A 把比賽於 Top 9th 交棒給 closer B 來收尾,這場比賽的結果就成了 1W + 1S (save)。基於「分工」,沒有人會說這樣的調度是不正確的,但這樣的 save 就像是「偷了一個 decision」。

從另一個角度切入:在 9th inning 時,不論球隊領先 3 分或 領先 1 分,closer 上場將比賽結束,他拿到的都是 1 個 save,不過我相信大部份的 closer 都喜歡在領先 3 分的時候上場。換句話說,領先 1 分的 save 比領先 3 分的 save 要有品質,但 total saves 永遠不會告訴 fans 這其中的故事。

BS (Blown Save) 呢?其實可信度也有限。有的時候 RP 在大量超前 (3 分以上) 時上場,結果卻把領先分全都吐了回去。在這種情況下,由於 RP 上場時並不具有 save opportunity,所以也不會有 BS charge 在這種 RP 的身上。雖然這種傷害對球隊而言非同小可,BS 卻說不出這個部份的故事,更沒有一種指標 -- 好比說 "Squander" -- 讓這類的 RP "Got what he deserved"。

基於 Bequeathed Runners 的失分不計在 RP 的頭上,使得 ERA 對 RP 而言也沒什麼太大意義;WHIP 呢?它可能只說了部份的故事,畢竟就打者來說,WHIP 的其中一部份 -- Hits -- 是一項受到 defense 影響極大的數字,也因此 Voros McCracken 將 DIPS 的觀念帶進評量投手能力的領域 (不過這不盡然是正確的!David Gassko 的文章 提供了一些 DIPS 的 further development 與參考文獻)。Nate Silver 則針對 WWII 以來、每連續兩年超過 500PAs 的打者,算出了他們在幾項 Hits 指標方面的相關性:

Category / PACorrelation Coefficient
Single0.68
Double0.43
Triple0.51
Homerun0.81
SO0.88
BB0.81

事實上投手的部份和打者差不多,只有 HR、BB 與 SO -- 與 defense 無關的數字 -- 統稱 TTO -- Three True Outcomes -- 才是較為可靠的指標。即使如此,TTO 只能說明投手的 stuff。

RP 的 stuff 固然重要,但以我個人的看法,我比較偏好 Leverage 這個數字。簡單的說,Leverage 將 SP 進場的情況定義為 1.00 (less important),所謂的 High-Leverage Situation (more important) 就像是比數咬得很緊、或是 late-inning 時的情況,它和 Win Expenctancy 有很大的關聯性,BP 的 Keith Woolner 在 05 年重新考慮了原本由 Tantotiger 提出的點子讓 Leverage 成為 BP Statistics 的一項新數據,簡單的講述一下 Leverage 的概念:

以 Win Expectancy 的角度來看,假設在 1st inning 的 lead-off HR 會讓球隊贏球的機會由 50% 上昇到 59.8% (+9.8%);但是在平手的情況下,8th inning 的 lead-off HR 則會使球隊贏球的機會由 50% 昇到 74.9% (+24.9%)。換句話說,同樣是平手、同樣是 lead-off HR,但出現在 8th inning 的話,它的價值將是出現在 1st inning 的 (24.9 / 9.8) = 2.54 倍。於是在平手時 start 8th inning 的 RP 的 Leverage 便是 2.54。

也就是說,Leverage 反映出來的是 situational 的重要性。同時再配合 WXLWXRL,這會是看一位 RP 的價值較好的指標。

以下是 Baez 在 05 年和幾位 RP 的比較:

NameTeamWXLWXRLLEV
Danys BaezTBA2.9924.4721.71
Yhency BrazobanLAD-0.3610.9131.74
Duaner SanchezLAD0.6651.7291.46
Scot ShieldsLAA2.8064.5232.03
Mariano RiveraNYA3.5795.1651.77
Francisco RodriguezLAA3.9825.6262.21
Joe NathanMIN3.0084.4002.04
B.J. RyanBAL1.9483.3751.57
Billy WagnerPHI2.4773.7811.51
Brad LidgeHOU3.2844.6501.48

我們可以發現的是 Baez 在 05 年的 LEV 和 Rivera 差不多,不過在校正之後,WXL 與 WXRL 則顯示出兩者對球隊貢獻的差距。但對於一位在火力最兇猛的 AL East 的 closer,不能否認的是 Baez 在 05 年的表現確實是不差的。

Brazoban 的數字則反映出他與 Baez 在幾乎相同的 LEV 下砸掉了多少球隊的勝利 (而且在 NL "Mild" West!);老朋友 Sanchez 與 LAA 的 Shields 比較則可以發現 LEV、WXL 或 WXRL 不會因為投手的身份是 RP 或是 closer 而產生 bias;另外也多少可以說明 05 年的 offseason 裡,Omar Minaya 和 J.P. Ricciardi 花了點「瘋錢」。

至於 Gagne 在 03 年與 04 年的表現則是:

YearWXLWXRLLEV
20037.3589.2542.08
20046.3088.0012.11

附帶一提,Gagne 在 03 與 04 年的 LEV 都是 ML Top 1,WXRL 在 03 年也是 Top 1,04 年則只落後 HOU 的 Brad Lidge 的 8.132 (with LEV 1.62)。對於 Gagne 在健康時的表現,我只能說:He deserves to be named "Game Over"。

我想,「假使」Baez 能維持 05 年的表現,Dodgers 將 Baez 弄到手或許也算是砸錢做了一定程度的 damage control (I admit I still miss Tiffany though...),但 Baez 在 05 年的 41 saves 絕對不是給予他 credits 的關鍵。

7 comments:

KSwisher said...

仍在消化數據中,不過有些想說地話。

事已成定局,Baez也正式接下Dodgers closer的位置。猶記得在sports weekly還是那本雜誌專訪Baez時他曾表示不滿被DRays交易到Dodgers的決定,因為他認為以他去年的表現,實在是deserve closer的工作,而非是任一球隊的setup man。所以,現在正是他證明自己實力的時候了。

另外,在該雜誌還有老闆太太的專訪,看來她人還不錯的樣子。

Anonymous said...

不好意思,可以多解釋一下LEV嗎
我實在看不太懂

一個RP的LEV的數字
究竟代表為球隊帶來什麼好處?

是所有SP都設定為1.00嗎?

我已去BP看了一下
但英文不好
如果您有時間多做些教學解釋
我會很感激
謝謝

Morikawa said...

To KSwisher,

我相信在一支 NL West 的球隊裡做 closer 對 Baez 來說不是什麼難事,前提是他要能維持 05 年的表現。畢竟從 Baez 的年齡與他的 stuff 來 forecasting 的話,結果並不令人樂觀。

05 年 offseason 與 Rays 那筆 Tiffany <=> Baez 的交易我寫有寫過一些 comment,但是在 Gagne 「暫時」離隊之後,只怕那 vicious、vacuous、vindictive 的 LA media 又要歌功頌德一番。

其實我認為 Baez 的問題很簡單,主要就是因為他的 contract 沒有 guarantee 07 年的部份,換句話說,就算 Baez 再怎麼優秀,Dodgers 不可能「很便宜的長期控制」 Baez。而 Tiffany 在 Greg Miller 掛得差不多之後,應該說也背負了 Dodger Farm No.1 LHSP 的期待,但 Dodgers 卻連等他進 40-man roster 都不肯!

Believe it or not,Tiffany 到了 Bays 的 farm system 應該隨便都能排得上 Top 10。這等於是 Dodgers 犧牲了長遠的計劃去換短期的目標。

至於老闆夫人的話....我個人對她沒有什麼太深刻的印象,只知道 LA Times 的 columnist T.J. Simers 稱 Jamie 為 "screaming meanie" (我一直誤會這是 Simers 給 Frank McCourt 的封號),這究竟是為什麼?我也說不上來。

Morikawa said...

To sxxxxxFAN,

抱歉,如果把你的名字打出來,那確實像是在罵人,所以用 "x" 代替。我相信我個人的表達能力是有些問題,時常在寫完之後回頭看時才發現很多奇怪的用詞、用字與不正確的邏輯演繹。

在這裡,我先盡量不從數字面去解釋 LEV 這個環節,先想一個例子:如果某球隊在進入 Top 8th 時領先 3 分,被攻成無人出局滿壘後換上第一任後援投手 A,結果 A 在無失分的情況下將 Top 8th 守住,最後領先 3 分進入 Top 9th,由 coser B 來接替並結束比賽。

表面上的結果是 B 拿到一個 save、A 拿到一個 Hold。請問:A 和 B 的貢獻究竟是誰比較大?

相信多半的人都會愛說某 RP (後援投手) 在 XX 年拿下了 XX 個 Saves,卻鮮少有人去提某 RP 在 XX 年拿下了幾個 Holds。

但是就上述的例子,我相信沒有人會認為 A 的貢獻比 B 要小。也就是說在上述的例子裡,對球隊的勝負而言,「A 進場的時機其實比 B更加關鍵」,但這種「關鍵的程度」卻不是 Save 或 Holds可以告訴我們的,但 LEV 正是拿來定義這種「關鍵的程度」,用英文講,就是「LEV defines how intense the situation is as a RP is brought in.」

將 SP 的 LEV 設定為 1.00 在統計學上算是一種 "truncation",因為我們預期當比賽尚未開始前,球隊獲勝的機會是五五波的緣故。

如果以 05 年的數字來看,在上述的例子中 B 進場的 LEV 是 0.41。也就是說,B 進場時球隊幾乎已經勝券在握了 (實際上,05 年在 9th inning 領先 3 分時球隊的贏球機會是 0.978)。

也就是說,如果一個 RP 的 LEV 越高,則表示他進場的時機就越關鍵。但 LEV 的意義也僅止於此,我們必須要配合 WXL 或 WXRL 來看才會更準,這也就是我在原文中提過的東西。

再用一次上面的例子:由於 B 進場時球隊的勝利機會是 0.978,而最後 B 也確實讓球隊贏得勝利,那麼 B 等於是為球隊添得了 ( 1 - 0.978 ) = 0.022 場的勝利,這就是 Win Expectancy 的基本觀念。

但是這裡的 0.022 是非常「生」 (raw) 的數字,另一個不能忽略的要素是一般來說 B 進場時如果碰到的是 3、4、5 棒的中心打者,那麼難度又比起他碰到的是 7、8、9 棒的打者要高,所以 BP 的 WXL 就是針對這一點為 Win Expectancy 做修正,WXL 修正的對象則是用聯盟打者的平均水準,WXRL 修正的對象則是 replacement level 的打者。這裡 replacement level 所指的對象大概指是那些 OPS ( OPS = OBP + SLG) 「低於聯盟平均水準約 0.07 的打者」,翻譯成中文,就像是那些剛從 AAA 上來的替補球員的水準。

也因此,我在原文中將 Dodgers 的 Brazoban 與 05 年仍在 TBA 的 Baez 拿出來比較,在他們的 LEV 相仿的情況下,你發現的是 Brazoban 的 WXL 甚至是「負值」 (-0.361),這多少說明了 Brazoban 在 05 年的投球有多麼的 struggle。另外在原文的列表裡,我把條件設定在至少在 05 年投滿 50 innings 的 RPs,基本上比較沒有投球局數不足所造成的怪現象。

總而言之,LEV 是一個好的參考指標,但如果不配合 WXL 或 WXRL 來看,其實並沒有什麼太大的意義,LEV 仍然只告訴了我們一部份的故事而已。

希望你看得懂以上的說明:)

Anonymous said...

懂了懂了
您解釋的非常清楚
我這次看懂了
謝謝您的詳細解說

Morikawa said...

我想,這裡還是有一些 terms 需要修正和補充一下:

1. 定義 SP 的 LEV 為 1.00 不盡然代表說球賽開始時雙方獲勝的機會都是 50-50,也許拿獲勝的機會將主隊的 SP 與客隊的 SP 相比會類似出現像 57-43 之類的情況,但這裡可以再做修正:好比說前例中 B 在 主場的 Top 9th 領先 3 分進場時擁有 0.41 的 LEV,那麼 B 在客場的 Bottom 9th 領先 3 分進場時的 LEV 可能會是 0.41 * (57/43)。

2. WXL 或 WXRL 是違反 model reality 的一項數字,好比說 Gagne 在 03 年的 WXRL 是 9.2542,這並不代表 Gagne 在 03 年替 Dodgers 掙得了 9.2542 場的勝利!因為這個 9.2542 是建立在 replacement level 的 RP 一季為球隊掙得「0」場勝利的情況下所「比較」出來的結果。事實上就算拿一支全都是 replacement level players 的球隊在 ML 的等級打個一季,他們絕不可能一場比賽都贏不下來!也就是說,WXL 和 WXRL 這是建立在 "truncate" 的觀念所下的結果,並不是一個代表實際的數字,但拿來做比較卻也算不失其意義。

Morikawa said...

更正一個用詞:

「將 SP 的 LEV 設定為 1.00 在統計學上算是一種 "truncation"」

這裡的用詞不正確,LEV 應該叫 neutralization 或是 nomalization,像是 Bill James 提出的 speed score 才是 "truncation"。