Monday, August 28, 2006

Chad Took More Than Rattling D'Backs' Cage

儘管在 Petco Park 遭到 Padres 的橫掃,Dodgers 仍然盡力拿下了在 Chase Field 的 series,以 4W5L 的成績結束了這次的 9-game road trip,勉強算是可以接受的結果。以下是本次與 D'Backs 的 series 的一些 summary (Ex_H:Extra Base Hits):

TeamRunnersEx_HRunsBABIP
Dodgers4113170.273
D'Backs5510150.370

發生在 Dodgers 身上的壞事還不少:得不到主審 corner strike 青睞的 Maddux、中彈的 Lowe、著火的 bullpen... 反觀 D'Backs 的運氣則是好得不可思議,Dodgers 被轟的安打真正 hit hard 的並不多,但對手在前兩戰的 BABIP 分別是 .388 與 .385,這簡直是面對一個由 9 個 Ichiro 所組成的 lineup,途中則因為 bullpen 燒乾而使得 Gio Carrara 遭到 released 並由另一個 "washout" RP Hamulack 緊急接替 (Big deal...),更不用提在第一場 15 局的鏖戰後,D'Backs 接下來兩戰的 SP 是很會吞局數的 Miguel Batista 與 rubber arm -- Livan Hernandez。

在 Jeff Kent 的 clutch solo-HR 下讓 Dodgers 保住了拿下這個 series 的可能性,最後一戰的責任落到了 young Chad Billingsley 的頭上。

Billingsley 在 06 年的前幾次 outing 總是讓教練團坐立難安,他的基本線就是 5-inning、100 pitches、and no more;只是在 All-Star break 後,Billingsley 似乎有越投越有感覺的趨勢 (8 starts, 48 inning pitched, RA 2.43),根據 D'Backs broadcaster Thom Brennaman 轉述的故事,Grady Little 對 Billingsley 打了一道雷:

Listen, son. We're not gonna let you pitch 5 innings then burn our bullpen. You can do that in Las Vegas, or you just go out and win everything for us. Your call!
-- Grady Little, Dodgers manager, talk to Chad Billingsley

Brennaman 並不是那種會瞎扯蛋的 broadcaster,但他保有了 west division 大部份 broadcasters 的特色:轉播球賽是一種閒聊,也因此送上了這段頗具娛樂性質的談話。而 Billingsley 在對上 D'Backs 的 rubber game 裡給了 Dodgers 7 solid innings,讓 bullpen 得到了調整,也把 series win 帶給了 Dodgers。別弄錯了,Billingsley 仍然被 D'Backs 敲了 .333 -- bad luck -- 的 BABIP,除了 Gonzo 那支 double,真正被痛打的球其實沒有幾個,加上幾次適時出現的 GIDP,Billingsley 贏得幸運,卻也不是完全僥倖。

然而這場比賽裡有一個很值得玩味的點。

在 Top 5th 的進攻裡,1-0 落後的 Dodgers 由 Ethier 率先攻上 2B,接下來 Betemit 一個 "productive out" (This "epithet" doesn't make much sense.) 給了 Dodgers 1 out、runner on 3rd 的機會,輪到第八棒的 Martin 打擊。

此時 D'Backs manager Bob Melvin 賞給了 Martin 一個 IBB 使得局勢變成了 1 out, runners on 1st & 3rd,前一次打擊擊出中間方向 blooper single 的 Billingsley 即將上場。想像一下:如果你是 Grady Little,你會怎麼做?

以下是 3 個不同的人的答案:

  • I'll let Billingsley swing.
    -- Thom Brennaman, D'Backs broadcaster

  • I'll let Billingsley bunt.
    -- Joe Garagiola, D'Backs broadcaster

  • Stand still, and wait for the 3rd strike call.
    -- Morikawa, nobody

"Nobody" 的想法很簡單:眼下是一個 potential GIDP situation,如果可以的話,put ball into play、尤其又是輪到最沒有打擊力的投手時,是必須要儘可能避免的。至於要求 Billingsley 把 Martin 給 bunt 到 2nd 的做法則必須考慮失敗的情況:撇開 GIDP,次糟的 failed bunt 可能造成 1st 的 runner 從 Martin 換成了 Billingsley,與其如此,寧願 Billingsley 早點回 dugout 休息並要求下一位打者 Furcal 多玩投手幾個球。

而 Little 的選擇和 Garagiola 相同,他得到一個 successful bunt,然後 Furcal 的 triple 與 Lofton 的 single 讓 Dodgers 以 3-1 超前。整件事看起來像是 Little 的決定 "right on the money",在此讓我們實際用 ERM (Expected Runs Matrix) 來檢視一下。

以下是 ML 由 1999 ~ 2002 年間的 ERM,由 3 種出局數與 8 種跑者狀況所組成的 24 個 situational expected runs:

Runner / Out012
---0.5550.2970.117
1--0.9530.5730.251
-2-1.1890.7250.344
--31.4820.9830.387
12-1.5730.9710.466
1-31.9041.2430.538
-232.0521.4670.634
1232.4171.6500.815

我找不到 06 年確切的 ERM,也懶得去 retrosheet 爬,原則上年與年間的 EXR (Expected Runs) 的差別不大,將錯就錯吧。

ERM 告訴我們的是當 Billingsley 上場打擊時,Dodgers 的 EXR 大約有 1.243 (由於輪到的是投手打擊,實際上這個數字可能要再下修一點),考慮以下的情況:

  • DP:
    Delta_EXR = -1.243

  • Bunt successed:
    Delta_EXR = 0.634 - 1.243 = -0.609

  • Bunt failed:
    Delta_EXR = 0.538 - 1.243 = -0.705

  • Strike out:
    Delta_EXR = 0.538 - 1.243 = -0.705

也就是說,Little 下令 Billingsley bunt 的結果可以比 "nobody" 的決定少丟 0.096 的 EXR。假使不在乎因為 bunt 失敗造成 Billingsley 必須上場跑壘的情況,讓 Billingsley bunt "應該" 是 better option。

但是不能忽略的是一個失敗的 bunt 也可能被 turned to DP,換句話說,考慮下定決心要 Billingsley 執行 bunt 的時候,以 P_bs、P_bdp 與 P_obf 分別代表 "成功的觸擊"、"觸擊失敗成為 DP" 與 "其它形式的觸擊失敗",整個機率空間 (probability space) 就可以表示為:

P_bs + P_bdp + P_obf = 1

由於讓 Billingsley 站著等 SO 是不可能出差錯的事,同時 Billingsley 被 SO 之後對 EXR 的影響和 failed bunt 相同。那就是說:當 "決定" 是 let Billingsley bunt 的時候,(-0.705) 就可以當成是這個策略下達的基準點,於是一個成功的 bunt 可以讓 Dodgers 賺進 0.096 的 EXR;bunt 成 DP 則會讓 Dodgers 損失 -0.538 (-1.243 + 0.705) 的 EXR,此時的 break even rate 就可以計算如下:

P_bs * 0.096 + P_bgidp * (-0.538) + P_obf * 0 = 0
( P_bs / P_bdp ) = ~ 5.6

這個結果告訴我們:只要 bunt successfully 的機率為 bunt into DP 的 5.6 倍以上,Little 此次的策略下達就不會賠!

事實上在 00 ~ 05 年間因為 bunt 造成的各種形式的 DP 的機率不大於 3%,那麼 Billingsley 的 bunt successfully rate 只要能 maintain 在 17% 以上,bunt 指令就有其合理的被執行性。

#### Updated at Aug.30, 18:04 ####

Walaykao 兄點出了我的疏失:上述的機率空間在計算 bunt successed 的 break even rate 是有問題的,必須考慮的是 bunt into hit 與 bunt into ROE (Reached On Error) 的情況 -- 雖然此二者發生的機會都不高,但是在 EXR 的變化上可能不小,更不用提在計算時是在底限 offset 0.705 的情況下。

先計算一下可能的 EXR 變化:

  • Bunt into Infield Hit (P_bs_hit):
    Delta_EXR = 1.650 - 1.243 = 0.407
    (Assume the runner on 3rd would be hold.)

  • Bunt into ROE I (P_bs_roe_I):
    (Result in error, base loaded)
    Delta_EXR = 1.650 - 1.243 = 0.407

  • Bunt into ROE II (P_bs_roe_II):
    (Result in error, run allowed and runners on 1st & 2nd)
    Delta_EXR = 1 + 0.971 - 1.243 = 0.728

  • Bunt into ROE III (P_bs_roe_III):
    (Result in error, run allowed and runners on 1st & 3rd)
    Delta_EXR = 1 + 1.243 - 1.243 = 1

  • Bunt into ROE IV (P_bs_roe_IV):
    (Result in error, run allowed and runners on 2nd & 3rd)
    Delta_EXR = 1 + 1.467 - 1.243 = 1.224

如果將上面這五種情況計入 bunt successed 的 category 裡,仍然以 P_bs 代表其成功的機率,計算 break even rate 的式子就要重新寫為:

(P_bs_hit + P_bs_roe_I) * 1.112 + P_bs_roe_II * 1.433 + P_bs_roe_III * 1.705 + P_bs_roe_IV * 1.929 + P_bs_o * 0.096 + P_bgidp * (-0.538) + P_obf * 0 = 0
Where P_bs_o = P_bs - (P_bs_hit + P_bs_roe_I + P_bs_roe_II + P_bs_roe_III + P_bs_roe_IV)

補上的 new categories 在 weight 方面都比較大,可預期的是 Billingsley 的 bunt 不需要 maintain 到 17% 的 successful rate 就可以達到 break even。

但機率空間在這樣的修正下究竟能改變多少?會不會從 17% 一下子掉到 10% 或更低呢?從數字面看來應該是不至於,在 ML 的比賽裡,put ball into play 所造成的 ROE per PA 大約在 1%,執行 bunt 的結果一旦發生 ROE 當然也會計在那 1% 裡頭。換句話說,那些 P_bs_roe* 的總和大約也會在 1% 上下跳動,如果再考慮 bunt into hit 的可能性,總的來說,17% 的 break even rate 差不多可以下修 3% ~ 4%。

#### End of Update ####

有興趣的朋友不妨可以算算看如果讓 Billingsley swing,在可能造成 DP 的情況下,擊出安打的 rate 大約要 maintain 到多少才足夠 break even。

另一個角度則是 Bob Melvin 選擇對 Martin IBB -- 將 Dodgers 的 EXR 增加了 0.26 分 (1.243 - 0.983) 是比較令人不解的事,當時 D'Backs 的確只有領先 1 分,但 Top 5th、1 out、RD (run differential) = 1 並不是什麼 very high leverage situation,Melvin 如果選擇讓 Livan 直接和 Martin 對決,Dodgers 在 top 5th 的進攻也許僅能以 1 分做收,Livan 也可能不至於在該局多投那麼多冤枉球。

"或許" Melvin 的決定讓整個 "運氣" 從 D'Backs 流向了 Dodgers,但還是那句話:Billingsley 也許有點運氣,而如果他沒有實力,單單僥倖並不會自動讓他贏得這場得來不易的勝利。

最後付上至 8 月 27 日為止的 Adjusted Dartboard Prediction:

NL West
TEAMP_WinP_LoseWPCT
LAN85.4876.520.528
SDN83.0978.910.513
SFN80.8181.190.499
ARI78.8783.130.487
COL77.8184.190.480


NL Central
TEAMP_WinP_LoseWPCT
SLN85.1376.870.526
CIN82.1379.870.507
HOU78.3483.660.484
MIL77.5084.500.478
CHN67.9594.050.419
PIT63.2598.750.390


NL East
TEAMP_WinP_LoseWPCT
NYN98.4463.560.608
PHI81.5080.500.503
FLO79.2082.800.489
ATL77.9084.100.481
WAS69.8992.110.431

Marlins 最近上浮的速度會不會太快...

Thursday, August 24, 2006

There're Still Cakes and Ale

如果不回頭看數字,我還真沒想到 Dodgers 的 Nemesis 居然是 Padres...

06 年的 Padres 在 NL West 內的戰績是 25-27,這看起來尚可的數字受到了 Dodgers 不小的恩惠,在 8 月 23 日遭到 swept 之後,Dodgers 與 Padres 的直接對戰紀錄是 3-11,還真不是普通的難看。

或許我們忽略了 Padre lineup 的力量,整個球季以來,Padres 的 Team OPS 一直徘徊在 .700 附近,但近來已經衝到了 .745 左右,與 Dodgers 僅有不到 30 points 的差距;除了季初 Padres 很妙的將老朋友 Piazza 降落在 San Diego 使得在 catcher 這個位子有了不錯的補償;另一個老朋友 Dave Roberts 在 Petco Park 的陰影下也打出不錯的成績,最重要的是 3B 的 noodle-swinger -- Vinny Castilla 被換成了不太好欺負的 Todd Walker,再加上老將 Mike Cameron 與 Brian Giles (power 沒了,眼睛還在),這個陣容在 NL West 其實還算夠看。

來看一下 Dodgers 的 SPs 對上 Padres 的成績:

NameGS/GW/LIPHK/BBRA
Billingsley2/20/010.1128/33.48
Hendrickson2/20/212137/13.75
Lowe2/20/012.299/43.55
Penny3/30/2152113/69.00
Sele1/20/1680/69.00
Tomko2/41/0161013/21.13

這排序沒什麼多大的意思,只是依 last name 做 alphabetize 而已。奇妙的是 Hendrickson 對上 Padres 投得還不差!? Uh...small sample size, all we got.

在與 Padres 這個 3-game series 進行前,Little 曾宣稱他要 "Ride Three Horses" -- 也就是 Penny、Lowe 和 Maddux,我也計算了一下,發現其實情況不是 Little 說了算的:自 8 月 21 日起,考慮 offday 對 rotation 的影響做 optimization 的話 (也就是儘可能跳過 No.5 SP),在剩下的 42 場比賽裡,Dodgers 除了 No.3 剩下 7 次 start 機會,剩下的 4 位 SPs 都還必須吃下 8 starts,現階段 No.1 是 Penny、No.2 是 Maddux、No.3 則是 Lowe,那就是說尚有 16 starts 必須由 Billingsley、Sele 與 Hendrickson 來分擔,主要的問題還是出在那幾天 offday 來得並不是時候。

所以 8 月 22 日那場讓 Little 宣稱 Hendrickson "pass the test" 就有點讓人頭大,畢竟這代表了 Little 可能把 Billingsley 拉出 rotation 換上 Sele,而這 3 位 No.4、5 SPs 所要負擔的場次還不少,個人寧願看到 Billingsley 上場也不要看到 Hendrickson。另外,有沒有人想過要將 Tomko 拉回 SP?他最近不僅晾著的時間變長,派上場的時機好像也不太對勁。

以下是 06 年 Maddux 和另一位曾對 Padres start 拿過勝投的 "former Dodger" 的對戰成績:

NameGS/GW/LIPHK/BBRA
Maddux2/20/111137/36.55
Seo2/31/01399/82.77

Maddux 對 Padres 的 deficit 是在 Cubs 時代的紀錄,應該是 5 月吧?那一陣 Padres 曾經連 7 場比賽大殺 Cubs,這位 future HOFer 也沒有倖免。至於 Dodgers 未來和 Padres 最後的一個 4-game series 是在 9 月 15 ~ 18 日,如果按表操課的話,那個 series 裡 No.3、4、5 各領一場 start 是跑不掉的,至於剩下的一場得看 Little 如何調整了,當然如果上面這些 small sample size 都成立的話,不管是 Penny 或 Maddux 領牌恐怕都不會太好過,好消息是那個 4-game series 在 Dodger Stadium 舉行。

我們也可以從 SPs 對 Padres 所拿到的敗場數嗅到一點端倪,在 11 場敗戰裡,SPs 真正負敗投責任的只有 5 場 -- 還不到一半,換句話說 Padres 其實並不是完全的把 Dodgers 打垮,bullpen 與 lineup 的相對無效率 (relative ineffectiveness) 應該也是原因,簡單說來,和 Padres 要是打起了 see-saw game 或 close game,Dodgers 似乎是必敗無疑。

話說回來,Dodgers 在 Petco Park 的這個 series 在前兩場都有勝機 -- 尤其是 Billingsley 主投的那一場,最終弄不好的結果就是 Dodgers 的領先被打了 75% discount -- 由原本的 4GB 剩下 1GB,任何人都可以儘量將這個 3-game losing streak 大化 (maginify) -- 好比說在最近的 7 場比賽掉了 5 場之類的 "解讀",不過還有 39 場比賽要走,離球季結束還有好一段路。至少現在的 Dodgers 在 NL West 依舊是 "a team to beat"。

至於 Dodgers 究竟還有多少機會進 playoff?BP 有利用 PECOTA 的結果所做成的 Adjusted Standings 可以參考,在這裡部份裡,PECOTA 的總管 Nate Silver 還引進了一項叫 "ELO" 的預測方式,其用意是將各隊的 current strength 做動態的調整 (adjust dynamically) 以檢視最終的勝負成績,ELO 版的 adjusted standings 在 這裡

原本是發展於預測足球隊的 ELO system 的解釋則在 這裡 找得到,問題在於這裡頭有一些 "rating" 的東西必須針對棒球做一些修正,Nate 也一如 BP authors 的慣例將這個部份帶得不很清楚,對 fans 而言,想自己動手算倒是有些無力感。

不過剝貓皮的方法可不只一種,THT 的 David Gassko 幾乎在 Nate 發表 ELO system 的同一時間也發表了一個很類似的方式來為所有的球隊做一個 ranking,Gassko 管這個叫 "Dartboard"。

Dartboard 的系統比起 ELO 來得單純很多,大致的 concept 是引進了目前表現 (應該是) "最好" 的一個 runs estimator -- BaseRun -- 為基,配合 custom exponent 的 Pythagorean Formula 為剩餘的勝敗場數做 prediction,同時佐以 ESPN 所提供的 Strength of Schedule (SOS) 做最後的修正。

SOS adjustment 的用意是將 NL 與 AL 的球隊做一個整體的 ranking,我認為只要稍做一些 neutralization 就可以對 NL 與 AL 各球隊最後成績的 dynamical prediction 做修正,至於 custom Pythagorean exponenet 的部份,我用的是這個式子:

(Runs per game + Runs allowed per game) ^ 0.287

以下是 NL 至 8 月 23 日為止的 ADP (Adjusted Dartboard Prediction):

NL West
TEAMP_WinP_LoseWPCT
LAN85.0676.940.525
SDN83.7978.210.517
SFN79.3782.630.490
ARI79.1682.840.489
COL77.5784.430.479


NL Central
TEAMP_WinP_LoseWPCT
SLN83.7478.260.517
CIN83.3078.700.514
MIL78.2083.800.483
HOU76.7885.220.474
CHN68.5493.460.423
PIT64.1397.870.396


NL East
TEAMP_WinP_LoseWPCT
NYN97.7864.220.604
PHI82.2479.760.508
FLO77.3884.620.478
ATL76.9485.060.475
WAS70.3791.630.434

See? There's still room for "Dodgers" to swin, at least for now....

在 BaseRun 的部份,由於是以目前的 "火力" 為基對剩餘的比賽做 forecasting。換句話說,如果 NL 所有的球隊保持現狀衝下去,搞不好 Wild Card 會出現在 NL West。而 playoff 讓 "NL Mild West" 進了兩支球隊的話...這大概也 somehow 代表了整個 NL 在 06 年的沈淪吧?

坦白說我還挺喜歡這種動態強度式的 standings,日後也許會以 series 為單位定時重算,當然,如果 Dodgers 進 playoff 的位子和 Mets 一樣穩、或不幸 out of race 的話,我大概就會收手了,只希望最後讓我收手的理由是 "前者"。

Saturday, August 12, 2006

Ethier The Juggernaut

在 05 年 offseason 時,Dodgers 以 Milton Bradley 與 Antonio Perez 向 Athletics 換來了一位叫 Andre Ethier 的年輕人。

雖然 Bradley (可能) 有不得不走的理由,但以這筆交易本身來看,我想 DePo 派的 Dodger Fans 大概都認為是被搶了,當時個人留下的 comment 是:

Ethier 就他的 OBP 來看似乎很合乎 Billy Beane 的治隊理念,但 SLG 顯示的是到了高階後的 Ethier 在 power 方面並不十分出色,至於守備方面也沒有很好的評價。只是以目前 Dodgers 外野手殘缺不全的情況來看,Ethier 在 2006 年進入 active roster 應該只是時間問題。

另外,我一度以為 Ethier 就是易燃、易爆的化學藥品 "乙醚" (Ether),後來才曉得我這輩子從來沒有拼對過這個字。

在 06 season 過了大半之後,Ethier 成為 Dodgers 最有威力的打者之一,目前的三項基本指標是 .348 / .398 / .568;他在 replacement level 水平較高的 LF 也交出了 28.5 的 VORP、隊上僅次於 Nomar 的 32.3;同時有可能成為暨 01 年 Albert Pujos 後又一個在 rookie year 交出 .950 OPS 以上的打者。

左打的 Ethier 並不會因為對方的先發投手是左投而缺席,這其中有個小故事:據 Scully 爺爺表示,Ethier 有個非常奉獻 (dedicated) 的父親,由於 Ethier 是 left-handed,他的父親 (right-handed) 為了讓 Ethier 適應左投手的投球角度,於是開始練習用左手投球給兒子打,從 6 feet 一直練到正常投手丘到本壘板距離的 60 feet,也造就了 Ethier 目前在對左與右的 splitted OPS .945 / .966 -- 相當一致的結果。當然這數字有點不真實,因為兩者 PA 的比接近 1:6 1:5,同時 Ethier 對左投手幾乎沒有拗到 BB 過。

這沒有影響 Ethier 的自信,也因此當他被問到碰上左投手的感覺時,Ethier 總是操著有點好笑的 French 式南方口音表示:"I always hit left-handed well."。

不過在鎂光燈開始聚集在 Ethier 身上時,有個隱性的數字卻不得不讓我們注意到 -- Ethier 的 BABIP 是 .402 (至 06 年 8 月 11 日為止),這個數字看起來高得有點過份。如果對這個數字沒什麼概念的話 -- Ichiro Suzuki 在創下單季 262 支安打紀錄的 04 年,他的 BABIP 是 .401。

BABIP 是個很難解釋的東西,一般來說它有很大的運氣成份,當然這讓人很容易想到像是 "等 Ethier 的 BABIP regresses to the mean 時就會鳥掉" 的情況,不過我們可以更實際的考慮一下 Ethier 的 phenomenon 會否和整個 NL 06 年的 "BABIP 生態" 有關?有沒有什麼數字可以 somehow 解釋 BABIP?或者說 Ethier 究竟 lucky 到什麼樣的一個程度?

為了探討這些問題,我挑選了 128 位 NL 在 06 年 PA 超過 250 的打者,試著找出一些訊息。

BABIP 的構造是 (H - HR) / (AB - SO - HR),以數學的角度來看,分母越小,這個數字會越大,也因此首先讓我想到的就是那些很會被三振的 power hitter -- 換句話說,那些 BIP_PA (PA of Batted ball Into Play) 較少或 IsoP 較高的打者 "可能" 會是高 BABIP 的 group。

由於 BABIP 是 rate statistic,如果直接以 BIP_PA (count statistic) 去 figure 的話並不合理,所以使用 BIP_PA%、也就是 Batted ball into play 的 PA 佔總 PA 的比例;IsoP 的部份我考慮了兩種形式,第一種是一般所熟知的 (SLG - AVG);另一種則是 (2B + 3B + 3*HR) / AB,我把它標為 Adj_IsoP。

使用 Adj_IsoP 的原因是我認為 triples 在探討 pure power 時不應該有比 2B 更高的權重 (weight),畢竟大部份的 triple 都是 double + speed 所產生出來的。不過計算的結果顯示 BIP_PA%、IsoP 和 Adj_IsoP 與 BABIP 的 CC (Correlation Coefficient) 都低得很難看:

BABIP Correlates WithBIP_PA%IsoPAdj_IsoP
Correlation Coefficient-0.014-0.072-0.118

在 Adj_IsoP 的部份讓我有點驚訝,我一直都認為 power hitter 應該有最好的 BABIP,不過 -0.118 的 CC 算是小有意思,它 somehow 代表了 Adj_IsoP 越大的選手 BABIP 會越小,這和我的直覺相反;至於 BIP_PA%、IsoP 與 BABIP 的 CC 則是小到幾乎是完全的 scattered。

而 Ethier 的 BIP_PA% 是 71%,換句話說有 Ethier 站上打擊區時有 71% 的機會把球打進場內,在 128 位選出來的 NL 打者裡排名 77th;IsoP 排在 31st,Adj_IsoP 則排在 43rd (all in descending order)。

另一個讓我想到可能拿來 figure 的則是 batted ball tendency,理論上 LD (line drive) 是最容易轉換為 hit 的項目,同時也代表打者的擊球咬得夠準或是對投手的失投球掌握得較好,在這個部份依舊將 batted ball tendency 轉換為 rate statistics -- 以 FB%、GB%、LD% 與 PU% 分別計算與 BABIP 的 CC 如下:

BABIP Correlates withFB%GB%LD%PU%
Correlation Coefficient-.236.167.489-.459

Batted ball tendency 的 CC 要比起先前的 BIP_PA% 與 IsoP 之類的要有意義一點,LD% 果然有了與直覺相符的結果,而如果有看過 THT 的 David Gassko 所 fit 的 DIPS 3.0,也可以發現 LD 這個自變數 (independent variable) 在對 runs 做預測時有最大的 postive slope,証明 LD 在 batted ball type 裡對得分的影響最為要緊。

以下是 NL 128 位打者裡 Top 10 LD% 的 BABIP:

NameTeamLD%BABIP
C. SullivanCOL.291.358
F. SanchezPIT.290.361
B. AbreuPHI.265.351
E. Encarnacion CIN.258.337
Adam DunnCIN.256.297
O. VizquelSFN.254.349
N. JohnsonWAS.242.322
J. EdmondsSLN.238.303
R. ZimmermanWAS.238.335
S. HattebergCIN.237.338

以下是 Bottom 10 LD% 的 BABIP:

NameTeamLD%BABIP
R. AbercrombieFLO.105.295
J. BautistaPIT.118.290
S. FinelySFN.133.271
W. TaverasHOU.138.326
M. EnsbergHOU.139.257
J. BurnitzPIT.142.249
J. LaneHOU.144.222
E. ByrnesARI.147.295
J. Cruz Jr.LAN.148.287
C. FloydNYN.152.259

這裡多少可以看出 LD% 與 BABIP 的 somehow 正相關。

Ethier 的 LD% 則是 .228,在 128 位選出來的 NL 打者排名 16th,可以說他 "確實擊中球" 的能力掌握得不錯,而 Athletics 出身的 Ethier 擁有的 plate discipline 應該也是不在話下,既然還年輕,個人並不排斥看到 Ethier 盡情的揮擊,畢竟 Ethier 離需要利用 "waiting game" 來為 production 做補償的年齡還要等好幾年。

至於 Ethier 高達 .402 的 BABIP 究竟與 "大眾" 差多少?接下來我們用 LD% 對 BABIP 做個 simple linear regression:


原則上 LD% 高的選手 BABIP 就有越高的趨勢,看到 Either 在哪裡了嗎?他離那條 fit 出來的直線有一段不小的距離。Statistically,我們管這個叫 residual (殘差),針對 residual 大到某個程度的樣本點 -- 也就是所謂的 "outlier",fit model 的人可以選擇將它移掉,但是大到多少該移掉則是自由心証。

另外我也把 Barry Bonds 標示出來,他今年的 BABIP 是 deadly low,坦白說這個結果有點不自然。至於另一個標出來的點則是自家的 "Martin Brother" (Ethier 一直都這麼叫他),Martin 的 LD% 在 128 名 NL 打者裡排在 79th;BABIP 則是 39th,看起來他比起 Ethier 要正常一點。

這麼看來 Ethier 的確有些 lucky,若設定基準為 residual 的絕對值必須小於 predicted BABIP 0.05 ,那麼在 128 位 NL 打者將有 13 個 outliers,以 residual 依 descending order 排序的結果是:

NameTeamResidual
A. EthierLAN.0753
C. JonesATL.0584
B. HawpeCOL.0545
C. WilsonPIT.0543
M. CabreraFLO.0529
N. MclouthPIT-.0510
R. AuriliaCIN-.0514
B. SchneiderWAS-.0532
J. LaneHOU-.0628
K. Griffey Jr.CIN-.0685
B. BondsSFN-.0800
Y. MolinaSLN-.0854

如果把 residual 越 大/小 解釋為越 lucky/unlucky ,06 年到目前為止 NL 的 super "lucky" star 大概就非 Ethier 莫屬了,但 lucky 無罪,同時也不改變 Ethier 在 06 年打出爆炸性成績的事實。換句話說,瞭解 Ethier 的 stuff 是一回事,但計算他的 contribution 又是另一回事。After all, Ethier very often crushes opponents like the Juggernaut, and he deserves to be proud.

最後還有一個有趣的訊息:還記得 Tango Tiger 分析 BABIP 的結果嗎?他提到了 BABIP 有 44% 的成分是 luck,而如果從這 128 位 NL 打者把上述的 13 個 outliers 去掉後重新計算 BABIP 與 LD% 的 CC,Guess what?由原本的 .489 跳到 .532,pretty close。

Wednesday, August 09, 2006

Winning Streak and Trading Deadline

長久以來,個人一直以無神論者自居,認為世事的變化應該有 99% 以上可以用科學解釋,不過在 11-game winning streak -- 這似乎很難提出任何型式的解釋 -- 的籠罩下,身為 Dodger Fan 的自己終究是選擇了沈默了一段時間,盡量低調以對。

BP 的 Joe Sheehan 在 8 月 9 日的 Prospectus Today 裡對 Dodgers 的 winning streak 提到了一個觀點:在 All-Star Break 後的 14-game stretch 裡,Dodgers 的對手依序是 Cardinals (4-game)、D'Backs (4-game)、Cardinals (3-game) 與 Padres (3-game),考慮 NL 當時 WPCT (winning percentage) 在 .500 以上的球隊除了 "尚未陣亡" 的 Dodgers 以外僅有 5 支,而以 Dodgers 一口氣鬥上了其中 3/5 的角度來看,這幾乎可說是 06 年較嚴厲的旅程之一,至於後來的 winning streak 裡所碰到的對手如 Nats、Reds、Marlins 與 Rockies,相較之下就是 easy legs。

Sheehan 的說法大致上沒有錯,不過以 probability 的觀點,考慮給予 2/3 的 LPCT (Losing Percentage) 在 14 場比賽裡輸 13 場的情況;與給予 2/3 的 WPCT 並在 11 場比賽裡通吃的情況,此兩者所發生的機會其實都微乎其微。也就是說在 All-Star Break 後的 1-13 stretch 裡,Dodgers 其實並不該那麼糟;隨後的 11-0 的 streak 裡,Dodgers 其實也沒有那麼好!說來說去,還是 Scully 爺爺的話最中肯:

"It is the same old story with the Dodgers these (winning streak) days. You give them an inch, and they take a whole ballgame."
--Vin Scully, Voice of Baseball

另外也很高興在這段時間裡沒有什麼 old school columnists 大談 chemistry 或是 former GM DePodesta 又被拿來開刀的問題。我想幾位 06 年 season opening 就在 active roster 上的成員可能還分不清 "Betemit" 與 "Batman" 的差別,或是不曉得 Lugo's first name 的正確發音...etc,as long as Dodgers are rolling, who cares? Winning always brings the best chemistry.

附帶一提,Dodgers 在 04 年拿下 NL West 的班底,如今只剩下一個人 -- The Killer-Tomato -- Olmedo Saenz,這也說明了高層在球隊策略運用上的舉棋不定。

我稍微收集了一下在這次 11-game winning streak 下的 WPA 資料,這是一個用 state by state 來衡量球員 contribution 的系統,整體說來與 Keith Woolner 的 WX 系列有點類似。Dave Studeman 在 THT 則對 WPA 有些 great pieces 值得一讀,尤其是在 runs scored 與 "clutch" 方面的詮釋:

What WPA Can Tell Us About Teams ?
What WPA Can Tell Us About Players ?

以下是 Dodgers 在最近 11-game winning streak 的 WPA 於投、打方面的 split:

DateTeamScorePitching WPABatting WPA
07 / 28Nats1 - 138.241.8
07 / 29Nats5 - 713.836.2
07 / 30Nats3 - 434.715.3
08 / 01Reds10 - 4-10.160.1
08 / 02Reds5 - 334.115.9
08 / 03Reds3 - 057.5-7.5
08 / 04Marlins6 - 234.615.4
08 / 05Marlins10 - 212.537.5
08 / 06Marlins7 - 35.844.2
08 / 07Rockies2 - 728.221.8
08 / 08Rockies2 - 438.611.4

總的說來,較為 impressive 的部份是投手。這一陣子的表現比想像中 -- 或是之前設定的 "league average" 的標準 -- 要好上很多很多,尤其在幾場低比分的比賽裡,投手群也都能跟得上 (be able to come up with)。Sheehan 形容目前的 Dodger Bullpen 裡 Broxton 與 Saitoh 的組合有幾分 03 ~ 04 年時 Guillermo Mota 與 Eric Gagne 的 Deja Vu。當然,就 dominance 而言是差了一截,但交出來的成績其實也並不遜色。

以下列出了 Colletti 在 731 deadline 結束前,幾筆重要交易裡所 involve 的選手 (外帶一位 regular,暫時以 "?" 代替) 在 Dodgers 11-game winning streak 裡的 WPA:

DateIzzyBetemitLoneyDessensLugoMaddux
07/2817.1------0-------2.0
07/29-5.4------26.2-------2.0
07/3013.213.22.0---------4.0
08/01---20.611.1----2.2---9.9
08/02----2.0-1.13.11.8----2.1
08/03----9.2------031.8-7.5
08/04---65.4----5.9----3.1
08/05----8.15.4---3.4---11.6
08/06---22.3-1.1---11----6.9
08/07----2.8------0.5----0.1
08/08---26.90.5---4.511.5-4.5
Total24.966.922.229.313.143.3-2.7

在 WPA 的語言裡,大概 0.5 相當於 1 win,所以 Izzy 可說是在離隊前做了最好的 showcasing。

我相信很多 Dodger Fans 不滿意 Colletti 用 Joel Guzman + Sergio Pedroza 去換 Lugo 的作法,這裡再談一下這筆 Lugo 的交易:

帳面上,Dodgers 被搶是沒有疑問的,不過以即刻戰力而言,Lugo 可以頂替當時傷勢不明的 Kent,並提供比 Izzy 好過太多的 runs production。你可以說 Lugo 是個很貴的打工人、同時有 transaction 上的問題,但無論如何,在不能保証 Nomar 或 Kent (甚至 Drew) 什麼時候又會倒下的前提裡,Lugo 至少到 06 年 regular season 結束前都會是很好的保險,這一點可不是 Guzman 或 Pedroza 可以 "馬上" 提供的,同時也別忘了 13M 的 annual salary 並不自動讓 Furcal 成為鐵人,而且 Furcal 的位置與打序和 Lugo 則是 perfectly match 的。

Pedroza 就不多談了,從來也沒有人認為他存在於 Dodgers 未來的規劃裡;而先前也提過:當 Matt Kemp 跳過 Guzman 而先一步上到 ML 之後,Guzman 的地位就已經顯得岌岌可危,加上 Andre Ethier 在 ML 等級打得夠 "殺",在沒有 DH 的 NL 裡,Guzman 可以說已經失去了他的位子。

目前 21 歲的 Guzman 在 06 年來不論守備或期待的 power 都沒有長足的進步,這就是說對 Guzman 而言,他應該上的學校是 major league 而不是長時間窩在 minor (如果這麼做,Guzman 成為下一個 CCF 只是指日可待的事...),但 Guzman 需要的是一支比較不好的球隊 -- 或者說已經被允許重建的球隊 -- 來忍受他長時間的 incapability 直到 successfully developed,而我們都曉得:這種球隊不會是 Dodgers。

相較之下,D-Rays 可能給予 Guzman 較大的發揮空間;再者,兩個月後即成為自由身的 Lugo 非常可能為 Dodgers 帶來一個 Type-A (這得基於 Colletti 沒有和 Lugo 續約並 offer salary arbitration),一旦成真就足以中和失去 Guzman 的損失。也因此只要 Dodgers 在未來不犯錯,我並不認為 Dodgers 在 Lugo 這筆交易裡是輸家。

WPA 顯示最 impressive 的選手是 Betemit,不過別忘了在 Betemit 的交易裡,Braves 的主要目標是 Danys Baez,這即是說 Dodgers 多放出 Aybar 等於是 "被多騙了一個選手" 的感覺。相較之下,Betemit 比較接近 free-swinger 的 style;Aybar 則比較有耐性且更年輕。想想看:如果當初 Dodgers 讓 Aybar 上場,打出像 Betemit 這樣的成績並不是不可期待的,也就是說即使 Betemit 的交易為這次的 winning streak 帶來了很大的貢獻,但比起 Lugo 那一筆在實質上才是比較 "賠" 的。

至於 Maddux 的 acquisition 除了昇級 Dodgers 的 3 個 5th-starter spots 的其中之一,還有另一層的 "隱性" 價值:如果 Dodgers 真的因為近期的好表現而衝進 06 年的 playoff,Maddux 將成為 Colletti 在這次 731 裡可能獲利最大的投資!畢竟在 playoff 的 performance translation 方面,starting pitcher 是比起 fielders 要來得更為保險是沒有疑問的。

Moreover,Loney 的供輸開始變得比 early 06 要穩定得多,我期待看到 Colletti 在這個 offseason 裡把 Nomar 給放掉。

至於那個 WPA 裡的 "?",我對這位仁兄在 06 年的表現是 "相當、相當、相當的" 失望!這位仁兄的 annual salary 目前高居全 ML 的 95% percentile,他叫 J.D. Drew。

Tuesday, August 01, 2006

The Caliber Dodgers Have to Maintain...

我很高興自己在 友台的發言裡 換算 731 non-waiver trading deadline 的時差出了錯,不過這至少可以讓我少緊張一天。

在最後的關頭,Colletti 做出的兩筆交易是:

  • Cesar Izturis <=> Greg Maddux
  • Joel Guzman + Sergio Pedroza <=> Julio Lugo
Will Carroll 在他的 報導 裡對 Dodgers 在這次大限的交易態度留下了這樣的描述:
The Dodgers have resisted including prospects in most of their discussions. "They sound like the Braves," one team source told me. "Logan White knows his system so well that people are getting a little scared to deal with them. When's the last time you saw a Braves prospect pan out?"

我個人覺得 Will 所提供的這個 source 對 Logan 的描述有點妙,注意他說的是 "knows so well" 而不是 "knows how well his (White's) system is",這似乎有暗示 White 不同意把他一手打造的 farm 交給 Colletti 去揮霍的味道;另一方面則是 Matt Kemp 在 06 年季中已經跳過了 Joel Guzman,証明他也 somehow 有挑戰大舞台的能力,因此 Guzman 也就被逐出 White 未來對 Dodgers 的 blue print 而交給 Colletti 去運用 -- 不管有效或無效。

Guzman 所換回來的 Julio Lugo 在 06 年 offseason 就成為自由身,他被 Colletti 認定是 Kent 與 Nomar 尚未歸隊前的補償。06 年 Lugo 的成績是 career high,以一個 middle INF 而言他所能提供的火力算是可觀 (EQA .292),當然拿兩個 prospects 只換回一個兩個月的打工人在任何角度都是愚蠢的行為,更何況老早就 out of option 的 Lugo 還有 transaction 上的問題,但基於 Kent 與 Nomar 兩人的歸隊期程未必會像官方預測得那麼樂觀的前提下,Lugo 如果維持了 06 年的水平,Dodgers 就可以容忍 Kent 或 Nomar 的歸隊遲到 9 月 -- roster expanded -- 的時刻,屆時 roster spots 就不再是問題。

現階段 Dodgers 還必須空出一個 active roster 的 spot 給 Lugo,官方還沒有發布這個問題的處理方式,算一算整個 active roster 上有 6 個 OFs 是多了一點,但擁有 option 的只有 Ethier 和 Repko。Ethier 看起來不可能被動到;Repko 動了的話 Dodgers 就得忍受 Lofton 在 CF 無法提供的 arm strength,以合約價值來看,不排除 Ricky Ledee 遭到 DFA。

另一個可行的路子則是在擁有 Lugo 與 Betemit 這兩位 INF 工具人後考慮 DFA Ramon,如果此舉成真,對 Dodger Fans 來說又是一次勝利。

Lugo 的到來自然不是這次 trading deadline 最值得高興的事,Colletti 能用 Cesar Izturis 將 Greg Maddux plus his contract remaining 弄到手才是重點!倒不是指 Maddux 的到來會讓 Dodgers 在 NL West 裡像開坦克一樣把其它四隊撞翻,而是 Izzy 的離隊終於讓 Dodgers 能夠以其它的方式讓 Little 不需要在 starting lineup 再度寫上 Izturis 這個名字。話說回來,我記得 Cubs 已經有一個叫 Neifi Perez 的 SS 了,他們為什麼會想要第二個、或者說 younger version 的 Neifi?這還真是讓人想不透。嗯,難得得到了便宜,還是低調點好。

Maddux 的到來讓 Dodgers 的 active roster 上又出現了 12 名投手的編制,以 Little 的作風,這大概不會是他所在乎的事。

06 年的 Maddux 在風馳電掣了一個 4 月後開始 struggle,這可以從他的 ERA Graph 看得出來,而 season stats 則說明他的 control 仍然是 pinpoint,不過 BABIP 與 LOB% 都是近 5 年來的低點,以下是 Maddux 與幾位 Dodger SPs 的 Pitcher's Quality of Batters Faced 的比較:

(actual / opponent)
NameIPAVGOBPSLG
Maddux136.3.286/.263.313/.338.445/.426
Billingsley50.3.270/.268.400/.343.411/.434
Lowe142.7.269/.259.323/.329.378/.415
Penny125.265/.259.322/.331.398/.413
Sele76.271/.263.326/.334.425/.425

這也多少能解釋 Maddux 正用 old man skill -- 也就是對 BB 的控制 -- 做為 retire 前的最後掙扎,是否因此迫使他已經失去品質的 strikes 被擊出過多的安打尚不得而知。無論如何,現在的 Maddux 已經大不如前了,只是將 Izzy 換成 Maddux 仍然能為 Dodgers 帶來不小的利益。

NL 投手在 06 年的 RA 大概在 4.96 左右,replacement level 則是 6.1352 左右。Maddux 在未來的 57 場比賽裡預計可以得到至少 12 ~ 14 次的先發機會,合理的估計是他能夠為 Dodgers 吃下約 72 ~ 90 局左右,這麼一來在 Maddux 最終維持 league average RA 水準的前提下可以為 Dodgers 掙得的 VORP 會落在 9.88 ~ 12.35 之間,差不多是 1.0 ~ 1.2 wins;至於 Izzy 的部份,他如果以 EQA .220 做收,57 場比賽裡大約會為 Dodgers 掙得 -5.5 左右的 VORP,一來一去顯示這筆交易可以為 Dodgers 掙得約 1.5 ~ 1.7 wins,比起要到 Bobby Abreu 替換 Kenny Lofton 都還 賺得多

撇去這種一對一交易的 "淨賺",我們再來看看另一件事:在 731 之後的 Dodgers 究竟要 "打到什麼程度" 才能進 playoff。

Dodgers 目前的戰績則是 50 勝 55 敗 (7 月 31 日為止),如果以 05 年 Padres 拿下 NL West 的 82 勝為最低點,外加考慮 85、88、90 勝的情況,則 Dodgers 必須在剩下的 57 場比賽裡 maintain 的 WPCT (winning percentage) 為:

Final WinsWins in Next 57Losses in Next 57WPCT to Go
823225.5614
853522.6140
883819.6667
904017.7018

考慮 replacement level:VORP 的單位是 "runs differential",也就是說 VORP 是我們將 replacement level 的 runs 設為 0 所做出的一種統計量,但如果真有一支球隊全部以 replacement level 所組成,這支球隊也不致於打完一季後連 1 勝都拿不到。正確的說,全部由 replacement level 選手所組成的球隊在 162 場比賽裡也能打出約 1/3 的 WPCT。

也就是說,如果我們要以 VORP 轉換為 Wins 來看 Dodgers 在剩下 57 場比賽裡該 maintain 什麼樣的程度時,基準點可以視為由 19 wins (57 * 1/3) 開始。那麼假使 Dodgers 以 82 勝為目標,必須 maintain 32 - 19 = 13 場 wins above replacement level。

Dodgers 投手群目前的 RA 是 4.84,比起 6.1352 的 league replacement leve RA 要高出一截,在投球局數與比賽場次的修正下,估計投手群在剩下的 57 場比賽可以為 Dodgers 帶來約 71.36 的 VORP。

再以 82 勝為例,如果將 13 場 wins above replacement level 看成 130 的 VORP 的話,這就是說 Dodgers 的打線在剩下的 57 場比賽裡必須 maintain addtional 130 - 71.36 = 58.63 的 VORP,如果將這 58.63 分配給 8 個 positions,each position 就必須交出約 0.1287 的 VORPr

在投手的變數被固定的前提下,把 82、85、88 與 90 勝時 each position 所需要 maintain 的 VORPr 計算如下:(VORPr_PP:VORPr Per Position)

Final WinsWPCT to maintainWAR to GoVORPr_PP
82.561413.1287
85.614016.1945
88.666719.2603
90.701821.3042

這個結果可能看起來沒什麼概念,打個比方好了:假使 Dodgers 的目標是拿下 88 勝,除了投手群維持現有的水準以外,打線必須在剩餘的 57 場比賽裡 maintain 19 wins above replacement level,而每個 position 必須 maintain 0.2603 的 VORPr,這差不多是 Russell Martin 目前的水準。

換句話說,以 88 勝為目標時,除了投手群維持現有水準,Dodgers 在未來 57 場比賽裡必須在 8 個位置都至少打出類似 Martin 的成績才有機會達成,而 Martin 目前的 VORPr 其實比 J.D. Drew 都還好上一截,在超過 200 PAs 的 Dodgers 打者裡只有 Nomar 與 Ethier 的 VORPr 比 Martin 要高。

88 wins? Sounds crazy, doesn't it?

同時也別忘了:投手上場打擊所損失掉的 VORP 是被忽略掉的,更沒有考慮守備的影響。但光是這麼看 -- 也就是 88 勝 -- 進入 playoff 的安全數字 -- 就已經不是個容易的目標,即使 Drew 回復了應有的身手,Betemit 與 Lugo 在未來的發揮不只要打出一定的水準,更需要去補上 Furcal、Lofton 等人所不足的部份。

我不曉得這樣的 methodology 有沒有問題,不過這個結果倒不讓我太意外,也符合個人對 Dodgers 在 06 年的 pennant race 已經出局的預期。Colletti 固然是做了一些補強,也留住了幾個 farm system 與 active roster 裡的 prospects。只是這些交易除了 "表面上" 對那些 local media 的 vicious columnists 算是有了個交代,實質上的幫助還是很有限的。歸根究底,還是得怪 all-star break 後的那個失速的 1-13 的 14-game strech。