How Teams Win Their Games?
因為 management 的不效率與過多的決策錯誤,使得 07 年的 Dodgers 一直讓我提不起什麼勁,MLB.tv 買得有點像是 donate 給 MLB.com,但相對的,也讓我多出一些 "東摸摸、西摸摸" 的時間 -- 我指的是 sabermetrics 的研讀。
這一陣子在看過 Aloha 的對 Pythagorean Formula 的解讀,以及與 Todd 談到 WXRL 的問題後,對 WE (Win Expectancy)、leverage 與一些 neutralized stats 的解讀有了點心得,就這個部份做一些 follow-up。
But no...我不打算引用 BP 的 WXRL,因為 1) 我不曉得 WXRL 所 apply 的 replacement level 在哪裡? 2) 我不認為 adjusted lineup 有其必要,而且也不曉得 BP 是怎麼做的? 3) BP 似乎不打算修正 Keith Woolner 在 BBTN 對 LEV 的定義錯誤,WXRL 的 scale 有懷疑的空間。因此,我引用 Fan Graphs (FG) 所提供的資料。
整個 Fan Graphs 的系統 -- 在我的觀點下 -- 是由 OPS_Win、BRAA 與 WPA 這 3 個重點所貫穿的,以下個人小小的解釋一下這 3 個東西,已經知道的朋友可以跳過下面這個區塊。
※※※※※※※※
◎ OPS_Wins:
調整 OBP、SLG 的權重與 playing time (PA) 來估算球員的 Wins Above Average,它幾乎可以與 BP 的 EQA 相提並論,但計算上簡單得多,關於 EQA 的討論請參考 這一篇。
◎ BRAA (Batting Runs Above Average):
和 BP 裡 DT 所提供的 BRAA 是兩回事。FG 的 BRAA 的精神比較像是 "不考慮時間的 situational Runs Added",換句話說,它是紀錄 state by state transition 時 RE (Run Expectancy) 所改變的量,舉例說明,在 RPG 為 4.5 的情況下:
Base | Outs | RE |
--- | 0 | 0.500 |
1-- | 0 | 0.884 |
12- | 0 | 1.494 |
如果某位打者在 lead-off the inning 時獲得一個 BB,他為球隊賺進的 RE 是 0.884 - 0.500 = 0.384;但接下來的打者在 1 壘有跑者時又拗到一個 BB 而形成 1、2 壘有人,他賺進的 RE 就是 1.494 - 0.884 = 0.610。同樣是一個 BB,但產生的 BRAA -- 也就是 RE -- 會不太一樣。
對投手而言,BRAA 則是 Expected Runs Prevented,就 "定義" 來看,它比較像 BP 的 ARP。
◎ WPA (Win Probability Added):
WPA 其實就是加上時間考量 (局數),將 RE 轉換成 WE (Win Expectancy) 後在 state by state transition 下的紀錄其 differential,初心者請參考 這裡。
※※※※※※※※
以下是 NL 至 8 月 17 日為止 WPCT 仍在 .500 以上的球隊,依 WPCT 排序與他們打擊 (BWPA)、先發投手 (SWPA) 與後援投手 (RWPA) 三項分別的 WPA 總和:
Team | WPCT | BWPA | SWPA | RWPA |
D'Backs | 0.569 | -2.10 | 3.34 | 6.76 |
Mets | 0.562 | -0.35 | 3.34 | 4.01 |
Padres | 0.537 | -8.45 | 6.44 | 7.01 |
Phillies | 0.537 | 6.48 | -2.24 | -0.23 |
Braves | 0.524 | 0.84 | -0.63 | 3.29 |
Dodgers | 0.516 | -6.15 | 1.13 | 6.52 |
Cubs | 0.512 | -2.64 | 3.53 | 0.11 |
Rockies | 0.512 | 5.99 | -1.79 | -2.20 |
Brewers | 0.508 | -0.80 | -0.77 | 3.07 |
首先,兩支球隊的 WPA 在比賽開始時是 50-50 的,一場勝利所倚靠的是把對手起始時所擁有的 0.5 WPA 給 "搶過來"。也就是說 0.5 的 WPA 可以代表 0.5-win above average 或是 actual 的 1-Win。也因此若 WPA 相當接近 "0",至少代表在球隊該 category 下的整體表現是接近 league average 的。
For good measure,從上面的列表能很清楚的看到每支球隊的 "長處與短處" 所在,比方說 Phillies 與 Padres 的 WPCT 相同,但 Phillies 靠的是用他們的 bats 去 muscle 對手,Padres 則是憑他們優勢的投手群;Dodgers 則是一如開季前的預期,在投手群有突破性發揮的情況下被打線完全脫垮;Rockies 長久以來在野手 prospects 的培養於 07 年開花...etc。
由於 assign 在每一個 situation 的 WPA 的多寡取決於該 situation 的 crucial 程度 (leverage),也就是說在 high/low leverage situation 下,得失分對 WE 的 swing 影響會越 大/小;相對的,average leverage situation 下的得失分到會接近我們常用的 10-run equals 1-win 的估計式。
上述的 BWPA、SWPA 與 RWPA 裡,顯然 受到 leverage 影響較大的 category 會是 RWPA -- 也就是後援投手的部份。以 D'Backs 為例,目前 RA > RS 卻拿下約 8-win above average 除了顯示他們可能在 close game 下的表現相當好以外,他們 bullpen 的 效率也是高人一等。
什麼叫 "效率高人一等"?Here is an idea:
Team | WPCT | RWPA | RBRAA |
D'Backs | 0.569 | 6.76 | 13.18 |
Mets | 0.562 | 4.01 | 25.02 |
Padres | 0.537 | 7.01 | 57.74 |
Phillies | 0.537 | -0.23 | -6.96 |
Braves | 0.524 | 3.29 | 5.43 |
Dodgers | 0.516 | 6.52 | 35.25 |
Cubs | 0.512 | 0.11 | 15.50 |
Rockies | 0.512 | -2.20 | 15.02 |
Brewers | 0.508 | 3.07 | -4.73 |
我們曉得 Padres 的 RWPA 在目前的 NL 是最高的 7.01,D'Backs 則以 0.25 RWPA -- 也就是 0.5-win 的差距緊追在後,但 Padres 的 bullpen 所省下的 situational runs above average (RBRAA) 是 57.74,整整多出 D'Backs 近 45-run 之多!這其實說的是 D'Backs 的 bullpen 被炸得很徹底時可能多半是 low leverage situation,因此對 RWPA 影響不大;但在 high leverage situation 時,他們卻不吝於達成救火的任務。我們不曉得 D'Backs 為什麼有本事拿到這麼多的 high leverage situation,但可以想像得到 D'Backs 的牛棚對 Pythagorean Formula 這種 neutralized 的估計式的 "殺傷力" 有多大。
有個想法:如果計算 RBRAA / RWPA 所得到的結果很小,至少代表這支球隊的 manager 確實做到 "send the right guy out at the right time" -- 不論他是有心還是無心;如果結果較大,那倒不盡然是 manager 調度的失誤,說不定是他的球隊沒有碰上太多 crucial 的情況使然;另外像 Brewers 的 RBRAA < 0 但 RWPA > 0 的情況或許不適用 RBRAA / RWPA 來推論,但可以理解到 Brewers 的牛棚掉了不少分數,可撿回來的分數卻比那些丟掉的要 crucial 得多。
Truth is:RWPA 與 RBRAA 的結果帶給個人最大的認知是 neutralized 的 stats -- 包括 RA、VORP...etc 都不適用於評價 RP 的貢獻 (或者說,against model reality...),RP 上場時的 leverage 使得 WE Swing 太過劇烈,幾乎看不出任何往中間靠 (neutralized) 的可能性;相較之下,打者與先發投手的部份在經過一個 long run 後,high & low leverage situation 對 WPA 的影響被中和掉的可能性是很大的,也比較適合使用 neutralized 的 stats 去評估。
最後,我們得知在 dig out "how teams get their win" 的時候,我們有 3 個不同的 scope 可以運用,以下是小小的結論:
◎ Batting:
- OPS_Win 是 neutralized win 的估計,適用於 10-run equals 1-win 的結果。
- BRAA 是 situational 但沒有考慮比賽進行程度的紀錄,與 OPS_Win 比較時,若 (BRAA/10) 大於/小於 OPS_Win,則 roughly 代表球隊可能在 runners on 時有 較佳/較差 的表現。
- WPA 加入了比賽進行的程度,late-inning 的 nice/lousy performance 會給予較大的 fluctuation。如果 WPA > (BRAA/10),則 somehow 代表打者在 crucial situation 有較佳的 peformance。說穿了,這應該是現今衡量 "clutchiness" 最好的指標。
◎ Pitching:
- RAAA (Runs Allowed Above Average) 是最 neutralized win 的估計,最適用於 10-run equals 1-win 的結果。SP/RP 的 RAAA 的計算方式是找出 league average SP/RP 的 RA -- say lgRA,然後利用 (RA - lgRA) * (IP/9) 來計算。
- BRAA 是 situational runs saved 但沒有考慮比賽進行的程度,與打者 BRAA 的相似之處在於若投手的 BRAA 大於 RAAA,somehow 表示投手在 runners on 時把他們變成殘壘的情況較多,這當然也包括了 prevent inherited runners scored 的資訊。
- WPA 加入了比賽進行程度的因素,BRAA 若與 WPA 成反比,代表投手在 crucial situation 下表現得較好。如果談到 clutch pitching,和打者的部份一樣,WPA 與 BRAA 的比較將是最好的指標。
相較於 BP 那一堆來路不明的 stats,Fan Graphs 所提供的玩具不僅簡單明瞭,而且也夠 powerful 來讓我們做出一些有利的結論。So, try to love it!
必須要強調的是,以上都只是個人的解讀,未必是 100% 正確的,如果認為有任何不妥之處,請留下 comment 給我。