Tuesday, January 16, 2007

Perhaps, There's No Such Thing as Pitching Consistency

  • Dodgers.com: Penny's season scrutinized


  • 把這篇老文章翻出來其實也沒什麼,只是裡頭有一小段應該是所有看過棒球、聽過 commentator 解說的球迷都耳熟能詳的故事:

    "I see a guy who's had a pretty good season, and I still think he can have a better season," said Little, who said Penny only lacks consistency, but had no theory as to why.

    在 06 年前季強了好一陣子的 Penny 於 2nd half 突然出現一些不可解的問題,讓他的被信任度降到了冰點,在這個 offseason 裡,Seattle 的 local media 甚至傳出以 Adrian Beltre 交換 Brad Penny 的 rumor。

    而針對 Little 對 Penny 做出的 comment,我們可以問個問題:究竟什麼是 consistency?

    Dodgers 一整個 06 球季的 rotation 用 "三天一小改、五天一大改" 來形容都不算誇大,GS 在 30 次以上的只有兩位:Derek Lowe (35) & Brad Penny (34);而排名第 3 的就是自家出產的 Chad Billingsley (16);如果不是七月底 Colletti 神來一筆的用 "某熱狗" 換來 future HOFer Maddux,只怕在 NLDS 的首輪也沒有人認為 Dodgers 在 rotation 的方面較 Mets 有 edge。

    如此看來,Lowe 雖然 稱不上是 ACE,但他畢竟是 Grady Little 心中最 "consistent" 的 SP 吧?在這裡我們用很簡單的數學來比較 Penny 和 Lowe 在 06 年的表現,順便加上一位 "匿名人士",以下是方法:

    • 分別記錄 Lowe、Penny 與匿名人士在 06 年的每次 GS 的 run allowed,再以 NL 06 年的 league RA (run average) 4.88 補上 SP 不足的局數做為 bullpen support,如此可以得到某位 specified SP 在先發情況下其所屬球隊可能的總失分。

      例如 Penny 在 9 月 18 日對 Padres 的先發交出了 5 inning、4-run allowed,則該役 Dodgers 的 total run allowed 大約是:

      Total Run Allowed = 4 + (9 - 5) * 4.88 ~= 6.17
      Total Run Allowed = 4 + [(9 - 5)/9] * 4.88 ~= 6.17

    • 除此之外,我們尚可佐以 Pythagorean Formula 計算出每一場比賽的 winning percentage,事實上把每場比賽當成一個 Bernuolli Event 的話,那就是 expected wins。在這裡 Pythagorean Formula 的 power 要用多少並不是很重要,畢竟指定了 power 後被拿來比較的投手就站在同一條起跑線上了!為求簡單起見,這裡不再額外考慮 runs enviroment,直接以原始版本的 "2" 做為 power。延續上例,Dodger 在 9 月 18 日比賽的 expected wins 就是:

      Expected Wins = (4.88)^2 / ( 4.88^2 + 6.17^2) = 0.385

    接下來對 3 位受檢的投手每場比賽的 TRA/G (Total Run Allowed per Game) 的 STDEV (standard deviation) 來檢視離散程度,STDEV 大,somehow 可以表示該投手的 consistency 相對較差,而這裡用 TRA/G 的原因是為了加入投手每次先發所吃下局數的考量;把所有的 Expected Wins 加總則當做該投手對球隊的勝利貢獻的一種指標,要說明的是:以下的數字並沒有加入 Park Factor 的考量。

    以下是三位投手的比較結果,GS 表示 Game Started;TEW 表示 Total Expected Wins;STDEV 則是所有 GS 的 TRA/G 的 standard deviation:

    NameGSTEWSTDEV
    Lowe3521.3282.628
    Penny3419.2962.436
    Somebody3219.3242.485

    單以 TEW 來看,Penny 的確是 3 位 SPs 中最不好的一位,至於那位 "somebody" 如果給予他和 Lowe 相同的 GS,他的 TEW 理當會比 Lowe 要高,但是在 STDEV 這個項目裡,Penny 卻是 3 人中最小的!這或多或少說明了 Penny 還算 consistent,只不過他每回先發帶給球隊勝機是相對的較少。

    當然,在固定相同的投球局數下,10 場先發都各失 1 分與 10 場比賽各失 6 分在 TRA/G 的 STDEV 是相同的;兩場先發各投 6 局、各失 4 分的 SP 與各投 6 局、分別失 2 分與 6 分的 SP 相比,前者的 consistency 看來較好,但 TEW 卻是後者 (0.859 vs 0.935) 較高的!這也是為什麼要把 TEW 搬出來的原因之一。

    所以下一回再聽到哪位 manager 或 commentator 談到 consistency 的時候,我們也多少可以理解到 consistency 在數字上的展現其實可能只是一層包裝過的謊言、甚至沒話找話講。Fans 真正希望看到的是 "a better, or the best starting pitcher" 而不是一個 "more consistent pitcher"。

    順便把 Lowe、Penny 與 somebody 所有 GS 下 0 ~ 9 的 run allowed 做個瀏覽:


    這位 somebody 就是 06 年 offseason 時 Colletti 用 3-year 47M 所簽下來的 "so-called" Ace -- Jason Schmidt,假使他在 06 年沒有什麼太大的突破 (事實上以 33 歲高齡的 Schmidt,07 年有所突破的機會想必也不大...),Dodgers 得到的也許只是一個比 06 年的 Lowe 要好一些的 inning-eater 加上額外 7M annually 的支出,期待 Schmidt 成為數年前在 Dodger Stadium 威不可擋的 Kevin Brown,怕是有些奢侈的夢想。

    2 comments:

    Max said...

    Total Run Allowed = 4 + (9 - 5)"/9" * 4.88 ~= 6.17 ^^

    Morikawa said...

    Hi Max,

    Thanks for correcting that for me.