Saturday, July 14, 2007

Being God

寫這篇文章,只是在最近和 Todd 的討論與看過 J-Train 兄的 Blog 後有一些想法,話說在前面:這篇也許和 baseball 的關聯性不大,沒興趣的朋友,個人不願意浪費您寶貴的時間,請自己跳離。

大概是數學系學生的時代吧?那時個人看過一本書叫做 "Fermat's Last Theorem" (費瑪最後定理),大意是這樣的:

Given an integer greater than "2", equation "a^n + b^n = c^n" has no solutions in non-zero integers a, b, and c.

(給予一個 > 2 的整數,等式 a^n + b^n = c^n 裡的 a、b、c 沒有非零的整數解。)

個人不可能在這裡教訪客去証明這個花了數學家們 357 年的時間才証出來的定理,就算個人知道如何証明它也不會讓我的 annual salary 一翻數倍,我想說的是那本書裡所帶出的一個小故事,它大約是這樣的:

某天,一位天文學家、物理學家與數學家坐在同一班火車上,經過一個大草原時,3 個人都看到一頭全黑色的乳牛在吃草,這時天文學家說:

"看啊!這個國家的乳牛是黑色的!"

物理學家立刻反駁:

"不對!我們應該說在這個國家裡,於方才經過的草原上的乳牛是黑色。"

最後發言的數學家說了:

"都不對!我們應該說在這個國家裡,至少有一片草原、草原上至少有一頭乳牛、這頭乳牛至少在我們看到牠的那一面 -- 是黑色的!"

這應該算是個笑話,其中的一個重點在於 "數學家永遠都在說廢話",另一種較為委婉的說法則是 "數學家在事情不是 deterministic (決定性的) 的情況下都不會滿意"!

那麼,什麼樣的 event 會是 "決定性" 的?簡單的說,就是 "必定發生" 的 event,換成數學的講法即是給定 event A,A 不可能是決定性的 -- 除非 A 發生的機會 -- say P(A) -- 等於 "1"。遺憾的是,能夠 maintain 每個 event A 的 P(A) = 1 只有一位,而且他不屬於地球上的一員。Simply put, that's the "God" we're talking about!

除非哪一天我們有機會成為 Bruce Almighty,否則我們不會知道下一步會發生什麼事,但這並不是說我們只能聽天由命,世界上還是有很大的一群人想成為 God -- 他們不停的做 estimation & prediction 來指引決策者一個方向,說穿了,這群人就是 statisticians,在 baseball 的世界裡,我們叫他們為 sabermetricians。

反對 sabermetrics 的人在我的眼裡看來是很奇怪的!他們 either 是要求 sabermetricians 做得太多、or 他們都在講一些廢話,打個自己最常用的比方:今天我告訴大家說 "雙十節是國定假日",請問讀者得到了什麼訊息?

Nothing!Zip!因為雙十節是國定假日的發生機會是 "1",這句話本身就沒有任何的消息含量,講了等於沒講!所以 sabermetricians 並不是在告訴大家 P(A) = 1 的結果,而是闡述 "如果我們希望 A 發生,該怎麼做才比較有機會讓 P(A) = 1"。

再舉個簡單的例子:這裡有兩群數字各 50 個,第一群是 1 ~ 50;第二群是 31 ~ 80,現在我們要從兩群中選一群、並抽出一個 "大於 40" 的數字,那麼該選哪一群?

毫無疑問,該選第二群,而為什麼會知道?

因為數字告訴我們兩群的 mean 是 25.5 / 55.5, respectively;兩群中選出大於 40 的數字的機會是 0.2 / 0.8, respectively,所以 statisticians 說 "我們該從第二群裡去挑",但重點在於 statisticians 沒有保証從第二群去挑就 "一定" 能得到一個大於 40 的數字,在這個例子裡,你會責怪 statisticians "推卸責任、避重就輕" 嗎?我想不會。

現在我們看回 baseball 世界的例子:當談到 Tango 在分析 BABIP 的成份裡有 44% 是 luck 的時候,這其實說的是 Tango 用了很多的自變數 (independent variables) 去 figure BABIP 這個應變數 (dependent variable),在架構出的數學模型下,已知的自變數只能解釋 BABIP 約 56% 的部份,而無法解釋的部份將之命名為 "luck",所以 Tango 的結果告訴大家:OK,如果你要用數學模型去 analyze BABIP,"peripheral stats" 大概只說了 56% 的故事,換言之,BABIP 就是個不安定的因子,它不易被定位為球員的真實能力。在這個例子裡,你會責怪 sabermetricians 在 "推卸責任、避重就輕" 嗎?會到個人這裡來觀光的朋友恐怕都說 "No",但是那些反 sabermetrics 的人的口中 -- 兩個本質相同的例子下 -- 會變成 "Yes"。

我們拿 Wang 來舉另一個例子好了,投手的 peripheral stats 裡真正可靠的只有 3 項 -- 就是 TTO (Three True Outcomes) -- SO、BB、HR,你可以發現的是 TTO 的成份裡沒有任一個是與守備有關,全部都是投手自己的問題,同時球員的 TTO 在 year to year 之間的 correlation 在 80% 以上,比起其它低 correlation 的 stats,historical TTO 用來預測顯然要可靠得多,所以 Tango 用這 3 項做自變數來 figure 他的 FIP 不是沒有道理的。而我們在 question Wang 的 SO 為什麼那麼少的時候,不妨連著 TTO 一起看看 -- 這是個人唯一 "能" 做的事 -- 畢竟我從來都分不出 breaking ball 的種類 (看不到球的握法我就不曉得那是什麼),更不用提寫出像 Andre 兄這類的 great piece

NameAgeIPK/9BB/9HR/9
Wang25116.13.642.480.70
---263.06.782.260.62
Wang26218.03.142.150.50
--- 268.06.682.350.24

請注意 Wang 的 BB/9 與 HR/9 在他 25、26 歲那兩年與 "---" 的比較,roughly speak,"---" 與 Wang 在這兩個 categories 是 almost identical 的,那麼那位 "---" 是誰?他就是 future HOFer -- Greg "Professor" Maddux。那麼在不受傷的前提下,如果擁有 Maddux 的 TTO 可以進 HOF,那麼 "取三者有其二" 的 Wang 在近兩年的 solid performance -- 在可參考的 historical data 越來越多的情況下 -- 真的有那麼 exceptional?

這並不是我頭一回用 TTO 給 Wang 背書,早在 06 年的季中我在 PTT 就提過類似的說法。相較於其它的數字,for example:由於 BABIP 有太大的 fluctuation 空間,所以我們應該避免用 H 甚至 WHIP 來做 ground;ERA?很久很久以前就當垃圾看了;GIDP?Boy,不讓人上壘哪來的 GIDP?而讓人上壘再製造 GIDP 如果和 "危機處理能力" 劃上等號,the leap could be greater than the distance between sun & earth;Preventing SB?C'mon,那只不過是 secondary advantage,一個上壘的傢伙就算一路偷回本壘也只有 1 分,和 2H 或 2BB 的意義絕對是大大不同的,so...what else?

棒球的確不是只有數據,但數據不會騙人,只是有人喜歡拿錯誤的數字說謊,或是只挑與自己有利的部份來闡述罷了;數字當然也不是萬能,但沒有數字,卻是萬萬不能。

We can't be no God, but we can at least try to be -- by using statistics.

這也是我選擇研究 sabermetric 的原因,即便我有這個 luxury 去每天看一場球賽,一天裡頭還有超過 14 個小時眼睛沒有閉著,那為什麼不從數字裡去找答案、找方向呢?

最後我們以 Kevin Tower -- Padres GM -- 的一段 quote 做收,當大家把 Moneyball、Billy Beane 掛在口中的時候,別忘了有一支球隊,以少於 70M 的 total payroll,連續兩年在兩支大資金的球隊夾擊下,拿下 NL West Division Title。

Sabermetric is a cutting-edge science of modern baseball. If you didn't know that, you've already missed the boat.
-- Kevin Tower, Padres GM

Do not miss the boat, and do not hop in the wrong boat, either.

8 comments:

J-Train said...

Morikawa兄,

您好,這是我在這裡首次留言。沒想到你還會去看我的東西,見笑了。

首先,必須得先說一聲,我完全沒有反對 sabermetrics,甚至,我也是信徒之一,只是當然沒有你們那麼專精了。

必須也得承認,或許我那篇的標題下的太重了,但那也確實是我當時的心境,當時也跟 Peter Abraham 聊,我們都很受不了,只是丟個數據出來,就要說某某人的防守好,誰誰誰的防守其實很爛,這些人真的有在看比賽嗎?(I mean no disrespect here, so please don't take it the wrong way.)

先不提 Moneyball、Bill James 的書,SportingNews 與 Stats 出的數據統計、球員資料,以前年年都買,I just love looking at the numbers and stuff.

我不會說我是 sabermetrics 的專家,因為我不是,但我相信它,所以我才會喜歡讀你們的文章,就像我才剛跟一名網友聊到的,或許我不會每次都百分之百同意你們的說法,but I do respect it.

「棒球的確不是只有數據,但數據不會騙人,只是有人喜歡拿錯誤的數字說謊,或是只挑與自己有利的部份來闡述罷了;數字當然也不是萬能,但沒有數字,卻是萬萬不能。」

我想,你寫的這段話,大概沒法再形容地更好了。

我會繼續來這裡拜讀大作的。

Todd7622 said...

好文章!

如果要選出Morikawa Blue裡面最好的幾篇文章,我想這篇會是其中之一!看到上面那則小故事和您在我部落格裡的留言忽然想到高中時一位物理老師說過的話:學物理不能和學數學混為一談,物理學家要做的事是用數學的方法來驗證物理現象,它不是絕對!數學家就很龜毛,數學家要的是一個accurately的答案!

Morikawa said...

To J-Train 兄,

我有用心看您那篇文章的內容,也從頭到尾不覺得您是 sabermetrics 的反對者,引述大名只是用這一篇做 follow-up 而不是 against。Key word:FOLLOW-UP

如果這裡沒有太多誤會,會是感激的。

--------

To Todd,

所以統計學要的其實也不是絕對,數學的確是持續的要把一些東西變成 "絕對",但統計學只是為走向 "絕對" 指引一個方向。

J-Train said...

Follow-up? 您太客氣了,這是非常精彩的一篇文章,受教甚多。

GoTribeYang said...

GREAT post you do it again ! :)

Dorasaga said...

我在這裡想到一個小問題:FIP 是不是放大後可以預測投手的責失分(ER)?

我記得可以,所以我曾經自己打計算機用本季季中Cubs' Rich Hill 來比較Padres' Peavy:

Peavy:
games / IP / K/BB / OBA / SLG / WHIP / FIP
9 / 60.1 / 4.05 / 0.258 / 0.239 / 0.98 / 1.96

Hill:
games / IP / K/BB / OBA / SLG / WHIP / FIP
9 / 58.2 / 2.57 / 0.287 / 0.374 / 1.09 / 4.65

當季出多數Cubs' Faithfuls認為Hill很神,結果他開始丟五六分,大家認為只是低潮,我發現他的FIP 4.65,代表可能丟四到五分,變成已經有點意義了。

FIP 不講ER,可是factor 只在TTO,結果比ERA更加真實的代表責失分可能,這樣講應該沒錯吧?

法洛猛 said...

我來自首,我最近也發表過這一類的大不敬言論 XD

現在的網路上,應該很少看到真的要 anti-sabermetrics 的球迷吧,我當然也不是。(如果有大概也都被當小白,死得很難看了。那種人不管看球的腦袋或反對 sabermetrics 的行為都相當不智。)

但看到 J-Train 兄的文章,我會深有同感,正是因為相反的,我看到了一些拿數字當事實的人。尤其是那種「這就是數字,這就是事實,其餘免談」的態度。完全沒那種「所以 sabermetricians 並不是在告訴大家 P(A) = 1 的結果,而是闡述 "如果我們希望 A 發生,該怎麼做才比較有機會讓 P(A) = 1"。」的認知。

另外他們也少了 Morikawa 兄在「Demystify EQA and Its Eccentric Baseline...」中
講的那種「只是在不瞭解數學式子背後的真實意義的情況下,瞭解他們的想法,相信永遠比運用那些數字重要。」的信念吧。

我得老實承認,我對棒球統計這方面完全沒下過功夫,對VORP、BABIP只是知道個大概的意思,勉強能知道別人文章裡在講什麼,沒有真的去算過,所以也從來不敢直接用…。

但不時看到一些人,反過來把數字當事實、當終點,真的讓人搖頭,所以忍不住就感嘆了一下了。

以上自白。 XD

對了,請教一下。文中講到GIDP。GIDP當然不是什麼「危機處理能力」,甚至多了還有「創造危機再處理的能力」之嫌。但對滾地球投手而言它算不算是一種能力呢?或許在二個WHIP相等的投手之間?還是把它當成一種成績統計就可以了?

不久前才寫了一篇文章扯到WHIP。如果先看到這篇,可能動筆前會更加三思吧 :P

Morikawa said...

To J-Train,

I mean it...

--------

To GoTribeYang,

Thanks a lot.

--------

To Dorasaga,

由於 FIP 所運用的 independent variables 較能代表了投手真實的能力,所以它的確具備不差的預測能力。

談到 ERA,說起來也許除了蝴蝶球投手,一般 "常人" 在一季下來後,RA 與 ERA 也差不了多少。而且,我也不認為 "責失" 的判定是很有意義的,最主要的一點 -- 它不客觀。

我認為 FIP 與 ERA 站在同一條線上時,只有一個結論比較穩:如果一位投手的 ERA 遠遠 高於/低於 FIP,簽了後者而遭到 backfire 的機會將比較大。

--------

To Fal,

你的 WHIP 其實也是有點意思的。不過既然 Wang 到目前為止維持了穩定的表現,WHIP 卻有如此大的波動。That should ring some bells...

簡而言之,這訊息就和 sabermetrician 的想法一樣:WHIP "不代表" 投手真正的 "能力",但可以視為 "貢獻"。

GIDP....我的確有研究過這個部份,但使用的幾個自變數都不足以解釋 GIDP 的發生 -- 包括 high GB/FB。也許要做像是 Andre 兄那種球路 movement 的研究會比較容易找到答案也說不定。

我個人現在仍然傾向 GIDP 的發生是隨機的 (直說就是:發生了,就趕快感謝上帝)!尤其以 Wang 的例子更是不可思議 -- 他有一個接近全聯盟最爛的內野在他的背後....