野球小札《戰報分析》 @ 阿衡的探秘地圖

數學vs.地質	7：11	負
經濟vs.數學	16：6	負
數學vs.政治	6：14	負
數學vs.心理	22：9	勝

　　niche：「數學前四戰每場平均攻分10.25分/G，很高的得分能力，八隊中排名第二。扣除掉對心理那一場太誇張得了22分，數學似乎一場球至少都能得6分以上，也算是不錯的攻擊能力。因為沒有人親眼看到數學心理之戰的過程或是比賽記錄，不知道那22分到底有幾分真的是不靠對手失誤拿到的？總之在不瞭解那一場數學得分原因的分佈（安打？長打？失誤？）之下，有可能那22分的成份要打一點折扣呢（或許這個數字只是一個outlier喔XD)，因此也不用太高估他們的打擊啦！何況投手是黑雞呢！」

　　在做球隊的平均攻分和失分的計算時，我有考慮誤差，就像跳水、體操、滑冰等等有裁判打分數的競賽項目，會先把最高和最低分數剔除後再做統計，此乃統計學中處理偏差值的常用方式：離散群的選擇。這也是niche的動作：扣除掉對心理那一場太誇張得了22分。

　　然而，目前才只有四場比賽樣本太少，而且也無法確定數學對心理所攻下的22分，是否全是靠棒子紮實打回來的。雖說不要過於高估數學的實力，但那22分的成份到底要打多少折扣？如果真的仔細去看數據紀錄，或許會在其中看到不容易發現的細節和含意。

　　以下只是很粗淺的「直覺」分析，首先再把數學前四場的戰績拿出來比較：

數學vs.地質	7：11	負
經濟vs.數學	16：6	負
數學vs.政治	6：14	負
數學vs.心理	22：9	勝

　　數學vs.心理－22：9，與其他三場對戰相比，似乎是很誇張的數字。或許這種看似「偏差極大」的數據，會影響並高估對手的實力，所以需要作可能的誤差修正，但在處理「人為活動」時，必須要考慮實際的情況與結果。

　　如果要修正誤差項，我覺得不應該把該場比賽全部的22分都剔除，因為最終的結果仍是「數學勝心理」。若以最低容忍程度來修正，設數學攻分的最低容忍值為10，我們可以把比賽結果修正為：數學vs.心理－10：9。用最低容忍值來考慮，也是一種在樣本空間非常小（或非常少）時，可以求得最接近數值的分析方法。

　　以最低容忍值的分析方法，再計算數學的平均攻分，就下修到7.25分/G，這是最低容忍值的保守估計範圍。

　　若想要更接近實際情形的分析呢？考慮數學的對手心理的前四戰成績：

政治vs.心理	14：6	負
大氣vs.心理	14：11	負
心理vs.森聯	3：8	負
數學vs.心理	22：9	負

　　心理平均會讓對手攻下的分數為14.5分/G，用這個方向去思考「數學vs.心理」，數學攻分的最低容忍值就變成14.5，這個數字小於實際的22分，是可能且可以接受的統計範圍。

　　因此，重新設定比賽結果：數學vs.心理－14.5：9，再次計算數學的平均攻分為8.375分/G。與森聯平均攻分9.5分/G做比較，8.375是一個相當接近的數字，有沒有高估數學？在比較球隊攻分的分析數據之後，多少能有個底了。

　　上述所討論的方法，在處理數據上也很常用：「重複回歸逼近修正」，用逼近的方法不斷遞迴帶入，以求得最佳的分析結果。處理數學平均攻分分析的程序，是很簡單的一次遞迴，而物理實驗數據的分析，常常要做到無數次的遞迴呢。

　　在數值的統計分析中，在極端的樣本空間（極少和極多），「平均值」是很容易讓人誤解的一環。樣本數極少還容易讓人理解，但是為什麼樣本數極多，平均值也會被誤解？我想誤解的來源，大多發生在討論「個別樣本」平均值之間的差異。討論分析結果時，往往容易忽略了「實際情況因子」，在極大的樣本空間中，雖然差異極細微，卻也可能代表實際上有很大的不同。

　　如何在細微的數據統計分析之中，去發掘容易被人忽略卻是最有價值的細節，此為棒球經濟學Sabermetrics的真諦。

森聯vs.數學，場邊記錄組