數學vs.地質 | 7:11 | 負 |
經濟vs.數學 | 16:6 | 負 |
數學vs.政治 |
6:14 |
負 |
數學vs.心理 | 22:9 | 勝 |
niche:「數學前四戰每場平均攻分10.25分/G,很高的得分能力,八隊中排名第二。扣除掉對心理那一場太誇張得了22分,數學似乎一場球至少都能得6分以上,也算是不錯的攻擊能力。因為沒有人親眼看到數學心理之戰的過程或是比賽記錄,不知道那22分到底有幾分真的是不靠對手失誤拿到的?總之在不瞭解那一場數學得分原因的分佈(安打?長打?失誤?)之下,有可能那22分的成份要打一點折扣呢(或許這個數字只是一個outlier喔XD),因此也不用太高估他們的打擊啦!何況投手是黑雞呢!」
在做球隊的平均攻分和失分的計算時,我有考慮誤差,就像跳水、體操、滑冰等等有裁判打分數的競賽項目,會先把最高和最低分數剔除後再做統計,此乃統計學中處理偏差值的常用方式:離散群的選擇。這也是niche的動作:扣除掉對心理那一場太誇張得了22分。
然而,目前才只有四場比賽樣本太少,而且也無法確定數學對心理所攻下的22分,是否全是靠棒子紮實打回來的。雖說不要過於高估數學的實力,但那22分的成份到底要打多少折扣?如果真的仔細去看數據紀錄,或許會在其中看到不容易發現的細節和含意。
以下只是很粗淺的「直覺」分析,首先再把數學前四場的戰績拿出來比較:
數學vs.地質 | 7:11 | 負 |
經濟vs.數學 | 16:6 | 負 |
數學vs.政治 |
6:14 |
負 |
數學vs.心理 | 22:9 | 勝 |
數學vs.心理-22:9,與其他三場對戰相比,似乎是很誇張的數字。或許這種看似「偏差極大」的數據,會影響並高估對手的實力,所以需要作可能的誤差修正,但在處理「人為活動」時,必須要考慮實際的情況與結果。
如果要修正誤差項,我覺得不應該把該場比賽全部的22分都剔除,因為最終的結果仍是「數學勝心理」。若以最低容忍程度來修正,設數學攻分的最低容忍值為10,我們可以把比賽結果修正為:數學vs.心理-10:9。用最低容忍值來考慮,也是一種在樣本空間非常小(或非常少)時,可以求得最接近數值的分析方法。
以最低容忍值的分析方法,再計算數學的平均攻分,就下修到7.25分/G,這是最低容忍值的保守估計範圍。
若想要更接近實際情形的分析呢?考慮數學的對手心理的前四戰成績:
政治vs.心理 | 14:6 | 負 |
大氣vs.心理 | 14:11 | 負 |
心理vs.森聯 |
3:8 |
負 |
數學vs.心理 | 22:9 | 負 |
心理平均會讓對手攻下的分數為14.5分/G,用這個方向去思考「數學vs.心理」,數學攻分的最低容忍值就變成14.5,這個數字小於實際的22分,是可能且可以接受的統計範圍。
因此,重新設定比賽結果:數學vs.心理-14.5:9,再次計算數學的平均攻分為8.375分/G。與森聯平均攻分9.5分/G做比較,8.375是一個相當接近的數字,有沒有高估數學?在比較球隊攻分的分析數據之後,多少能有個底了。
上述所討論的方法,在處理數據上也很常用:「重複回歸逼近修正」,用逼近的方法不斷遞迴帶入,以求得最佳的分析結果。處理數學平均攻分分析的程序,是很簡單的一次遞迴,而物理實驗數據的分析,常常要做到無數次的遞迴呢。
在數值的統計分析中,在極端的樣本空間(極少和極多),「平均值」是很容易讓人誤解的一環。樣本數極少還容易讓人理解,但是為什麼樣本數極多,平均值也會被誤解?我想誤解的來源,大多發生在討論「個別樣本」平均值之間的差異。討論分析結果時,往往容易忽略了「實際情況因子」,在極大的樣本空間中,雖然差異極細微,卻也可能代表實際上有很大的不同。
如何在細微的數據統計分析之中,去發掘容易被人忽略卻是最有價值的細節,此為棒球經濟學Sabermetrics的真諦。
【森聯vs.數學,場邊記錄組】
留言列表