- 封面故事
- 2022年
- 634期-統計科學(10月號)
文章專區
2022-10-01運動員的身價怎麼算?體育中的運動統計學
634 期
Author 作者
沈緯鈞/國立體育大學體育研究所兼任助理教授、台灣運動心理學會副秘書長。
Take Home Message
• 運動統計學的應用能解答運動領域的問題,透過界定問題特性、調查或實驗後記錄數值與分析,得到並詮釋結果。
• 應用統計的迴歸分析,可計算球員對勝率的貢獻和簽約金額。蒐集更多的樣本與數據後,統計結果能更接近實際情況。
• 科技進步使得資料取得容易,統計方法也影響運動領域的多個面向,例如理論、訓練、比賽策略和規則、產業等。
今(2022)年臺灣的職業與半職業籃球聯盟百家爭鳴,賽季期間常有數個對戰同時段開打,球員在場上激盪出的火花及嶄新的對戰讓球迷們大飽眼福,聯盟選秀與選手薪資議題也受到大眾關切。實際上,職業隊伍的選才、運動員該領的薪資與身價,一直是全世界的運動團隊、運動員與運動迷所關心的議題,而這些議題其實可藉由運動統計來一探究竟。
什麼是運動統計?
統計學,是將我們所關心的現象以數學形式來描述的科學,透過觀察、抽樣、記錄、分析、呈現與推論數值來解答問題;而運動統計學,則是將統計學應用於各種運動脈絡的學科,在追求最佳表現的競技運動(sport)、提升身體適能與健康的健身運動 (exercise),以及以身體活動達到教育目標的體育(physical education)情境中均被廣泛使用。舉凡多數人從小到大做過的體適能檢測、智能手環的心跳率監控、乃至於奧運賽場上令人振奮的新世界紀錄,都是運動統計在生活中的體現。除了記錄數值本身之外,統計數值也是策略擬定的基礎,像是如何改善自身體重或血壓、提升運動團隊默契等,解決這些問題的歷程其實都是運動統計的應用。
而統計的應用也反映出解答問題的步驟:首先確立所關心的問題,界定問題的特性,並確定這些特性是可以被測量的,後續選擇具代表性的族群來調查或實驗,並記錄數值與分析,再呈現與詮釋所得的結果。統計應用在運動領域的常見議題有:成績有關的紀錄、技術或動作分析、教學法的成效、影響表現的因素、產業經營與管理、現況調查與政策擬定。雖然所有可以被量化的數值都能夠被記錄與分析,但並不是所有數值都有意義,例如籃球運動員的彈跳高度會影響場上的表現,但對於撞球選手來說,彈跳高度就並非表現的關鍵。因此決定哪些數值應該被該記錄分析,就需要考量運動脈絡的特殊性,以及分析這些變項的目的。整體來說,運動統計就是解答運動脈絡中蘊含問題的一門應用科學,以下我們利用兩個例子來展示運動統計的應用。
如果你是運動團隊的總經理,會跟哪位運動員簽約?
運動員的年齡、能力、年資、聲望、合約長度等是影響運動員選擇的因素,其中,運動員的表現及對團隊的貢獻經常是決策者的主要考量,表一呈現了兩位籃球員的生涯個人數據,如果你是球隊總經理,你會選擇簽下哪位球員?
乍看之下兩位運動員的數據似乎沒有太大的不同,不過如果我們想更客觀地比較,就可應用統計中的迴歸分析(regression analysis)來處理此問題。迴歸分析的目的在於找到變項之間的線性組合,如果能經由多數人的資料確立這條線性關係,就能以現有的數值來預測結果,它的數學模式為:
式中的Ŷ 為結果變項,為結果變項的起點,為迴歸係數,代表Xi 與Ŷ 的相關程度。Xi 為預測變項,ε為誤差,R2 為解釋變異量,代表預測變項能解釋結果變項的強度。上例中,我們可選擇球隊勝率作為最重要的結果,檢視個人數據為勝率的貢獻狀況,假設我們蒐集聯盟中 300位球員所在隊伍的勝率與球員的數據,分析後得到的數學模型為:
球隊勝率 =0.24+0.13×投籃命中率 +0.04×助攻數+0.11×抄截數 +0.03×籃板球數 -0.13×失誤數;R2 = 0.26
再以這組模型為基礎,找出五個對勝率有貢獻的變項,表示投籃命中率、助攻數、抄截數與籃板球數愈高、失誤數愈低,球隊勝率愈高;而且這些比賽數值能解釋 26%的球隊勝率變化,球員的貢獻就可參用此模型估算。回到上面這個例子,你會選擇誰?將數據帶入模型後,A球員可帶來的團隊勝率為0.45、B 球員為0.63。
事實上有許多職業運動都會提供運動員的個人數據,並計算成相對應的指標做為評價選手的依據,如美國國家籃球聯盟(National Basketball Association,NBA)使用的選手效率值(efficiency)、有效命中率(effective field goal percentage)、球員效率評比(player's efficiency rating)就是計算不同的個人數據,並且考量數據的各自貢獻而產生,這些指標的形成在邏輯上與上例相同,當在意的結果不同時,形成的指標也就不同。
滿意你的新合約嗎?
如果你是一位脫離新秀合約(820 萬美元/年)的NBA 籃球員,新合約的報價是一年 2200 萬美元,你會接受嗎?我們可用 NBA 的公開統計數據,選取2021~2022 年賽季的五個位置各 20 位球員的資料,初步估算個人數據與薪資的關係,預測變項包含 12 種數據(表二),結果變項為年薪,分析後可以得到:
球員年薪 =-28140020.53+1335460.24×平均得分+1014520.74×籃板數 +55896624.53×有效命中率 +1291046.12×助攻數 +144176.50×球員效率評比-3671193.81×失誤數;R2 =0.32
結果顯示對預測年薪有貢獻的數據包含:平均得分、籃板數、有效命中率、助攻數、失誤數與球員效率評比,而這些個人數據解釋了32%的年薪變化。若你今年度的數據為平均得25.8 分、兩分球命中率30%、三分球命中率20%、罰球命中率68%、有效命中率34%、6.3個籃板、2.1個助攻、1.1個阻攻、0.4 個抄截、3.8 個失誤、3.7 次個人犯規與20.63 的球員效率評比,套用上頁的模型,你今年的表現約可獲得2711 萬7402 美元。在不改變其他條件的狀況下,你很可能會拒絕新合約的報價。當然,我們也可以按位置進行個別分析,數值與年薪的關係呈現於表二,結果顯示不同位置的球員,預測年薪的數據並不相同,五個位置球員的預估薪資呈現如圖一。如果你是大前鋒,套用表二的數值可得薪資約為1590 萬3410 美元,此時你很可能會接受這份合約。需要注意的是,若上例中能蒐集更多的樣本、對運動特性有愈全面的考量,運動統計的結果也能愈接近實際狀況。
整體而言,運動員能為團隊表現帶來的效益、為財團產生的廣告利益、跟球迷間產生的情感認同,都有可能影響運動員的薪資與身價,而運動統計的應用能幫助我們找到更客觀且合理的依據評估運動員的價值,運動員也可依此統計結果強化特定的個人數據來提升身價。
籃球員的工作分配
圖一|相同統計數據下不同位置球員的預期薪資
統計,改變了運動領域的世界
上例使用統計了解運動員的身價,僅是應用運動統計的其中一面。統計是解決問題的工具,以分析數據來解決問題的過程,此過程影響運動領域中的許多面向:
(一)運動理論
統計可幫助研究者檢驗並建立新的學理架構,統計原理與方法的演進也能補強過去未能檢視的議題,豐富運動的知識與學理架構。
(二)賽會與競賽規則
許多運動項目為了比賽節奏及公平性,便基於統計分析的結果修正規則,例如桌球大小的改變、羽球發球的允許高度。
(三)運動訓練與比賽策略
指導者或團隊主帥若能檢驗訓練與計畫的成效,就能設計高效率的策略方針,如2002 年美國職棒大聯盟(Major League Baseball, MLB)的奧克蘭運動家(Oakland Athletics)以賽伯計量學(sabermetrics)從谷底翻身、2014 年世界盃足球賽德國依照即時數據分析系統,一舉捧起金盃就是透過統計分析改善訓練與競賽策略的寫照。
(四)運動產業
在數千億的運動產業產值中,統計分析是運動團隊的軟硬體開發、活動與廣告設計運作的重要一環。運動產業的從業型態也隨著數據分析的重要性提升而有所變化,像是近期新興的運動數據分析師,就是以統計分析為專業的職業。
(五)生活型態
運動是生活中的一部份,從個人層面的健康提升與照護到國家層面的政策發展,都能基於統計分析而有更合適的規畫。
隨著統計方法與科技器材的進展,運動相關數據的取得與分析變得容易,運動情境也不再是資料稀有的環境。統計正快速地改變運動的世界。