球隊轉會淨支出對成績影響力大還是薪金支出影響力大? - 從統計學分析

論盡足球場 於 04/06/2014 發表 收藏文章
俗語常說「數據不會說謊」,而比起直接比較數據,統計學會提供一個科學方法去分析數據所顯示的東西,這裏我嘗試以比較簡單的統計學方式去分析有關足球的數據。對於金錢足球,球迷很多時都著眼於轉會支出,大家會常提到夏薩特是三千萬磅、加利夫巴爾是一億歐元、馬達是3700萬磅,這些很容易知道,但其實球會另一樣影響深遠的金錢支出就在於給予球員的工資。曼城在蒙蘇剛入主但未打出成績之時就是以高工資去吸引球員加盟,所以說工資其實對球會的購買力也存在很大的影響,增加球員加盟的意願。既然兩種金錢支出都有能力讓球隊有更佳的成績,那究竟是哪項比較具影響力呢?我嘗試以英超3個球季,2010-11、11-12及12-13的數據去分析,因為英超的各項數字都比較透明易見,其他聯賽則很多不透露轉會費的交易,所以便不取用,然後從中發現了薪金支出比轉會淨支出﹙轉會支出 - 轉會收入﹚更影響球會最終的排名及得分。

首先我會將資料整合,分成6項,首先是賽季(Season)、球隊(Team)、聯賽排名(League Position)、積分(Points)、轉會淨支出(Net Transfer Spend)和薪金支出(Wage Bill),轉會淨支出與薪金支出都以百萬英磅為單位。有關轉會淨支出數據來自http://www.transferleague.co.uk/,而薪金支出數據則來自衛報http://www.theguardian.com/news/datablog/2014/may/01/premier-league-club-accounts-debt-wages,下圖為該數據列表,總共有60行但不逐一展示。


然後就會輸出數據到統計學軟件作出相關系數(Correlation)的分析。在這裏先簡單說明這項統計數據的意思,希望讀者不要覺得太沈悶,因為「其實唔難」。相關系數是指兩組數字的關係,正數即是兩者關係成正比,負數則成反比,0即是兩者毫無關係,而相關系數是介於-1至1之間,越接近-1或者1的話,兩個數據的關係便越大,統計學會以0.2當作是有輕微關係,而0.6以上則是有強烈的關係。

然後我就要展示那個相關系數的統計結果圖表,紅色圈著的就是相關系數。


先舉一些圖表中的實例讓大家明白相關系數,就如第一行聯賽排名與積分有-0.941的相關,即是積分高的時候,排名的數字就越小﹙冠軍是第1名,所以排名數字越小排名就越前﹚,反之亦然,這是十分正常的。而像賽季跟積分很明顯是不會構成關係的,所以它們的相關系數便是-0.004。示範完畢,進入正題要分析的東西。

看打橫第一行就能看見聯賽排名與各項數據的關係,而聯賽排名與薪金支出的關係達到-0.766,但與淨轉會支出的相關系數是-0.321,即是兩者都能對聯賽排名構成影響力,但薪金支出的影響力卻比淨轉會支出高很多,而因為相關系數是負數,所以當薪金支出及轉會淨資出越多,他們的聯賽排名便會越前,這和我們正常的理解很一致。

而從第二行的積分與薪金支出和淨轉會支出有更強的關係,分別是-0.831及-0.387,雖然兩個相關系數都有增加,但薪金支出的影響力仍然是比淨轉會支出高出很多。


總結

基於以上的分析,薪金支出比起淨轉會支出更能預測球隊的排名,又或者可以說把資金用在薪金上的成效會比用在轉會上有效,這並不是說要球會把轉會資金全放在薪金上,只是說明每1蚊薪金資出可以比每1蚊淨轉會支出為球隊成績帶來更大的效果,但球隊總是要有轉會費才能購得有實力的球員,才會值得球會給予高薪。在有限的資金下,球會都要對金錢的支出有謹慎的安排,這項統計數據希望能更清楚的認出一些球會支出的方向。


小弟第一次運用統計學作一些數據分析,希望大家喜歡,以後我會再嘗試找其他的數據作分析,如大家有興建的也可以作一些提議讓我嘗試去找數據作分析。
標籤: 統計  數據  英超  薪金  轉會支出  金錢  

留言


請按此登錄後留言。未成為會員? 立即註冊
  • lyly 於 05/06/2014 評論 NO. 1

    用 panel data 去分析咁多年的 salary and league position 比較有說服力d ;)

  • 口水仔 於 06/06/2014 評論 NO. 2

    當初我做既時候都想盡量做多幾年,但係衛報有既資料係最新係12-13,最舊係10-11,所以我盡量做佢有既年份
    當然有其他SOURCE有提供更早既年份資料,但又冇新年度既資料,為左達到資料一致性我就避免左從唔同既媒體去拎取資料
    因為有時唔同媒體都會報出唔同既轉會費,薪酬數據,所以我先選擇單用衛報所提供到既3年數據

    如果有更好既SOURCE可以提供到更多年份既資料我都會好樂意再嘗試test多一次
    不過從統計學相關系數既概念60個data唔算太少,而且相差既距離亦都大得有好明顯既差別,所以勉強我都覺得可以認為推論係成立

    好多謝讀者既意見,希望我解答到你既問題,有機會我再寫統計分析時會嘗試拎更多既data set去做

快捷鍵:←
快捷鍵:→