俗語常說「數據不會說謊」,而比起直接比較數據,統計學會提供一個科學方法去分析數據所顯示的東西,這裏我嘗試以比較簡單的統計學方式去分析有關足球的數據。對於金錢足球,球迷很多時都著眼於轉會支出,大家會常提到夏薩特是三千萬磅、加利夫巴爾是一億歐元、馬達是3700萬磅,這些很容易知道,但其實球會另一樣影響深遠的金錢支出就在於給予球員的工資。曼城在蒙蘇剛入主但未打出成績之時就是以高工資去吸引球員加盟,所以說工資其實對球會的購買力也存在很大的影響,增加球員加盟的意願。既然兩種金錢支出都有能力讓球隊有更佳的成績,那究竟是哪項比較具影響力呢?我嘗試以英超3個球季,2010-11、11-12及12-13的數據去分析,因為英超的各項數字都比較透明易見,其他聯賽則很多不透露轉會費的交易,所以便不取用,然後從中發現了薪金支出比轉會淨支出﹙轉會支出 - 轉會收入﹚更影響球會最終的排名及得分。
首先我會將資料整合,分成6項,首先是賽季(Season)、球隊(Team)、聯賽排名(League Position)、積分(Points)、轉會淨支出(Net Transfer Spend)和薪金支出(Wage Bill),轉會淨支出與薪金支出都以百萬英磅為單位。有關轉會淨支出數據來自http://www.transferleague.co.uk/,而薪金支出數據則來自衛報http://www.theguardian.com/news/datablog/2014/may/01/premier-league-club-accounts-debt-wages,下圖為該數據列表,總共有60行但不逐一展示。
然後就會輸出數據到統計學軟件作出相關系數(Correlation)的分析。在這裏先簡單說明這項統計數據的意思,希望讀者不要覺得太沈悶,因為「其實唔難」。相關系數是指兩組數字的關係,正數即是兩者關係成正比,負數則成反比,0即是兩者毫無關係,而相關系數是介於-1至1之間,越接近-1或者1的話,兩個數據的關係便越大,統計學會以0.2當作是有輕微關係,而0.6以上則是有強烈的關係。
然後我就要展示那個相關系數的統計結果圖表,紅色圈著的就是相關系數。
先舉一些圖表中的實例讓大家明白相關系數,就如第一行聯賽排名與積分有-0.941的相關,即是積分高的時候,排名的數字就越小﹙冠軍是第1名,所以排名數字越小排名就越前﹚,反之亦然,這是十分正常的。而像賽季跟積分很明顯是不會構成關係的,所以它們的相關系數便是-0.004。示範完畢,進入正題要分析的東西。
看打橫第一行就能看見聯賽排名與各項數據的關係,而聯賽排名與薪金支出的關係達到-0.766,但與淨轉會支出的相關系數是-0.321,即是兩者都能對聯賽排名構成影響力,但薪金支出的影響力卻比淨轉會支出高很多,而因為相關系數是負數,所以當薪金支出及轉會淨資出越多,他們的聯賽排名便會越前,這和我們正常的理解很一致。
而從第二行的積分與薪金支出和淨轉會支出有更強的關係,分別是-0.831及-0.387,雖然兩個相關系數都有增加,但薪金支出的影響力仍然是比淨轉會支出高出很多。
總結
基於以上的分析,薪金支出比起淨轉會支出更能預測球隊的排名,又或者可以說把資金用在薪金上的成效會比用在轉會上有效,這並不是說要球會把轉會資金全放在薪金上,只是說明每1蚊薪金資出可以比每1蚊淨轉會支出為球隊成績帶來更大的效果,但球隊總是要有轉會費才能購得有實力的球員,才會值得球會給予高薪。在有限的資金下,球會都要對金錢的支出有謹慎的安排,這項統計數據希望能更清楚的認出一些球會支出的方向。
小弟第一次運用統計學作一些數據分析,希望大家喜歡,以後我會再嘗試找其他的數據作分析,如大家有興建的也可以作一些提議讓我嘗試去找數據作分析。
首先我會將資料整合,分成6項,首先是賽季(Season)、球隊(Team)、聯賽排名(League Position)、積分(Points)、轉會淨支出(Net Transfer Spend)和薪金支出(Wage Bill),轉會淨支出與薪金支出都以百萬英磅為單位。有關轉會淨支出數據來自http://www.transferleague.co.uk/,而薪金支出數據則來自衛報http://www.theguardian.com/news/datablog/2014/may/01/premier-league-club-accounts-debt-wages,下圖為該數據列表,總共有60行但不逐一展示。
然後就會輸出數據到統計學軟件作出相關系數(Correlation)的分析。在這裏先簡單說明這項統計數據的意思,希望讀者不要覺得太沈悶,因為「其實唔難」。相關系數是指兩組數字的關係,正數即是兩者關係成正比,負數則成反比,0即是兩者毫無關係,而相關系數是介於-1至1之間,越接近-1或者1的話,兩個數據的關係便越大,統計學會以0.2當作是有輕微關係,而0.6以上則是有強烈的關係。
然後我就要展示那個相關系數的統計結果圖表,紅色圈著的就是相關系數。
先舉一些圖表中的實例讓大家明白相關系數,就如第一行聯賽排名與積分有-0.941的相關,即是積分高的時候,排名的數字就越小﹙冠軍是第1名,所以排名數字越小排名就越前﹚,反之亦然,這是十分正常的。而像賽季跟積分很明顯是不會構成關係的,所以它們的相關系數便是-0.004。示範完畢,進入正題要分析的東西。
看打橫第一行就能看見聯賽排名與各項數據的關係,而聯賽排名與薪金支出的關係達到-0.766,但與淨轉會支出的相關系數是-0.321,即是兩者都能對聯賽排名構成影響力,但薪金支出的影響力卻比淨轉會支出高很多,而因為相關系數是負數,所以當薪金支出及轉會淨資出越多,他們的聯賽排名便會越前,這和我們正常的理解很一致。
而從第二行的積分與薪金支出和淨轉會支出有更強的關係,分別是-0.831及-0.387,雖然兩個相關系數都有增加,但薪金支出的影響力仍然是比淨轉會支出高出很多。
總結
基於以上的分析,薪金支出比起淨轉會支出更能預測球隊的排名,又或者可以說把資金用在薪金上的成效會比用在轉會上有效,這並不是說要球會把轉會資金全放在薪金上,只是說明每1蚊薪金資出可以比每1蚊淨轉會支出為球隊成績帶來更大的效果,但球隊總是要有轉會費才能購得有實力的球員,才會值得球會給予高薪。在有限的資金下,球會都要對金錢的支出有謹慎的安排,這項統計數據希望能更清楚的認出一些球會支出的方向。
小弟第一次運用統計學作一些數據分析,希望大家喜歡,以後我會再嘗試找其他的數據作分析,如大家有興建的也可以作一些提議讓我嘗試去找數據作分析。
請按此登錄後留言。未成為會員? 立即註冊