关于NBA球星薪资的“性价比”分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
关于NBA球星薪资的“性价比”分析
数据收集杨冉 40421033
数据分析王荣盛 40421024
资料整理赵颐春 40421041
1,课题背景及目的
体育赛事职业化、产业化已经成为当今世界竞技体育项目发展的一种趋势。发展的最为成功的职业体育竞技联盟――全美职业篮球联盟(NBA)被世界各国的作为体育经济的教科书来模仿、学习。NBA的球员为全世界球迷展现高水平的比赛的同时,也收入全世界一流的高薪水。2006-2007赛季NBA球员一年的平均薪水是500万美元,30支队伍的薪水支出加起来达到16亿美元。每一个NBA球队的老板在与球员续约的时候,都认为球员是值得球队付给其合同上的金额的,其后发生种种变化,联盟中有许多“高薪低能”的球员,也有许多“人超所值”的球员,我们认为一个球员的个人能力反映了他在工作上的贡献,就像其它所有工作一样,一个员工的薪资应该是依据他的表现而来的。怀着对篮球运动的爱好,以及对体育产业经济问题的研究精神,我们选取了一些NBA现役球员,运用基本的统计量和所学的相关知识决定对他们的实际比赛表现和薪水状况做一个关于他们“性价比”的分析。
我们的假设是球员的统计资料对于他的薪资有显著效果。我们决定每赛季出场场数(played number per season),每场平均上
场时间 (minutes per game),每场平均助攻(assists per game),每场平均篮板(rebounds per game),每场平均得分(points per game)这些变量对于薪资是成正比的。在分析中,我们认为每场上场时间(minutes per game)是很重要的,因为我们认为球员打的时间越长,他所赚的钱应该越多。每场平均得分(points per game)也包括在变量里,因为我们认为这是一个球员对球队是否有价值之衡量标准,篮板球与助攻以及场次也是很重要的衡量标准。其中每场平均得分可能是最显著的变数。
2,模型设计
●Y=球员薪资
●X1=每场平均得分
●X2=每赛季出场场数
●X3=每场平均上场时间
●X4=每场平均助攻
●X5=每场平均篮板
由于本研究很大程度上是对上述假设进行实证分析,所以首先对被解释变量Y(球员薪资)与球员各影响薪资因素X进行回归分析并将方程形式设定为一次型。
Y=β1+β2X1+β3X2+β4X3+β5X4+β6X5
3,数据收集
4,模型的估计与调整
多重共线性
Dependent Variable: Y
Method: Least Squares
Date: 02/13/04 Time: 13:41
Sample: 1 28
Variable Coefficient Std. Error t-Statistic Prob.
C 4538173. 871467.8 5.207505 0.0000
X1 122156.2 35694.56 3.422264 0.0024
X2 105959.6 24551.61 4.315790 0.0003
X3 43978.31 24800.33 1.773295 0.0900
X4 -28665.48 82566.86 -0.347179 0.7318
R-squared 0.918688 Mean dependent var 15680194 Adjusted R-squared 0.900208 S.D. dependent var 2377192.
S.E. of regression 750951.0 Akaike info criterion 30.08348
Sum squared resid 1.24E+13 Schwarz criterion 30.36895
Log likelihood -415.1687 F-statistic 49.71270
因为X4 X5 的t 检验不显著,所以剔出这两个变量。多重共线性简单相关系数检验如下:
X1 X2 存在多重共线性,用逐步变量回归法进行修正。
其中加入X2的方程R2(修正可决系数)最大,以X2为基础,顺次加入其它变量逐步回归,结果如下表所示:
经比较,新加入X1的方程R2修正=0.898171 ,改进最大,而且各参数的t检验显著,选择保留X1,再作X2 和X1的相关系数检验,结果如下:
仍存在多重共线性,考虑X= X1* X2 ,将小类指标合并成大类指标即
全赛季总得分=每场平均得分*每赛季出场场数
使之与X3进行相关系数检验。
结果表明二者无多重共线性。
Dependent Variable: Y
Method: Least Squares
Date: 02/13/04 Time: 15:51
Sample: 1 28
Variable Coefficient Std. Error t-Statistic Prob.
C 9720386. 618820.5 15.70792 0.0000
X 2786.676 194.6140 14.31899 0.0000
X3 42572.45 21349.72 1.994052 0.0572
R-squared 0.907552 Mean dependent var 15680194
Adjusted R-squared 0.900156 S.D. dependent var 2377192.
S.E. of regression 751148.8 Akaike info criterion 29.99755
Sum squared resid 1.41E+13 Schwarz criterion 30.14029
Log likelihood -416.9657 F-statistic 122.7105
Durbin-Watson stat 1.563233 Prob(F-statistic) 0.000000
利用White检验来检验异方差:
F-statistic 1.907331 Probability 0.133934
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 02/13/04 Time: 15:40
Sample: 1 28
C -3.24E+11 3.29E+12 -0.098418 0.9225
X -2.37E+09 1.33E+09 -1.775201 0.0897
X^2 371579.4 250820.2 1.481457 0.1527
X*X3 44273018 36974950 1.197379 0.2439
X3 1.56E+11 2.13E+11 0.735852 0.4696
R-squared 0.302399 Mean dependent var 5.04E+11
Adjusted R-squared 0.143853 S.D. dependent var 8.57E+11
S.E. of regression 7.93E+11 Akaike info criterion 57.82345
Sum squared resid 1.38E+25 Schwarz criterion 58.10892
Log likelihood -803.5283 F-statistic 1.907331
Durbin-Watson stat 1.897290 Prob(F-statistic) 0.133934
从上表中可以看出,nR2=8.467175 <Χ20.05(5)=11.0705 ,所以接受原假设,拒绝备择假设,表明模型不存在异方差。
进行相关性检验: