数据分析课程设计-NBA球员技术统计分析报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《数据分析方法》课程设计
成绩评定表
学生姓名严震班级学号1109010114
专业信息与计算课程设计题目NBA球员技科学术统计分析报告
评
语
组长签字:
成绩
日期
20年月日
《数据分析方法》课程设计
课程设计任务书
学院理学院专业信息与计算科学学生姓名严震班级学号1109010114
课程设计题目NBA 球员技术统计分析报告实践教学要求与
任务 :
设计要求(技术参数):
1、熟练掌握SPSS 软件的操作方法;
2、根据所选题目及调研所得数据,运用数据分析知识,建立适当的数学模型;
3、运用 SPSS 软件,对模型进行求解,对结果进行分析并得出结论;
4、掌握利用数据分析理论知识解决实际问题的一般步骤。
设计任务:
1、查阅相关资料,找到NBA 球员技术的相关指标,获得相关数据;
2、利用数据分析的理论,建立线性回归模型,以及对其进行主成分分析;
3、利用 SPSS软件求解 , 并给出正确的结论。
工作计划与进度安排 :
第一天——第二天学习使用SPSS 软件并选题
第三天——第四天查阅资料
第五天——第六天建立数学模型
第七天——第九天上机求解并完成论文
第十天答辩
指导教师:专业负责人:学院教学副院长:
201年月日201年月日201年月日
II
摘要
数据分析析的主要应用有两方面,一是寻求基本结构,简化观测系统,将具有错综复杂关系的对象(变量或样品)综合为少数几个因子(不可观测的,相互独立的随机变
量),以再现因子与原变量之间的内在联系;二是用于分类,对p
个变量或 n 个样品进
行分类。聚类分析一般有两种类型,即按样品聚类或按变量(指标)聚类,其基本思想是通过定义样品或变量间“接近程度”的度量,将“相近”的样品或变量归为一类。本文
利用利用数据分析中的因子分析和聚类分析对多个变量数据进行了分析。就是分析和处理
数据的理论与方法,数据分析中提出了广泛的多元数据分析的统计方法,包括线性回归分析、方差分析、因子分析、主成分分析、典型相关分析、判别分析、聚类分析等。
关键词: spss 软件 ; 聚类分析 ; 因子分析 ; 线性规划
目录
1数据分析的任务和目的 (1)
1.1问题的背景 (1)
1.2任务和目的 (1)
2数据的搜集与整理 (3)
2.1数据的来源 (3)
2.2数据的处理 (3)
3利用 SPSS软件对结果进行分析 (5)
总结 (15)
参考文献 (16)
1数据分析的任务和目的
1.1问题的背景
一年一度的 NBA 赛季让全世界的篮球迷为之疯狂,NBA 赛事之所以如此受欢迎,最主要的原因在于NBA 球员高超的球技。球队中灵魂人物的个人发挥
能够直接影响其球队的成败。因而对他们的技术统计与分析是一件十分重要的事情。众所周知,科比 -布莱恩特和阿伦 -艾弗森是深受大家喜爱的两位球员,两位
球员在赛季的发挥也在一定程度上影响着两队的战绩。因此,通过两位球员在以往的赛季中的发挥及表现,可以大概的预测两人的得分及表现,为NBA 相关的商业活动和广大球迷提供数据上的参考。
1.2任务和目的
1、频数分析(对两人平均每场上场时间进行频数分析)
2、基本描述统计量(用基本描述统计量的计算结果对两人技术进行分析比
较)
3、单样本 t 检验(检验科比-布莱恩特和阿伦-艾弗森平均每场犯规次数的均
值是否为 2.7)
4、两独立样本 t 检验(科比-布莱恩特和阿伦-艾弗森平均每场犯规次数比较)
5、单样本非参数假设检验(检验科比 -布莱恩特平均每场进攻次数与首发
的关系基本是否为 1:1:10: 10:10:10:10:10: 10:10:2)
6、单样本非参数假设检验(检验科比 -布莱恩特和阿伦 -艾弗森平均每场盖帽
次数总体的分布是否为正态分布)
7、单样本非参数假设检验(检验科比 -布莱恩特在某段时间内平均每场得分
是否持续正常 )
8、单因素方差分析(用单因素方差分析,分别分析科比-布莱恩特和阿伦 -艾
弗森平均每场防守次数对平均每场得分有无显著影响)
9、相关分析(研究平均每场三分球命中率与平均每场得分之间是否具有较
强的线性关系)
10、偏相关分析(以平均每场失误次数为控制变量,研究平均每场罚球命中
率与平均每场得分的偏相关关系)
11、线性回归分析(用逐步筛选法找科比-布莱恩特的平均每场得分的线性
回归方程)
12、曲线回归分析(用曲线回归分析法分析科比-布莱恩特的平均每场得分)
2数据的搜集与整理
2.1数据的来源
《 NBA 球员科比 -布莱恩特和阿伦 -艾弗森 11 个赛季技术统计表》下载自NBA 中文官方网站 ,具有可信度。
2.2数据的处理
定义视图
数据视图:
《数据分析方法》课程设计
3 利用 SPSS 软件对结果进行分析
( 1)频数分析 (对两人平均每场上场时间进行频数分析)
数据文件中增加一个变量 scsj 。
NBA 球 员 * 分 组 后 上 场 时 间 Crosstabulation
Count
分组后上场时间
1
2
Total
NBA 阿伦-艾弗森 1 10 11 球 员 科比-布莱恩特
7 4 11 Total
8
14
22
输出 1
Chi-Square Tests
Asymp. Sig. Exact Sig. Exact Sig.
Value
df
(2-sided)
(2-sided)
(1-sided)
Pearson Chi-Square 7.071b
1 .008 Continuity Correction a 4.911 1 .027 Likelihood Ratio 7.719
1
.005
Fisher's Exact Test
.024
.012
N of Valid Cases
22
a. Computed only for a 2x2 table
b. 2 cells (50.0%) have expected count less than 5. The minimum expected count is 4.00.
分析:
从输出 1 中看出,阿伦 10-40 (分钟)的频数为 1,
在 40-50 (分钟)的频数为 10;科比 - 布莱恩特平均每场上场时间在 10-40 (分钟)的频数为 7,在 40-50(分钟)的频数为 4;两人平均每场上场时间在 10-40
(分钟)的频数为 8,在 40-50 (分钟)的频数为 14。
从输出 2 中看出,交叉分组下的频数分析卡方检验结果的相伴概率为 0.008 ,
小于显著性水平 0.05 ,故拒绝原假设,认为两人的平均每场上场时间 存在显著性差异。
( 2)基本描述统计量(用基本描述统计量的计算结果对两人技术进行分析比较)
实现按 NBA 球员拆分,输出结果放在同一张表中。
- 艾弗森平均每场上场时间在
输出 2