数据分析课程设计 - NBA球员技术统计分析报告(2020年7月整理).pdf

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
关键词:spss 软件;聚类分析;因子分析;线性规划
目录
1 数据分析的任务和目的 ...................................................................................................... 1 1.1 问题的背景 ................................................................................................................ 1 1.2 任务和目的 ................................................................................................................ 1
2 数据的搜集与整理 ............................................................................................................... 2 2.1 数据的来源 ................................................................................................................ 2 2.2 数据的处理 ................................................................................................................ 2
2.1 数据的来源
《NBA 球员科比-布莱恩特和阿伦-艾弗森 11 个赛季技术统计表》下载自 NBA 中文官方网站 www.nba.com.cn,具有可信度。
2.2 数据的处理
Leabharlann Baidu定义视图
2
学海无涯
数据视图:
3
学海无涯
3 利用 SPSS 软件对结果进行分析
(1)频数分析(对两人平均每场上场时间进行频数分析) 数据文件中增加一个变量 scsj。
-.580
.661
-.503
.661
-.736
.661
.666
.661
-.706
.661
.248
.661
分析:
输出3
从输出 3 中看出,科比-布莱恩特的平均每场投篮命中率、平均每场三分球命
中率和平均每场罚球命中率的均值均比阿伦-艾弗森高,但标准差有高有底,
5
学海无涯
说明在投篮方面科比-布莱恩特比阿伦-艾弗森发挥出色,但稳定程度高低不定。 均值的统计误差均小于 0.05(比较小),说明数据没有不均衡现象,说明两人的 发挥都比较稳定。
III
学海无涯
1 数据分析的任务和目的
1.1 问题的背景
一年一度的 NBA 赛季让全世界的篮球迷为之疯狂,NBA 赛事之所以如此 受欢迎,最主要的原因在于 NBA 球员高超的球技。球队中灵魂人物的个人发挥 能够直接影响其球队的成败。因而对他们的技术统计与分析是一件十分重要的事 情。众所周知,科比-布莱恩特和阿伦-艾弗森是深受大家喜爱的两位球员,两位 球员在赛季的发挥也在一定程度上影响着两队的战绩。因此,通过两位球员在以 往的赛季中的发挥及表现,可以大概的预测两人的得分及表现,为 NBA 相关的 商业活动和广大球迷提供数据上的参考。
学生姓名
学海无涯
成绩评定表
严震
班级学号
1109010114
专 业 信 息 与 计 算 课程设计题目 NBA 球 员 技
科学
术统计分析报告
组长签字:
评 语
成绩 日期
20 年 月 日
I
学海无涯
课程设计任务书
学院
理学院
专业
信息与计算科学
学生姓名
严震
班级学号
1109010114
课程设计题目
NBA 球员技术统计分析报告
2、利用数据分析的理论,建立线性回归模型,以及对其进行主成分分析;
3、利用 SPSS 软件求解,并给出正确的结论。
工作计划与进度安排:
第一天——第二天 学习使用 SPSS 软件并选题
第三天——第四天 查阅资料
第五天——第六天 建立数学模型
第七天——第九天 上机求解并完成论文
第十天
答辩
指导教师:
专业负责人:
201 年 月 日 201 年 月 日
学院教学副院长: 201 年 月 日
II
学海无涯
摘要
数据分析析的主要应用有两方面,一是寻求基本结构,简化观测系统,将具有错综 复杂关系的对象(变量或样品)综合为少数几个因子(不可观测的,相互独立的随机变 量),以再现因子与原变量之间的内在联系;二是用于分类,对 p 个变量或 n 个样品进行 分类。聚类分析一般有两种类型,即按样品聚类或按变量(指标)聚类,其基本思想是 通过定义样品或变量间“接近程度”的度量,将“相近”的样品或变量归为一类。本文 利用利用数据分析中的因子分析和聚类分析对多个变量数据进行了分析。就是分析和处 理数据的理论与方法,数据分析中提出了广泛的多元数据分析的统计方法,包括线性回 归分析、方差分析、因子分析、主成分分析、典型相关分析、判别分析、聚类分析等。
1
学海无涯 强的线性关系) 10、偏相关分析(以平均每场失误次数为控制变量,研究平均每场罚球命中 率与平均每场得分的偏相关关系) 11、线性回归分析(用逐步筛选法找科比-布莱恩特的平均每场得分的线性 回归方程) 12、曲线回归分析(用曲线回归分析法分析科比-布莱恩特的平均每场得分)
2 数据的搜集与整理
t -4.799
.297
df 10 10
Sig. (2-t ailed) .001 .773
Mean Diffe re n ce
-.6818
.0473
输出4
95% Confidence Interval of the
Diffe re n ce
Lower Upper
-.9984 -.3652
-.3079
Std. DSetvaitaisttioicn .0179124 .0403442 .0182836
.419636 .300909 .778818
.006128 .0203237 .009339 .0309724 .016848 .0558799
Skewness
Statistic Std. Error
.4025
从输出 4 中得,阿伦-艾弗森单样本假设的相伴概率为 0.001,小于显著性水平 0.05,故拒绝原假设,认为阿伦-艾弗森平均每场犯规次数的均值与 2.7 有显著性 差异;科比-布莱恩特单样本假设的相伴概率为 0.773,大于显著性水平 0.05,故 接受原假设,认为科比-布莱恩特平均每场犯规次数的均值与 2.7 无显著性差异。 (4) 两独立样本t检验(科比-布莱恩特和阿伦-艾弗森平均每场犯规次数比较)
1.2 任务和目的
1、频数分析(对两人平均每场上场时间进行频数分析) 2、基本描述统计量(用基本描述统计量的计算结果对两人技术进行分析比 较) 3、单样本 t 检验(检验科比-布莱恩特和阿伦-艾弗森平均每场犯规次数的均 值是否为 2.7) 4、两独立样本 t 检验(科比-布莱恩特和阿伦-艾弗森平均每场犯规次数比较) 5、 单样本非参数假设检验(检验科比-布莱恩特平均每场进攻次数与首发 的关系基本是否为 1:1:10:10:10:10:10:10:10:10:2) 6、单样本非参数假设检验(检验科比-布莱恩特和阿伦-艾弗森平均每场盖帽 次数总体的分布是否为正态分布) 7、 单样本非参数假设检验(检验科比-布莱恩特在某段时间内平均每场得分 是否持续正常) 8、单因素方差分析(用单因素方差分析,分别分析科比-布莱恩特和阿伦-艾 弗森平均每场防守次数对平均每场得分有无显著影响) 9、相关分析(研究平均每场三分球命中率与平均每场得分之间是否具有较
b. 2 cells (50.0%) have expect ed count less than 5. The minimum expected count is 4.00.
分析:
输出2
从输出 1 中看出,阿伦-艾弗森平均每场上场时间在 10-40(分钟)的频数为 1,
在 40-50(分钟)的频数为 10;科比-布莱恩特平均每场上场时间在 10-40(分
3 利用 SPSS 软件对结果进行分析 ......................................................................................3 总 结 ............................................................................................................................................. 13 参考文献 ...................................................................................................................................... 14
Descriptive Statistics
N Stat ist ic
11 11 11 11 11 11 11 11
Minimum Stat ist ic
.4170 .2500 .7940
.3870 .2340 .7020
Mean Statistic Std. Error .449364 .005401 .324636 .012164 .831909 .005513
(3) 单样本 t 检验(检验科比-布莱恩特和阿伦-艾弗森平均每场犯规次数的均
值是否为 2.7) 实现按 NBA 球员拆分,输出结果放在同一张表中。
NBA球 员 阿 伦 -艾 弗 森 科 比 -布 莱 恩 特
平均每场犯规次数 平均每场犯规次数
分析:
One-Sample Test Test Value = 2.7
钟)的频数为 7,在 40-50(分钟)的频数为 4;两人平均每场上场时间在 10-40
(分钟)的频数为 8,在 40-50(分钟)的频数为 14。
从输出 2 中看出,交叉分组下的频数分析卡方检验结果的相伴概率为 0.008,
小于显著性水平 0.05,故拒绝原假设,认为两人的平均每场上场时间
存在显著性差异。
V alu e 7 .07 1 b 4.911 7.719
22
df 1 1 1
Asymp. Sig. (2 -side d ) .008 .027 .005
Exact Sig. (2 -side d )
.024
Exact Sig. (1 -side d )
.012
a. Comput ed only for a 2x2 t able
NBA球 员 * 分 组 后 上 场 时 间 Crosst abulat ion
Count
NBA 球员
Tot al
阿 伦 -艾 弗 森 科 比 -布 莱 恩 特
分组后上 场时间
1
2
1
10
7
4
8
14
Tot al 11 11 22
4
学海无涯
输出 1
Chi-Square Test s
Pearson Chi-Square Continuity Correctiona Likelihood Ratio Fisher's Exact T est N of Valid Cases
(2) 基本描述统计量(用基本描述统计量的计算结果对两人技术进行分析比较)
实现按 NBA 球员拆分,输出结果放在同一张表中。
NBA球 员 科 比 -布 莱 恩 特
阿 伦 -艾 弗 森
平均每场投篮命中率 平均每场三分球命中率 平均每场罚球命中率 Valid N (listwise) 平均每场投篮命中率 平均每场三分球命中率 平均每场罚球命中率 Valid N (listwise)
实践教学要求与任务:
设计要求(技术参数):
1、熟练掌握 SPSS 软件的操作方法;
2、根据所选题目及调研所得数据,运用数据分析知识,建立适当的数学模型;
3、运用 SPSS 软件,对模型进行求解,对结果进行分析并得出结论;
4、掌握利用数据分析理论知识解决实际问题的一般步骤。
设计任务:
1、查阅相关资料,找到 NBA 球员技术的相关指标,获得相关数据;
相关文档
最新文档