体育统计第二章资料的收集与整理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二节 资料的整理
一、原始资料的审核与复查 二、数据清理和汇总
(一)数据清理 1.有效范围清理 录入的数据必须在规定的范围之内。 2.逻辑一致性清理 问题1 问题1:你有运动服装吗? 有(编码为1 有(编码为1) 没有(编码为0) 没有(编码为0 甲答:没有(编码为0 甲答:没有(编码为0) 问题2:你有几套运动服?甲答:2 问题2:你有几套运动服?甲答:2套
体育统计教学内容
第二章 资料的收集与整理
第一节 资料的收集 第二节 资料的整理 第三节 上机实践
第二章 资料的收集与整理统计
第一节 资料的收集
一、统计资料的来源 二、变量及其分类 三、收集资料时应注意的问题
第二章 资料的收集与整理统计
第一节 资料的收集
完整、准确的原始资料是做好统计分析的必要 条件,而统计分析方法的选择与改进,都不能弥补 数据资料本身的缺陷,人们常说:“巧妇难为无米 之饮”。没有必要的条件,再有本事的人也难有作 为。所以,必须十分重视统计资料的收集。
3.乔丹NBA职业生涯主要记录 3.乔丹NBA职业生涯主要记录
3.乔丹NBA职业生涯主要记录 3.乔丹NBA职业生涯主要记录
第一节 资料的收集
一、统计资料的来源
(一)常规性资料 (二)专题性资料 *
专题性资料:通过专题性调查或实验获得的资料。 1. 调查 调查:指在对被查对象不施加任何处理的情况下,根据 研究目的所进行的数据收集。 它只是对被测对象进行测试,将数据记录下来即可, 对数据的形成不加干涉。 例如:对北京申奥认同性的调查 例如:对不同运动项目受伤情况的调查
对比:女人的最佳身材体型标准
上、下身比例:肚脐为界,上下身比例应为5:8,符合“黄金分割”定律。 上、下身比例:肚脐为界,上下身比例应为5
对比:女人的最佳身材体型标准
胸围:由腋下沿胸部的上方最丰 满处测量胸围,应为身高 的一半。 腰围:在正常情况下,量腰的最 细部位。腰围较胸围小20 细部位。腰围较胸围小20 厘米。 髋围:在体前耻骨平行于臀部最 大部位。髋围较胸围大4 大部位。髋围较胸围大4 厘米。 大腿围:在大腿的最上部位,臀 折线下。大腿围较腰围 小10厘米。 10厘米。 小腿围:在小腿最丰满处。小腿 围较大腿围小20厘米。 围较大腿围小20厘米。 足颈围:在足颈的最细部位。足 颈围较小腿围小10厘米。 颈围较小腿围小10厘米。 上臂围:在肩关节与肘关节之间 的中部。上臂围等于大 腿围的一半。 颈围:在颈的中部最细处。颈围 与小腿围相等。 肩宽:两肩峰之间的距离。肩宽 等于胸围的一半减4 等于胸围的一半减4厘米。
第一节 资料的收集
一、统计资料的来源 二、变量及其分类
(一) 离散型变量和连续型变量 变量: 变量:指数值可以变化的量。 离散型变量:指变量只能取有限个或可数个数值。 离散型变量:指变量只能取有限个或可数个数值。 如掷骰子,X可取1 如掷骰子,X可取1至6点。 特点:变量所取的值能一个一个数出来,每一个数据相 特点:变量所取的值能一个一个数出来,每一个数据相 互独立。 例如:变量表示投蓝命中的次数、射击中靶的次数、成 功与失败的次数、获得的奖牌数。 对离散型变量的描述常用相对数,如命中率、失误率等。 它们的相互比较常用χ 它们的相互比较常用χ2检验。
第二节 资料的整理
2.连续型变量 2.连续型变量
* 制作频数分布表步骤: 制作频数分布表步骤: (1) 找出观察值中的最大值、最小值,计算全距 本例 最大值144,最小值115 最大值144,最小值115 全距=最大值全距=最大值-最小值 R= Xmax - Xmin (Range极差,范围 maximum minimum) Xmax (Range极差,范围 R= 144 - 115 = 29 (厘米) (厘米) (2) 确定组数k和组距i 确定组数k和组距i 分多少组适宜,可根据样本含量大小以及能较好显示频数分布规律为原 则。 分组参考表 样本含量 参考组数 本例80人,可以分为10个组。 本例80人,可以分为10个组。 50 6- 6-8 100 10 >100 20
(二) 定类变量、定序变量、定距变量和定比变量 定类变量、定序变量、
第一节 资料的收集
二、变量及其分类 三、收集资料时应注意的问题 第一 保证资料的完整性、有效性和可靠性。 完整性:指无论作横向的对比、归纳,还是作纵向的观察追踪, 掌握的资料必须齐全,即一个都不能少。 如:指标完整、含量完整、时间完整。 有效性:指所测得的指标数据,一定要能反映所观察事物的本质 特征,即目标与结果的统一。 如:测安静时的脉搏,一定要刚起床时测量。 如:测身高时,被测人的眼睛要平视。 可靠性:所测的数据误差不能超过规定的误差范围,即控制误差 范围。 第二 保证资料的代表性 措施1 措施1:保证抽样的随机性 措施2 措施2:保证足够的样本含量 措施3 措施3:确定合理的抽样方式
第二节 资料的整理
在体育实践中,通过教学、训练、统计调查和科学 实验收集到的原始数据资料一般都是分散、杂乱、没有 任何条理的。这些零乱的数据资料,不但有可能存在错 漏,而且只表明研究对象个体各自的“特性”,不可能 直接反映出数据资料的内部规律。因此,必须对原始数 据进行审核和整理,使之成为我们进行统计分析的基本 数据。 本节将介绍对原始资料的审核、复查,对资料进行 编码、录入以及对数据的清理和汇总。
第一节 资料的收集
一、统计资料的来源
(一)常规性资料 (二)专题性资料
专题性资料:通过专题性调查或实验获得的资料。 2. 实验 实验: 实验:是指科学上为阐明某一现象而创造特定的条件, 以便观察它的变化和结果的过程。 体育实验分室内、室外。 例如:在室内,进行抗爱滋病药物的实验,让一组猴子吃 抗爱滋病的药物,另一组猴子吃安慰剂,结果未吃抗爱滋病药 物一组的猴子死亡,从而获得有关抗爱滋病药物的数据。
*
第二节 资料的整理
一、原始资料的审核与复查
通常有两个步骤:第一步初审核查;第二步复查。 (一) 初审核查 (二) 复查 1.逻辑检查 逻辑检验:指运用逻辑推理从各项指标的关系上进行数据复 核。 如:某中学生身高测试数据为1.65米,坐高测试数据 如:某中学生身高测试数据为1.65米,坐高测试数据 为0.65米。根据我国人体身高比例常识判定,身高与 0.65米。根据我国人体身高比例常识判定,身高与 坐高之比约为2 坐高之比约为2:1。而该生测试数据出入很大,如 2.54(腿长) 2.54(腿长):1。据此可判定该数据很可能有错。 2.抽样复查 可按1/10,1/20,1/30等比例随机抽样复查。 可按1/10,1/20,1/30等比例随机抽样复查。
据台湾中国时报报道,北京体育大学学 生、身高一七八公分的美女孔燕松,近 日获网友票选为“美腿大赛冠军”。她 更在网络上大发美腿照片,引来网友一 片惊叹。 孔燕松,北京体育大学学生。一个住在 北方圆环套圆环城里的年轻姑娘,神情 萧索,眼神茫然落寞,绝世而独立。 身高一七八公分的北京体育大学学生孔 燕松,近日获网友选为美腿大赛冠军, 她最大特色在于拥有一双非常修长的美 腿,近日她在网路大发照片,网友惊叹: “这腿也长的太不像话。”网路询问度, 也是第一。 孔燕松去年在北京奥运开幕式上,就因 担任场中工作人员而让不少观众注意到 她一双修长美腿,她近日一系列照Βιβλιοθήκη Baidu更 是成为网友疯狂转寄的照片,腿超过身 体的一半,而且非常细长,几乎没有一 丝多余的赘肉,不少网友说:“这是假 人吧,太不真实了。”
R 29 i= = = 2.9 ≈ 3 K 10
i — 组距 (interval n [数] 区间) [数 区间) k— 组数(kind 类) 组数(kind
第二节 资料的整理
制作频数表步骤: 制作频数表步骤:
* (3)确定组限 组限:指每组的起始范围。 每组的起点值为下限,终点值为上限。本例组距为3 每组的起点值为下限,终点值为上限。本例组距为3,第 一组下限定为115,第二组下限应是118,其余依此类推。 一组下限定为115,第二组下限应是118,其余依此类推。 确定组限原则:第一组一定包括最小值,最后一组一定包括 确定组限原则:第一组一定包括最小值,最后一组一定包括 最大值。 注意: 注意:以时间记录的成绩仍以最小值作为第一组下限值。 (4)列频数分布表并登记(见表)
第二节 资料的整理
2.连续型变量 2.连续型变量 例2.2 测得某市小学二年级80名男孩身高数据 测得某市小学二年级80名男孩身高数据 如下,试制作频数分布表。
135 131 136 130 127 134 128 134 137 127 140 133 139 127 129 132 124 121 130 124 130 133 133 129 126 132 132 120 131 134 129 130 132 128 121 131 124 144 122 129 136 122 131 128 138 128 124 127 127 134 135 127 127 132 120 121 125 133 131 125 122 125 128 131 120 127 124 132 135 123 121 131 115 128 127 131 125 127 132 133
第二节 资料的整理
一、原始资料的审核与复查 二、数据清理和汇总
(二)数据汇总 制作频数分布表 * 制作频数分布表 频数:指同一个数或同组中的数重复出现的次数,用符号 频数:指同一个数或同组中的数重复出现的次数,用符号 f表示。(frequency频数、频率) 表示。(frequency频数、频率) 如:1.80,1.80, 如:1.80,1.80, f=2 1. 离散型变量 例2.1 某人50发射击成绩如下,试作频数整理。 某人50发射击成绩如下,试作频数整理。 8,6,8,9,9,5,8,9,8,9,9,8,8,9,6,5, 9,5,9,8,9,9,8,9,9,8,8,9,9,8,5,8, 9,9,6,9,9,8,9, 10,8,8,8,9, 10,9,8,9, 10, 10, 10, 10,8
第二节 资料的整理
一、原始资料的审核与复查
通常有两个步骤:第一步初审核查;第二步复查。 (一) 初审核查 * 初审核查主要从缺、疑、误三个方面进行审核。 缺:指不完整。 如:测试的指标数不够,应测十项,结果只测了八项; 该填的数没有填;每个指标应测50个人,结果只测了40 该填的数没有填;每个指标应测50个人,结果只测了40 人,测的人数不够。 疑:指填写潦草,无法识别的测试数据。 误:明显的错误数据。 如:跳远成绩本来是5.60米,记录时写成6.50米。 如:跳远成绩本来是5.60米,记录时写成6.50米。 百米成绩本来是12.10“,记录时写成10.12”。 百米成绩本来是12.10“,记录时写成10.12”。
第一节 资料的收集
一、统计资料的来源
(一)常规性资料 (二)专题性资料
第一节 资料的收集
一、统计资料的来源 *
(一)常规性资料 常规性资料:指日常工作中获得的资料。 如考核、训练、比赛成绩,技术统计以及各项工作 的记录等。
1.简介 1.简介
2.职业生涯主要荣誉 2.职业生涯主要荣誉
3.乔丹NBA职业生涯主要记录 3.乔丹NBA职业生涯主要记录
第一节 资料的收集
一、统计资料的来源 二、变量及其分类 (一) 离散型变量和连续型变量
连续型变量:指变量可取某一(有限或无限)区间内任何数值。 连续型变量:指变量可取某一(有限或无限)区间内任何数值。 如100米跑,x可取起点到终点100米距离内任意时间 100米跑,x可取起点到终点100米距离内任意时间 值,故x 值,故x为连续型随机变量。 特点:变量所取的值不可数,观测值可无限的精确。 特点:变量所取的值不可数,观测值可无限的精确。 实际中连续型随机变量通常取以时间、距离、重量为单位的观测值。 如连续型随机变量x 如连续型随机变量x表示运动员的身高、体重、最大氧耗等。 对连续型变量的描述常用均数、标准差,它们的相互比较常用t检 验等。 掌握随机变量的类型有助于正确地选择统计方法,得出所需的统计 分析结果。