第四章正态分布体育统计学
体育统计正态分布
第一节 随机事件及概率分布 第二节 正态分布 第三节 正态分布在体育中的应用 ♣
♥ 1 利用正态分布估计实际分布情况
♥ 2 利用正态分布制定考核、考试标准
♥ 3 用正态分布比较不同运动项目成绩 的优劣
例:
某大型网球运动中心,每天接待的人数x服 从正态分布,其平均数μ=800人,标准差 σ=150人,试求:
各等级的标准。
p(650<x<1000 )=p(-1<u <1.33) =p(u <1.33)-p(u < -1) =0.9082-01587 =0.7495
• 2 每天接待人数在1100人以上的概率: p=0.0228
• 3 每天接待人数不足350人的概率: p=0.0013
۩
径赛成绩
以时间为单位计算,数值越小成绩越好, 所以优秀成绩应在正态分布图的左侧。
求每天接待人数不足350人的概率, 即求p(x<350)
解:
求每天接待人数在650~1000人之间的概率 已知x~N(800、1502),将650、1000标 准化为:
u1=(x1-μ)/σ=(650-800)/150=-1 u2=(x2-μ)/σ=(1000-800)/150=1.33 于是
查标准正态分布表知,
p(u <-1.28)=0.1003≈0.10 代入公式u=(x-x)/s 即:-1.28=( x1-14.7)/0.7, x1=14.7-1.28×0.7=13.80秒
Hale Waihona Puke 同理:p(u <-0.25)=0. 4013≈0. 40;x2=14.53
p(u <1.41)=0. 9207≈0. 92;x3=15.69
1 每天接待人数在650~1000人之间的概率 2 每天接待人数超过1100人的概率 3 每天接待人数不足350人的概率
《体育统计学》教学大纲
《体育统计学》教学大纲课程名称:体育统计学课程代码:108011108S课程性质:专业必修课总学时:36学分:2适用专业:体育教育先修课程: 无一、课程的性质、目的与任务:1.课程性质:《体育统计学》是根据教育部颁发的《普通高等学校本科体育教育专业课程教学指导方案》的要求所开设的一门专业基础理论课。
体育统计学是运用统计的理论和方法,特别是数理统计方法来研究体育教学、训练、科研和管理中的问题,探讨体育发展规律的一门学科。
2.课程目的:体育统计学是运用统计的理论和方法,特别是数理统计方法来研究体育教学、训练、科研和管理中的问题,探讨体育发展规律的一门学科。
通过本课程的学习是学生掌握体育统计学的基础知识,熟悉统计学在体育中的具体应用,提高学生利用统计学知识解决体育实践问题的能力。
3.课程任务:使学生了解体育统计学在运动训练、体质监测等工作中的具体应用,提高学生学习兴趣,让学生掌握体育统计学的基本概念和基本理论,掌握区间估计的基本方法和计算步骤,掌握假设检验的原理和步骤,掌握基本的统计学检验方法,并可以运用统计学基本方法解决实践问题。
二、教学内容与教学基本要求:(一)理论部分第一章绪论1.教学内容第一节体育统计及其研究对象一、体育统计的概念二、体育统计工作的基本过程三、体育统计的研究对象及其特征第二节体育统计在体育活动中的作用二、体育统计有助于训练工作的科学化三、体育统计能帮助研究者制定研究设计四、体育统计能帮助研究者有效地获取文献资料第三节体育统计中的若干基本概念一、总体二、样本三、随机事件四、随机变量五、总体参数与样本统计量六、概率2.教学目的与要求要求学生了解体育统计的概念;明确体育统计工作的基本过程;了解学科的研究对象及其特征;了解体育统计在体育活动中的作用。
第二章统计资料的收集与整理1.教学内容第一节统计资料的收集一、收集资料的基本要求二、收集资料的方法三、几种常用的抽样方法第二节统计资料的整理一、资料的审核二、频数整理三、直方图与多边形图2.教学目的与要求要求学生掌握统计资料的收集方法和基本要求。
体育统计学第三版第四章课后题答案
体育统计学第三版第四章课后题答案一单项选择(每题2分)1. 体育统计是研究体育领域各种()规律性的基础应用学科。
[单选题] *A)数据B)体育项目C)随机现象(正确答案)D)体育活动2. 从性质上看,对事物的某些特征及状态进行实际的数量描述的统计为()统计[单选题] *A)描述性(正确答案)B)猜测性C)估计性D)推断性3. 在总体中先划分群,然后以集体为抽样的单位,再按简单随机抽样抽取若干群组成样本的抽样方法称为() [单选题] *A)简单随机抽样B)分层抽样C)系统抽样D)整群抽样(正确答案)4. 反映总体的一些数量特征称为() [单选题] *A)参数(正确答案)B)统计量C)抽样误差D)总和5. 将样本的观察值按其数值大小顺序排列,处于中间位置的那个数值就是() [单选题] *A)中位数(正确答案)B)均值C)众数D)数学期望6.描述离散程度的量数为差异量数,那么差异量数越大则集中量数的代表性越() [单选题] *A)小(正确答案)B)大C)没用联系D)以上都对7. 如果某实验重复进行了次,事件出现次,则与的比称为事件的() [单选题] * A)平均数B)频率C)概率(正确答案)D)频数8. 从性质上看,通过样本数字特征以一定方式估计、推断总体的特征为()统计。
[单选题] *A)描述性B)猜测性C)估计性D)推断性(正确答案)9. 总体中个体可按某种属性特征分成若干类型、部分或层,然后在各类型、部分或层中按比例进行简单随机抽样的方法称为() [单选题] *A)简单随机抽样B)分层抽样(正确答案)C)系统抽样D)整群抽样10. 由样本所获得的一些数量特征称为() [单选题] *A)参数B)统计量(正确答案)C)概率D)总和12. 样本观测值在频率分布表中频率最多的那一组的组中值,称为() [单选题] * A)中位数B)均值C)众数(正确答案)D)数学期望13. 以下描述定量资料离散趋势的指标的是() [单选题] * A)均数、标准差、方差B)极差、标准差、中位数C)中位数、均数、变异系数D)标准差、变异系数(正确答案)14. 抽样误差的原因是() [单选题] *A)观察对象不纯B)资料不是正态分布C)个体差异(正确答案)D)随机方法错误15. 在做双侧检验时,和称为原假设的() [单选题] *A)拒绝域(正确答案)B)接受域C)显著水平D)置信区间18. 关于相对数,下列说法错误的是() [单选题] *A)是有关指标的比率B)可以作为动态分析的依据C)可以没有单位D)按作用可分为有名数和无名数(正确答案)19. 关于动态分析,下列说法错误的是() [单选题] *A)可研究某些指标发展变化规律B)以动态数列为基础C)可预测事物的发展水平D)动态分析表和动态分析图无关(正确答案)20. 在动态数列中,将各时期的指标数值与某一时间的指标数值相比得到的数列是() [单选题] *A)定基比相对数(正确答案)B)环比相对数C)增长率相对数D)增长值数列21. 在动态数列中,将各时期的指标数值与前一时期的指标数值相比得到的数列是() [单选题] *A)定基比相对数B)环比相对数(正确答案)C)增长率相对数D)增长值数列二、多项选择题(至少两项符合题意;每题2分)1.关于随机变量的概念,说法正确的是() *A)是随机事件的数量表现((正确答案)B)常分为离散型和连续性变量(正确答案)C)连续型变量所有取值必无穷((正确答案)D)不同类型变量分布特征不同(正确答案)2. 在资料的收集过程中,一般要求() *A)资料的准确性((正确答案)B)资料的齐同性(正确答案)C)资料的随机性((正确答案)D)资料的动态性3.以下数量指标中属于集中位置量数的有() * A)中位数(正确答案)B)方差C)平均数(正确答案)D)众数(正确答案)4. 以下数量指标中属于离中位置量数的有() * A)全距((正确答案)B)方差((正确答案)C)标准差((正确答案)D)众数5. 动态分析中所使用的动态数列主要有() * A)绝对动态数列((正确答案)B)相对动态数列(正确答案)C)平均数动态序列((正确答案)D)体育动态数列6.动态数列编制的基本原则有(). *A)时间长短前后一致((正确答案)B)总体范围应该统一(正确答案)C)计算方法应该统一((正确答案)D)指标内容要统一(正确答案)7. 统计推断的根本目的在于由样本特征来推断总体情况,主要包括以下部分() * A)区间估计(正确答案)B)系统控制C)统计决策D)假设检验(正确答案)8. 在使用方差分析时,应满足的条件有() *A)样本是随机样本((正确答案)B)不同总体的样本相互独立(正确答案)C)各总体都是正太总体((正确答案)D)每个总体的方差相等(正确答案)三、判断题(每题2分)1. 标准差和变异系数都是反映变量离散程度的统计指标,他们都与数据有相同的单位; [判断题] *对错(正确答案)2. 标准差和样本标准误都是描述变量离散程度的统计指标,但各自描述的研究对象不同。
体育统计学复习资料
体育统计学复习资料1、体育统计的概念:从性质上看,统计可分为两类,一类是描述性统计,另一类是推断性统计。
前者主要是对事物的某些特征及状态进行实际的数量描述,后者则是通过样本的数量特征以一定的方式估计和推断总体的特征。
2、体育统计学:是运用数理统计的原理和方法对体育领域里各种随机现象规律性进行研究的一门基础应用学科,属于方法论学科范畴。
3、体育统计工作的基本过程:1统计资料的收集2统计资料的整理3统计资料的处理4统计资料的分析和解释。
4、体育统计的研究对象:体育统计的研究对象除了体育领域里的各种可量化的随机现象之外,还包括非体育领域但对体育的发展有关的各种随机现象。
5、体育统计研究对象的特征:1运动性特征2综合性特征3客观性特征。
6、总体:根据统计研究的具体研究目的而确定的同质对象的全体称为总体7、样本:根据需要与可能从总体中抽取的部分研究对象所形成的子集为样本。
可分为随机样本和非随机样本两种形式。
8、抽样:从总体中,按照某种方法,抽取一部分个体,作为样本的方式称为抽样。
9、一定的实验条件下,有可能发生也有可能不发生的事件称为随机事件。
10、随机变量:在统计研究中随机事件需由数值来表示,我们把随机事件的数量表现称为随机变量11、总体参数:反映总体的一些数量特征称为总体参数12、样本统计量:由样本所获得的一些数量特征称为样本统计量13、统计概率:随机事件A的频率(Wa)随实验次数(N)的变化而变化。
当N充分大的时候,频率(Wa)越来越趋近一个常数,就称为随舰事件A的概率。
1、收集资料可直接和间接的收集2、收集资料的基本要求:1资料的准确性2资料的齐同性3资料的随机性3、收集资料的方法:日常积累、全面普查、专题研究4、常见的抽样方法:1简单随机抽样2分层抽样3整群抽样(分层抽样:先将总体中的个体根据某些特征属性,将其分为若干类型(层次),然后从每一类型中采用适当地方法按一定的比例随机抽取适当个体组成样本。
00498 体育统计学大纲
00498 体育统计学大纲00498体育统计学大纲00498体育统计概要南京师范大学编(高纲0707)一、课程的性质、目的和要求(一)课程性质和特点体育统计学是运用数理统计原理和方法研究体育领域各种随机现象规律的一门基础应用学科。
它属于方法论范畴。
学习体育统计的目的是让应考者理解体育统计的基本思想、概念,领会体育统计的基本思路,掌握统计处理、分析技术,并能够运用体育统计解决实际问题。
具体来说,要求考生理解体育统计的基本思想和概念,以及体育统计研究的基本思路,并能运用统计学定量方法解决实际问题;掌握统计学的基本技术,主要学习使用统计软件(Excel、SPSS)的操作方法,以及分析和解释统计结果的方法。
(二)本课程的基本要求通过本课程的学习,你应该满足以下要求:1、总体上要领会体育统计的基本思想、概念及体育统计研究的基本思路,能运用统计方法解决实际问题;掌握统计的基本方法、统计技术,能够对统计方法所得出结果进行合理的分析,得出结论。
具体掌握以下几项内容:2.掌握统计的基本概念,描述统计的基本方法;掌握统计假设检验的基本思想和均值差异显著性检验的方法。
3、理解方差分析的基本思想,掌握方差分析中的基本概念,掌握方差分析表的内容,并对方差分析表作出合理的分析。
4.理解相关分析的概念,掌握相关分析、简单相关分析、层次相关分析、偏相关分析和复相关分析的内容。
了解回归分析的基本概念,掌握单变量回归分析及相关概念。
并且可以使用相关和回归分析来研究这两个变量之间的关系。
5、了解和掌握统计研究设计的有关内容。
(三)本课程的相关课程体育统计方法是一门应用工具,它应用领域很广泛。
特别在运动生理、生化、心理等领域有着较重要的应用。
所以要很好的应用这门工具,必须很好的熟悉与研究内容有关的理论、课程。
和其联系最紧密的课程是概率论和数理统计,它是统计方法的基本理论。
二、课程内容和评估目标第一章体育统计的基本概念及其常规统计量(一)课程内容体育统计的基本概念,集中趋势统计量,离中趋势统计量,相对趋势统计量(二)学习目的了解体育统计中常用的统计概念,如人口、样本、统计学、参数等。
第四章 正 态 分 布 体育统计学
第四章 正 态 分 布如果将第二章中的(表2 — 1)中的数据绘制成直方图,把每个方条顶部中点联结起来,就得到一个图形,它称为频数多边形。
(图4 — 1)当分组数很多,组距很小时,频数多边形就趋于类似(图4 —2)所示的平滑的曲线。
这种曲线呈现出两侧近似对称的钟形。
随机变量的类似这种分布,在自然界是相当普遍的其中最有代表性的是正态分布。
下面就来介绍正态分布及其在体育中的几个应用。
12345678910x图4 — 1 频数多边形图第一节 正态分布曲线的形式如果随机变量X 的概率密度函数为y =πσ21e 222)(σμ--x (+∞<<∞-x ) (4 — 1)则称随机变量X 是服从正态分布的由上式绘出的图形叫做正态曲线。
(图4 — 2)X 的变动范围在 ∞- 至 +∞ 间。
YX0μ图4 — 2 正态分布曲线正态分布曲线中有两个参数:均值 μ 及方差 2σ。
为了应用方便,对式(4 — 1)中的随机变量经过一个称为标准化的变换,即令u 来代替原式中的 σμ-x , 寻这时的随机变量u 的概率密度函数成为:y = π21e 22u - (4 — 2) 按照(4 — 2)式绘出的图形,称作标准正态曲线。
(图4 — 3)Y00.40.30.20.1-1-2-3123μ图4 — 3 标准正态分布曲线第二节正态分布曲线的特征正态分布曲线有许多特点,它们对实际工作有很大的帮助。
它的主要特点有以下几个方面:一,正态分布的形式是对称的(但对称的分布不一定是正态分布)。
在正态分布中均值与中位数相重合。
二,从中央最高点逐渐向两侧降低,降低的速度是先慢后快,以后又再次减慢,最后接近横轴,但终究不能与横轴相交。
三,从中央向两侧逐渐下降,它的方向是先向内弯,达到离均值左右各一个标准差时又改向外弯,是以σμ1±的点为曲线从内弯转向外弯的转折点,即正态曲线中标准差与曲线有固定的关系。
四,因为正态曲线是对称的,在曲线下不仅平均数的两侧面积相等,各相当距离间的面积相等,而且各相当距离间的曲线高度也相等,正态曲线下(与横轴间)的总面积为1. 00。
《体育统计学》课程教学大纲
《体育统计学》课程教学大纲
二、课程简介
社会体育专业要求本科学生掌握社会体育方面的“基础知识、基础理论、基本技能,同时要求学生具有较强的实践能力”。
体育统计学是运用统计学的原理和方法研究体育领域随机现象的数量规律的一门基础应用学科,属于方法论学科范畴。
通过本课程的学习,使学生掌握体育统计学的基本原理和方法、定量描述随机现象的常规方法、常用的统计推断方法并能运用统计思想和方法分析一些实际问题以及常用的几种研究设计方法。
三、课程教学目标(精炼概括条目标,本课程教学目标须与授课对象的专业培养目标有一定的对应关系)
()培养体育统计学独特思维方式
()学习正确运用体育统计学方法
()结合体育专业知识解释统计结论
四、课程进度表
理论教学进程表。
《体育统计学》课程第4.5讲正态分布
频率 组距
总体密度曲线 总体在区间(a , b)内取值的概率
产品 尺寸 (mm)
a
b
二 正态分布的概念
定义:若随机变量X的概率分布密度 函数是:
f ( x)
1 e 2
( x )2 2
2
式中,μ和δ都是常数,且δ>0, - ∞<x<∞,称随机变量X服从参 数为μ和δ的正态分布,记为X~N ( μ, δ2)。
σ越小,曲线越“高”,总体分布越集中。
四 标准正态分布
为了分析问题的方便,把任何不同参数的 正态分布改造成标准正态分布。其具体步 骤如下:
u
x
四 标准正态分布
由此,可使正态分布的概率密度函数改造 成标准正态分布的概率密度函数,其函数 式为
1 f (u) e 2
u 2
一 正态分布的由来
1 直方图 在平面坐标上,以横轴根据各组组距的宽 度标明各组组距,以纵轴根据次数的高度 标示各组次数绘制成的统计图。纵轴的左 侧标明次数,右侧标明频率,如果没有频 率,直方图只在左侧标明次数。
一 市场及其相关概念
一 直方图的基础上,用折线连接 各个直方形顶边中点,并在直方图形两侧 各延伸一组,使折线与横轴相连。也可根 据各组组中值与次数求出各组的坐标点, 并用折线连接各点而成。折线所覆盖的面 积等于直方图条形的面积,表示总次数。
二 正态分布表的使用和计算方法(续)
上面是标准正态分布,其横轴是标准变量u。 若将标准正态分布还原成一般正态分布,则上 述各类区间的上下限分别又可用原始变量X的 值予以表示,即 (μ-1δ, μ+1δ) 所围成的面积(概率) P=0.6826;(μ-1.96δ, μ+1.96δ) 所围成的面积(概率) P=0.95; (μ-2.58δ, μ+2.58δ) 所围成的面积 (概率)P=0.99;(μ-3δ, μ+3δ) 所围成的面积(概率)P=0.9974;
体育统计学 第4章 概率及其分布
频数
600
2.13 - 2.18
记为X~N(μ,σ2),其对应的曲线叫正态曲线 。
正态曲线有以下性质:
1.曲线在X轴上方,以 X=μ为其对称轴,当X=μ 时,函数F(X)有最大值,正 态曲线达到最高点。 2.μ,σ为正态分布的两 个参数,μ确定曲线的中心位 置,如图4-5所示,σ确定曲 线的形状,σ愈大,曲线愈扁 平。 3.曲线与X轴所围面积 为1 。
4.2 随机变量及其概率分布
一、随机变量 当用一个变量的取值来表示随机试验 的结果时,该变量随着试验的不同结果而 取不同的值,也就是说变量的取值是随机 的,称此变量为随机变量,随机变量一般 用大写英文字母X、Y、Z表示,也可以 用ξ、η等表示。
二、随机变量的概率分布
1.概率分布的概念 概率分布:随机变量的取值及取值的概率 称为随机变量的概率分布。 2.概率分布的表示方法 ⑴ 分布列法 ⑵ 分布曲线法
4.4.2 估计实际分布情况 [例4-19] 设高中男生身高X(单位:厘米)是正态变量,均 值是171,标准差是4,即X~N(171,42)。求: (1) 身高超过175的学生所占的比例; (2) 身高在165至175之间学生所占的比例; (3) 以均值171为中点的一个区间,使其学生占95%。
4.4.3 统一计分标准
可以用一个数来描述随机事件在一次试验 中发生的可能性大小,该数就是概率。
2.概率 随机事件的概率:在n次重复试验中随机事件A发 生的次数记为m,当n很大时,频率m/n会稳定地在某 一数值p的附近摆动,而且随着试验次数n的增加,其 摆动的幅度越来越小,称p为随机事件A的概率,记为: P(A)= p 例如,在投硬币的试验中,“出现正面”这一随 机事件发生的频率在0.5附近摆动,且随着试验次数 的增多摆动的幅度会越来越小,因此,可以认为“出现 正面”这一随机事件的概率为0.5。
体育统计学复习资料
第一章绪论1.体育统计学的定义是一门将概率论和数理统计的理论与方法应用于体育领域,为体育实践提供解决问题的方法的工具学科。
属方法论学科范畴。
1.总体:根据统计研究的具体研究目的而确定的同质对象的全体。
样本:根据需要与可能从总体中抽取部分研究对象所组成的子集。
个体;组成总体的每个基本单位,即被研究对象的单个观测值。
2.样本容量(含量):样本中所含个体的数目。
记为:“n”。
3.总体容量:总体中所含个体的数目。
记为:“N”。
4.指标:对于自然科学研究者来说,是在实验观察中用来指示(反映)研究对象中某些特征的可被研究者或仪器感知的一种现象标志。
5.统计量:由样本所得,关于样本特征的统计指标。
6.有效数字:通常将仅保留末一位估计数字其余数字为准确数的数字称为有效数字。
统计误差:统计分析过程中产生的数据与真值之间的差距。
分为两大类:测量误差和抽样误差。
7.系统误差:由于实验仪器、操作人员的操作水平、以及实验环境等因素产生的误差。
1.研究设计:确定研究方向―→选择课题―→作出研究设计(基本过程)调查设计(问卷调查、专家访问、文献资料等)研究设计{试验设计2.对试验设计的几点要求:1)所取的每个试验对象的测量值,不能有系统误差。
2)应该选取适当的试验指标(价值)。
3)所测得的数据应能找到相应的数理统计方法进行分析,使得所取数据能够满足统计分析的基本模型。
3.数据的收集应注意的问题:1)保证资料的完整性、有效性和可能性。
2)保证样本的代表性(遵循随机抽样原则)。
附:几种常用的随机抽样方法1)单纯随机抽样法(抽签法、随机数表法)2)机械抽样3)分层抽样(类型抽样)4)整群抽样第二节资料的整理频率:(在统计学中)是指在一次试验过程中,某事件发生的次数与样本容量的比值。
一、资料的审核审核数据资料的准确性和完整性。
步骤如下:1.初审2.逻辑检查3.复核二、频数分布表和频数直方图的制作整理步骤如下:1.求极差2.确定组数与组距3.确定分组点及各组的上下限4.整理频数分布表5.绘制频数直方图第三章 样本特征数第一节 集中位置量数一、定义:统计学中定义为:反映一群性质相同的观察值的平均水平或集中趋势的统计指标。
用正态分布原理制定体育项目考核标准
正态分布原理是统计学中非常重要的概念,它可以帮助我们更好地理解和解释各种自然现象和社会现象。
在体育项目的考核标准中,利用正态分布原理来制定标准可以更加客观、科学地评估运动员的表现,同时也可以更好地激发运动员的潜力,提高整体竞技水平。
接下来,我将从浅入深地探讨这一主题。
1. 正态分布原理的基本概念正态分布是指在一定条件下,大量相互独立、相同分布的随机变量的分布情况。
在正态分布曲线图中,均值处为中心,两侧分别为标准差的倍数。
正态分布具有许多重要性质,比如68%的数据落在均值的一倍标准差内,95%的数据落在均值的两倍标准差内,99.7%的数据落在均值的三倍标准差内。
这些性质使得正态分布成为了许多自然和社会现象的分布模型。
2. 体育项目考核标准中的应用在体育项目的考核标准中,通常会设置一些基准指标,比如最终成绩的均值和标准差。
根据正态分布原理,我们可以将运动员的成绩进行统计,然后根据均值和标准差来分析和评价运动员的表现。
通过这种方式,我们可以更客观、科学地评估运动员的水平,而不是仅凭主观印象来做评判。
这有助于激励运动员努力提高自己的水平,同时也有利于选拔出更具潜力的运动员。
3. 个人观点和理解我个人认为利用正态分布原理来制定体育项目考核标准是非常有益的。
它可以帮助我们更客观地评估运动员的水平,并且可以激发运动员的潜力,提高整体竞技水平。
当然,这并不是说正态分布原理是万能的,它只是一种辅助工具,我们还需要结合实际情况和专业知识来进行评估和选拔。
总结回顾在本文中,我首先介绍了正态分布原理的基本概念,然后探讨了它在体育项目考核标准中的应用,最后共享了我的个人观点和理解。
通过对这一主题的深入探讨,相信读者对如何用正态分布原理制定体育项目考核标准有了更深入的了解。
在日常工作中,我们需要不断提高综合素质,在对体育项目进行考核时,也要兼顾公平和合理,而正态分布原理的运用正是一种可取的方式。
希望本文可以给大家带来一些启发,也欢迎大家共享自己对这一主题的看法和经验。
第四章正态分布
X
分布函数----F(x) =P {Xx}, 示事件{Xx}的概率。 表 性质 1、单调不减性:若x1<x2, 则F(x1)F(x2);
2、归一 性:对任意实数x,0F(x)1,且
F( ) lim F( x ) 0, F( ) lim F( x ) 1;
x x
注:
(0) 0.5
(x)=1- (-x);
P (| X | a ) 2(a ) 1
x
x
对一般的正态分布 :X ~N ( , 2) (t ) x 1 其分布函数 F ( x) e 2 dt 2
2 2
作变量代换
s
t
1 2
0.5e
0.5x
dx e
1
3.5
0.37
0.5e
0.5x
dx
1.5
3. 正态分布 正态分布是实践中应用最为广泛,在理论上 研究最多
的分布之一,故它在概率统计中占有特别重要的地位。
若随机变量
X ~ f ( x) 1
x 2
2 2
2 ( x )
x
对任意实数a, b (a<b), P {a<Xb}=P{Xb}-P{Xa}= F(b)-F(a).
a
X
b
概率密度函数
若 : F ( x) P( X x) = =
x
f ( u)du
y f ( x)
s
x
x
P {a<Xb}=P{Xb}-P{Xa} = 密度函数的性质
(1) 非负性 f(x)0,(-<x<);
体育统计专题之正态分布技术介绍
数学便利性
正态分布具有许多良好的数学性 质,如概率密度函数的对称性和 概率计算方法的简便性,这使得 基于正态分布的统计分析变得相 对容易。
精度提升
在数据量较大或样本均数接近总 体均数时,正态分布能够提供更 为精确的估计和预测。
局限性分析
01
02
03
数据分布假设
正态分布假设数据来自正 态分布的总体,这在某些 体育项目中可能不成立, 如跳跃、举重等。
感谢观看
REPORTING
https://
正态分布图呈现钟形曲线,对称轴为水平线,峰 值在中间位置。
分析数据分布情况
根据图形判断数据分布是否集中,离散程度如何。
确定数据范围
根据图形确定数据的最大值、最小值、平均值等 统计指标。
正态分布的参数与特性
参数
均值、标准差、偏度、峰度等。
特性
正态分布是一种连续概率分布, 具有对称性、集中性、均匀变动
PART 06
结论
REPORTING
WENKU DESIGN
正态分布在体育统计中的重要地位
正态分布是概率论和统计学中最重要的理论之一,在体育统计中也有着广泛的应用。
在体育领域中,许多数据指标都呈现出正态分布的特点,如运动员的身高、体重、 运动成绩等。
正态分布在体育统计中主要用于描述和分析这些数据,帮助我们了解运动员的身体 特征、运动表现和训练效果等。
体育统计专题之正态 分布技术介绍
https://
REPORTING
目录
• 引言 • 正态分布在体育统计中的应用 • 正态分布的绘制与解读 • 正态分布在体育统计中的优势与局限性 • 案例分析 • 结论
PART 01
引言
正版体育教育专业体育统计学复习题库
体育统计学复习题第一章绪论一、名词解释:1、总体:根据统计研究的具体研究目的而确定的同质对象的全体,称为总体。
2、样本:根据需要与可能从总体中抽取的部分研究对象所形成的子集。
3、随机事件:在一定实验条件下,有可能发生也有可能不发生的事件称随机事件。
4、随机变量;把随机事件的数量表现(随机事件所对应的随机变化量)。
5、统计概率:如果实验重复进行n次,事件A出现m次,则m与n的比称事件A在实验中的频率,称统计概率。
6、体育统计学:是运用数理统计的原理和方法对体育领域里各种随机现象的规律性进行研究的一门基础应用学科。
二、填空题:1、从性质上看,统计可分为两类:描述性统计、推断性统计。
2、体育统计工作基本过程分为:收集资料、整理资料、分析资料。
3、体育统计研究对象的特征是:运动性、综合性、客观性。
4、从概率的性质看,当m=n时,P(A)=1,则事件A为必然事件。
当m=0时,P(A)=0,则事件A为不可能发生事件。
5、某校共有400人,其中患近视眼60人,若随机抽取一名同学,抽取患近视眼的概率为0.15。
6、在一场篮球比赛中,经统计某队共投篮128次,命中41次,在该场比赛中每投篮一次命中的率为0.32。
7、在标有数字1~8的8个乒乓球中,随机摸取一个乒乓球,摸到标号为6的概率为0.125。
8、体育统计是体育科研活动的基础,体育统计有助于运动训练的科学化,体育统计有助于制定研究设计,体育统计有助于获取文献资料。
9、体育统计中,总体平均数用μ表示,总体方差用σ2表示,总体标准差用σ表示。
10、体育统计中,样本平均数用x表示,样本方差用S2表示,样本标准差用S表示。
11、从概率性质看,若A、B两事件相互排斥,则有:P(A)+P(B)=P(A+B)。
12、随机变量有两种类型:一是连续型变量,二是离散型变量。
13、一般认为,样本含量n≥45为大样本,样本含量n<45为小样本。
14、现存总体可分为有限总体和无限总体。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章 正 态 分 布如果将第二章中的(表2 — 1)中的数据绘制成直方图,把每个方条顶部中点联结起来,就得到一个图形,它称为频数多边形。
(图4 — 1)当分组数很多,组距很小时,频数多边形就趋于类似(图4 —2)所示的平滑的曲线。
这种曲线呈现出两侧近似对称的钟形。
随机变量的类似这种分布,在自然界是相当普遍的其中最有代表性的是正态分布。
下面就来介绍正态分布及其在体育中的几个应用。
12345678910x图4 — 1 频数多边形图第一节 正态分布曲线的形式如果随机变量X 的概率密度函数为y =πσ21e 222)(σμ--x (+∞<<∞-x ) (4 — 1)则称随机变量X 是服从正态分布的由上式绘出的图形叫做正态曲线。
(图4 — 2)X 的变动范围在 ∞- 至 +∞ 间。
YX0μ图4 — 2 正态分布曲线正态分布曲线中有两个参数:均值 μ 及方差 2σ。
为了应用方便,对式(4 — 1)中的随机变量经过一个称为标准化的变换,即令u来代替原式中的 σμ-x , 寻这时的随机变量u 的概率密度函数成为: y = π21e 22u - (4 — 2) 按照(4 — 2)式绘出的图形,称作标准正态曲线。
(图4 — 3)Y00.40.30.20.1-1-2-3123μ图4 — 3 标准正态分布曲线第二节正态分布曲线的特征正态分布曲线有许多特点,它们对实际工作有很大的帮助。
它的主要特点有以下几个方面:一,正态分布的形式是对称的(但对称的分布不一定是正态分布)。
在正态分布中均值与中位数相重合。
二,从中央最高点逐渐向两侧降低,降低的速度是先慢后快,以后又再次减慢,最后接近横轴,但终究不能与横轴相交。
三,从中央向两侧逐渐下降,它的方向是先向内弯,达到离均值左右各一个标准差时又改向外弯,是以σμ1±的点为曲线从内弯转向外弯的转折点,即正态曲线中标准差与曲线有固定的关系。
四,因为正态曲线是对称的,在曲线下不仅平均数的两侧面积相等,各相当距离间的面积相等,而且各相当距离间的曲线高度也相等,正态曲线下(与横轴间)的总面积为1. 00。
五,正态曲线可以有不同形式,它们的均值和标准差可以不相同,均值不同表明曲线在横轴上所处位置不同,标准差不同表明曲线的形态不同。
标准差小则曲线高、且窄;标准差大则曲线低、且宽。
(图4 — 4)由式(4 — 1)和(4 — 2)知,标准正态曲线的μ= 0,σ= 1,即标准正态曲线是关于纵轴对称;它在μ= 0时,有最大值,它近似等于0. 4,如(图4 — 3)所示。
YX 0μσ=0.5σ=1σ=2图4 — 4 三种不同形式的正态分布曲线第三节 正态分布表从某市17岁男生中随机抽出205人测量身高,由这个样本计算得到 X = 168. 40厘米,S = 6. 13厘米。
假定该市17岁男生身高服从正态分布,试估计身高在16. 40 — 172. 40厘米之间的人数。
求解这类问题的一般方法是:求从正态总体中随机选取一个个体的测量值落在区间(a, b )上的概率。
这个概率在标准正态曲线下就是曲线、X 轴、直线X = a 和X — b 所围成的面积。
(图4 — 5)当概率P 求得后,要求的人数约等于总人数乘以P 值。
Y00.1-1-2-3123μ0.20.40.3a b图4 — 5 随机变量X在区间(a,b)内取值的概率示意图表的左边第 1 列这横轴上的位置,它是指横轴上某一点与平均值的距离,以标准差为单位来表示,通常记为u,即u =σμ-x(4 — 3)表上边的第1 行为u值的第2位小数。
表的主体部分是各u值与均数(u = 0)之间所对应的单侧面积(或概率)。
一、知U值求对应的面积例 4 —1求u 值为-1 至+2 之间对应的面积。
解:由于标准正态曲线是关于x = u对称的均数处的u值为零,所以u值在-1至0这间对应的面积与它在0 至+1 之间的对应面积相等。
查书后附表1得u值在-1至0的对应面积是34. 13%;u 值在0至+2 之间的面积是47. 72%。
前者在均值的左边,后者在均值的右边,因此这两块面积之和便是所求面积。
(图4 — 6)即:34. 13% + 47. 72% = 81. 85%-12=+81.85%34.13%47.72%00-12图4—6例 4 —2 本节开始提出的问题,即试估计身高在160. 40 —172. 40厘米之间的人数。
解:首先要求出身高为160. 40厘米和172. 40厘米的u值,按式(4 — 3)有(当u 和σ未知时,可用X和S近似代替):u 1 = 13.640.16840.160- = -1. 31 u 2 = 13.640.16840.172- = 0. 65 查书后附表1 求 u 1、u 2 所对应的面积。
u 1 = -1. 31 所对应的面积是40. 49%,u 2 = 0. 65所对应的面积是24. 22%。
u 值-1. 31至0. 65所对应的面积为40. 49% + 24. 22% = 64. 71%,见(图4 — 7)所示,于是身高在 160. 40 — 172. 40厘米之间的人数约为 205×64. 71% ≈133(人)。
0-1-212μ24.22%40.49%160.40米0.65-1.31图4-7 估计身高在160. 40-172. 40厘米间的人数百分数二、已知面积求对应的U 值例 4 — 3 试求从 +1σ 向右到什么位置对应的面积为14. 15%解:设从 +1σ 向右到 +k σ 对应的面积为14. 15%。
查标准正态分布表知+1σ对应的面积是34. 13%。
24. 13%+14. 15% = 48. 28%,就是u 值从0 到 +k 之间对应的面积。
查书后附表1和K = 2. 11,即从 +1σ 向右到 +2. 11σ 之间对应的面积为14. 15%。
(图4 — 8)从标准正态分布表中,可以找出标准正态曲线下面的分布规律。
在下表中列出的五个分布位置与其对应的概率是统计中电子学用到的,应该熟记。
μ+2.11б图4 — 8 从+1σ— +2. 11σ对应的面积表4 — 1 正态曲线下的概率分布μuσ该范围具有的概率±μ1σ68. 26%±μ 1. 96σ95. 00%±μ2σ95. 44%±μ 2. 58σ99. 00%±μ3σ99. 73%±第四节统计资料的正态性检验正态分布的理论适用于正态或近似正态分布的资料。
对样本要想用正态分布理论进行分析,首先要检验样本是否为正态分布。
检验的方法有多种,简单而实用的方法是“概率格纸绘图法”。
这种方法使用的概率纸是正态概率纸,它的横轴是普通的刻度,纵轴是按正态分布的规律刻划的。
使用时,先根据样本数据求出累计频率,然后根据累计频率和组限,将其点绘在正态概率纸上,如果样本资料是呈正态分布的则所有点几乎在一条直线上。
例 4 — 4 广州市某中学初中生800米跑的抽样测验成绩的累计频率如下表所示,试检验该资料是否近似正态分布组 限 频 数 累计频数 累计频率(%) -'''732 1 1 0. 8 -'''442 6 7 5. 6 -'''152 15 22 17. 6 -'''852 20 42 33. 6 -'''503 27 69 55. 2 -'''213 25 94 75. 2 -'''913 21 115 92. 0 -'''623 6 121 96. 8 -'''333 2 123 98. 4 -'''043 2 125 100. 0由样本计算得:X = 2303''' , S = 421''然后根据每组的下限值和相应的累计频率,将它们分别标在图上。
根据点的分布趋势画一直线,观察这些点的分布是否接近一条直线。
在画直线时应以靠近中部的点为主,两端的点为辅,因为中部的点的组频数大,所以占比重也大。
由(图4 — 9)可见,所有的点几乎都在一条直线上,故该样本资料接近于正态分布。
2′51″2′2′2′3′3′3′3′3′37″44″58″05″12″19″26″33″图 4—9当样本资料符合正态分布时,籍助正态概率纸做图,还可以对 μ 和 σ 作出近似地估计。
从正态分布理论知道累积频率为50% 的位置应在中点,即接近均数位置。
从纵轴50% 的位置画横线与钭线交于a 点,由不得a 点向横轴做垂线交于 μ 点,其值为 8203''' ,即为估计均数,它与计算值 2203''' 仅相差 50''。
又知均数减一个标准差位置的面积为34. 13%,故在纵轴上的应是50%-34. 13% = 15. 87%(b 点),以此划横线交于钭线上c 点,向横灿做垂线交于 9052''' 处,此点距均数的长度应为σ,故估计标准差的值为: 91190528203''='''-''' 。
计算值为 421'',仅相差 50''。
只要图做得准确,这些估计值也还是比较精确的。
第五节可疑数据的舍取在实际工作中,往往能够发现样本资料中具有个别突出的数值(特大或特小的数值)。
按样本数据系列大小顺序来看,发现这些突出的数值和其他数值之间有明显脱节现象。
这种现象使人们怀疑这些特别数值是否属于研究的总体,于是把这些数据称为可疑数据。
人们把来自非同一总体的极端值,称为异常数据。
样本中的异常数据应当及时剔除,否则会影响样本均数和标准差等统计量及计算结果的准确性。
如何判断可疑数据是否为异常数据,方法不少,下面介绍适用于正态分布,且数据个数不多时,比较常用而有效的戈罗伯斯(Grubbs)检验法。
设x1,x2……,x n来自正态分布的总体,将它们按大小重新排列,记为x(1)≤x(2)≤…… ≤x(n)。
首先计算出可疑数据的g n值,其公式为:g n =s |xx|-'(4 — 4)式中x'表示可疑数据值,若计算得g n值大于(表4 — 2)中的临界值a n,则认为x'是异常数据,应舍弃。
若小于临界值,则x'为正常数据,应保留。
表4 — 2 戈罗伯斯检验临界值(a n)表α= 0. 05 n a n n a n n a n n a n n a n3 1. 15 12 2. 29 21 2. 58 30 2. 96 40 2. 874 1. 46 13 2. 33 22 2. 60 31 3. 03 50 2. 965 1. 67 14 2. 37 23 2. 62 32 3. 09 60 3. 036 1. 82 15 2. 41 24 2. 64 33 3. 14 70 3. 097 1. 94 16 2. 44 25 2. 64 34 3. 18 80 3. 148 2. 03 17 2. 47 26 2. 75 35 3. 21 90 3. 189 2. 11 18 2. 50 27 2. 82 36 3. 23 100 3. 2110 2. 18 19 2. 53 28 2. 87 37 3. 24 110 3. 2311 2. 23 20 2. 56 29 2. 92 38 3. 25 120 3. 24例 4 — 5 为了解一般高中学生跳高水平,由随机样本计算得到统计量如下:n = 100人x= 1. 31米s = 0. 09米假定这些学生跳高成绩的分布呈正态分布。