2.2.2用样本的数字特征估计总体的数字特征 -
高中数学2.2.2 用样本的数字特征估计总体的数字特征1
2.(1)由平均数公式得 x=
(182×27+80×21)≈81.13(分).
48
(2)因为男生的中位数是75分,所以至少有14人得分不超过75
分.
又因为女生的中位数是80分,所以至少有11人得分不超过80分.
所以全班至少有25人得分不超过80分.
(3)男生的平均分与中位数的差别较大,说明男生中两极分化现
2.2.2 用样本的数字特征估计总体的数字特征
1.正确理解样本数据标准差的意义和作用,学会计算数据的标 准差. 2.能根据实际问题的需要合理地选取样本,从样本数据中提取 基本的数字特征(如平均数、标准差),并作出合理的解释. 3.会用样本的基本数字特征估计总体的基本数字特征,形成对 数据处理过程进行初步评价的意识.
x1 x2 xn
则 x =_______n_______.
2.方差、标准差 假设样本数据是x1,x2,x3,…,xn, x 是平均数,则 (1)方差是
s2=__n1[___x1___x_2____x_2 __x__2 ______x_n__x__2_].
(2)标准差为
s=__n1_[__x_1__x__2___x_2___x_2____ __x_n___x__2 ]_.
【解题指南】1.由平均数和方差的定义直接求解.
2.先画出茎叶图,再利用平均数和方差结合的形式分析稳定性.
【自主解答】1.
s2
1 [ 21
a1
x
2
a2 x
2
a20 x
2
xx
2
]
1 20 0.20 4 0.19.
21
21
答案:0.19
2.(1)作出茎叶图如下:
(2)派甲参赛比较合适.理由如下:
高中数学人教新课标B版必修3--《2.2.2用样本的数字特征估计总体的数字特征》课件3
x 4.91
问题3: 如何从频率散布直方图中估
计平均数,为什么?
21:32
答案:91.5,91.5
计中位数,为什么?
21:32
2 中位数:左边和右边的直方图面积相等
前三个矩形的面积和=0.41
后四个小矩形的面积和=0.48
0.25
0.15
0.13 0.10
0.06 0.22
0.09 0.11
4.91
分总析结::在在样本频数率据散中布,直有5方0%图的中个体,小把于频或率等散于中布位直数方,图也划有5分0%左的个右体两大
0.25
0.15
0.13 0.10
0.06 0.22
0.09 0.11
21:32
18
从锻炼时间样本数据可知,该样本的众数是3.5, 中位数是4.75,平均数是4.825。这与我们从样本频率 散布直方图得出的结论有偏差,你能解释一下原因吗?
因频率散布直方图本身得不出原始的数据内容, 所以由频率散布直方图得到的众数、中位数平 均值的估计往往与样本的实际中位数值不一致.
分析:众数为200,中位数为220,
平均数为300。
因平均数为300,由表格中所列 出的数据可见,只有经理在平均数以 上,其余的人都在平均数以下,故用 平均数不能客观真实地反应该工厂的 工资水平。
二、归纳提升: 众数、中位数、平均数的特点
特征数 众数 中位数 平均数
作用
局限性
众数体现了样本数据 的最大集中点
2.2.2 用样本的数字特征估计总体的数字特征(二) 标准差
2.2.2 用样本的数字特征估计总体的数字特征(二) 标准差 ●学习目标1、能从样本数据中求出标准差,并做出合理解释;2、进一步体会用样本估计总体的思想,会用样本的标准差估计总体的特征;3、注意对样本标准差的随机性的体会,并能够正确利用标准差解决一些简单的实际问题. ●学习重点从样本数据中求出标准差并做出合理解释;样本估计总体的思想. ●学习难点体会统计的作用和样本标准差的随机性,并利用标准差解决一些简单的实际问题. ●学习过程 一.温故知新1、众数、中位数和平均数都是描述一组数据_________的量.2、两名射击运动员在一次射击测试中各射靶10次,每次命中的环数如下: 甲:7 8 7 9 5 4 9 10 7 4 乙:9 5 7 8 7 6 8 6 7 7 分别求出这两名运动员射击成绩的众数、中位数和平均数,对这次射击情况应如何评价?二.走进课堂1、极差:反映一组数据的变化的___________,它对一组数中的______非常敏感,由此可以得到一种“______________,______________”的统计策略.2、标准差:考察样本数据的______________最常用的统计量,是样本数据到_______的一种____________,一般用s 表示.(1)标准差的表达式:______________________s =;变形得:s = (2)标准差的大小,受样本中每个数据的影响,如果数据间变异大,则标准差也大,反之则小.因此,标准差越大,数据的离散程度_____,标准差越小,数据的离散程度_____; (3)标准差的取值范围是:______s ∈;(4)标准差常被理解为稳定性,标准差的单位与原数值的单位相同. 如何对上面甲、乙两名射击运动员做出评价?3、方差:即标准差的平方2s .(1)方差的表达式:2________________________________s =;(2)方差也是反映数据离散程度的特征数字,它的单位是原数值的单位的平方. 【夯实基础】(1)甲、乙两支女子曲棍球队在去年的国际联赛中,甲队平均每场进球数为3.2,全年比赛进球个数的标准差为3;乙队平均每场进球数为1.8,全年比赛进球个数的标准差为0.3,下列说法正确的有( )①甲队的技术比乙队好; ②乙队发挥比甲队稳定 ③乙队几乎每场都进球; ④甲队的表现时好时坏A.1个 B.2个 C.3个 D.4个 (2)某班有50名学生,某次数学考试的成绩经计算得到的平均分数是70分,标准差是s ,后来发现记录有误,某甲得70分却记为40分,某乙50分误记为80分,更正后重新计算得标准差为1s ,则s 与1s 之间的大小关系是( )A.s =1s B.s <1s C.s >1s D.不能确定 (3)已知一个样本为:x ,1,y ,5,其中x ,y 是方程组222,10x y x y +=⎧⎨+=⎩的解,则这个样本的标准差是( )A.2 C.5(4)一组数据的方差是2s ,将这组数据中的每一个数都乘以2,得到一组新数据,其方差是( ) A.212s B.22s C.24s D.2s(5)一组数据中的每一个数都减去80,得一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是( )A.81.2,4.4 B.78.8,4.4 C.81.2,84.4 D.78.8,75.6 (6)五个数1,2,3,4,a 的平均数是3,,则a =____,这五个数的标准差是_____.(7)若1a ,2a ,…,20a ,这20个数据的平均数为x ,方差为0.20,则数据1a ,2a ,…,20a ,x 这21个数据的方差约为__________(保留2位有效 ).4、典例精析【例1】从一批棉花中抽取9根棉花的纤维,长度如下:(单位:mm ) 82,202,352,321,25,293,86,206,115. 求样本的平均数、样本的方差和样本的标准差.【例2】现有A 、B 两个班级,每个班级有45名学生参加一次测验,每名参加者可获得0,1B 班的测试结果如右图:(1)你认为哪个班级的成绩比较稳定?(2)若两班共有60人及格,则参加者最少获得 多少分才可能及格?5、课堂小结:(1)众数、中位数和平均数都是描述一组数据集中趋势的特征数;标准差、方差都是用来描述一组数据波动情况的特征数,标准差更具无偏性.(2)当两个样本的平均数相等或相差无几时,就要用标准差来反映样本数据的离散程度. 作业:。
2.2.2 用样本的数字特征估计总体的数字特征(2)
x甲 x乙
∴乙种玉米的苗长得高.
(2)由方差公式得:
1 s甲= [(25-30)2+(41-30)2+…+(42-30)2]=104.2, 10
2
2 同:乙种玉米苗长得高,甲种玉米苗长得齐.
2
2
课后作业
1.甲、乙两种水稻试验品种连续 5 年的平均单位面积产量如 下(单位:t/hm2),试根据这组数据估计哪一种水稻品种的产 量比较稳定.
课堂练习
1.如图是某校举行的元旦诗歌朗诵比赛中, 七位评委为某位选手打出分数的茎叶统计图 ,
去掉一个最高分和一个最低分,所剩数据
的平均数和方差分别为( (A)84,4.84 (B)84,1.6 )
(C)85,1.6
(D)85,0.4
【解析】选C.得分是79,84,84,86,84,87,93,最高分是93,最低分 是79,则去掉一个最高分和一个最低分后该选手得分是84,84, 86,84,87,计算得平均数是85,方差是1.6.
(2)因平均数为300,由表格中所列出的数据可见,只有经理 在平均数以上,其余的人都在平均数以下,故用平均数不能 客观真实地反映该工厂的工资水平.
因此,在例子中的解答过程可表述为: 解:由数据可得:
1 1 7 x甲 (7 8 7 4) 7, x乙 (9 5 7 7) 10 10
x甲 x乙
∴从平均成绩看甲、乙二人的成绩无明显差异。
1 7 72 8 72 4 72 2 s甲 10
|x1- x |+|x2- x |+„+|xn- x | S= .由于上式含有绝对值, n
运算不太方便,因此,通常改用如下公式来计算标准差:
s= 1 2 2 2 [ x - x + x - x +„+ x - x ]. 2 n n 1
2.2.2用样本的数字特征估计总体的数字特征
学习课题:2.2.2 用样本的数字特征估计总体的数字特征※学习目标1.正确理解样本数据标准差的意义和作用,学会计算数据的标准差;2.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释;3.会用样本的基本数字特征估计总体的基本数字特征,形成对数据处理过程进行初步评价的意识。
※课前准备(阅读课本P71-P78)※探索新知一、众数、中位数、平均数众数:_______________________________________________________________________中位数:_______________________________________________________________________平均数:_______________________________________________________________________ 思考探究:1、在频率分布直方图中如何求出众数、中位数、平均数。
2、分别利用原始数据和频率分布直方图求出众数、中位数、平均数,观察所得的数据,你发现了什么问题?为什么会这样呢?3、你能说说这几个数据在描述样本信息时有什么特点吗?二、标准差、方差标准差S=思考探究:1、标准差的大小和数据的离散程度有什么关系?2、标准差的取值范围是什么?标准差为0的样本数据有什么特点?注:在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差。
※例题精析例:农场种植的甲乙两种水稻,在面积相等的两块稻田连续6年的年平均产量如下:甲:900,920,900,850,910,920乙:890,960,950,850,860,890那种水稻的产量比较稳定?※当堂检测(ABC班完成)1、求下列各组数据的众数、中位数、平均数(1)1 ,2,3,3,3,4,6,7,7,8,8,8(2)1 ,2,3,3,3,4,6,7,8,9,92、下列对一组数据的分析,不正确的说法是()A、数据极差越小,样本数据分布越集中、稳定B、数据平均数越小,样本数据分布越集中、稳定C、数据标准差越小,样本数据分布越集中、稳定D、数据方差越小,样本数据分布越集中、稳定※延伸拓展(AB班完成)某公司的33名职工的月工资(单位:元)如下表:(2)若董事长、副董事长的工资分别从5500元、5000元提升到30000元、20000元,那么公司职工新的平均数、中位数和众数又是什么?你认为哪个统计量更能反映这个公司员工的工资水平?。
2.2.2用样本的数字特征估计总体的数字特征
举例 1. 甲在一次射击比赛中的得分如下: ( 单 位:环).7,8,6,8,6,5,9,10,7,5,则他命中的平均 数是_____. 7.1 2. 某次数学试卷得分抽样中得到:90分 的有3个人,80分的有10人,70分的有5人,60 77分 分的有2人,则这次抽样的平均分为______.
思考
2.2.2用样本的数字特征 估计总体的数字特征
创设意境
在一次射击比赛中,甲、乙两名运动员各射击
10次,命中环数如下﹕ 甲运动员﹕7,8,6,8,6,5,8,10,7,4; 乙运动员﹕9,5,7,8,7,6,8,6,7,7. 观察上述样本数据,你能判断哪个运动员发挥
的更稳定些吗?为了从整体上更好地把握总体的规
如何从频率分布直方图中估计中位数?
练习
应该采用平均数来表示每一个国家项目的平 均金额,因为它能反映所有项目的信息.但平均数 会受到极端数据2200万元的影响,所以大多数项 目投资金额都和平均数相差比较大.
标准差
有两位射击运动员在一次射击测试中各射 靶十次,每次命中的环数如下:
如果你是教练,你应当如何对这次射击情况作出 评价?如果这是一次选拔性考核,你应当如何作出选 择?
律,我们要通过样本的数据对总体的数字特征进行 研究——用样本的数字特征估计总体的数字特征.
1. 众数
在一组数据中,出现次数最多
的数据叫做这一组数据的众数. 2. 中位数 将一组数据按大小依次排列,把 处在最中间位置的一个数据(或两个数据的 平均数)叫做这组数据的中位数. 3. 平均数 (1) x = (x1+x2+……+xn) /n (2) x = x’ +a (3) x = (x1f1+x2f2+……xkfk)/n
2.2.2 用样本的数字特征估计总体的数字特征标准差
标准差
平均数向我们提供了样本数据的重要信息,但是 平均数向我们提供了样本数据的重要信息 但是 平均有时也会使我们作出对总体的片面判断. 平均有时也会使我们作出对总体的片面判断.因 为这个平均数掩盖了一些极端的情况, 为这个平均数掩盖了一些极端的情况,而这些极 端情况显然是不能忽的.因此, 端情况显然是不能忽的.因此,只有平均数还难 以概括样本数据的实际状态. 以概括样本数据的实际状态. 如:有两位射击运动员在一次射击测试中各 射靶10次 每次命中的环数如下: 射靶 次,每次命中的环数如下:
考察样本数据的分散程度的大小, 考察样本数据的分散程度的大小,最常用的统计量是 标准差. 标准差. 标准差是样本平均数的一种平均距离,一般用s表示 表示. 标准差是样本平均数的一种平均距离,一般用 表示. 所谓“平均距离” 其含义可作如下理解: 所谓“平均距离”,其含义可作如下理解: 假设样本数据是 x1 , x 2 ,⋅ ⋅ ⋅, x n , x 表示这组数据的平均 的距离是: 数,则 x i 到 x 的距离是: 则 的平均距离是: 于是样本数据 x1 , x 2 ,⋅ ⋅ ⋅, x n 到 x 的平均距离是:
甲 25.46, 25.32, 25.45, 25.39, 25.36 25.34, 25.42, 25.45, 25.38, 25.42 25.39, 25.43, 25.39, 25.40, 25.44 乙 25.40, 25.42, 25.35, 25.41, 25.39 25.40, 25.43, 25.44, 25.48, 25.48 25.47, 25.49, 25.49, 25.36, 25.34 25.33, 25.43, 25.43, 25.32, 25.47 25.31, 25.32, 25.32, 25.32, 25.48
222用样本的数字特征估计总体的数字特征(2)方差标准差讲解
性质归纳:kan b的平均数和方差:
已知a1,a2,,an的平均数是3,方差是2. 则a1 b,a2 b,,an b的平均数是3 b, 方差是2. ka1,ka2,,kan的平均数是3k,方差是2k 2.
标准差是样本平均数的一种平均距离,一般用s表示.
所谓“平均距离”,其含义可作如下理解:
假设样本数据是x1,x2,...xn ,x 表示这组数据的平均数,xi到 x
的距离是
-
xi - x (i = 1,2,… ,n).
, :
-
于是
样本数据x1,
x2,
x
到
n
x
的“平均距离”是
x1 x x2 x xn x
2.2.2用样本的数字特征估计总体 的数字特征(2) 方差、标准差
学习目标 1.明确标准差、方差等数字特征的意义,深刻 体会它们所反映的样本特征。 2.会用样本的数字特征估计总体的的数字特征, 初步体会样本的数字特征的随机性
复习回顾
一.什么是一组数据的众数、中位数及平均数?
众数:一组数据中出现次数最多的数据。
[解析] (1)甲组成绩的众数为 90 分,乙组成绩的众数为
70 分,从成绩的众数比较看,甲组成绩好些.
(2)s
2
甲
=
1 2+5+10+13+14+6
×[2×(50
-
80)2
+
5×(60
- 80)2 + 10×(70 - 80)2 + 13×(80 - 80)2 + 14×(90 - 80)2 +
A.众数 B.平均数
必修三2-2-2用样本的数字特征估计总体的数字特征
课前探究学习
课堂讲练互动
活页规范训练
规律方法 1.中位数的求法 (1)当数据个数为奇数时,中位数是按从小到大顺序排列 的中间那个数. (2)当数据个数为偶数时,中位数为排列的最中间的两个 数的平均数. 2.深刻理解和把握平均数、中位数、众数在反映样本数 据上的特点,并结合实际情况,灵活应用.
课前探究学习
课堂讲练互动
活页规范训练
自学导引
众数、中位数、平均数的概念 1. 次数 最多的数称为这组数据的 (1)众数:一组数据中出现_____ 众数.一组数据中的众数可能不止一个,也可能没有.众 集中趋势 .在频率分布直方图中, 数反映了该组数据的_________ 中点 就是数据的众数. 最高矩形的_____ (2)中位数:一组数据按从小到大的顺序排成一列,处于 _____ 中间 位置的数称为这组数据的中位数(或两个数据的平均 数).一组数据中的中位数是唯一的,反映了该组数据的 集中趋势.在频率分布直方图中,中位数左边和右边的直 方图的面积_____ 相等 .
课前探究学习 课堂讲练互动 活页规范训练
1 解 (1) 利 用 平 均 数 计 算 公 式 得 x = (82×27 + 48 80×21)≈81.13(分). (2)∵男同学的中位数是75, ∴至少有14人得分不超过75分.
又∵女同学的中位数是80, ∴至少有11人得分不超过80分. ∴全班至少有25人得分低于80分(含80分). (3)男同学的平均分与中位数的差别较大,说明男同学中 两极分化现象严重,得分高的和低的相差较大.
课前探究学习
课堂讲练互动
活页规范训练
(4)数据的离散程度可以通过极差、方差或标准差来描 述.极差反映了一组数据变化的最大幅度,它对一组数据 中的极端值非常敏感,方差则反映了一组数据围绕平均数 波动的大小.为了得到以样本数据的单位表示的波动幅 度,通常用标准差——样本方差的算术平方根来描述. (5)标准差的大小不会越过极差. (6)方差、标准差、极差的取值范围:[0,+∞).当标准 差、方差为0时,样本各数据全相等,表明数据没有波动 幅度,数据没有离散性. (7)因为方差与原始数据的单位不同,且平方后可能夸大 了偏差的程度,所以虽然方差和标准差在刻画样本数据的 分散程度上是一样的,但在解决实际问题时,一般采用标 准差.
2-2-2 用样本的数字特征估计总体的数字特征
次,5出现三次,5出现的次数最多,所以5为众数.
第二章
2 .2
2.2.2
成才之路 ·高中新课程 ·学习指导 ·人教A版 ·数学 ·必修3
2.中位数 (1)定义:一组数据按从小到大的顺序排成一列,处于
中间 位置的数称为这组数据的中位数.
(2)特征:一组数据中的中位数是 唯一 的,反映了该组数 据的 集中趋势. 在频率分布直方图中,中位数左边和右边的 直方图的面积 相等.
第二章
2 .2
2.2.2
成才之路 ·高中新课程 ·学习指导 ·人教A版 ·数学 ·必修3
温故知新 上一节我们学习了用图表来组织样本数据,并且还学习 了用样本的频率分布估计总体分布.为了更好地把握总体的 规律,我们还需要对总体的数字特征进行研究.
第二章
2 .2
2.2.2
成才之路 ·高中新课程 ·学习指导 ·人教A版 ·数学 ·必修3
第二章
2 .2
2.2.2
成才之路 ·高中新课程 ·学习指导 ·人教A版 ·数学 ·必修3
据;当样本数据个数为偶数时,中位数则是中间两个数据的
平均数 ,当这两个数据相等时,中位数是样本数据,否则
它不是样本数据,众数则是指在样本数据中出现次数 最多 的 数据,众数不一定 唯一.通过本节的学习,我们会更深刻地 理解这些数字特征,并能通过频率分布直方图去估算它们, 这也是我们学习的重点和难点所在.
在初中,我们已经学过平均数描述了数据的 平均 水平, 定量地反映了数据的集中趋势所处的水平.我们也知道可以 用样本的平均数去估计总体的平均水平,而样本数据的方 差、标准差则反映了数据的离散程度.方差或标准差越 小 , 数据越集中,总体越均衡;方差或标准差越 大 ,数据越分 散,总体越不均衡.而中位数则是指样本数据按从小到大(或 从大到小)的顺序排列后,处于 中间 位置的一个量,当样本数 据个数为奇数时, 中间一个数据 就是中位数,它是样本数
高中数学人教A版必修三课时习题:第2章 统计 2.2.2.2含答案
2.2.2 用样本的数字特征估计总体的数字特征第2课时方差、标准差课时目标1.理解方差、标准差的意义,会计算一组数据的方差和标准差,掌握用样本方差或标准差去估计总体方差或总体标准差的方法.2.会用平均数和方差对数据进行处理与比较.识记强化标准差及方差考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本数据到平均数的一种平均距离,一般用s表示.标准差的平方s2叫做方差,也为测量样本数据分散程度的工具.若样本数据是x1,x2,…,x n,x表示这组数据的平均数,则s=1n[x1-x2+x2-x2+…+x n-x2];s2=1n[(x1-x)2+(x2-x)2+…+(x n-x)2].课时作业一、选择题1.下列说法正确的是( )A.在两组数据中,平均值较大的一组方差较大C .2x -+3和s 2D .2x -+3和4s 2+12s +9 答案:B解析:由平均数、方差的求法可得.6.甲、乙两位同学都参加了由学校举办的篮球比赛,他们都参加了全部的7场比赛,平均得分均为16分,标准差分别为5.09和3.72,则甲、乙两同学在这次篮球比赛活动中,发挥得更稳定的是( )A .甲B .乙C .甲、乙相同D .不能确定 答案:B解析:方差或标准差越小,数据的离散程度越小,表明发挥得越稳定.∵5.09>3.72,故选B.二、填空题7.已知样本9、10、11、x 、y 的平均数是10,方差是2,则xy =________. 答案:96解析:由平均数得9+10+11+x +y =50,∴x +y =20,又由(9-10)2+(10-10)2+(11-10)2+(x -10)2+(y -10)2=(2)2×5=10,得x 2+y 2-20(x +y )=-192,(x +y )2-2xy -20(x +y )=-192,xy =96.8.如图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.答案:6.8解析:x =15(8+9+10+13+15)=11,s 2=15[(8-11)2+(9-11)2+(10-11)2+(13-11)2+(15-11)2]=6.8.9.若k 1,k 2,…,k 8的方差为3,则2(k 1-3),2(k 2-3),…,2(k 8-3)的方差为________. 答案:12解析:设k 1,k 2,…,k 8的平均数为k ,则18[(k 1-k )2+(k 2-k )2+…+(k 8-k )2]=3,而2(k 1-3),2(k 2-3),…,2(k 8-3)的平均数为2(k -3),解析:x 9=x 8+19(x 9-x 8)=5+19×(4-5)=449,s 29=89[s 28+19(x 9-x 8)2]=89[22+19(4-5)2]=29681. 13.下图为我国10座名山的“身高”统计图,请根据图中信息回答下列问题。
2.2.2用样本的数字特征估计总体的数字特征
说出众数,中位数和平均数
讨论探究
某学校高一甲班和高一乙班各有49名学生,两班在一次数学 测试中的成绩统计如下:
班级甲班Leabharlann 平均分79众数
70
中位数
87
标准差
19.8 5.2
79 70 79 乙班 (1)请你对下面的一段话给予简要分析:
甲班的小刚回家对妈妈说:“昨天的数学测验,全班平均分为
79分,得70分的人最多,我得了85分,在班里算是上游了!” (2)请你根据表中的数据,对这两个班的数学测验情况进行简要 分析,并提出建议.
班级
甲班 乙班
平均分
79 79
众数
70 70
中位数
87 79
标准差
19.8 5.2
解:(1)由于甲班49名学生数学测验成绩的中位数是87,则 85分排在全班第25名之后,所以从位次上看,不能说85分是上 游,成绩应该属于中游. 但也不能以位次来判断学习的好坏,小刚得了85分,说明他 对这段的学习内容掌握得较好,从掌握学习的内容上讲,也可 以说属于上游. (2)甲班成绩的中位数是87分,说明高于87分(含87)的人数占 一半以上,而平均分为79分,标准差又很大,说明低分也多, 两极分化严重,建议加强对学习困难的学生的帮助. 乙班的中位数和平均数都是79分,标准差又小,说明学生之 间差别较小,学习很差的学生少,但学生优异的也少,建议采 取措施提高优秀率.
用样本的频率分布估计总体分布
习题课
学习目标 (1)会根据数据列出频率分布表; (2)画出频率分布直方图,并会读取直方 图中的信息
例:对某电子元件进行寿命跟踪调查,情况如下
寿命/h 个数 100—200 200—300 300—400 400—500 500—600 20 30 80 40 30
山东省高中数学《2.2.2 用样本的数字特征估计总体的数字特征》教案2 新人教A版必修3
第2课时标准差导入新课思路1平均数为我们提供了样本数据的重要信息,但是,有时平均数也会使我们作出对总体的片面判断.某地区的统计显示,该地区的中学生的平均身高为176 cm,给我们的印象是该地区的中学生生长发育好,身高较高.但是,假如这个平均数是从五十万名中学生抽出的五十名身高较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身体素质.因此,只有平均数难以概括样本数据的实际状态.所以我们学习从另外的角度来考察样本数据的统计量——标准差.(教师板书课题)思路2在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员:7,8,7,9,5,4,9,10,7,4;乙运动员:9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥得更稳定些吗?如果你是教练,选哪位选手去参加正式比赛?我们知道,x甲=7,x乙=7.两个人射击的平均成绩是一样的.那么,是否两个人就没有水平差距呢?从上图直观上看,还是有差异的.很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们从另外的角度来考察这两组数据——标准差.推进新课新知探究提出问题(1)如何通过频率分布直方图估计数字特征(中位数、众数、平均数)?(2)有甲、乙两种钢筋,现从中各抽取一个标本(如下表)检查它们的抗拉强度(单位:kg/mm2),通过计算发现,两个样本的平均数均为125.甲110 121312512125135125135125乙115 112513115125125145125145哪种钢筋的质量较好?(3)某种子公司为了在当地推行两种新水稻品种,对甲、乙两种水稻进行了连续7年的种植对比实验,年亩产量分别如下:(千克)甲:600, 880, 880, 620, 960, 570, 900(平均773)乙:800, 860, 850, 750, 750, 800, 700(平均787)请你用所学统计学的知识,说明选择哪种品种推广更好?(4)全面建设小康社会是我们党和政府的工作重心,某市按当地物价水平计算,人均年收入达到1.5万元的家庭即达到小康生活水平.民政局对该市100户家庭进行调查统计,它们的人均收入达到了1.6万元,民政局即宣布该市民生活水平已达到小康水平,你认为这样的结论是否符合实际?(5)如何考查样本数据的分散程度的大小呢?把数据在坐标系中刻画出来,是否能直观地判断数据的离散程度?讨论结果:(1)利用频率分布直方图估计众数、中位数、平均数:估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点) 估计中位数:中位数把频率分布直方图分成左右两边面积相等.估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. (2)由上图可以看出,乙样本的最小值100低于甲样本的最小值110,乙样本的最大值145高于甲样本的最大值135,这说明乙种钢筋没有甲种钢筋的抗拉强度稳定.我们把一组数据的最大值与最小值的差称为极差(range ).由上图可以看出,乙的极差较大,数据点较分散;甲的极差小,数据点较集中,这说明甲比乙稳定.运用极差对两组数据进行比较,操作简单方便,但如果两组数据的集中程度差异不大时,就不容易得出结论. (3)选择的依据应该是,产量高且稳产的品种,所以选择乙更为合理.(4)不符合实际.样本太小,没有代表性.若样本里有个别高收入者与多数低收入者差别太大.在统计学里,对统计数据的分析,需要结合实际,侧重于考察总体的相关数据特征.比如,市民平均收入问题,都是考察数据的分散程度.(5)把问题(3)中的数据在坐标系中刻画出来.我们可以很直观地知道,乙组数据比甲组数据更集中在平均数的附近,即乙的分散程度小, 如何用数字去刻画这种分散程度呢? 考察样本数据的分散程度的大小,最常用的统计量是方差和标准差.标准差:考察样本数据的分散程度的大小,最常用的统计量是标准差(standard deviation).标准差是样本数据到平均数的一种平均距离,一般用s 表示. 所谓“平均距离”,其含义可作如下理解:假设样本数据是x 1,x 2,…,x n ,x 表示这组数据的平均数.x i 到x 的距离是|x i -x |(i=1,2,…,n).于是,样本数据x 1,x 2,…,x n 到x 的“平均距离”是S=nx x x x x x n ||||||21-++-+- .由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差: s=])()()[(122221x x x x x x nn -++-+- .意义:标准差用来表示稳定性,标准差越大,数据的离散程度就越大,也就越不稳定.标准差越小,数据的离散程度就越小,也就越稳定.从标准差的定义可以看出,标准差s≥0,当s=0时,意味着所有的样本数据都等于样本平均数.标准差还可以用于对样本数据的另外一种解释.例如,在关于居民月均用水量的例子中,平均数x =1.973,标准差s=0.868,所以x +s=2.841,x +2s=3.709; x -s=1.105,x -2s=0.237.这100个数据中,在区间[x -2s,x +2s ]=[0.237,3.709]外的只有4个,也就是说,[x -2s, x +2s ]几乎包含了所有样本数据.从数学的角度考虑,人们有时用标准差的平方s 2——方差来代替标准差,作为测量样本数据分散程度的工具: s 2=n1[(x 1-x )2+(x 2-x )2+…+(x n -x )2].显然,在刻画样本数据的离散程度上,方差与标准差是一样的.但在解决实际问题时,一般多采用标准差.需要指出的是,现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道的.如何求得总体的平均数和标准差呢?通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.这与前面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.两者都是描述一组数据围绕平均数波动的大小,实际应用中比较广泛的是标准差.如导入中的运动员成绩的标准差的计算器计算.用计算器计算运动员甲的成绩的标准差的过程如下:即s 甲=2.用类似的方法,可得s 乙≈1.095.由s 甲>s 乙可以知道,甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙比甲的射击成绩稳定. 应用示例思路1例1 画出下列四组样本数据的条形图,说明它们的异同点. (1)5,5,5,5,5,5,5,5,5; (2)4,4,4,5,5,5,6,6,6; (3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8. 分析:先画出数据的条形图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组数据的标准差.解:四组样本数据的条形图如下:四组数据的平均数都是5.0,标准差分别是:0.00,0.82,1.49,2.83. 它们有相同的平均数,但它们有不同的标准差,说明数据的分散程度是不一样的.例2 甲、乙两人同时生产内径为25.40 mm 的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm): 甲25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.45 25.38 25.42 25.39 25.43 25.39 25.40 25.44 25.40 25.42 25.35 25.41 25.39 乙25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.49 25.36 25.3425.33 25.43 25.43 25.32 25.47 25.31 25.32 25.32 25.32 25.48从生产的零件内径的尺寸看,谁生产的质量较高?分析:每一个工人生产的所有零件的内径尺寸组成一个总体.由于零件的生产标准已经给出(内径25.40 mm),生产质量可以从总体的平均数与标准差两个角度来衡量.总体的平均数与内径标准尺寸25.40 mm 的差异大时质量低,差异小时质量高;当总体的平均数与标准尺寸很接近时,总体的标准差小的时候质量高,标准差大的时候质量低.这样,比较两人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数与标准差的大小即可.但是,这两个总体的平均数与标准差都是不知道的,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本的平均数、标准差,以此作为两个总体之间差异的估计值. 解:用计算器计算可得甲x ≈25.401,乙x ≈25.406;s 甲≈0.037,s 乙≈0.068.从样本平均数看,甲生产的零件内径比乙的更接近内径标准(25.40 mm),但是差异很小;从样本标准差看,由于s 甲<s 乙,因此甲生产的零件内径比乙的稳定程度高得多.于是,可以作出判断,甲生产的零件的质量比乙的高一些.点评:从上述例子我们可以看到,对一名工人生产的零件内径(总体)的质量判断,与所抽取的零件内径(样本数据)直接相关.显然,我们可以从这名工人生产的零件中获取许多样本.这样,尽管总体是同一个,但由于样本不同,相应的样本频率分布与平均数、标准差等都会发生改变,这就会影响到我们对总体情况的估计.如果样本的代表性差,那么对总体所作出的估计就会产生偏差;样本没有代表性时,对总体作出错误估计的可能性就非常大.这也正是我们在前面讲随机抽样时反复强调样本代表性的理由.在实际操作中,为了减少错误的发生,条件许可时,通常采取适当增加样本容量的方法.当然,关键还是要改进抽样方法,提高样本的代表性. 变式训练某地区全体九年级的3 000名学生参加了一次科学测试,为了估计学生的成绩,从不同学校的不同程度的学生中抽取了100名学生的成绩如下:100分12人,90分30人,80分18人,70分24人,60分12人,50分4人.请根据以上数据估计该地区3 000名学生的平均分、合格率(60或60分以上均属合格). 解:运用计算器计算得:100450126024701880309012100⨯+⨯+⨯+⨯+⨯+⨯=79.40,(12+30+18+24+12)÷100=96%,所以样本的平均分是79.40分,合格率是96%,由此来估计总体3 000名学生的平均分是79.40分,合格率是96%.思路2例1 甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm 2),试根据这组数据估计哪一种水稻品种的产量比较稳定.品种 第1年 第2年 第3年 第4年 第5年 甲 9.8 9.9 10.1 10 10.2 乙9.410.310.89.79.8解:甲品种的样本平均数为10,样本方差为 [(9.8-10)2 +(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]÷5=0.02. 乙品种的样本平均数也为10,样本方差为 [(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]÷5=0.24. 因为0.24>0.02,所以,由这组数据可以认为甲种水稻的产量比较稳定.例2 为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换.已知某校使用的100只日光灯在必须换掉前的使用天数如下,试估计这种日光灯的平均使用寿命和标准差.天数151—180 181—210 211—240 241—270 271—300 301—330 331—360 361—390灯泡数1111820251672分析:用每一区间内的组中值作为相应日光灯的使用寿命,再求平均寿命. 解:各组中值分别为165,195,225,255,285,315,345,375,由此算得平均数约为165×1%+195 ×11%+225×18%+255×20%+285×25%+315×16%+345×7%+375×2%=267.9≈268(天). 这些组中值的方差为1001×[1×(165-268)2+11×(195-268)2+18×(225-268)2+20×(255-268)2+25×(285-268)2+16×(315-268)2+7×(345-268)2+2×(375-268)2]=2 128.60(天2). 故所求的标准差约6.2128≈46(天).答:估计这种日光灯的平均使用寿命约为268天,标准差约为46天. 知能训练 (1)在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为____________.(2)若给定一组数据x 1,x 2,…,x n ,方差为s 2,则ax 1,ax 2,…,ax n 的方差是____________. (3)在相同条件下对自行车运动员甲、乙两人进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:甲 27 38 30 37 35 31 乙 33 29 38 34 28 36试判断选谁参加某项重大比赛更合适? 答案:(1)9.5,0.016 (2)a 2s 2(3)甲x =33,乙x =33,33734722=>=乙甲s s ,乙的成绩比甲稳定,应选乙参加比赛更合适. 拓展提升某养鱼专业户在一个养鱼池放入一批鱼苗,一年以后准备出售,为了在出售以前估计卖掉鱼后有多少收入,这个专业户已经了解到市场的销售价是每千克15元,请问,这个专业户还应该了解什么?怎样去了解?请你为他设计一个方案.解:这个专业户应了解鱼的总重量,可以先捕出一些鱼(设有x 条),作上标记后放回鱼塘,过一段时间再捕出一些鱼(设有a 条),观察其中带有标记的鱼的条数,作为一个样本来估计总体,则鱼塘中鱼的总条数鱼的条数鱼塘中所有带有标记的条鱼中带有标记的条数)(x aa =这样就可以求得总条数,同时把第二次捕出的鱼的平均重量求出来,就可以估计鱼塘中的平均重量,进而估计全部鱼的重量,最后估计出收入. 课堂小结1.用样本的数字特征估计总体的数字特征分两类:用样本平均数估计总体平均数,平均数对数据有“取齐”的作用,代表一组数据的平均水平.用样本标准差估计总体标准差.样本容量越大,估计就越精确,标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度. 2.用样本估计总体的两个手段(用样本的频率分布估计总体的分布;用样本的数字特征估计总体的数字特征),需要从总体中抽取一个质量较高的样本,才能不会产生较大的估计偏差,且样本容量越大,估计的结果也就越精确. 作业习题2.2A 组4、5、6、7,B 组1、2.设计感想统计学科,最大的特点就是与现实生活的密切联系,也是新教材的亮点.仅仅想借助“死记硬背一些概念及公式,简单模仿课本例题”来学习,是绝对不行的.用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差,其原因在于样本的随机性.这种偏差是不可避免的.虽然我们从样本数据得到的分布、均值和标准差并不是总体的真正分布、均值和标准差,而只是总体的一个估计,但这种估计是合理的,特别是当样本的容量很大时,它们确实反映了总体的信息.教师建议:亲身经历“提出问题,收集数据,分析数据,并作出合理决策”过程,在此过程中不仅可以加深对概念等知识的深刻理解,更重要的是发展了思维,培养了分析及解决问题能力,同时在情感、意志等领域也得到了协调发展,这才是学校学习的科学而全面的目标,习题设置有层次,尽量源于教材,又高于教材,这也是高考命题原则.。
用样本的数字特征估算总体的数字特征
(1)多高株苗在这两种玉米中最常见?
(2)哪种玉米要长得高一些?
(3)哪种玉米要长得齐一些?
例1:某校从参加高二年级学业水平测试的学生中抽出80名 学生,其数学成绩(均为整数)的频率分布直方图如图所示.
标准差越小,表示数据越稳定,离散程度越 小;标准差越大,则说明数据差异很大,离 散程度大,不稳定。
随堂练习:下面是甲乙两位运动员在一次射击测试中的10 次成绩。 甲:8 7 9 5 4 9 10 7 4 9 乙:9 5 7 8 6 8 9 7 9 7 你能说说谁的成绩更稳定吗?
随堂练习:下面是甲乙两个品种玉米的株高情况,各抽10 柱,情况为:(单位:cm)
5、平均数:将样本中所有数据求和之后,除以样本中 个体的个数,得到的结果。它是最常用的表现数据平均 水平的量。
随堂练习:下面是甲乙两位运动员在一次射击测试中 的10次成绩。 甲:8 7 9 5 4 9 10 7 4 9 乙:9 5 7 8 6 8 9 7 9 7 1、计算甲乙二人的平均成绩,说说谁的更好。 2、甲乙二人的射击成绩中,中位数是多少?众数呢? 对于选手来说,稳定性也很重要,有没有什 么数据能够说明样本的稳定性的?
变式题:为了调查某厂工人生产某种产品的能力,随机抽查了 20位工人某天生产该产品的数量得到频率分布直方图如图, 则 (2)这20名工人中一天生产该产品数量的中位数、众数和平均 数分别为多少?
(1)这20名工人中一天生产该产品数量在数;
(2)求这次测试数学成绩的平均数;
(1)利用直方图估算众数, (3)求这次测试数学成绩的中位数。 即频数最高区域两端点的平 均值。 (2)利用直方图估算平均数,将各组 的两端点的平均值作为各组的平均数。 (3)利用直方图估算中 位数,利用中位数左边右 边各占一半,故直方图面 积也应该各占50%。
2.2.2用样本的数字特征估计总体的
25.49 25.32
从生产零件内径的尺寸看,谁生产的零件质量 ks5u精品课件 较高?
x 甲 » 25.401 s甲 » 0.037
x 乙 » 25.406
s乙 » 0.068
甲生产的零件内径更接近内径标准,且稳定 程度较高,故甲生产的零件质量较高.
说明:1.生产质量可以从总体的平均数与标准差 两个角度来衡量,但甲、乙两个总体的平均数与 标准差都是不知道的,我们就用样本的平均数与 标准差估计总体的平均数与标准差. 2.问题中25.40mm是内径的标准值,而不是 总体的平均数.
ks5u精品课件
例5 有20种不同的零食,它们的热量 含量如下: 110 120 123 165 432 190 174 235 428 318 249 280 162 146 210 120 123 120 150 140 (1)以上20个数据组成总体,求总体平 均数与总体标准差; (2)设计一个适当的随机抽样方法,从 总体中抽取一个容量为7的样本,计算样 本的平均数和标准差.
(3)
O
1Байду номын сангаас2 3 4 5 6 7 8
(4)
ks5u精品课件
例2 甲、乙两人同时生产内径为25.40mm的一种 零件,为了对两人的生产质量进行评比,从他们 生产的零件中各随机抽取20件,量得其内径尺寸 如下(单位:mm):
甲 : 25.46 25.45 25.44 乙: 25.40 25.49 25.47 25.32 25.38 25.40 25.43 26.36 25.31 25.45 25.42 25.42 25.44 25.34 25.32 25.39 25.39 25.35 25.48 25.33 25.32 25.36 25.43 25.41 25.48 25.43 25.32 25.34 25.39 25.39 25.47 25.43 25.48 25.42 25.40
2.2.2用样本的数字特征估计总体的数字特征
甲的环数极差=10- 4=6 甲的环数极差=10- 4=6 =10
乙的环数极差=9-5=4 乙的环数极差=9-5=4. =9
它们在一定程度上表明了样本数据的分散程度, 它们在一定程度上表明了样本数据的分散程度,与平均 数一起,可以给我们许多关于样本数据的信息.显然, 数一起,可以给我们许多关于样本数据的信息.显然,极差对极端 值非常敏感,注意到这一点,我们可以得到一种“去掉一个最高 值非常敏感,注意到这一点,我们可以得到一种“ 去掉一个最低分”的统计策略. 分,去掉一个最低分”的统计策略. 考察样本数据的分散程度的大小,最常用的统计量是标准 考察样本数据的分散程度的大小,最常用的统计量是标准 标准差是样本数据到平均数的一种平均距离,一般用s 是样本数据到平均数的一种平均距离 差.标准差是样本数据到平均数的一种平均距离,一般用s表 示. 所谓“平均距离” 其含义可作如下理解: 所谓“平均距离”,其含义可作如下理解:
频率 组距
0.5 0.4 0.3 0.2 0.1 O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)
2、在样本中,有50%的个体小于或等于 在样本中, 50% 中位数,也有50 50% 中位数,也有50%的个体大于或等于中位 因此,在频率分布直方图中, 数,因此,在频率分布直方图中,中位数 左边和右边的直方图的面积应该相等,由 左边和右边的直方图的面积应该相等, 此可以估计中位数的值。 此可以估计中位数的值。下图中虚线代表 居民月均用水量的中位数的估计值, 居民月均用水量的中位数的估计值,此数 据值为2.02t. 据值为2.02t.
人员 工 月 资 人数 合计 理 理 员 工 人 徒 合 经 管 人 技 工 学 计
张 计 发 表 资 总 均 恰 中 小 通 算 现 关工 的 平 数 为 ( × + × + × + × )÷ = 没 错 并 有 .
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§2.2.2用样本的数字特征估计总体的数字特征学习目标(1)正确理解样本数据标准差的意义和作用,学会计算数据的标准差。
(2)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释。
(3)会用样本的基本数字特征估计总体的基本数字特征。
(4)形成对数据处理过程进行初步评价的意识。
重点难点重点:用样本平均数和标准差估计总体的平均数与标准差。
难点:能应用相关知识解决简单的实际问题。
学法指导在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法。
知识链接用样本的频率分布去估计总体的分布,当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图。
问题探究一、情景设置:美国NBA在2006——2007年度赛季中,甲、乙两名篮球运动员在随机抽取的12场比赛中的得分情况如下:甲运动员得分:12,15,20,25,31,31,36,36,37,39,44,49.乙运动员得分:8,13,14,16,23,26,28,38,39,51,31,29.如果要求我们根据上面的数据,估计、比较甲,乙两名运动员哪一位发挥得比较稳定,就得有相应的数据作为比较依据,即通过样本数据对总体的数字特征进行研究,用样本的数字特征估计总体的数字特征.二、探究新知:知识探究(一):众数、中位数和平均数思考1:在初中我们学过众数、中位数和平均数的概念,这些数据都是反映样本信息的数字特征,对一组样本数据如何求众数、中位数和平均数?思考2:在城市居民月均用水量样本数据的频率分布直方图中(参考课本72页图2-2-5),你认为众数应在哪个小矩形内?由此估计总体的众数是什么?思考3:在频率分布直方图中,每个小矩形的面积表示什么?中位数左右两侧的直方图的面积应有什么关系?思考4:在城市居民月均用水量样本数据的频率分布直方图中,从左至右各个小矩形的面积分别是0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02.由此估计总体的中位数是什么?思考5:平均数是频率分布直方图的“重心”,在城市居民月均用水量样本数据的频率分布直方图中,各个小矩形的重心在哪里?从直方图估计总体在各组数据内的平均数分别为多少? 思考6:根据统计学中数学期望原理,将频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积相加,就是样本数据的估值平均数. 由此估计总体的平均数是什么?思考7:从居民月均用水量样本数据可知,该样本的众数是 2.3,中位数是 2.0,平均数是1.973,这与我们从样本频率分布直方图得出的结论有偏差,你能解释一下原因吗?思考8:一组数据的中位数一般不受少数几个极端值的影响,这在某些情况下是一个优点,但它对极端值的不敏感有时也会额成为缺点,你能举例说明吗?样本数据的平均数大于(或小于)中位数说明什么问题?你怎样理解“我们单位的收入水平比别的单位高”这句话的含义?知识探究(二):标准差样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息. 平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.当样本数据质量比较差时,使用众数、中位数或平均数描述数据的中心位置,可能与实际情况产生较大的误差,难以反映样本数据的实际状况,因此,我们需要一个统计数字刻画样本数据的离散程度.思考1:在一次射击选拔赛中,甲、乙两名运动员各射击10次,每次命中的环数如下: 甲:7 8 7 9 5 4 9 10 7 4乙:9 5 7 8 7 6 8 6 7 7甲、乙两人本次射击的平均成绩分别为多少环?思考2:甲、乙两人射击的平均成绩相等,观察两人成绩的频率分布条形图,你能说明其水平差异在那里吗?思考3:对于样本数据x1,x2,…,xn ,设想通过各数据到其平均数的平均距离来反映样本数据的分散程度,那么这个平均距离如何计算?频率0.4 0.3 0.2 0.1 4 5 6 7 8 9 10 环数O (甲)环数 频率 0.40.3 0.2 0.14 5 6 7 8 9 O (乙)思考4:反映样本数据的分散程度的大小,最常用的统计量是标准差,一般用s 表示.假设样本数据x1,x2,…,nx 的平均数为,则标准差的计算公式是:那么标准差的取值范围是什么?标准差为0的样本数据有何特点?思考5:对于一个容量为2的样本:()1212,x x x x 〈, 则1221,22x x x x x s +-==在数轴上,这两个统计数据有什么几何意义?由此说明标准差的大小对数据的离散程度有何影响?知识补充:1.标准差的平方称为方差,有时用方差代替标准差测量样本数据的离散度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差.2.现实中的总体所包含的个体数往往很多,总体的平均数与标准差是未知的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性.3.3.对于城市居民月均用水量样本数据,其平均数 1.973x =,标准差s=0.868.在这100个数据中,落在区间(),x s x s -+=[1.105,2.841]外的有28个;落在区间()2,2x s x s -+=[0.237,3.709]外的只有4个; 落在区间()3,3x s x s -+=[-0.631,4.577]外的有0个.一般地,对于一个正态总体,数据落在区间(),x s x s -+、()2,2x s x s -+、()3,3x s x s -+内的百分比分别为68.3%、95.4%、99.7%,这个原理在产品质量控制中有着广泛的应用(参考教材P79“阅读与思考”).三、典例分析:例 1 计算甲、乙两名运动员的射击成绩的标准差,比较其射击水平的稳定性.甲:7 8 7 9 5 4 9 10 7 4乙:9 5 7 8 7 6 8 6 7 7例 2 画出下列四组样本数据的条形图,说明他们的异同点. (1) 5,5,5,5,5,5,5,5,5;(2) 4,4,4,5,5,5,6,6,6;(3) 3,3,4,4,5,6,6,7,7;(4) 2,2,2,2,5,8,8,8,8.分析:先画出数据的直方图,22212()()()n x x x x x x s n-+-++-=L根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组数据的标准差。
例3甲、乙两人同时生产内径为25.40mm的一种零件,为了对两人的生产质量进行评比,从他们生产的零件中各随机抽取20件,量得其内径尺寸如下(单位:mm):甲:25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.45 25.38 25.42 25.39 25.43 25.39 25.40 25.44 25.40 25.42 25.35 25.41 25.39乙:25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.49 26.36 25.34 25.33 25.43 25.43 25.32 25.47 25.31 25.32 25.32 25.32 25.48从生产零件内径的尺寸看,谁生产的零件质量较高?(参考课本P77)例4以往招生统计显示,某所大学录取的新生高考总分的中位数基本稳定在550分,若某同学今年高考得了520分,他想报考这所大学还需收集哪些信息?例5 有20种不同的零食,它们的热量含量如下:110 120 123 165 432 190 174 235 428 318 249 280 162 146 210 120 123 120 150 140 (1)以上20个数据组成总体,求总体平均数与总体标准差;(2)设计一个适当的随机抽样方法,从总体中抽取一个容量为7的样本,计算样本的平均数和标准差.目标检测1、下列刻画一组数据离散程度的是()A.平均数B.方差C.中位数D.众数2、下列说法错误的是( ) A.一个样本的众数、中位数、平均数不可能是同一个数 B 统计中,我们可以用样本平均数去估计总体平均数 C.样本平均数既不可能大于,也不可能小于这个数中的所有数据 D.众数、中位数、平均数从不同的角度描述了一组数据的集中趋势3、若m 个数的平均数是x ,n 个数的平均数是y ,则这m+n 个数的平均数是 ( )A .2x y +B .x y m n ++C .mx ny m n ++D .mx ny x y++4、某同学历次数学考试成绩是95,98,92,83,91和92,则他取得的数学成绩的平均数、中位数、众数、极差和标准差分别是 ( ) A.91.8,92,92,15,4.60 B.92,92,92,15,5.60C.91.8,91,92,15,4.60D.91,92,92,18,4.605、某校高一年级进行一次数学测试,抽取40人,算出平均成绩为80分,为准确起见,后来又抽取50人,算出其平均成绩为83分。
通过两次抽样结果,估计这次数学测验成绩为( )A 、81.7分B 、81.5分C 、 80分D 、83分6、在一次歌手大奖赛上,五位评委为某歌手打出的分数如下:9.4,8.4,9.9,9.6,9.5,去掉一个最高分和一个最低分后,所剩数据的平均值和标准差分别为 ( )A.9.4, 0.1B.9.4,0.01C.9.5, 0.1D.9.5,0.017、甲、乙两台机器同时生产 一种零件,现要检验它们的运 行情况,统计10天中两台机器每天出次品数分别是甲:0,1,0,2,2,0,3,1,2,4;乙:2,3,1,1,0,2,1,1,0,1.则出次品数较少的为( ) A.甲 B.乙 C.相同 D.不能确定 8、.已知一组数54321,,,,x x x x x 的平均数是2,方差是31,那么另一组数据1232,32,x x -- 34532,32,32x x x ---的平均数和方差分别是 ( )A.2,31 B.2,1 C.4,32D.4,3 9、计算:(1)1,2,3,4,5,6,7,8,9的方差 2s = 标准差s= ; ( 2 )10,20,30,40,50,60,70,80,90的方差2s = ,标准差s= . 试比较两组数据的计算结果,得到的一般结论是10、已知样本101,100,99,x ,y 的平均数为100,方差为2,这个样本中的数据x 和y的值分别是 ,11、(选做)如果5个从小到大的整数所组成的数组的中位数是4,这个组唯一的众数是6,那么这个数组全体数字的和的最大值为 。