高二理科数学《2.2.2用样本数字特征估计总体数字特征》
高中数学2.2.2 用样本的数字特征估计总体的数字特征1
2.(1)由平均数公式得 x=
(182×27+80×21)≈81.13(分).
48
(2)因为男生的中位数是75分,所以至少有14人得分不超过75
分.
又因为女生的中位数是80分,所以至少有11人得分不超过80分.
所以全班至少有25人得分不超过80分.
(3)男生的平均分与中位数的差别较大,说明男生中两极分化现
2.2.2 用样本的数字特征估计总体的数字特征
1.正确理解样本数据标准差的意义和作用,学会计算数据的标 准差. 2.能根据实际问题的需要合理地选取样本,从样本数据中提取 基本的数字特征(如平均数、标准差),并作出合理的解释. 3.会用样本的基本数字特征估计总体的基本数字特征,形成对 数据处理过程进行初步评价的意识.
x1 x2 xn
则 x =_______n_______.
2.方差、标准差 假设样本数据是x1,x2,x3,…,xn, x 是平均数,则 (1)方差是
s2=__n1[___x1___x_2____x_2 __x__2 ______x_n__x__2_].
(2)标准差为
s=__n1_[__x_1__x__2___x_2___x_2____ __x_n___x__2 ]_.
【解题指南】1.由平均数和方差的定义直接求解.
2.先画出茎叶图,再利用平均数和方差结合的形式分析稳定性.
【自主解答】1.
s2
1 [ 21
a1
x
2
a2 x
2
a20 x
2
xx
2
]
1 20 0.20 4 0.19.
21
21
答案:0.19
2.(1)作出茎叶图如下:
(2)派甲参赛比较合适.理由如下:
高中数学必修三_2.2.2用样本数字特征估计总体的数字特征
组长评价: 教师评价:§2.2.2用样本的数字特征估计总体的数字特征编者:1.正确理解样本数据众数、中位数、平均数、标准差的意义和作用。
2.通过具体的实例,会用样本的基本数字特征估计总体的基本数字特征。
3.激情投入,积极思考,勇于发言,培养科学的态度和正确的价值观。
重点:用样本众数、中位数、平均数、标准差估计总体的平均数与标准差。
难点:能通过样本的数字特征估计总体的分布。
使用说明: (1)预习教材P 65 ~ P 71,用红色笔画出疑惑之处,并尝试完成下列问题,总结规律方法;(2)用严谨认真的态度完成导学案中要求的内容; (3)不做标记的为C 级,标记★为B 级,标记★★为A 级。
预习案(20分钟)一.知识链接在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕ 甲运动员﹕7,8,6,8,6,5,8,10,7,4; 乙运动员﹕9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究。
——用样本的数字特征估计总体的数字特征。
二.新知导学问题1:什么叫平均数?有什么意义?什么叫中位数?有什么意义? 什么叫众数?有什么意义?问题2:什么叫极差?有什么意义?什么叫标准差?有什么意义?探究案(30分钟)三.新知探究【知识点一】(★)众数、中位数、平均数、标准差的意义例1:某公司员工的月工资情况如表所示:分别计算该公司员工月工资的平均数、中位数、和众数。
例2:从甲、乙两个城市随机抽取的16台自动售货机的销售额可以用茎叶图表示,如图(1)甲乙两组数据的中位数、众数、极差分别是多少?(2)你能从图中分别比较甲乙两组数据平均数和标准差的大小吗?【知识点二】利用众数、中位数、平均数、标准差对总体进行估计例3:甲、乙两台机床同时生产直径是40mm的零件。
为了检验产品质量,从两台机床生产的产品中各抽取10件进行测量,结果如下表所示你能选择适当的数来估计甲、乙两台机床的优劣情况吗?四.我的疑惑(把自己在使用过程中遇到的疑惑之处写在下面,先组内讨论尝试解决,能解决的划“√”,不能解决的划“×”)(1)()(2)()(通过解决本节导学案的内容和疑惑点,归纳一下自己本节的收获,和大家交流一下,写下自己的所得)随堂评价(15分钟)※自我评价你完成本节导学案的情况为().A. 很好B. 较好C. 一般D. 较差※当堂检测(时量:15分钟满分:30分)计分:1.回答下列问题(1)平均数描述了数据的,定量地放映了数据的集中趋势所处的水平;(2)一般的,称为平均数或均值;(3)数据的离散程度可以用来描述;(4)一般地,称为样本标准差。
课件4:2.2.2 用样本的数字特征估计总体的数字特征
利用频率分布直方图求数字特征 (1)众数是最高的矩形的底边的中点. (2)中位数左右两侧直方图的面积相等. (3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐 标. (4)利用直方图求众数、中位数、平均数均为近似值,往往与实 际数据得出的不一致.但它们能粗略估计其众数、中位数和平 均数.
2.(1)(2016·福建检测)为了普及环保知识,增强环 保意识,某大学随机抽取 30 名学生参加环保知识测试,得分(十 分制)如图所示,假设得分值的中位数为 me,众数为 m0,平均 值为-x ,则( D )
2.标准差与方差 (1)标准差:标准差是样本数据到平均数的一种平均距离,一般 用 s 表示,计算时通常用公式
s=__________________________________________ 显然,标准差越大,数据的离散程度越大;标准差越小,数据 的离散程度越小. (2)方差:标准差 s 的平方 s2,即 s2= _n1_[_(x_1_-__-_x_)_2+__…__+__(_x_n_-__-x__)2_]_____叫做这组数据的方差,同标准 差一样,方差也是用来测量样本数据的分散程度的特征数.
3.平均数受样本中的每一个数据的影响,“越离群”的数据, 对平均数的影响也越大.与众数和中位数相比,平均数代表了 数据更多的信息.当样本数据质量比较差时,使用平均数描述 数据的中心位置可能与实际情况产生较大的误差.可以利用计 算机模拟样本,向学生展示错误数据对样本平均数的影响程 度.在体育、文艺等各种比赛的评分中,使用的是平均数.计 分过程中采用“去掉一个最高分,去掉一个最低分”的方法, 就是为了防止个别裁判的人为因素而给出过高或过低的分数对 选手的得分造成较大的影响,从而降低误差,尽量保证公平性.
合计
2.2.2用样本的数字特征估计总体的数字特征
5
= 0.02
x乙
2
s乙 = [(9 .4 − 10 ) + (10 .3 − 10 ) + (10 .8 − 10 ) + (9.7 − 10 ) + (9 .8 − 10 ) 2 ] ÷ 5 = 0.24
2 2 虽然 x甲 = x乙,但是 S甲 < S乙 所以甲水稻的产量比较 稳定。
1 = ( 9 . 4 + 10 . 3 + 10 . 8 + 9 . 7 + 9 . 8 ) = 10 5 2 2 2 2
可将众数看作直方图中面积最大长方形的“中心” 可将众数看作直方图中面积最大长方形的“中心”
频率 组距
0.6 0.5
如何在频率分布直方图中估计中位数 可将中位数看作整个直方图面积的“中心” 可将中位数看作整个直方图面积的“中心” 前四个小矩形的 面积和=0.49 面积和 后四个小矩形的 面积和=0.26 面积和
平均数、方差的运算性质: 平均数、方差的运算性质: 如果数据
2
方差为 s ,则
x1, x2 , ⋅⋅⋅, xn 的平均数为 x
2
,
(1)新数据 x1 + b, x2 + b, ⋅⋅⋅, xn + b 的平均数为
x + b,方差仍为
s
.
(3)新数据 ax1 + b, ax2 + b, ⋅⋅⋅, axn + b 的平均数为 ax + b 方差为a2s2 . ,
标准差, 称为这个样本的标准差 分别称为样本方差、 称为这个样本的标准差,分别称为样本方差、样本标准差
样本中各数据与样本平均数的差的平方 和的平均数叫做样本方差 样本方差; 和的平均数叫做样本方差;样本方差的 算术平方根叫做样本标准差 样本标准差。 算术平方根叫做样本标准差。样本方差 和样本标准差都是衡量一个样本波动大 和样本标准差都是衡量一个样本波动大 的量,样本方差或样本标准差越大, 小的量,样本方差或样本标准差越大, 样本数据的波动就越大。 样本数据的波动就越大。
2.2.2用样本数字特征估计总体数字特征
(C)中位数
(D)标准差
样本的众数、中位数和平均数常用来表 示样本数据的“中心值”,其中众数和中位 数容易计算,但只能表达样本数据中的少量 信息. 平均数代表了数据更多的信息,但受 样本中每个数据的影响,越极端的数据对平 均数的影响也越大.
因此,我们需要一个统计数字刻画样本 数据的离散程度(波动程度).
方差:
S 2 (x1 x)2 (x2 x)2 ...... (xn x)2
则7个剩余分数的方差为?
(A) 116
9
(B) 36
7
(C) 36
(D) 6 7
7
【201山东文】某次测量中得到的A样本数
据如下:82,84,84,86,86,86,
88,88,88,88. 若B样本数据恰好是A
样本数据都加 2后所得数据,则A,B两
样本的下列数字特 征对应相同的是?
(A)众数
(B)平均数
(3)若k1,k2,…, k8的方差为3,则2(k1-3),
2(k2-3), …, 2(k8-3)的方差为____1_2___
【2013山东文】将某选手的9个得分 去掉1个最高分,去掉1个最低分, 7个剩余分数的平均分为91,现场做 的9个分数的茎叶图后来有一个数据 模糊,无法辨认,在图中以x表示。
乙:9 5 7 8 7 6 8 6 7 7
因为s甲=2,s乙=1.095. 所以乙的成绩更稳定
练习:
(1)若x1, x2 , , xn的方差为4,那么
x1 3, x2 3, , xn 3的方差为_4___
(2)若x1, x2 , , xn的方差为2,那么 这组数据均乘以4后的方差为 __3_2_
ห้องสมุดไป่ตู้
标准差:
2.2.2用样本的数字特征估计总体的数字特征
§2.2.2用样本的数字特征估计总体的数字特征目标要求:1.会求样本的众数、中位数、平均数、标准差、方差.2.理解用样本的数字特征来估计总体数字特征的方法.3.会应用相关知识解决简单的统计实际问题.基础梳理:1.有关概念(1)众数:在一组数据中,出现_____最多的数据(即频率分布最大值所对应的样本数据)叫这组数据的众数.若有两个或两个以上的数据出现得最多,且出现的次数一样,则这些数据都叫众数;若一组数据中每个数据出现的次数一样多,则没有众数.(2)中位数:将一组数据按大小依次排列,把处在_______位置的一个数据(或两个数据的平均数)叫这组数据的中位数.2. 标准差由于平均距离中含有绝对值,运算不太方便,因此改用如下公式来计算标准差S =____________________________________________________________________显然,标准差越大,数据的离散程序越大;标准差越小,数据的离散程序越小.所以标准差可以用来刻画数据的分散程度的大小.对众数、中位数、平均数的理解(1)众数通常用来表示样本数据的中心值,容易计算.但是它只能表达样本数据中很少的一部分信息,通常用于描述样本数据的中心位置.(2)中位数不受少数几个极端数据(即排序靠前或靠后的数据)的影响,容易计算,它仅利用了中间数据的信息.当样本数据质量比较差,即存在一些错误数据时,应该用抗极端性很强的中位数表示数据的中心值.(3)平均数受样本中的每一个数据的影响,“越离群”的数据,对平均数的影响也越大.与众数和中位数相比,平均数代表了数据更多的信息.当样本数据质量比较差时,使用平均数描述数据的中心位置可能与实际情况产生较大的误差.(4)如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之说明数据中存在许多较小的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中极端数据的信息.(3)平均数:指样本数据的算术平均数. 即x -=1n (x 1+x 2+…+x n ).2.对标准差和方差的理解(1)样本标准差反映了各样本数据聚集于样本平均值周围的程度,标准差越小,表明各个样本数据在样本平均数周围越集中;反之,标准差越大,表明各样本数据在样本平均数的两边越分散.(2)当样本的平均数相等或相差无几时,就要用样本数据的离散程度来估计总体的数字特征,而样本数据的离散程度,就由标准差来衡量.(3)数据的离散程度可以通过极差、方差或标准差来描述.极差反映了一组数据变化的最大幅度,它对一组数据中的极端值非常敏感,方差则反映了一组数据围绕平均数波动的大小.为了得到以样本数据的单位表示的波动幅度,通常用标准差——样本方差的算术平方根来描述.(4)标准差的大小不会越过极差.(5)方差、标准差、极差的取值范围:[0,+∞).当标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性.(6)因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差和标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般采用标准差.典例分析:例1.高一(3)班有男同学27名,女同学21名,在一次语文测验中,男同学的平均分是82分,中位数是75分,女同学的平均分是80分,中位数是80分.(1)求这次测验全班平均分(精确到0.01);(2)估计全班成绩在80分以下(含80分)的同学至少有多少人?(3)分析男同学的平均分与中位数相差较大的主要原因是什么?跟踪练习1:某校在一次考试中,甲、乙两班学生的数学成绩统计如下:分数50 60 70 80 90 100甲班 1 6 12 11 15 5人数乙班 3 5 15 3 13 11选用平均数与众数、中位数评估这两个班的成绩?例2:甲、乙两机床同时加工直径为100 cm的零件,为检验质量,各从中抽取6件测量,数据为:甲:9910098100100103乙:9910010299100100(1)分别计算两组数据的平均数及方差;(2)根据计算结果判断哪台机床加工零件的质量更稳定.跟踪练习2:从甲、乙两种玉米苗中各抽10株,分别测得它们的株高如下:(单位:cm) 甲:25414037221419392142乙:27164427441640401640问:(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得齐?当堂检测:1.下面是高一(18)班十位同学的数学测试成绩:82,91,73,84,98,99,101,118,98,110,则该组数据的中位数是().A.98 B.99 C.98.5 D.97.52.某学习小组在一次数学测验中,得100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各有1人,则该小组成绩的平均数、众数、中位数分别是().A.85,85,85 B.87,85,86C.87,85,85 D.87,85,903.为了让人们感受丢弃塑料袋对环境造成的影响,某班环保小组的六名同学记录了自己家中一周内丢弃的塑料袋的数量,结果如下(单位:个):33,25,28,26,25,31.如果该班有45名学生,那么根据提供的数据估计本周全班同学各家总共丢弃塑料袋的数量约为().A.900个B.1 080个C.1 260个D.1 800个4.已知样本9,10,11,x,y的平均数是10,标准差是2,则xy=________.5.若40个数据的平方和是56,平均数是22,则这组数据的方差是________,标准差是________.6.在一次歌手大奖赛中,8位评委现场给每位歌手打分,然后去掉一个最高分和一个最低分,其余分数的平均数作为该歌手的成绩,已知8位评委给某位歌手的打分是:9.29.59.49.69.89.58.19.5比较这8位评委的实际平均分和该歌手的成绩,有何体会?。
2.2.2 用样本的数字特征估计总体的数字特征标准差
标准差
平均数向我们提供了样本数据的重要信息,但是 平均数向我们提供了样本数据的重要信息 但是 平均有时也会使我们作出对总体的片面判断. 平均有时也会使我们作出对总体的片面判断.因 为这个平均数掩盖了一些极端的情况, 为这个平均数掩盖了一些极端的情况,而这些极 端情况显然是不能忽的.因此, 端情况显然是不能忽的.因此,只有平均数还难 以概括样本数据的实际状态. 以概括样本数据的实际状态. 如:有两位射击运动员在一次射击测试中各 射靶10次 每次命中的环数如下: 射靶 次,每次命中的环数如下:
考察样本数据的分散程度的大小, 考察样本数据的分散程度的大小,最常用的统计量是 标准差. 标准差. 标准差是样本平均数的一种平均距离,一般用s表示 表示. 标准差是样本平均数的一种平均距离,一般用 表示. 所谓“平均距离” 其含义可作如下理解: 所谓“平均距离”,其含义可作如下理解: 假设样本数据是 x1 , x 2 ,⋅ ⋅ ⋅, x n , x 表示这组数据的平均 的距离是: 数,则 x i 到 x 的距离是: 则 的平均距离是: 于是样本数据 x1 , x 2 ,⋅ ⋅ ⋅, x n 到 x 的平均距离是:
甲 25.46, 25.32, 25.45, 25.39, 25.36 25.34, 25.42, 25.45, 25.38, 25.42 25.39, 25.43, 25.39, 25.40, 25.44 乙 25.40, 25.42, 25.35, 25.41, 25.39 25.40, 25.43, 25.44, 25.48, 25.48 25.47, 25.49, 25.49, 25.36, 25.34 25.33, 25.43, 25.43, 25.32, 25.47 25.31, 25.32, 25.32, 25.32, 25.48
2.2.2 用样本的数字特征去估计总体的数字特征(第一课时)
自学检测:
1.什么是众数、中位数、平均数? 众 数: 一组数中出现次数最多的数.
的值分别为( )
A.2,5
B.5,5
C.5,8
D.8,8
2.(2013 山东临沂高三 3 月质检)从某中学高三年级甲、乙两个 班中各选出 7 名学生参加数学竞赛,他们取得的成绩(满分 100 分)的 茎叶图如图,其中甲班学生成绩的众数是 85,乙班学生成绩的中位数 是 83,则 x+y 的值为( )
新知探究(二):众数、中位数和平均数的特征分析
探究4 :一个企业中,绝大多数是一线工人,他们的年收入可能是两 万元左右,另外有一些经理层次的人,年收入可以达到几十万元.这个企 业每年都要到人力市场去招聘工人,应聘者可能会问及企业员工的年 “收入水平”问题.
问题1:假若你是老板,你对企业员工的年“收入水平”会怎样回答? 问题2:从实际情况来看,你认为用哪种数字特征来反映该企业员工的 年“收入水平”相对合理些? 问题3:如果该企业员工年收入是2.5万元的人数最多,你认为一个新 来的打工仔的年收入可能会是怎样?
它反映的往往是局部较集中的数据信息
中位数:将一组数据按大小依次排列,把处在最中间位置的 一个数据(或最中间两个数据的平均数)叫做这组 数据的中位数. 它是位置型数,反映处于中间部位的数据信息
平均数:将所有数相加再除以这组数的个数,所得到得数 它反映所有数据的平均水平
2.众数、中位数和平均数分别能反映样本数据的哪些 数字特征?
2.2.2用样本的数字特征估计总体的数字特征
件中各抽出20件, 量得其内径尺寸如下 (单位: mm):
甲 分25析.46: 评25定.3两2 人2所5.4生5产2零5.件39的质25量.36高低, 主要是看
是否符25合.34规定25尺.4寸2 . 2与5.规45定尺25寸.38偏离25很.42小, 则质量高;
与规定2255尺..3490寸的2255偏..44离32 大22,55..33则95 质22量55..低4401.
1.0
0.9
0.8 0.7
x5
①求平均数. 平均数相同.
(2) 4, 4, 4, 5, 5, 5, 6, 6, 6;
0.6 s0.00
0.5
②求标准差
(3) 3, 3, 4由, 4标, 5准, 6差, 6看, 出7, (71;)组均匀00程..34 度最好, (4)组最差.
(4) 2, 2, 2, 2, 5, 8, 8, 8, 8.
25.44 25.39
乙 检25测.40偏离25程.4度3 的2大5.4小4, 2就5.要48计算25其.48标准差.
25.47 25.49 25.49 25.36 25.34
25.33 25.43 25.43 25.32 25.47
25.31 25.32 25.32 25.32 25.48
从生产的零件内径尺寸看, 谁生产的质量较高?
上例中两运动员射击成绩的条形图如图:
频率
频率
0.4
0.4
0.3
0.3
0.2
0.2
0.1
0.1
4 5 6 7 8 9 10 环数
(甲)
4 5 6 7 8 9 10 环数
(乙)
频率
例1. 画出下列四组样本数据 的条形图, 说明它们的异同点. (1) 5, 5, 5, 5, 5, 5, 5, 5, 5;
用样本的数字特征估算总体的数字特征
(1)多高株苗在这两种玉米中最常见?
(2)哪种玉米要长得高一些?
(3)哪种玉米要长得齐一些?
例1:某校从参加高二年级学业水平测试的学生中抽出80名 学生,其数学成绩(均为整数)的频率分布直方图如图所示.
标准差越小,表示数据越稳定,离散程度越 小;标准差越大,则说明数据差异很大,离 散程度大,不稳定。
随堂练习:下面是甲乙两位运动员在一次射击测试中的10 次成绩。 甲:8 7 9 5 4 9 10 7 4 9 乙:9 5 7 8 6 8 9 7 9 7 你能说说谁的成绩更稳定吗?
随堂练习:下面是甲乙两个品种玉米的株高情况,各抽10 柱,情况为:(单位:cm)
5、平均数:将样本中所有数据求和之后,除以样本中 个体的个数,得到的结果。它是最常用的表现数据平均 水平的量。
随堂练习:下面是甲乙两位运动员在一次射击测试中 的10次成绩。 甲:8 7 9 5 4 9 10 7 4 9 乙:9 5 7 8 6 8 9 7 9 7 1、计算甲乙二人的平均成绩,说说谁的更好。 2、甲乙二人的射击成绩中,中位数是多少?众数呢? 对于选手来说,稳定性也很重要,有没有什 么数据能够说明样本的稳定性的?
变式题:为了调查某厂工人生产某种产品的能力,随机抽查了 20位工人某天生产该产品的数量得到频率分布直方图如图, 则 (2)这20名工人中一天生产该产品数量的中位数、众数和平均 数分别为多少?
(1)这20名工人中一天生产该产品数量在数;
(2)求这次测试数学成绩的平均数;
(1)利用直方图估算众数, (3)求这次测试数学成绩的中位数。 即频数最高区域两端点的平 均值。 (2)利用直方图估算平均数,将各组 的两端点的平均值作为各组的平均数。 (3)利用直方图估算中 位数,利用中位数左边右 边各占一半,故直方图面 积也应该各占50%。
2.2.2用样本的数字特征估计总体的
25.49 25.32
从生产零件内径的尺寸看,谁生产的零件质量 ks5u精品课件 较高?
x 甲 » 25.401 s甲 » 0.037
x 乙 » 25.406
s乙 » 0.068
甲生产的零件内径更接近内径标准,且稳定 程度较高,故甲生产的零件质量较高.
说明:1.生产质量可以从总体的平均数与标准差 两个角度来衡量,但甲、乙两个总体的平均数与 标准差都是不知道的,我们就用样本的平均数与 标准差估计总体的平均数与标准差. 2.问题中25.40mm是内径的标准值,而不是 总体的平均数.
ks5u精品课件
例5 有20种不同的零食,它们的热量 含量如下: 110 120 123 165 432 190 174 235 428 318 249 280 162 146 210 120 123 120 150 140 (1)以上20个数据组成总体,求总体平 均数与总体标准差; (2)设计一个适当的随机抽样方法,从 总体中抽取一个容量为7的样本,计算样 本的平均数和标准差.
(3)
O
1Байду номын сангаас2 3 4 5 6 7 8
(4)
ks5u精品课件
例2 甲、乙两人同时生产内径为25.40mm的一种 零件,为了对两人的生产质量进行评比,从他们 生产的零件中各随机抽取20件,量得其内径尺寸 如下(单位:mm):
甲 : 25.46 25.45 25.44 乙: 25.40 25.49 25.47 25.32 25.38 25.40 25.43 26.36 25.31 25.45 25.42 25.42 25.44 25.34 25.32 25.39 25.39 25.35 25.48 25.33 25.32 25.36 25.43 25.41 25.48 25.43 25.32 25.34 25.39 25.39 25.47 25.43 25.48 25.42 25.40
2.2.2 用样本的数字特征估计总体的数字特征
平均数都是5.0,但是它们有不同的标准差,
说明数据的分散程度是不一样的.
标准差的另外一种应用:
例如,在关于居民月均用水量的例子中,平均数 x 1.973
标准差s=0.868 ,所以
x s 2.841, x 2s 3.709
x s 1.105, x 2s 0.237.
这100 个数据中 ,
练习: 在一次中学生田径运动会上, 参加男子跳高的17名运动员的成绩如下 表所示:
成绩(单 位: 米)
人数
1.50 1.60 1.65
2
3
2
1.70 3
1.75 4
1.80 1.85
1
1
1.90 1
分别求这些运动员成绩的众数,中位数与 平均数
解:在17个数据中,1.75出现了4次,出现的 次数最多,即这组数据的众数是1.75.
s甲 s乙, 因此甲生产的零件内径比乙的稳定程度高得多。 于是可以作出判断, 甲生产的零件的质量比乙的高一些。
课本P79 阅读与思考
生产过程中的质量控制图
正态分布:一些总体的分布密度曲线是由它的平均
数 与标准差 完全确定的,我们把这样的分布
记作
,称为平均数为 ,方差为 的
正态分布.
生产过程中的质量控制图
频率 组距
0.5 0.4 0.3 0.2 0.1
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5
月平均用水量(t)
说明:
2.03这个中位数的估计值,与样本 的中位数值2.0不一样,这是因为样本数 据的频率分布直方图,只是直观地表明 分布的形状,但是从直方图本身得不出 原始的数据内容,所以由频率分布直方 图得到的中位数估计值往往与样本的 实际中位数值不一致.
课件5:2.2.2 用样本的数字特征估计总体的数字特征
[归纳升华] (1)平均数计算方法 ①定义法:n 个数据 a1,a2,…,an 的平均数 a=a1+a2+n …+an. ②利用加权平均数公式: 在 n 个数据中,如果 x1 出现 f1 次,x2 出现 f2 次,…,xk 出现 fk 次(f1+f2+… +fk=n),则这 n 个数的平均数为:x=x1f1+x2f2+n …+xkfk. ③当数据较大时,用公式 x=x′+a 简化计算.
s2乙
=
1 6
[(99
-100)2+(100
-100)2+(102
-100)2
+
(99
-100)2
+
(100
-
100)2+
(100-100)2]=1.
(2)两台机床所加工零件的直径的平均数相同,又 s2甲>s乙2 ,所以乙机床加工
零件的质量更稳定.
[归纳升华] 1.计算标准差的方法 (1)算出样本数据的平均数. (2)算出每个样本数据与样本平均数的差 xi- x (i=1,2,…,n). (3)算出(xi- x )2(i=1,2,…,n). (4)算出(xi- x )2(i=1,2,…,n)这 n 个数的平均数,即为样本方差 s2. (5)算出方差的算术平方根,即为样本标准差 s.
[126.5,128.5)
[128.5,130.5]
(2)作出频率分布直方图;
(3)根据频率分布直方图或频率分布表求这组数据的众数、中位数和平均数.
高中数学 2.2.2用样本的数字特征估计总体的数字特征
高中数学2.2.2用样本的数字特征估计总体的数字特征【学习目标】1.学会列频率分布表,画频率分布直方图2. 通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计【学习重点】1.会列频率分布表,画频率分布直方图2. 会画频率折线图和茎叶图课前预习案【知识链接】在NBA的2015赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕甲运动员得分:12,15,20,25,31,31,36,36,37,39,44,49,50乙运动员得分:8,13,14,16,23,26,28,38,39,51,31,29,33请问从上面的数据中你能否看出甲、乙两名运动员哪一位发挥比较稳定?【知识梳理】1.频率分布直方图:频率分布是指一个样本数据在各个小范围内所占比例的大小。
一般用频率分布直方图反映样本的频率分布。
其一般步骤为(以100位居民的月均用水量为例,数据见教材66页):(1)计算一组数据中______与_____的差,即求极差。
(2)决定组距与组数:若样本容量为n,确定分组k应该在(1+log2n)附近选。
当样本容量不超过100时,按照数据的多少,常分成5~12组.取组距0.5,那么组数=极差/组距=4.1/0.5=8.2因此可以将数据分成9组,这个组数是较合适的,于是取组距为0.5,组数为9.(3)确定分点,将数据分组.以组距为0.5将数据分组,可以分以下9组:[0,0.5),[0.5,1),[1,1.5),…,[4,4.5](4)统计频数,计算频率,制成频率分布表. (频数=样本数据落在各小组内的个数,频率=频数÷样本容量)注分组时,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间[2, 2, 5(5)画频率分布直方图:频率分布直方图的特征:①横坐标为样本数据尺寸,纵坐标为频率/组距②从频率分布直方图可以清楚的看出数据分布的总体趋势。
高中数学 2.2.2 用样本的数字特征估计总体的数字特征(
.2.2.2 用样本的数字特征估计总体的数字特征(二)【明目标、知重点】1.理解样本数据标准差的意义,会计算样本平均数和标准差.2.体会用样本估计总体的思想,会用样本的基本数字特征(平均数、标准差)估计总体的基本数字特征. 【填要点、记疑点】 1.标准差标准差是样本数据到平均数的一种平均距离,一般用s 表示.s = 1n[x 1-x2+x 2-x2+…+x n -x2].2.方差标准差的平方s 2叫做方差.s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2](x n 是样本数据,n 是样本容量,x 是样本平均数). 【探要点、究所然】 探究点一 标准差问题 平均数向我们提供了样本数据的重要信息,但是平均数有时也会使我们作出对总体的片面判断,因为这个平均数掩盖了一些极端的情况,而这些极端情况显然是不能忽视的.因此,只有平均数还难以概括样本数据的实际状态.如:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下: 甲:7 8 7 9 5 4 9 10 7 4 乙:9 5 7 8 7 6 8 6 7 7如果你是教练,你应当如何对这次射击作出评价? 思考1 甲、乙两人本次射击的平均成绩分别为多少环?答 经计算得:x 甲=110(7+8+7+9+5+4+9+10+7+4)=7,同理可得x 乙=7.思考2 观察下图中两人成绩的频率分布条形图,你能说明其水平差异在哪里吗?答直观上看,还是有差异的.如:甲成绩比较分散,乙成绩相对集中.思考3 对于甲乙的射击成绩除了画出频率分布条形图比较外,还有没有其它方法来说明两组数据的分散程度?答还经常用甲乙的极差与平均数一起比较说明数据的分散程度.甲的环数极差=10-4=6,乙的环数极差=9-5=4.它们在一定程度上表明了样本数据的分散程度,与平均数一起,可以给我们许多关于样本数据的信息.显然,极差对极端值非常敏感,注意到这一点,我们可以得到一种“去掉一个最高分,去掉一个最低分”的统计策略.思考4 如何用数字去刻画这种分散程度呢?答考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本数据到平均数的一种平均距离,一般用s表示 .思考5 所谓“平均距离”,其含义如何理解?答假设样本数据是x1,x2,…,x n,x表示这组数据的平均数.x i到x的距离是|x i-x |(i =1,2,…,n ).于是,样本数据是x 1,x 2,…,x n 到x 的“平均距离”是 S =|x 1-x |+|x 2-x |+…+|x n -x |n.由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差:s =1n[x 1-x2+x 2-x2+…+x n -x2].思考6 标准差的取值范围如何?若s =0表示怎样的意义?答 从标准差的定义可以看出,标准差s ≥0,当s =0时,意味着所有的样本数据等于样本平均数. 探究点二 方差思考1 方差的概念是怎样定义的?答 人们有时用标准差的平方s 2—方差来代替标准差,作为测量样本数据分散程度的工具,方差:s 2=1n·[(x 1-x )2+(x 2-x )2+…+(x n -x )2].思考2 对于一个容量为2的样本:x 1,x 2(x 1<x 2),它们的平均数和标准差如果分别用x 和a 表示,那么x 和a 分别等于什么?答 x =12(x 1+x 2),a =12(x 2-x 1).思考3 在数轴上,x 和a 有什么几何意义?由此说明标准差的大小对数据的离散程度有何影响?答 x 和a 的几何意义如下图所示.说明了标准差越大离散程度越大,数据较分散;标准差越小离散程度越小,数据较集中在平均数周围.思考 4 现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道的.如何求得总体的平均数和标准差呢?答通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.这与前面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.例1 求出问题中的甲乙两运动员射击成绩的标准差,并说明他们的成绩谁比较稳定?解x甲=110(7+8+7+9+5+4+9+10+7+4)=7,同理可得x乙=7.根据标准差的公式,s甲=110[7-72+8-72+…+4-72]=2;同理可得s乙≈1.095.所以s甲>s乙.因此说明甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙比甲的射击成绩稳定.反思与感悟标准差能够衡量样本数据的稳定性,标准差越大,数据的离散程度就越大,也就越不稳定.标准差越小,数据的离散程度就越小,也就越稳定.跟踪训练1如图所示是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________. 答案 6.8解析 从茎叶图中求出运动员在5次比赛中的分数,结合方差公式求解.依题意知,运动员在5次比赛中的分数依次为8,9,10,13,15,其平均数为8+9+10+13+155=11.由方差公式得s 2=15[(8-11)2+(9-11)2+(10-11)2+(13-11)2+(15-11)2]=15(9+4+1+4+16)=6.8. 探究点三 标准差及方差的应用例2 画出下列四组样本数据的条形图,说明它们的异同点.(1)5,5,5,5,5,5,5,5,5; (2)4,4,4,5,5,5,6,6,6; (3)3,3,4,4,5,6,6,7,7; (4)2,2,2,2,5,8,8,8,8.解 四组样本数据的条形图如下:四组数据的平均数都是5.0,标准差分别是:0.00,0.82,1.49,2.83.它们有相同的平均数,但它们有不同的标准差,说明数据的分散程度是不一样的.反思与感悟比较两组数据的异同点,一般情况是从平均数及标准差这两个方面考虑.跟踪训练2 从甲、乙两种玉米中各抽10株,分别测得它们的株高如下:甲:25、41、40、37、22、14、19、39、21、42;乙:27、16、44、27、44、16、40、40、16、40;(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得齐?解(1)x甲=110(25+41+40+37+22+14+19+39+21+42)=30,x乙=110(27+16+44+27+44+16+40+40+16+40)=31,x甲<x乙.即乙种玉米的苗长得高.(2)由方差公式得:s2甲=110[(25-30)2+(41-30)2+…+(42-30)2]=104.2,同理s2乙=128.8,∴s2甲<s2乙.即甲种玉米的苗长得齐.答乙种玉米苗长得高,甲种玉米苗长得齐.例3 甲、乙两人同时生产内径为25.40 mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm):甲25.46 25.32 25.45 25.39 25.3625.34 25.42 25.45 25.38 25.4225.39 25.43 25.39 25.40 25.4425.40 25.42 25.35 25.41 25.39乙25.40 25.43 25.44 25.48 25.4825.47 25.49 25.49 25.36 25.3425.33 25.43 25.43 25.32 25.4725.31 25.32 25.32 25.32 25.48从生产的零件内径的尺寸看,谁生产的质量较高?(结果保留小数点后3位)解用计算器计算可得x甲≈25.401,x乙≈25.406;s甲≈0.037,s乙≈0.068.从样本平均数看,甲生产的零件内径比乙的更接近内径标准(25.40mm),差异很小;从样本标准差看,由于s甲<s乙,因此甲生产的零件内径尺寸比乙的稳定程度高得多.于是,可以作出判断,甲生产的零件的质量比乙的高一些.反思与感悟从上述例子我们可以看到,尽管总体是同一个,但由于样本不同,相应的样本频率分布与平均数、标准差等都会发生改变,这就会影响到我们对总体情况的估计.如果样本的代表性差,那么对总体所作出的估计就会产生偏差;样本没有代表性时,对总体作出错误估计的可能性就非常大.跟踪训练3 甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm2),试根据这组数据估计哪一种水稻品种的产量比较稳定.解[(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]÷5=0.02. 乙品种的样本平均数也为10,样本方差为[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]÷5=0.244. 因为0.244>0.02,所以,由这组数据可以认为甲种水稻的产量比较稳定. 【当堂测、查疑缺】1.下列说法正确的是( )A .在两组数据中,平均值较大的一组方差较大B .平均数反映数据的集中趋势,方差则反映数据离平均值的波动大小C .方差的求法是求出各个数据与平均值的差的平方后再求和D .在记录两个人射击环数的两组数据中,方差大的表示射击水平高 答案 B解析 A 中平均值和方差是数据的两个特征,不存在这种关系;C 中求和后还需取平均数;D 中方差越大,射击越不平稳,水平越低.2.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示: 则7个剩余分数的方差为( )A.1169B.367C .36D.677答案 B 解析 由题意知87+94+90+91+90+90+x +917=91,解得x =4.所以s 2=17[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2] =17(16+9+1+0+1+9+0) =367. 3.已知一组数据x 1,x 2,x 3,x 4,x 5的平均数是x =2,方差是13,那么另一组数据3x 1-2,3x 2-2,3x 3-2,3x 4-2,3x 5-2的平均数和方差分别为 ( )A .2,13B .2,1C .4,13D .4,3答案 D解析 因为x =2,s 2=13;所以X =3x -2=4,S 2=9s 2=3,故选D.4.某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4.则:(1)平均命中环数为________; (2)命中环数的标准差为________. 答案 (1)7 (2)2解析 (1)x =110(7+8+7+9+5+4+9+10+7+4)=7010=7.(2)s 2=110[(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=4, ∴命中环数标准差为2. 【呈重点、现规律】1.标准差的平方s 2称为方差,有时用方差代替标准差测量样本数据的离散程度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差.2.现实中的总体所包含的个体数往往很多,总体的平均数与标准差是未知的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性.3.在抽样过程中,抽取的样本是具有随机性的,因此样本的数字特征也有随机性.用样本的数字特征估计总体的数字特征,是一种统计思想,没有唯一答案.。
高中数学 2.2.2 用样本的数字特征估计总体的数字特征
当 堂
案 设
x1+x2+…+xn
双 基
计
如果有 n 个数 x1,x2,…,xn,那么 x =
n
,达 标
课
前 叫做这 n 个数的平均数.
自
课
主
时
导
作
学
业
课 堂 互 动 探 究
教 师 备 课 资 源
菜单
RB ·数学 必修3
教
学
思
教
样本的方差与标准差
法
想 方
分
法
析
【问题导思】
技 巧
教
学 方
甲、乙两名战士在相同条件下各射靶 10 次,每次命中的 当 堂
备 课
资
源
菜单
教
学
教
法
●教学流程
分
析
教 学 方 案 设 计
课 前 自 主 导 学
课 堂 互 动 探 究
菜单
RB ·数学 必修3
思 想 方 法 技 巧
当 堂 双 基 达 标
课 时 作 业
教 师 备 课 资 源
教 学 教 法 分 析
教 学 方 案 设 计
课 前 自 主 导 学
课 堂 互 动 探 究
菜单
教 师 备 课 资 源
RB ·数学 必修3
教
学
思
教
想
法
方
分
法
析
技
巧
教 学
1.正确理解样本数据标准差的意义和作用,学
当
方 案
会计算数据的标准差.(重点)
堂 双
设 计
课 2.能根据实际问题的需要合理地选取样本,
标 从样本数据中提取基本的数字特征(如平均
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.2.2用样本的数字特征估计总体的数字特征(2课时)
教学目标:
知识与技能
(1)正确理解样本数据标准差的意义和作用,学会计算数据的标准差。
(2)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释。
(3)会用样本的基本数字特征估计总体的基本数字特征。
(4)形成对数据处理过程进行初步评价的意识。
过程与方法
在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法。
重点与难点
重点:用样本平均数和标准差估计总体的平均数与标准差。
难点:能应用相关知识解决简单的实际问题。
教学设想
【创设情境】
在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕
甲运动员﹕7,8,6,8,6,5,8,10,7,4;
乙运动员﹕9,5,7,8,7,6,8,6,7,7.
观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?为了从整体上更好地把握总体
的规律,我们要通过样本的数据对总体的数字特征进行研究。
——用样本的数字特征估计总
体的数字特征(板出课题)。
【探究新知】
<一>、众数、中位数、平均数
〖探究〗:P62
(1)怎样将各个样本数据汇总为一个数值,并使它成为样本数据的“中心点”?
(2)能否用一个数值来描写样本数据的离散程度?(让学生回忆初中所学的一些统计知识,思考后展开讨论)
初中我们曾经学过众数,中位数,平均数等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息。
例如前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是 2.25t(最高的矩形的中点)(图略见课本第62页)它告诉我们,该市的月均用水量为2. 25t的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少。
〖提问〗:请大家翻回到课本第56页看看原来抽样的数据,有没有2.25这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?(请大家思考作答)
分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失的原因,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差。
〖提问〗:那么如何从频率分布直方图中估计中位数呢?
分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数。
因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边
的直方图的面积应该相等。
由此可以估计出中位数的值为 2.02。
(图略见课本63页图
2.2-6)
〖思考〗:2.02这个中位数的估计值,与样本的中位数值2.0不一样,你能解释其中的原因吗?
(原因同上:样本数据的频率分布直方图把原始的一些数据给遗失了)
(课本63页图2.2-6)显示,大部分居民的月均用水量在中部(2.02t 左右),但是也有少数居民的月均用水量特别高,显然,对这部分居民的用水量作出限制是非常合理的。
〖思考〗:中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会成为缺点,你能举例说明吗?(让学生讨论,并举例)
<二>、标准差、方差
1.标准差
平均数为我们提供了样本数据的重要信息,可是,有时平均数也会使我们作出对总体的片面判断。
某地区的统计显示,该地区的中学生的平均身高为176㎝,给我们的印象是该地区的中学生生长发育好,身高较高。
但是,假如这个平均数是从五十万名中学生抽出的五十名身高较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身体素质。
因此,只有平均数难以概括样本数据的实际状态。
例如,在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕
甲运动员﹕7,8,6,8,6,5,8,10,7,4;
乙运动员﹕9,5,7,8,7,6,8,6,7,7.
观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?如果你是教练,选哪位选手去参加正式比赛? 我们知道,77x x ==乙甲, 。
两个人射击的平均成绩是一样的。
那么,是否两个人就没有水平差距呢?(观察P66图2.2-8)直观上看,还是有差异的。
很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们从另外的角度来考察这两组数据。
考察样本数据的分散程度的大小,最常用的统计量是标准差。
标准差是样本数据到平均数的一种平均距离,一般用s 表示。
样本数据1,2,,n x x x 的标准差的算法:
(1) 、算出样本数据的平均数x 。
(2) 、算出每个样本数据与样本数据平均数的差:(1,2,)i x x i n -=
(3) 、算出(2)中(1,2,)i x x i n -= 的平方。
(4) 、算出(3)中n 个平方数的平均数,即为样本方差。
(5) 、算出(4)中平均数的算术平方根,,即为样本标准差。
其计算公式为:
显然,标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小。
〖提问〗:标准差的取值范围是什么?标准差为0的样本数据有什么特点?
从标准差的定义和计算公式都可以得出:0s
≥。
当0s =
时,意味着所有的样本数据都等
s =
于样本平均数。
(在课堂上,如果条件允许的话,可以给学生简单的介绍一下利用计算机来计算标准差的方法。
)
2.方差
从数学的角度考虑,人们有时用标准差的平方2
s (即方差)来代替标准差,作为测量样本数
据分散程度的工具:
在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差。
【例题精析】
〖例1〗:画出下列四组样本数据的直方图,说明他们的异同点。
(1)5,5,5,5,5,5,5,5,5
(2)4,4,4,5,5,5,6,6,6
(3)3,3,4,4,5,6,6,7,7
(4)2,2,2,2,5,8,8,8,8
分析:先画出数据的直方图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组数据的标准差。
解:(图略,可查阅课本P68)
四组数据的平均数都是5.0,标准差分别为:0.00,0.82,1.49,2.83。
他们有相同的平均数,但他们有不同的标准差,说明数据的分散程度是不一样的。
〖例2〗:(见课本P69)
分析: 比较两个人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数与
标准差的大小即可,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本数据的平均数、标准差,以此作为两个总体之间的差异的估计值。
【课堂精练】 P 71 练习 1. 2. 3 4
【课堂小结】
1. 用样本的数字特征估计总体的数字特征分两类:
(1) 用样本平均数估计总体平均数。
(2) 用样本标准差估计总体标准差。
样本容量越大,估计就越精确。
2. 平均数对数据有“取齐”的作用,代表一组数据的平均水平。
3. 标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度。
【评价设计】
1.P 72 习题2.2 A 组 3、 4、10
2222121[()()()]n s x x x x x x n =-+-++-。