人教B版(2019)数学必修(第二册):5.1.4 用样本估计总体 学案

合集下载

人教版(B版2019课标)高中数学必修二5.1.4用样本估计总体 学案

人教版(B版2019课标)高中数学必修二5.1.4用样本估计总体   学案

用样本估计总体【学习目标】1.理解样本数据标准差的意义和作用,会计算数据标准差,对样本数据中提取基本的数字作合理的解释。

2.会用样本的基本数字特征估计总体的基本数字特征。

3.培养统计意识,形成尊重事实、用数据说话的态度,认识数据处理的实际意义。

【学习重难点】根据有关问题查找资料或调查,用随机抽样的方法选取样本,能用样本的平均数和方差对总体、个体有合理的估计和推测。

【学习过程】一、问题提出1.对一个未知总体,我们常用样本的频率分布估计总体的分布,其中表示样本数据的频率分布的基本方法有哪些?频率分布直方图、频率分布表、频率分布折线图、茎叶图2.美国NBA在2006-2007年度赛季中,甲、乙两名篮球运动员在随机抽取的12场比赛中的得分情况如下:甲运动员得分:12,15,20,25,31,30,36,36,37,39,44,49。

乙运动员得分:8,13,14,16,23,26,28,38,39,51,31,39。

如果要求我们根据上面的数据,估计、比较甲,乙两名运动员哪一位发挥得比较稳定,就得有相应的数据作为比较依据,即通过样本数据对总体的数字特征进行研究,用样本的数字特征估计总体的数字特征。

二、能力探究用样本的平均数来估测总体的平均数“珍惜能源,从我做起,节约用电,人人有责”。

为了解某小区居民节约用电情况,物业公司随机抽取了今年某一天本小区10户居民的日用电量,数据如下:(1)求这组数据的平均数;(2)已知去年同一天这10户居民的平均日用电量为7.8度,请你估计,这天与去年同日相比,该小区200户居民这一天节约了多少度电?分析:(1)用算术平均数公式可计算出平均数;(2)由10户居民的平均日用电量估计该小区200户居民的平均日用电量,所以该小区节约的用电量等于用电户数与两年同一天的日平均用电量之差的积。

解:(1)这组数据的平均数为:x=4.4+4.0+5.0+5.6+3.4+4.8+3.4+5.2+4.0+4.210=44 10=4.4(度)(2)200×(7.8-4.4)=680(度),即该小区200户居民这一天大约节约了680度电。

高中教育数学必修第二册人教B版《5.1.4 用样本估计总体》教学课件

高中教育数学必修第二册人教B版《5.1.4 用样本估计总体》教学课件
【答案】
B
【解析】 观察频率分布直方图可知众数为
中位数为x,
则0.06×5+(x-10)×0.1=0.5,
解得x=12
10+15
=12.5,设
2
状元随笔 众数是最高的矩形的
底边的中点,中位数左边和右边的直
方图的面积相等,都是0.5.
(2)2021年起,我省实行“3+1+2”高考模式,某中学为了解本校学生的
例3 已知一组数据:
125 121 123 125 127 129 125 128 130 129
126 124 125 127 126 122 124 125 126 128
(1)填写下面的频率分布表:
分组
[120.5,122.5)
[122.5,124.5)
[124.5,126.5)
[126.5,128.5)
例1 (1)某工厂有甲、乙两条流水线同时生产直径为50 mm的零件,各抽取10个进行测量,其结果如图所
示,则以下结论不正确的是(
)
【答案】 D
A.甲流水线生产的零件直径的极差为0.4 mm
B.乙流水线生产的零件直径的中位数为50.0 mm
C.乙流水线生产的零件直径比甲流水线生产的零件直径稳定
D.甲流水线生产的零件直径的平均值小于乙流水线生产的零件直径的平均值
=0.21.
7
【解析】从表中一周的利润可得一天的平均利润为തx=
又五月份共有31天,
所以五月份的总利润约是0.21×31=6.51(万元).
18日
0.25
(3)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,
将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下

新教材人教B版必修第二册 5.1.4 用样本估计总体 学案

新教材人教B版必修第二册 5.1.4 用样本估计总体 学案

5.1.4 用样本估计总体5.2 数学探究活动:由编号样本估计总数及其模拟(略)素养目标·定方向课程标准学法解读1.能用样本的数字特征估计总体的数字特征. 2.能用样本的分布估计总体的分布.通过用样本估计总体,提升学生的数据分析、数学运算和逻辑推理素养.必备知识·探新知知识点用样本估计总体(1)前提样本的容量恰当,抽样方法合理. (2)必要性①在容许一定误差存在的前提下,可以用样本估计总体,这样能节省人力和物力. ②有时候总体的数字特征不可能获得,只能用__样本__估计总体. (3)误差估计一般是有__误差__的.但是,大数定律可以保证,当样本的容量__越来越大__时,估计的误差很小的可能性将越来越大.思考:用样本估计总体出现误差的原因有哪些?提示:样本抽取的随机性;样本抽取的方法不合适,导致代表性差;样本容量偏少等. 知识点用样本的数字特征来估计总体的数字特征(1)一般来说,在估计总体的数字特征时,只需直接算出样本对应的__数字特征__即可. (2)样本是用分层抽样得到的,由每一层的数字特征估计总体的数字特征.以分两层抽样的情况为例.条件假设第一层有m 个数,分别为x 1,x 2,…,x m ,平均数为x -,方差为s 2;第二层有n 个数,分别为y 1,y 2,…,y n ,平均数为y -,方差为t 2 结论如果记样本的平均值为a ,样本方差为b ,则a -=m x -+n y-m +n,b 2=1m +n ×⎣⎡⎦⎤(ms 2+nt 2)+mn m +n (x --y -)2知识点用样本的分布来估计总体的分布如果总体在每一个分组的频率记为π1,π2,…,πn ,样本在第一组对应的频率记为p 1,p 2,…,p n ,一般来说,1n ∑i =1n(πi -p i )2不等于零.当样本的容量__越来越大__时,上式很小的可能性将越来越大.关键能力·攻重难题型探究题型用样本的特征数估计总体的特征数角度1 简单随机抽样的数字特征 ┃┃典例剖析__■典例1 甲、乙两机床同时加工直径为100 cm 的零件,为检验质量,各从中抽取6件测量,数据为甲:99 100 98 100 100 103 乙:99 100 102 99 100 100 (1)分别计算两组数据的平均数及方差;(2)根据计算结果判断哪台机床加工零件的质量更稳定. [解析] (1)x -甲=16(99+100+98+100+100+103)=100,x -乙=16(99+100+102+99+100+100)=100.s 2甲=16[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=73, s 2乙=16[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.(2)两台机床所加工零件的直径的平均值相同,又s 2甲>s 2乙,所以乙机床加工零件的质量更稳定. 规律方法:(1)利用样本的原始数据求得的样本数字特征是准确值,可用以估计总体. (2)此类问题需计算样本的平均值和方差来估计总体. ┃┃对点训练__■1.为了快速了解某学校学生体重(单位:kg)的大致情况,随机抽取了10名学生称重,得到的数据整理成茎叶图如图所示.估计这个学校学生体重的平均数和方差.4 5 9 7 9 6 6 5 1 8 9 6[解析] 将样本中的每一个数都减去50,可得 -5,-1,-3,-1,-4,-4,1,8,9,10,这组数的平均数为-5-1-3-1-4-4+1+8+9+1010=1,方差为62+22+42+22+52+52+02+72+82+9210=30.4,因此可估计这个学校学生体重的平均数为51,方差为30.4. 角度2 分层抽样的数字特征 ┃┃典例剖析__■典例2 在对树人中学高一年级学生身高(单位:cm)的调查中,采用分层抽样的方法,抽取了男生23人,其平均数和方差分别为170.6和12.59,抽取了女生27人,其平均数和方差分别为160.6和38.62,你能由这些数据计算出样本的方差,并对高一年级全体学生身高的方差作出估计吗?[解析] 把样本中男生的身高记为x 1,x 2,…,x 23,其平均数记为x -,方差记为s 2x ;把样本中女生的身高记为y 1,y 2,…,y 27,其平均数记为y -,方差记为s 2y ,把样本的平均数记为a -,方差记为s 2.则a -=23×170.6+27×160.623+27=165.2,s 2=23×[s 2x +(x --a -)2]+27×[s 2y+(y --a -)2]23+27=23×[12.59+(170.6-165.2)2]+27×[38.62+(160.6-165.2)2]50=51.486 2,即样本的方差为51.486 2.因此估计高一年级全体学生身高的方差为51.486 2.规律方法:1.求分层随机抽样的平均数的步骤 (1)求样本中不同层的平均数;(2)应用分层随机抽样的平均数公式进行求解. 2.求分层随机抽样的方差的步骤 (1)求样本中不同层的平均数; (2)求样本中不同层的方差;(3)应用分层随机抽样的方差公式进行求解. ┃┃对点训练__■2.为了解某公司员工的身体情况,利用分层抽样的方法抽取了9名男员工的身高和体重数据,计算得到他们的体质指数的平均数为25.1,方差为6,抽取了5名女员工的身高和体重数据,计算得到她们的体质指数的平均数为20.3,方差为3.求样本平均数与方差.[解析] 样本平均数x -=9×25.1+5×20.39+5≈23.4,方差s 2=9×[6+(25.1-23.4)2]+5×[3+(20.3-23.4)2]9+5≈10.2. 题型用样本的分布估计总体的分布┃┃典例剖析__■典例3 我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x (吨),一位居民的月用水量不超过x 的部分按平价收费,超出x 的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a 的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由; (3)若该市政府希望使85%的居民每月的用水量不超过标准x (吨),估计x 的值,并说明理由.[解析] (1)由频率分布直方图知,月均用水量在[0,0.5)中的频率为0.08×0.5=0.04,同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.由0.04+0.08+0.5×a +0.20+0.26+0.5×a +0.06+0.04+0.02=1,解得a =0.30. (2)由(1)可知,100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12. 由以上样本的频率,可以估计全市30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85, 而前5组的频率之和为:0.04+0.08+0.15+0.20+0.26=0.73<0.85,所以2.5≤x <3, 由0.3×(x -2.5)=0.85-0.73, 所以x =2.9,所以估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.规律方法:(1)由于频率分布表、频率分布直方图丢失了样本的原始数据,以此求得数字特征都是样本数字特征的估计值.(2)可用样本的分布估计总体的分布. ┃┃对点训练__■3.某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层随机抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如图所示的频率分布直方图:(1)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数; (2)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.[解析] (1)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,分数在区间[40,50)内的人数为100-100×0.9-5=5. 所以总体中分数在区间[40,50)内的人数估计为400×5100=20.(2)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60, 所以样本中分数不小于70的男生人数为60×12=30.所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.所以根据分层随机抽样原理,总体中男生和女生人数的比例估计为3∶2.易错警示┃┃典例剖析__■典例4 在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示:成绩/m 1.50 1.60 1.65 1.70 1.75 1.80 1.85 1.90 人数23234111[错解] 根据以上数据可得众数为1.75,中位数为1.70+1.752=1.725,平均数为1.69.[辨析] 所求数据要注意单位问题,另外中位数计算错误.[正解] 在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75 m .表中的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是 1.70 m ;这组数据的平均数是x -=117(1.50×2+1.60×3+…+1.90×1)=28.7517≈1.69(m).故17名运动员成绩的众数、中位数、平均数依次为1.75 m,1.70 m,1.69 m .。

高中数学第五章统计与概率51统计514用样本估计总体教学课件新人教B版必修第二册

高中数学第五章统计与概率51统计514用样本估计总体教学课件新人教B版必修第二册

2021/4/17
高中数学第五章统计与概率51统计514用样本估计总体教学 课件新人教B版必修第二册
14

因为
x甲
=
8+11+14+15+22 5
=14,
x乙
=
6+7+10+23+24 5
=14.
x甲 x乙.
s
2 甲
=
62 +32 +02 +12 +82 5
=22,
s
2 乙
=
82 +72 +42 +92 +102 5
(2)已知抽取的样本中,男生20人,女生15人,怎样估计总体平均数与 方差?
2021/4/17
高中数学第五章统计与概率51统计514用样本估计总体教学 课件新人教B版必修第二册
8
问题3.如何分析频率分布直方图,用样本的分布估计总体的分布 通过整理某中学1257名高一学生期中考试数学成绩,得到如下数据,并 作出了频率分布直方图和折线图.
2021/4/17
高中数学第五章统计与概率51统计514用样本估计总体教学 课件新人教B版必修第二册
16
2021/4/17
高中数学第五章统计与概率51统计514用样本估计总体教学 课件新人教B版必修第二册
17
解 (1)由(0.002+0.0095+0.011+0.0125+x+0.005+0.0025)x20=1,得x=0.0075. (2)众数为[220,240)区间的中点230. 因为(0.002+0.0095+0.011)x20=0.45<0.5,所以中位数在[220,240)

5.1.4 高中必修二数学教案《用样本估计总体》

5.1.4  高中必修二数学教案《用样本估计总体》

高中必修二数学教案《用样本估计总体》教材分析义务教育阶段,学生学习了统计内容,对数据统计全过程有所体验。

高中阶段要求进一步培养学生的随机思想,发展学生的统计观念。

其中包括:统计意识、统计方法及对统计结果的正确认识。

本节课《用样本估计总体》是抽样方法及数据的数字特征内容后的又一重要内容,通过本节课的学习,学生进一步掌握了对样本数据处理的重要方法之一——画频率分布直方图,以及用样本估计总体的思想,同时为学生在后续学习统计案例和应用统计知识解决实际问题打下良好的基础。

学情分析学生在初中就知道了分布的初步概念,在前面也刚学习过概率及抽样的相关知识,对用样本估计总体有一定的认识,对用表和图来反映知识有很强的意识,具有一定的作图能力和较为周全的分析问题能力,而学生的理解能力不足,发现问题能力上可能很难满足本节课的要求。

但学生对新知识兴趣高,肯下功夫,思维活跃,会为本节课的顺利推进提供一定的保障。

教学目标1、通过实例理解样本数据标准差的意义和作用,学会计算数据标准差。

2、进一步体会用样本估计总体的思想,会用样本的基本数字特征估计总体的基本数字特征;初步体会样本频率分布和数字特征的随机性。

教学重点用样本的数字特征估计总体的数字特征、通过频率分布或频率分布直方图对数据作出总体估计。

教学难点通过频率分布或频率分布直方图,对数据作出总体估计。

教学方法讲授法、讨论法、练习法教学过程一、情境导学以下是某学校高一年级98位学生的身高(单位:cm);已知这组数的总体平均数为163.5,总体方差为56.3。

用简单随机抽样的方法,从总体中抽取容量为10的样本3次,分别计算样本平均数与样本方差,并与总体对应的值进行比较。

二、学习新知1、用样本的数字特征估计总体的数字特征一般情况下,如果样本的容量恰当,抽样方法又合理的话,样本的特征能够反映总体的特征。

特别地,样本平均值(也称为样本均值)、方差(也称为样本方差)与总体对应的值相差不会太大。

课件1:5.1.4 用样本估计总体

课件1:5.1.4  用样本估计总体
5.1.4 用样本估计总体
课程标准
学科素养
理解并会运用样本的数字特征估 通过对用样本估计总体的学习,强
计总体的数字特征,用样本的分布 化数据分析、数学运算、数学建模
估计总体的分布,通过实例体会其 的核心素养.
意义和作用.
【自主预习】
知识点1 用样本的数字特征估计总体的数字特征
一般情况下,如果样本的容量恰当,抽样方法又合理的话,样本 的特征能够反映总体的特征.特别地,样本平均数(也称为样本均 值)、方差(也称为样本方差)与总体对应的值相差不会____太__大____.
[方法总结] 1.众数、中位数、平均数与频率分布表、频率分布直方图的关系 (1)众数:众数一般用频率分布表中频率最高的一小组的组中值来表示, 即在样本数据的频率分布直方图中,最高矩形的底边中点的横坐标.
(2)中位数:在频率分布表中,中位数是累计频率(样本数据小于某一数 值的频率叫作该数值点的累计频率)为0.5时所对应的样本数据的值,而 在样本中有50%的个体小于或等于中位数,也有50%的个体大于或等于 中位数.因此,在频率分布直方图中,中位数左边和右边的直方图的 面积应该相等.
探究三 在频率分布直方图中求平均数、中位数、众数
【例3】某校从参加高二年级学业水平测试的学生中抽出80名学生, 其数学成绩(均为整数)的频率分布直方图如图所示. (1)求这次测试数学成绩的众数; (2)求这次测试数学成绩的中位数; (3)求这次测试数学成绩的平均分.
解 (1)由图知众数为70+2 80=75.
【课堂小结】
1. 样本平均数与总体平均数的关系:①在简单随机抽样中,我们常 用样本平均数-y 去估计总体平均数-Y . ②一般地,大部分样本平均数离总体平均数不远,在总体平均数附近 波动.样本量越大,波动幅度越小. 2.众数、中位数分别是频率分布直方图中最高的小矩形的中间值、 累计频率为 0.5 时所对应的样本数据的值,平均数为每个小矩形底边 中点的横坐标与小矩形的面积的乘积之和.

新教材高中数学第五章统计与概率1.4用样本估计总体课件新人教B版必修第二册课件

新教材高中数学第五章统计与概率1.4用样本估计总体课件新人教B版必修第二册课件

(☆)为了了解学生的身体发育情况,某校订年满16周岁的60名男生的身高进
行测量,其结果如下:
身高/m 1.57
1.59
Hale Waihona Puke 1.601.621.63
1.64
1.65
1.66
1.68
人数 2
1
3
2
3
4
2
7
6
身高/m 1.69
1.70
1.71
1.72
1.73
1.74
1.75
1.76
1.77
人数 8
7
4
3
2
1
1.如果样本容量恰当,抽样方法又合理,在允许有一定误差的前提下,可以用样本 的散布去估计总体的散布. 频率散布是指一个样本数据在各个小范围内所占比例的大小.一般利用频率散布 表和频率散布直方图来直观体现. 2.如何用样本散布估计总体散布 一般是利用样本在某一范围内的频率近似地估计总体在该范围内的频率.所以, 第一样本抽取要合理科学,其次要正确绘制频率散布表(或直方图),或者要准确找 出题目所给频率散布表(或直方图)中的相关信息,最后由样本散布估计出总体分 布情况.
1.平均数、中位数、众数与频率散布直方图的关系: (1)众数在样本数据的频率散布直方图中,就是最高的小长方形中某个(些)点的横 坐标. (2)由于在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中 位数,因此在频率散布直方图中,中位数左侧和右侧的小长方形的面积和应该相 等,据此可以估计中位数的值. (3)平均数是频率散布直方图的“重心”,是直方图的平衡点.用频率散布直方图 估计平均数时,平均数的估计值等于频率散布直方图中每个小长方形的面积与小 长方形底边中点的横坐标(组中值)之积的和. 2.利用直方图求得的众数、中位数和平均数均为近似值,往往与由实际数据得出 的不一致,但它们能粗略估计众数、中位数和平均数.

5.2 数学探究活动:由编号样本估计总数及其模拟高一数学精品教学课件(人教B版2019必修第二册)

5.2 数学探究活动:由编号样本估计总数及其模拟高一数学精品教学课件(人教B版2019必修第二册)

日常生活中,人们经常对人或者 物进行连续编号(即编号为 001,002,003……)
为什么要连续编号?
连续编号的优点:
知道编号的最大值就能方便的知道总数是多少
问题:1 能否举出日常生活中
连续编号的例子 ?
高考学生准考证号,火车座位号等
在很多情况下得到最大的编号并不容易,能不能 根据编号样本的信息,利用有关统计的知识, 估计出人或物的总数呢?
计学家估计值是多少?进一步猜测谁的更准确.)
时间 1940年6月 1941年6月 1942年8月
统计估计/辆 情报估计/辆
169
1000
244
1550
327
1550
实际/辆
下面看实际真实结果是什么样的?
时间 统计估计/辆 情报估计/辆
1940年6月
169
1000
1941年6月
244
1550
1942年8月
第二次世界大战期间,德军生产的坦克是连续编号的,盟军从战场上缴获了一些 德军坦克,因此获得了一些坦克编号,盟军希望能根据这些样本数据估计出德军 所生产的坦克数量.后来统计学家们圆满地解决了这一问题,而且,如下表所示, 当时统计学家们的估计比情报部门的估计误差小很多!
1. 任 务 : 已 知 总 体 是 连 续 编 号 的 , 假 设 已 有 的 编 号 样 本 从 小 到 大 依 次 为 x1 , x2,…,xm,由这些样本去估计总数n.
2 类似问题在实际生活中有 时是具有战略意义的
第二次世界大战期间,德军生产的坦克是连续编号的,盟军 从战场上缴获了一些德军坦克,并获得了一些坦克编号,盟军 希望能根据这些样本数据估计出德军所生产的坦克数量.
对于坦克总数问题,当初统计学家和 情报学家都做了相应的调查和分析,统计 如下,你认为哪个更准确呢? (让学生猜测统

【新教材】高中数学 新人教B版必修第二册 第五章 5.1.4 用样本估计总体 课件

【新教材】高中数学 新人教B版必修第二册 第五章 5.1.4 用样本估计总体 课件
训练题2[2019·福建五校高二联考]某网站从春节期间参与收发网络红包的手机用 户中随机抽取2 000名进行调查,将受访用户按年龄分成5组:[10,20),[20, 30),…,[50,60],并整理得到如图所示的频率分布直方图. (1)求a的值; (2)从春节期间参与收发网络红包的手机用户中随机 抽取一人,估计其年龄低于40岁的频率; (3)估计春节期间参与收发网络红包的手机用户的平均年龄.
.
这个公式推导如下:
a ∵
s = 2 1 m
m i1
(xi-
x
)2=
1 m
m
i 1
(xi-
x a +
-
) = 2 1 m
m i1
[(xi- a )2+2( a - x )(xi- a )
+( a
-x
)2]=
1 m
m
i1
(xi-
a
)2+2(
a
-
x

m
i 1
(xi-
a
)+
m
i 1
(a
-
x
)2
例1[2019·甘肃庆阳第一中学高一月考]为了调查某校高三学生的身高,随机抽取了50 名学生实测身高的数据(单位:cm)如下: 175 168 170 176 167 181 162 173 171 177 179 172 165 157 172 173 166 177 169 181 160 163 166 177 175 174 173 174 171 171 158 170 165 175 165 174 169 163 166 166 174 172 166 172 167 172 175 161 173 167 (1)求这50名学生的身高的平均数、标准差. (2)如果用简单随机抽样的方法从这50名学生中再抽取一个样本容量为10的样本,试设计 抽取方案并求出抽取的10名学生身高的平均数及方差.

2019-2020学年人教B版必修第二册 5.1.4用样本估计总体 学案

2019-2020学年人教B版必修第二册 5.1.4用样本估计总体 学案

5.1.4 用样本估计总体(教师独具内容)课程标准:1.结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义.2.结合实例,能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义.3.结合实例,能用样本估计总体的取值规律.4.结合实例,能用样本估计百分位数,理解百分位数的统计含义.5.结合具体实例,掌握分层抽样的样本均值和样本方差.教学重点:用样本的数字特征估计总体的数字特征,用样本的分布估计总体的分布.教学难点:利用样本估计总体的思想解决一些简单的实际问题.知识点一 用样本的数字特征估计总体的数字特征一般情况下,如果样本的容量□01恰当,抽样方法又□02合理的话,样本的特征能够反映□03总体的特征.在容许一定误差存在的前提下,可以用样本的数字特征去估计□04总体的数字特征. 知识点二 分层抽样的平均数和方差已知由两层构成的样本中,假设第一层有m 个数,分别为x 1,x 2,…,x m ,平均数为x -,方差为s 2;第二层有n 个数,分别为y 1,y 2,…,y n ,平均数为y -,方差为t 2.则x -=1m ∑m i =1x i ,s 2=1m ∑m i =1(x i -x -)2, y -=□011n ∑n i =1y i ,t 2=□021n∑n i =1 (y i -y -)2. 如果记样本均值为a -,样本方差为b 2,则a -=□031m +n⎝⎛⎭⎫∑m i =1x i +∑n i =1y i =□04m x -+n y -m +n,b 2=□05m [s 2+(x --a -)2]+n [t 2+(y --a -)2]m +n=□061m +n ⎣⎢⎡⎦⎥⎤(ms 2+nt 2)+mn m +n (x --y -)2. 知识点三 用样本的分布来估计总体的分布如果样本的容量□01恰当,抽样方法又□02合理的话,样本的分布与□03总体分布会差不多.如果容许有一定误差,则可以用样本的分布去估计□04总体的分布.1.中位数不受几个极端数据(即排序靠前或靠后的数据)的影响,容易计算.它仅利用了数据中排在中间数据的信息.当样本数据质量比较差,即存在一些错误数据时,应该用抗极端性很强的中位数表示数据的中心值.2.如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中极端数据的信息.3.平均数与标准差在估计总体时的差异(1)平均数提供了样本数据的重要信息,但是平均数有时也会使人对总体作出片面的判断,样本中的最大值和最小值对平均数的影响较大,所以平均数有时难以概括样本数据的实际状态.(2)当样本的平均数相等或相差无几的时候,就要用样本数据的离散程度来估计总体的数字特征,而样本数据的离散程度,就由标准差来衡量.(3)标准差反映了各个样本数据聚集于样本平均数周围的程度.标准差越小,表明各个样本数据在样本平均数的周围越集中;反之,表明各个样本数据在样本平均数的周围越分散.4.茎叶图不仅能够保留原始数据,而且能够展示数据的分布情况.当样本数据较少时,用茎叶图表示数据的效果较好.它不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来了方便.但当样本数据较多时,茎叶图就显得不太方便.因为每一个数据都要在图中占据一个空间,如果数据很多,枝叶就会很长.5.频率分布直方图直观、形象地反映了样本的分布规律.但是从频率分布直方图中得不出原始的数据内容.把数据绘制成频率分布直方图后,原有的具体数据信息就被抹掉了.6.随着样本容量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之减小,相应的频率折线图就会越来越接近于一条光滑曲线.1.判一判(正确的打“√”,错误的打“×”)(1)一组样本数据的众数可能不止一个,而中位数是唯一的.( )(2)由样本的频率分布直方图,不能估计总体的众数、中位数和平均数.( )(3)当样本数据较多时,用茎叶图表示样本数据较好.( )(4)用样本频率估计总体分布的过程中,总体容量越小,估计越精确.( ) 答案 (1)√ (2)× (3)× (4)×2.做一做(1)我国古代数学名著《数书九章》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为( )A .134石B .169石C .338石D .1365石 (2)某医院急救中心随机抽取20位病人等待急诊的时间记录如下表: 等待时间(分钟)[0,5) [5,10) [10,15) [15,20) [20,25] 频数4 85 2 1用上述分组资料计算出病人平均等待时间的估计值x -=________.(3)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中每周自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据频率分布直方图,则这200名学生中每周的自习时间不少于22.5小时的人数是________.答案(1)B(2)9.5(3)140题型一用样本平均数、方差估计总体例1甲、乙两台机床在相同的条件下同时生产一种零件,现在从中各抽测10个,它们的尺寸(单位:mm)如下茎叶图所示:(1)分别计算这两个样本的平均数和方差;(2)如果图纸上的设计尺寸为10 mm,从计算结果看,用哪台机床加工这种零件较合适?[解](1)由茎叶图可得样本数据分别为甲:8.9,9.7,9.9,9.9,10.0,10.1,10.1,10.2,10.3,10.9.乙:9.6,9.7,9.8,9.9,10.0,10.0,10.1,10.2,10.3,10.4.x-甲=110×(8.9+9.7+9.9+9.9+10.0+10.1+10.1+10.2+10.3+10.9)=10,x-乙=110×(9.6+9.7+9.8+9.9+10.0+10.0+10.1+10.2+10.3+10.4)=10,所以s2甲=110×[(8.9-10)2+(9.7-10)2+(9.9-10)2+(9.9-10)2+(10.0-10)2+(10.1-10)2+(10.1-10)2+(10.2-10)2+(10.3-10)2+(10.9-10)2]=0.228,s 2乙=110×[(9.6-10)2+(9.7-10)2+(9.8-10)2+(9.9-10)2+(10.0-10)2+(10.0-10)2+(10.1-10)2+(10.2-10)2+(10.3-10)2+(10.4-10)2]=0.06.(2)因为x -甲 =x -乙=10,s 2甲>s 2乙,所以用乙机床加工这种零件较合适.用样本估计总体时,样本的平均数、方差只是总体的平均数、方差的近似值.在实际中,当所得数据的平均数不同时,需先分析平均水平,再计算方差,分析稳定情况.从同一地块甲、乙两种玉米的苗中共抽18株,分别测得它们的株高(单位:cm)如下茎叶图所示:(1)哪种玉米的苗长得高?哪种玉米的苗长得齐?(2)这18株玉米株高的平均值和方差分别是多少?解 (1)由茎叶图可得所抽取的甲、乙两种玉米苗的株高分别为甲:15,21,22,25,37,39,40,41.乙:16,16,16,27,27,40,40,40,44,44.x -甲=18×(15+21+22+25+37+39+40+41)=30,x -乙=110×(16+16+16+27+27+40+40+40+44+44)=31.因为x -甲<x -乙,所以乙种玉米的苗长得高.s 2甲=18×[(15-30)2+(21-30)2+(22-30)2+(25-30)2+(37-30)2+(39-30)2+(40-30)2+(41-30)2]=93.25.s 2乙=110×[(16-31)2+(16-31)2+(16-31)2+(27-31)2+(27-31)2+(40-31)2+(40-31)2+(40-31)2+(44-31)2+(44-31)2]=128.8.因为s 2甲<s 2乙,所以甲种玉米的苗长得齐.(2)因为x -甲=30,s 2甲=93.25,甲种玉米抽了8株,x -乙=31,s 2乙=128.8,乙种玉米抽了10株,所以这18株玉米株高的平均值x -=818×30+1018×31≈30.56,这18株玉米株高的方差s 2=818×[93.25+(30-30.56)2]+1018×[128.8+(31-30.56)2]≈113.25.题型二 用频率分布直方图估计数据的数字特征例2 从高三抽出50名学生参加数学竞赛,由成绩得到如图的频率分布直方图.试利用频率分布直方图求:(1)这50名学生成绩的众数与中位数;(2)这50名学生成绩的平均数(答案精确到0.1).[解] (1)由众数的概念可知,众数是出现次数最多的数.在直方图中高度最高的小长方形框的中间值的横坐标即为所求,所以由频率分布直方图得众数应为75.由于中位数是所有数据中的中间值,故在频率分布直方图中体现的是中位数的左右两边频数应相等,即频率也相等,从而就是小矩形的面积和相等.因此在频率分布直方图中将频率分布直方图中所有小矩形的面积一分为二的直线所对应的成绩即为所求.∵0.004×10+0.006×10+0.02×10=0.04+0.06+0.2=0.3,∴前三个小矩形面积的和为0.3,而第四个小矩形面积为0.03×10=0.3,0.3+0.3>0.5,∴中位数应位于第四个小矩形内.设其底边为x ,高为0.03,令0.03x =0.2得x ≈6.7,故中位数约为70+6.7=76.7.(2)样本平均值应是频率分布直方图的“重心”,即所有数据的平均值,取每个小矩形底边的中点值乘以每个小矩形的面积即可.∴平均数为45×(0.004×10)+55×(0.006×10)+65×(0.02×10)+75×(0.03×10)+85×(0.021×10)+95×(0.016×10)≈73.7.(1)利用频率分布直方图估计一组数据的数字特征:①众数的估计值是最高小矩形的底边中点的横坐标;②中位数左右两侧直方图的面积相等;③平均数大约等于每个小矩形的面积与小矩形底边中点的横坐标之积的和.(2)利用频率分布直方图求得的众数、中位数、平均数均为估计值,往往与实际数据得出的结果不一致,但它们能粗略估计其众数、中位数和平均数.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.求:(1)高一参赛学生成绩的众数、中位数;(2)高一参赛学生成绩的平均数.解(1)由图可知众数为65,又∵第一、二个小矩形的面积分别为0.3,0,4,且0.3+0.4=0.7>0.5,∴设中位数为60+x,则0.3+x×0.04=0.5,得x=5,∴中位数为60+5=65.(2)依题意,平均数为55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67,∴高一参赛学生成绩的平均数为67.题型三用频率分布直方图估计总体的分布例3为了迎接某市作为全国文明城市的复查,爱卫会随机抽取了60位路人进行问卷调查,调查项目是自己对该市各方面卫生情况的满意度(假设被问卷的路人回答是客观的),以分数表示问卷结果,并统计他们的问卷分数,把其中不低于50分的分成五段:[50,60),[60,70),…,[90,100]后画出如图所示的部分频率分布直方图,观察图形信息,回答下列问题:(1)求出问卷调查分数低于50分的被问卷人数;(2)估计全市市民满意度在60分及以上的百分比.[解](1)因为各组的频率和等于1,故低于50分的频率为f=1-(0.015×2+0.030+0.025+0.005)×10=0.1,故低于50分的人数为60×0.1=6.(2)依题意,60分及以上的频率和为(0.015+0.030+0.025+0.005)×10=0.75,所以抽样满意度在60分及以上的百分比为75%.于是,可以估计全市市民满意度在60分及以上的百分比约为75%.频率分布直方图的应用频率分布指的是一个样本数据在各个小范围内所占比例的大小,一般用频率分布直方图反映样本的频率分布,其中:(1)频率分布直方图中纵轴表示频率组距;(2)频率分布直方图中,各个小长方形的面积等于频率,各个小长方形的面积之和为1;(3)长方形的高的比也就是频率之比;(4)频数相应的频率=样本容量.为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小矩形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率约是多少?解(1)频率分布直方图是以面积的形式来反映数据落在各小组内的频率大小的,因此第二小组的频率为42+4+17+15+9+3=0.08.因为第二小组的频率=第二小组的频数样本容量,所以样本容量=第二小组的频数第二小组的频率=120.08=150.(2)由直方图可估计该校全体高一年级学生的达标率约为17+15+9+32+4+17+15+9+3×100%=88%.1.在频率分布直方图中,各个长方形的面积表示()A.落在相应各组的数据的频数B.相应各组数据的频率C.该样本所分成的组数D.该样本的样本容量答案 B解析在频率分布直方图中,横轴是组距,纵轴是频率组距,故每个小长方形的面积是相应各组数据的频率.故选B.2.某班全体学生参加物理测试成绩的频率分布直方图如图所示,则估计该班物理测试成绩的平均数是()A.70 B.75C.68 D.66答案 C解析平均数就是频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标再求和,即0.005×20×30+0.010×20×50+0.020×20×70+0.015×20×90=68.3.为了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校400名授课教师中抽取20名,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示如图.据此可估计该校上学期400名教师中,使用多媒体进行教学次数在[16,30)内的人数为()A.100 B.160C.200 D.280答案 B解析由茎叶图可知在20名教师中,上学期使用多媒体进行教学的次数在[16,30)内的人数为8,据此可以估计400名教师中,使用多媒体进行教学次数在[16,30)内的人数为820×400=160.4.某社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本频率分布直方图(如图所示).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10000人中再用分层抽样方法抽出100人进行调查,则在[2500,3000)(单位:元)的月收入段应抽出________人.答案25解析因为月收入在[2500,300)的频率为0.0005×500=0.25,所以10000人中月收入在[2500,3000)的人数为0.25×10000=2500.所以用分层抽样方法抽出100人,月收入在[2500,3000)的人数为10010000×2500=25.5.一个水库养了某种鱼10万条,从中捕捞了20条,称得它们的质量(单位:kg)如下茎叶图所示:计算样本的平均数,并根据结果估计水库中所有鱼的总质量.解 由茎叶图可得样本数据分别为:1.04,1.07,1.09,1.10,1.11,1.12,1.14,1.15,1.15,1.16,1.16,1.18,1.19,1.21,1.21,1.24,1.25,1.25,1.29,1.32.所以样本的平均数x -=120×(1.04+1.07+1.09+1.10+1.11+1.12+1.14+1.15×2+1.16×2+1.18+1.19+1.21×2+1.24+1.25×2+1.29+1.32)=1.1715.水库中鱼的总质量约为1.1715×100000=117150(kg).答:样本的平均数为1.1715,估计水库中所有鱼的总质量约为117150 kg.。

5. 用样本估计总体-【新教材】人教B版(2019)高中数学必修第二册精品课件

5. 用样本估计总体-【新教材】人教B版(2019)高中数学必修第二册精品课件
第5章 5.1 5.1.4 用样本估计总体-【新教材】人教B版(2 019) 高中数 学必修 第二册 课件
第5章 5.1 5.1.4 用样本估计总体-【新教材】人教B版(2 019) 高中数 学必修 第二册 课件
4.从甲、乙两个班中各随机选出 15 名同学进行随堂测验,成 绩的茎叶图如图所示,则甲、乙两组的最高成绩分别是________, ________,从图中看,________班的平均成绩较高.
用样本的数字特征估计总体的数字特征 【例 1】 甲、乙两人在相同条件下各打靶 10 次,每次打靶的 成绩情况如图所示:
(1)填写下表:
平均数 方差 中位数 命中 9 环及以上

7
1.2
1

5.4
3
(2)请从四个不同的角度对这次测试进行分析:
①从平均数和方差结合分析偏离程度;
②从平均数和中位数结合分析谁的成绩好些;
1.用样本估计总体 (1)前提 样本的容量恰当,抽样方法合理. (2)必要性 ①在容许一定误差存在的前提下,可以用样本估计总体,这样 能节省人力和物力. ②有时候总体的数字特征不可能获得,只能用样本估计总体.
第5章 5.1 5.1.4 用样本估计总体-【新教材】人教B版(2 019) 高中数 学必修 第二册 课件
A.588 B.480 C.450 D.120
第5章 5.1 5.1.4 用样本估计总体-【新教材】人教B版(2 019) 高中数 学必修 第二册 课件
第5章 5.1 5.1.4 用样本估计总体-【新教材】人教B版(2 019) 高中数 学必修 第二册 课件
B [∵少于 60 分的学生人数为 600×(0.05+0.15)=120, ∴不少于 60 分的学生人数为 600-120=480.]

新教材人教B版必修第二册 用样本估计总体 学案

新教材人教B版必修第二册    用样本估计总体   学案

5.1.4用样本估计总体
学习目标
1.会用样本的数字特征估计总体的数字特征,提高数据运算的核心素养.
2.会用样本的分布估计总体的分布,提高数据分析的核心素养.
3.通过样本和总体的关系,体会部分和整体的辩证统一的关系,初步建立统计的概念,体会统计在生产和生活中的应用.
课堂练习
问题1:如何计算我班男生的平均体重?
问题2:已知我班男生平均体重为m,我班女生平均体重为n,如何估算我班学生平均体重?
问题3:某营养协会想调查某市所有高中学生的平均体重,你可以提供几种估算办法?
任务一阅读课本77~79页,完成下列问题.
(1)对“情景与问题”的98个数据,用简单随机抽样的方法进行抽样,样本为
169169163175163170164151155165
求样本的平均数和方差;
(2)样本的平均数和方差与总体的平均数和方差比较,你能得出什么结论?
(3)如果样本是用分层抽样的方法得到的,如何估计总体的数字特征?
在考察某中学学生身高时,如果用分层抽样的方法,得到男生身高平均数为170,方差为16,女生身高平均数为165,方差为25.
①如果没有其他信息,如何估计总体的平均数和方差?
②如果知道样本中男生20人,女生15人,如何估计总体的平均数和方差?
方法一:用男生或者女生身高的平均数与方差估计总体.
方法二:用每一次样本数字特征的算术平均数作为总体的估计,按照此种方法,估计总体的平均数为,方差为.
方法三:把各层数据集中在一起重新计算,按照此种方法,可以估计出总体的平均数
为,方差为.
以样本分两层为例,假设第一层有m个数,分别为x1,x2,…,x m,平均数为。

高一【数学(人教B版)】用样本估计总体(2)-教学设计

高一【数学(人教B版)】用样本估计总体(2)-教学设计

教学设计
12

钟尝试与
发现
通过对某中学1257名高一学生
期中考试的数学成绩(具体数据
见教材P85)进行整理,可以得
到如下数据,并由此可作出频率
分布直方图和折线图,如右图所
示.从数据中抽取容量为100的
样本,整理类似的表
格,并制作频率分布直
方图.
教师引导学生从中抽取出两个容量为100的样本,并得到频数和频率表,画出频率分布直方图.
教师引导学生对样本的分布与总体分布进行比较。

并指出:样本A的折线图和总体分布的折线图相似度非常高,几乎重合到一起,样本B的折线图和总体分布的折线图有些差异,但是整体也是相似的.当我们无法获取总体数据的时候,可以通过画样本的频率分布直方图及折线图来估计总体的分布,显然,和用样分组频数频率
[40,50)70.01
[50,60)650.05
[60,70)2760.22
[70,80)4800.38
[80,90)3300.26
[90,100]990.08。

新教材人教b版必修第二册第五章514用样本估计总体课件

新教材人教b版必修第二册第五章514用样本估计总体课件

【解析】选 C.依次分析选项可得:
A.第一季度总产值 3+4+4.5=11.5(万元),错误;
4.5+6+6.8
B.第二季度平均产值为 3
≈5.77(万元),错误;
C.第二季度比第一季度增加(4.5+6+6.8)-(3+4+4.5)=5.8(万元),正确; D.第二季度比第一季度增长151..85 ≈50%,错误.
A.18篇
B.24篇
C.25篇 D.27篇
【解析】选D.由题意,得优秀的调查报告所占的百分比为1-(5%+15%+35%) =45%,所以优秀调查报告有60×45%=27篇.
3.对于数据3,3,2,3,6,3,10,3,6,3,2,有下列结论: ①这组数据的众数是3; ②这组数据的众数与中位数的数值不相等; ③这组数据的中位数与平均数的数值相等; ④这组数据的平均数与众数的数值相等. 其中正确结论的个数为( ) A.1 B.2 C.3 D.4
【解析】选 C.该组数据的极差为 52-18=34,中位数为(27+32)÷2=29.5,平均 数为110 ×(18+23+25+26+27+32+33+35+49+52)=32,观察可知,①③正 确.
2.如图是某位同学近5次数学测试成绩(单位:分)的茎叶图,其中有一次测试 成绩记录不清楚,其末位数记为x,若该同学这5次数学测试成绩的中位数是 122分,则该同学这5次数学测试成绩的平均数不可能是( )
(3)设中位数为x吨. 因为前5组的频率之和为++++=0.73>0.5. 又前4组的频率之和为+++=0.48<0.5.所以2≤x<2.5. 由0.50×(x-2)=-,解得x=2.04. 故可估计居民月均用水量的中位数为吨.
【类题通法】(1)准确理解频率分布直方图的数据特点,频率分布直方图中纵 轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的 频率和条形图混淆. (2)抓住频率分布直方图中各小长方形的面积之和为1,这是解题的关键.而利 用频率分布直方图可以估计总体分布.

高一【数学(人教B版)】由样本估计总数及其模拟-教学设计

高一【数学(人教B版)】由样本估计总数及其模拟-教学设计

从上述表格中,我们可以明显地看到,不管是两位同学提出的最大值估计法,平均值估计法还是统计学家进行的估计,最终得到的结果都比情报数据更接近真实数据.从中我们可以统计方法的威力.
年份最大值
估计
平均数
估计
统计学家的
估计
真实

情报
数据
1940年6月1131141691221000 1941年6月2042202442711550 1942年6月2862863273421550
4分钟计算
机模

教师带领学生进行计算机模拟,计算三种估计方法的误差.
现在我们已经知道了事实上德军生产的坦克总量,那么我们就可以利用计算机模拟的方法,得到较多的样本数据,进而比较三种估计方法的误差大小.以1940年6月为例,德军实际生产的坦克是122辆.
在Excel中设定总数122,然后用随机数函RANDBETWEEN产生一些编号样本,为了对比三种估计方法,哪种方法的估计结果更接近122,可以多模拟产生几组样本数据.
按照前面提到的三种估计方法,通过每组样本数据得到的估计如下表所示:
最大值估计112 116 102
平均数估计139 121 105
“均匀分布”118 122 107
真实值122 122 122
整体来看,将样本数据看成在序列0,1,2 ,n中随机取的数.进而认为,这些取得的数是“均匀”分布在序列中的.这种估计方法产生的误差较小.
1分钟统计
推断
让我们回到小黄车的实际案例中,通过前面的分析,相信同学们对最初提出的两个问题都有了答案,请同学们课后按照所给的《由样本编号估计总数活动记录表》做进一步的整理和完。

数学新学案人教B件用样本估计总体

数学新学案人教B件用样本估计总体

案例三:医学领域疾病诊断应用
01
数据收集
收集一定数量的患者样本,包括患者的症状、体征、实验室检查结果等
信息。
02
数据分析
通过对患者样本的信息进行统计和分析,找出与疾病相关的关键指标和
特征。
ห้องสมุดไป่ตู้
03
总体估计
根据样本数据,运用统计学方法对疾病的总体情况进行估计和预测,为
医生制定治疗方案和评估治疗效果提供依据。同时,也可以为医学研究
数据分析方法举例
描述性统计分析
通过计算均值、中位数 、众数、方差等统计量 ,初步了解数据分布和
特征。
推论性统计分析
利用假设检验、置信区 间等方法,对总体参数
进行估计和推断。
回归分析
通过建立回归模型,探 究自变量和因变量之间 的线性或非线性关系。
方差分析
通过比较不同组别间的 差异,分析因素对实验
结果的影响程度。
统计量计算与分析
样本均值
计算样本数据的平均值, 用于估计总体均值。
样本方差
计算样本数据的离散程度 ,用于估计总体方差。
样本比例
计算样本中某一特征的比 例,用于估计总体中该特 征的比例。
估计方法比较与评价
点估计
通过样本统计量直接给出总体参 数的估计值,如样本均值作为总
体均值的点估计。
区间估计
根据样本统计量和抽样分布,构造 一个包含总体参数的置信区间,用 于评估估计的准确性和可靠性。
05
案例分析与讨论环节
案例一:某地区高考成绩分布情况
数据收集
收集该地区所有考生的高考成绩,并进行整理。
数据分析
通过计算平均分、最高分、最低分、标准差等指标,对该地区高考 成绩分布情况进行描述和分析。

5.1.4++用样本估计总体+课件2024-2025学年高一上学期数学人教B版(2019)必修第二册

5.1.4++用样本估计总体+课件2024-2025学年高一上学期数学人教B版(2019)必修第二册
5×1 +5×2 1 +2
(2)平均数 =
=
=73.5.
5+5
2
方差32
1
5×5
=
×[(5×104+5×56)+
×(73-74)2]=80.25.
5+5
5+5
防范措施
由两组数据合为一组数据,在求新数据组的平均数和方差时,不能简单地取
两者的平均数得到.
【变式训练】 已知数据组甲:-1,0,2,6,-2;乙:-2,3,5.
10
+(36-35)2+(38-35)2+(40-35)2+(41-35)2+(45-35)2]=35.4,由样本估计总体,知
选项D错误.
答案:BC
探究二
用样本的分布来估计总体的分布
【例2】 从高三抽出50名学生参加数学竞赛,由成绩得到如下的频率分布
直方图.
已知第二、六、四小矩形的面积依次成2倍关系.
17+15+9+3
×100%=88%.
2+4+17+15+9+3
=45.5,
2
则可估计海水稻根系深度的中位数为45.5,故选项A错误;
抽取的普通水稻根系深度的众数是32,由样本估计总体,知选项B正确;
海水稻根系深度的平均数为
38+39+39+43+44+47+49+50+50+51
=45,普通水稻根系深度的平均数为
10
25+27+32+32+34+36+38+40+41+45

高中数学B版必修2教学设计 5.1.4 用样本估计总体 第二课时

高中数学B版必修2教学设计 5.1.4 用样本估计总体 第二课时
分别记为样本A,样本B ,分别得到如下的频数、频率对应表,它们的 频率分布直方图.
用样本估计总体
例2. 我国是世界上严重缺水的国家之一,某市为了制定合理的节水方 案,对家庭用水情况进行了调查,通过抽样,获得了某年100个家庭的 月均用水量(单位:t),将数据按照[0,1),[1,2),[2,3),[3,4), [4,5)分成了5组,制成了如图所示频率分布直方图.
(1)求图中a的值;
(2)设该市有10万个家庭,估计全市月均用水量不 低于3t的家庭数;
(3) 假设同组的每个数据都用该组区间的中点值代替,估计全市家庭 月均用水量的平均数.
谢谢 看

人教版高中数学B版必修第二册 第五章
《用样本估计总体》
主 讲 人:王瑞群 北京市第二十中学 审核指导: 张 鹤 北京市海淀区教师进修学校
用样本估计总体
【尝试与发现】 通过对某中学1257名高一学生期中考试的数学成绩(具体数据参
见课本85-87页)进行整理,可以得到如下数据,并由此可作出频率 分布直方图和折线图,如图所示.
分组
频数
频率
[40,50)7ຫໍສະໝຸດ 0.01[50,60)
65
0.05
[60,70)
276
0.22
[70,80)
480
0.38
[80,90)
330
0.26
[90,100)
99
0.08
用样本估计总体
【学生活动1】 在附录的数据中抽取容量是100的样本,整理类似的表格,并制作
频率分布直方图. 学生分成2组,选用随机抽样的方法分别抽取容量是100的样本,
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

用样本估计总体【学习目标】1.理解用样本的数字特征估计总体的数字特征的方法,会分析实际问题。

2.能够利用频率分布直方图、茎叶图等解决统计问题。

【学习重难点】1.用样本的数字特征估计总体的数字特征。

2.用样本分布估计总体分布。

【学习过程】问题导学预习教材P77-P83的内容,思考以下问题: 1.如何用样本平均数估计总体平均数?2.样本方差、标准差公式是什么?它们的区别与联系是什么?3.在电视大奖赛中,计算评委打分的平均值时,为什么要去掉一个最高分和一个最低分?4.如何用频率分布直方图估计平均数、中位数、众数?5.同样一组数据,如果组距不同,得到的频率分布直方图也会不同吗? 【新知初探】1.简单随机抽样的数字特征一般情况下,如果样本的容量恰当,抽样方法又合理的话,样本的特征能够反映总体的特征。

特别地,样本平均数(也称为样本均值)、方差(也称为样本方差)与总体对应的值相差不会太大。

一般来说,在估计总体的数字特征时,只需直接算出样本对应的数字特征即可。

2.分层抽样的数字特征我们以分两层抽样的情况为例。

假设第一层有m 个数,分别为x 1,x 2,…,x m ,平均数为x -,方差为s 2;第二层有n 个数,分别为y 1,y 2,…,y n ,平均数为y -,方差为t 2.则x -=1m ∑i =1m x i ,s 2=1m ∑i =1m (x i -x -)2,y -=1n ∑i =1n y i ,t 2=1n ∑i =1n (y i -y -)2.如果记样本均值为a -,样本方差为b 2,则可以算出111m ni i i i mx ny a x y m n m n ==+⎛⎫=+= ⎪++⎝⎭∑∑ , ()22222222()()1()m s x a n t y a mn b ms nt x y m nm n m n ⎡⎤⎡⎤+-++-⎡⎤⎣⎦⎣⎦==++-⎢⎥+++⎣⎦【自我检测】1.判断正误(正确的打“√”,错误的打“×”) (1)样本的平均数描述了样本数据的平均水平。

( ) (2)方差越大、数据越集中在平均数左右。

( ) (3)中位数是样本数据中最中间位置的数据。

( ) 2.下列说法不正确的是( )A .频率分布直方图中每个小矩形的高就是该组的频率B .频率分布直方图中各个小矩形的面积之和等于1C .频率分布直方图中各个小矩形的宽一样大D .频率分布折线图是依次连接频率分布直方图的每个小矩形上边的中点得到的3.如图是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知( )A .甲运动员的成绩好于乙运动员B .乙运动员的成绩好于甲运动员C .甲、乙两名运动员的成绩没有明显的差异D .甲运动员的最低得分为0分4.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm ),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100cm 。

探究一、用样本的数字特征估计总体的数字特征1.甲、乙两机床同时加工直径为100cm 的零件,为检验质量,从中抽取6件测量数据为:甲:99 100 98 100 100 103乙:99 100 102 99 100 100 (1)分别计算两组数据的平均数及方差;(2)根据计算说明哪台机床加工零件的质量更稳定。

[规律方法](1)在实际问题中,仅靠平均数不能完全反映问题,还要研究其偏离平均值的离散程度(即方差或标准差),方差大说明取值分散性大,方差小说明取值分散性小或者取值集中、稳定。

(2)关于统计的有关性质及规律:①若x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,…,mx n +a 的平均数是m x -+a ;②数据x 1,x 2,…,x n 与数据x 1+a ,x 2+a ,…,x n +a 的方差相等; ③若x 1,x 2,…,x n 的方差为s 2,那么ax 1,ax 2,…,ax n 的方差为a 2s 2. [跟踪训练]1.某校高二年级在一次数学选拔赛中,由于甲、乙两人的竞赛成绩相同,从而决定根据平时在相同条件下进行的六次测试确定出最佳人选,这六次测试的求两人比赛成绩的平均数以及方差,并且分析成绩的稳定性,从中选出一位参加数学竞赛。

2.在对树人中学高一年级学生身高(单位:cm)的调查中,采用分层抽样的方法,抽取了男生23人,其平均数和方差分别为170.6和12.59,抽取了女生27人,其平均数和方差分别为160.6和38.62,你能由这些数据计算出样本的方差,并对高一年级全体学生身高的方差作出估计吗?探究二、频率分布直方图与数字特征的综合应用2.已知一组数据:125121123125127129125128130129126124125127126122124125126128(2)作出频率分布直方图;(3)根据频率分布直方图或频率分布表求这组数据的众数、中位数和平均数。

(1)利用频率分布直方图求数字特征:①众数是最高的矩形的底边的中点;②中位数左右两侧直方图的面积相等;③平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和。

(2)利用直方图求众数、中位数、平均数均为近似值,往往与实际数据得出的不一致,但它们能粗略估计其众数、中位数和平均数。

3.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组,绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.求:(1)高一参赛学生的成绩的众数、中位数;(2)高一参赛学生的平均成绩。

【达标反馈】1.甲乙两名学生六次数学测验成绩(百分制)如图所示。

①甲同学成绩的中位数大于乙同学成绩的中位数;②甲同学的平均分比乙同学高;③甲同学的平均分比乙同学低;④甲同学成绩的方差小于乙同学成绩的方差。

上面说法正确的是()B.①②④C.②④D.①③2.如图所示是一容量为100的样本的频率分布直方图,则由图中的数据可知,样本落在[15,20]内的频数为()A.20B.30C.40D.503.如图茎叶图表示的是甲、乙两人在5次综合测评中的成绩,其中一个数字被污损,若乙的平均分是89,则污损的数字是________。

4.甲、乙两人在相同条件下各打靶10次,每次打靶的成绩情况如图所示:平均数方差中位数命中9环及以上甲71.21乙5.43(2)请从四个不同的角度对这次测试进行分析:①从平均数和方差结合分析偏离程度;②从平均数和中位数结合分析谁的成绩好些;③从平均数和命中9环以上的次数相结合看谁的成绩好些;④从折线图上两人射击命中环数及走势分析谁更有潜力。

【参考答案】【自我检测】 1.答案:(1)√ (2)× (3)×2.解析:选A .频率分布直方图中每个小矩形的高=频率组距。

3.解析:选A .由茎叶图可以看出甲的成绩都集中在30~50分,且高分较多。

而乙的成绩只有一个高分52分,其他成绩比较低,故甲运动员的成绩好于乙运动员的成绩。

4.解析:60×(0.015+0.025)×10=24. 答案:24探究一、用样本的数字特征估计总体的数字特征1.【解】(1)甲=16(99+100+98+100+100+103)=100,乙=16(99+100+102+99+100+100)=100, s 2甲=16[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=73,s 2乙=16[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.(2)由(1)知甲=乙,比较它们的方差,因为s 2甲>s 2乙,故乙机床加工零件的质量更稳定。

[跟踪训练]1.解:设甲、乙两人成绩的平均数分别为甲,乙,则甲=130+16(-3+8+0+7+5+1)=133,乙=130+16(3-1+8+4-2+6)=133, s 2甲=16[(-6)2+52+(-3)2+42+22+(-2)2]=473, s 2乙=16[02+(-4)2+52+12+(-5)2+32]=383。

因此,甲与乙的平均数相同,由于乙的方差较小,所以乙的成绩比甲的成绩稳定,应该选乙参加竞赛比较合适。

2.解:把样本中男生的身高记为x1,x2,…,x23,其平均数记为,方差记为s2x;把样本中女生的身高记为y1,y2,…,y27,其平均数记为,方差记为s2y,把样本的平均数记为,方差记为s2.则=23×170.6+27×160.623+27=165.2,s2==23×[12.59+(170.6-165.2)2]+27×[38.62+(160.6-165.2)2]50=51.4862.即样本的方差为51.4862.因此估计高一年级全体学生身高的方差为51.4862.探究二、频率分布直方图与数字特征的综合应用频数累计(2)(3)在[124.5,126.5)中的数据最多,取这个区间的中点值作为众数的近似值,得众数为125.5,事实上,众数的精确值为125.图中虚线对应的数据是124.5+2×58=125.75,事实上,中位数为125.5.使用“组中值”求平均数:=121.5×0.1+123.5×0.15+125.5×0.4+127.5×0.2+129.5×0.15=125.8,事实上,平均数的精确值为=125.75.3.解:(1)由题图可知众数为65,又因为第一个小矩形的面积为0.3,所以设中位数为60+x ,则0.3+x ×0.04=0.5,得x =5, 所以中位数为60+5=65. (2)依题意,平均成绩为:55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67, 所以高一参赛学生的平均成绩约为67. 【达标反馈】1.解析:选A .甲的中位数为81,乙的中位数为87.5,故①错,排除B 、D ;甲的平均分=16(76+72+80+82+86+90)=81,乙的平均分′=16(69+78+87+88+92+96)=85,故②错,③对,排除C ,故选A .2.解析:选B .样本数据落在[15,20]内的频数为: 100×[1-5×(0.04+0.10)]=30.3.解析:设污损的叶对应的成绩为x ,由茎叶图可得,89×5=83+83+87+x +90+99,所以x =3.故污损的数字是3.答案:34.解:(1)乙的打靶环数依次为2,4,6,8,7,7,8,9,9,10.所以乙=110(2+4+6+8+7+7+8+9+9+10)=7;乙的打靶环数从小到大排列为2,4,6,7,7,8,8,9,9,10,所以中位数是7+82=7.5;甲的打靶环数从小到大排列为5,6,6,7,7,7,7,8,8,9,所以中位数为7.于是填充后的表格如(2)①甲、乙的平均数相同,均为7,但s 2甲<s 2乙,说明甲偏离平均数的程度小,而乙偏离平均数的程度大。

相关文档
最新文档