用样本估计总体
第九章 第二节 用样本估计总体
4.(2010·安徽高考 某市 . 安徽高考)某市 安徽高考 某市2010年4月1日~4月30日对空气污 年 月 日 月 日对空气污 染指数的监测数据如下(主要污染物为可吸入颗粒物 : 染指数的监测数据如下 主要污染物为可吸入颗粒物): 主要污染物为可吸入颗粒物 61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86, 81,83,82,82,64,79,86,85,75,71,49,45.
本题条件不变, 本题条件不变,由频率分布表与频率分布直方图能否判 断本月对空气污染指数的监测的数据众数和中位数落在 哪个小组内? 哪个小组内? 解:由频率分布表及直方图可判断众数和中位数均在 [81,91]这一组内,证明该市空气质量基本良好. 这一组内,证明该市空气质量基本良好. 这一组内
[归纳领悟 归纳领悟] 归纳领悟 1.频率分布表和频率分布直方图是一组数据频率分布的两 . 种形式,前者准确,后者直观. 种形式,前者准确,后者直观. 频率 2.频率分布直方图中横坐标表示组距,纵坐标表示 .频率分布直方图中横坐标表示组距, , 组距 频率 频率=组距× . 频率=组距× 组距 3.频率分布直方图中各小长方形的面积之和为 .频率分布直方图中各小长方形的面积之和为1.
[究 疑 点] 究 1.在频率分布直方图中,中位数、众数与平均数如何确定? .在频率分布直方图中,中位数、众数与平均数如何确定? 提示:在频率分布直方图中, 提示:在频率分布直方图中,中位数左边和右边的直 方图的面积相等,由此可以估计中位数的值, 方图的面积相等,由此可以估计中位数的值,而平均 数的估计值等于频率分布直方图中每个小矩形的面积 乘以小矩形底边中点的横坐标之和. 乘以小矩形底边中点的横坐标之和.众数是最高的矩 形的中点的横坐标. 形的中点的横坐标. 2.频率分布直方图中纵轴的含义是频率吗? .频率分布直方图中纵轴的含义是频率吗? 提示:不是.表示的是频率 组距 组距. 提示:不是.表示的是频率/组距.
第九章第二节用样本估计总体
返回
用C表示“选出的两名同学的植树总棵数为19”这一事件,则C中的结 果有4个,它们是:(A1,B4),(A2,B4),(A3,B2),(A4,B2).故所求 4 1 概率为P(C)=16=4.
返回
[巧练模拟]———————(课堂突破保分题,分分必保!)
解析:由茎叶图知平均值为
2
114+126+128+132 =125, 4
1 ∴s =4[(125-114)2+(125-126)2+(125-128)2+(125-132)2]=45.
答案: C
返回
4.一个容量为20的样本数据,分组后,组别与频数如下:
则样本在(20,50]上的频率为_____方图中,中位数左边和右边的直方图的 面积相等,由此可以估计中位数的值,而平均数的估 计值等于频率分布直方图中每个小矩形的面积乘以小
矩形底边中点的横坐标之和,众数是最高的矩形的中
点的横坐标.
返回
2.对标准差与方差的理解: 标准差、方差描述了一组数据围绕平均数波动的大 小.标准差、方差越大,数据的离散程度越大,标准 差、方差越小,数据的离散程度越小,因为方差与原 始数据的单位不同,且平方后可能夸大了偏差的程度, 所以虽然方差与标准差在刻画样本数据的分散程度上
返回
(1)求第6位同学的成绩x6,及这6位同学成绩的标准差s;
(2)从前5位同学中,随机地选2位同学,求恰有1位同学
成绩在区间(68,75)中的概率.
返回
[自主解答]
∵这6位同学的平均成绩为75分,
1 ∴6(70+76+72+70+72+x6)=75,解得x6=90. 这6位同学成绩的方差 1 s =6×[(70-75)2+(76-75)2+(72-75)2+(70-75)2+
样本估计整体
探究: 我国是世界上严重缺水的 国家之一,城市 缺水问题较为突出。某市政府为了节约用 水,计划在 本市试行居民生活用水定额管 理,即确定一个居民月用水量标准a,用水 量不超过a的按平价收费,超过 a的按议价 收费。如果希望大部分居民的 日常生活不 受影响,那么标准a定为多少比较合理? 你认为,为了较为合理地确定出这个标准, 需要做什么工作?
2、中位数不受少数几个极端数据(即排序靠前或排序靠后的数据) 的影响,容易计算,它仅利用了数据中排在中间数据的信息。 当样本数据质量比较差,即存在一些错误数据(如数据的录入 错误、测量错误等)时,应该用抗极端数据强的中位数表示 数据的中心值。
3、平均数受样本中每一个数据的影响,“越离群”的数据,对平均 数的影响越大。与众数和中位数相比,平均数代表了数据更多 的信息。
表2-1
3.1 3.4 2.5 2.6
100位居民的月均用水量 (单位 :t )
2.0 2.2 2.0 1.5 1.0 1.6 1.8 1.9 1.6 2.2 1.5 1.2 0.2 0.4 0.3 0.4
3.2
3.3 3.2
2.7
2.8 2.9
2.3
2.3 2.4
2.1 1.6 1.2 3.7 1.5 0.5 3.8
图2.2-2 100位居民的月均用水量的频率分 布折线图
频率
组距
0
a
b
月均用水量/t
※总体密度曲线能够很好的反映总体在各个范围 内的百分比,能够提供更准确的信息。尽管有些 总体密度曲线是客观存在的,但是很难象函数图 象那样准确的地画出来。 ?思考一下图中阴影部分的面积表示什么?
甲
乙
8
4 6 3 3 6 8 3 8 9
思考1:2.03是通过频率直方图估计出来的中位数,
用样本估计总体
9.2 用样本估计总体班级姓名一、学习目标:(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.(2)理解样本数据标准差的意义和作用,会计算数据标准差及方差.(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.(5)会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题.二、学习建议:(1)统计图表是统计中的主要工具,学会从图表中提取有关的数据信息、进行统计推断的方法.(2)加强运算能力的培养,统计的数字计算较繁,要有良好的运算习惯,通过统计的复习提高运算能力.三、自主预习1.从高三学生中抽取50名同学参加数学竞赛,成绩的分组及各组的频数如下(单位:分):[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100),8.知识链接1:列频率分布表、画频率分布直方图的步骤(1)计算极差,即计算一组数据中的差;(2)决定与;(3)将数据分组;(4)列表;(5)画频率分布直方图.注:①频率分布直方图是用小长方形的来表示在各个区间内取值的频率.直角坐标系中的纵轴表示的比值,即小长方形面积=×=频率;②各组频率的和等于,即所有长方形面积的和等于;③频率分布表在数量表示上比较,但不够、,不利于分析数据分布的;④从频率分布直方图可以清楚地看出数据分布的,但是从直方图本身得不出.2.连接频率分布直方图中各个小长方形上端的,就得到频率分布折线图.随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条曲线,统计中称这条曲线为______密度曲线.总体密度曲线反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.2.某公司甲、乙两名职员,自进入公司以来的阶段考核成绩如下:甲的得分:95,81,75,91,86,89,71,65,76,88,94,110,107;乙的得分:83,86,93,99,88,103,98,114,98,79,101.画出两人考核成绩的茎叶图,请根据茎叶图对两人的成绩进行比较.知识链接2:茎叶图的制作方法将所有的两位数的位数字作为茎(若是三位数,则将数字作为茎),位数字作为叶,若是两组数据,则共用一个茎,茎按从小到大的顺序从上向下排列,共茎的叶一般按从大到小或从小到大同行列出.在制作茎叶图时,重复的数字要记录,不能遗漏,特别是叶的部分,同一数据出现几次,就要在图中列出几次3.为了检查一批手榴弹的杀伤半径,抽取了其中20颗做试验,得到这20颗手榴弹的杀伤半径,并列表如下:(1)在这个问题中,总体、个体、样本和样本容量各是什么?(2)求出这20颗手榴弹的杀伤半径的众数、中位数和平均数,并估计这批手榴弹的平均杀伤半径.42)其中产量比较稳定的小麦品种是.知识链接3:众数、中位数与平均数(1)众数:一组数据中出现最多的数据叫做众数;(2)中位数:将一组数据从小到大(或从大到小)依次排列,把数据(或的平均数)叫做中位数,中位数把样本数据分成了相同数目的两部分;(3)平均数:x1,x2,…,x n的平均数x=___________________________注:由于众数仅能刻画某一数据出现的次数较多,对极端值不敏感,而又受极端值左右,因此这些因素制约了仅依赖这些数字特征来估计总体数字特征的准确性.标准差与方差考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本数据到平均数的一种平均距离,一般用s表示.s=____________________________________________四、当堂检测区1.某校对高三年级的学生进行体检,现将高三男生的体重(kg )数据进行整理后分成五组,并绘制频率分布直方图(如图).根据一般标准,高三男生的体重超过65 kg 属于偏胖,低于55 kg 属于偏瘦.已知图中从左到右第一、第三、第四、第五小组的频率分别为0.25,0.20,0.10,0.05,第二小组的频数为400,则该校高三年级的男生总数和体重正常的频率分别为 ( ) A .1000,0.50 B .800,0.50 C .800,0.60 D .1000,0.602用上表分组资料计算病人平均等待时间的估计值3.样本中共有五个个体,其值分别为a,0,1,2,3,若该样本的平均值为1,则样本方差为 ( )A .65 B .65C . 2D .24.观看下面两名选手全垒打数据的茎叶图,对他们的表现进行比较.1961年扬基队外垒手马利斯打破了鲁斯的一个赛季打出60个全垒打的记录.下面是扬基队的历年比赛中的鲁斯和马利斯每年击出的全垒打的比较图:鲁斯 马利斯0 81 3 4 6 52 23 6 8 54 3 3 9 9 7 6 6 1 1 49 4 4 50 6 15.为检测,某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,而极品8件,三级品13件,次品14件.(1)列出样本频率分布表;(2)画出表示样本频率分布的条形图;(3)根据上述结果,估计辞呈商品为二极品或三极品的概率约是多少6.某中学对高三年级进行身高统计,测量随机抽取的40名学生的身高,其结果如下(单位:cm)(1)列出频率分布表;(2)画出频率分布直方图;(3)估计数据落在[150,170]范围内的概率.五、课堂小结:1.众数、中位数、平均数的异同(1)众数、中位数及平均数都是描述一组数据集中趋势的量,是最重要的量.(2) 的大小与一组数据里每个数据均有关系,任何一个数据的变动都会引起的变动,而中位数和众数都不具备此性质.(3)众数考查各数据出现的,当一组数据中有不少数据多次出现时,众数往往更能反映问题.(4)中位数仅与数据的有关,中位数可能出现在所给数据中,也可能不在所给数据中,当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势.2.茎叶图刻画数据的优点(1)所有数据信息都在茎叶图中看到.(2)茎叶图便于记录和表示,且能够展示数据的分布情况.3.利用频率分布直方图估计样本的数字特征(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的相等,由此可以估计中位数的值.(2)平均数:平均数是频率分布直方图的“重心”,等于图中.(3)众数:在频率分布直方图中,众数是的横坐标.9.2 用样本估计总体班级 姓名一、学习目标:(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.(2)理解样本数据标准差的意义和作用,会计算数据标准差及方差.(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.(5)会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题.二、学习建议:(1)统计图表是统计中的主要工具,学会从图表中提取有关的数据信息、进行统计推断的方法. (2)加强运算能力的培养,统计的数字计算较繁,要有良好的运算习惯,通过统计的复习提高运算能力. 三、自主预习1.从高三学生中抽取50名同学参加数学竞赛,成绩的分组及各组的频数如下(单位:分): [40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100),8.知识链接1:列频率分布表、画频率分布直方图的步骤(1)计算极差,即计算一组数据中__最大值与最小值______的差;(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图.注:①频率分布表列出的是在各个不同区间内取值的频率,频率分布直方图是用小长方形面积的大小来表示在各个区间内取值的频率.直角坐标系中的纵轴表示频率与组距的比值,即小长方形面积=组距×频率组距=频率;②各组频率的和等于1,即所有长方形面积的和等于1;③频率分布表在数量表示上比较确切,但不够直观、形象,不利于分析数据分布的总体态势;④从频率分布直方图可以清楚地看出数据分布的总体态势,但是从直方图本身得不出原始的数据内容.2.连接频率分布直方图中各个小长方形上端的中点,就得到频率分布折线图.随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为______密度曲线.总体密度曲线反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.2.某公司甲、乙两名职员,自进入公司以来的阶段考核成绩如下:甲的得分:95,81,75,91,86,89,71,65,76,88,94,110,107; 乙的得分:83,86,93,99,88,103,98,114,98,79,101.画出两人考核成绩的茎叶图,请根据茎叶图对两人的成绩进行比较.从这个茎叶图上可看出,乙的得分情况是大致对称的,中位数是98;甲的得分情况除一个特殊得分外,也大致对称,中位数是88.因此乙成绩比较稳定,总体得分情况比甲好.知识链接2:茎叶图的制作方法将所有的两位数的十位数字作为茎(若是三位数,则将百位,十位数字作为茎),个位数字作为叶,若是两组数据,则共用一个茎,茎按从小到大的顺序从上向下排列,共茎的叶一般按从大到小或从小到大同行列出.在制作茎叶图时,重复的数字要重复记录,不能遗漏,特别是叶的部分,同一数据出现几次,就要在图中列出几次3.为了检查一批手榴弹的杀伤半径,抽取了其中20颗做试验,得到这20颗手榴弹的杀伤半径,并列表如下:(1)在这个问题中,总体、个体、样本和样本容量各是什么?(2)求出这20颗手榴弹的杀伤半径的众数、中位数和平均数,并估计这批手榴弹的平均杀伤半径. 解析: (1)总体是要检查的这批手榴弹的杀伤半径的全体;个体是每一颗手榴弹的杀伤半径;样本是所抽取的20颗手榴弹的杀伤半径;样本容量是20.(2)在20个数据中,10出现了6次,次数最多,所以众数是10(米).20个数据从小到大排列,第10个和第11个数据是最中间的两个数,分别为9(米)和10(米),所以中位数是21(9+10)=9.5(米). 样本平均数4.9)112311610495817(201=⨯+⨯+⨯+⨯+⨯+⨯=x (米)所以,估计这批手榴弹的平均杀伤半径约为9.4米.2)其中产量比较稳定的小麦品种是 甲 .解析:x ¯甲 = 1 5( 9.8 + 9.9 + 10.1 + 10 + 10.2) = 10.0,x ¯乙 = 1 5( 9.4 + 10.3 + 10.8 + 9.7 + 9.8) = 10.0; s 2甲 = 1 5( 9.82 + … + 10.22) – 102 = 0.02,s 2甲 = 1 5( 9.42 + … + 9.82) – 102= 0.244 > 0.02 .知识链接3:众数、中位数与平均数(1)众数:一组数据中出现_次数_最多的数据叫做众数;(2)中位数:将一组数据从小到大(或从大到小)依次排列,把_中间_数据(或___中间两数据__的平均数)叫做中位数,中位数把样本数据分成了相同数目的两部分;(3)平均数:x 1,x 2,…,x n 的平均数x =___________________________注:由于众数仅能刻画某一数据出现的次数较多,中位数对极端值不敏感,而平均数又受极端值左右,因此这些因素制约了仅依赖这些数字特征来估计总体数字特征的准确性.标准差与方差考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本数据到平均数的一种平均距离,一般用s 表示.s =____________________________________________注:由于众数仅能刻画某一数据出现的次数较多,中位数对极端值不敏感,而平均数又受极端值左右,因此这些因素制约了仅依赖这些数字特征来估计总体数字特征的准确性.四、当堂检测区1.某校对高三年级的学生进行体检,现将高三男生的体重(kg )数据进行整理后分成五组,并绘制频率分布直方图(如图).根据一般标准,高三男生的体重超过65 kg 属于偏胖,低于55 kg 属于偏瘦.已知图中从左到右第一、第三、第四、第五小组的频率分别为0.25,0.20,0.10,0.05,第二小组的频数为400,则该校高三年级的男生总数和体重正常的频率分别为 ( D ) A .1000,0.50 B .800,0.50 C .800,0.60 D .1000,0.60[思路] 先求第二小组的频率,结合其频数,就可以得出男生总数,正常体重学生所占频率为第二和第三小组频率之和.[解析] 据题意,得第二小组的频率为1-(0.25+0.20+0.10+0.05)=0.40,且其频数为400,设高三年级男生总数为n ,则有400n =0.40,∴n =1000.体重正常的学生所占的频率为第二和第三小组频率之和,即0.20+0.40=0.60.2[解答] 等待时间在[0,5)内的4个人的等待总时间的估计值为0+52×4=10;等待时间在[5,10)内的8个人的等待总时间的估计值为5+102×8=60;同理,其余三个时间段等待总时间的估计值分别为62.5,35,22.5.所以病人平均等待时间的估计值为10+60+62.5+35+22.54+8+5+2+1=9.5(分钟).3.样本中共有五个个体,其值分别为a,0,1,2,3,若该样本的平均值为1,则样本方差为 ( D )A .65 B .65C . 2D .2 [解析] 由题意知15(a +0+1+2+3)=1,解得a =-1,所以样本方差为s 2=15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2,故选D.4.观看下面两名选手全垒打数据的茎叶图,对他们的表现进行比较.1961年扬基队外垒手马利斯打破了鲁斯的一个赛季打出60个全垒打的记录.下面是扬基队的历年比赛中的鲁斯和马利斯每年击出的全垒打的比较图:鲁斯 马利斯0 81 3 4 6 52 23 6 8 54 3 3 9 9 7 6 6 1 1 49 4 4 50 6 1解析:鲁斯的成绩相对集中,稳定在46左右;马利斯成绩相对发散,成绩稳定在26左右. 5.为检测,某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,而极品8件,三级品13件,次品14件.(1)列出样本频率分布表;(2)画出表示样本频率分布的条形图;(3)根据上述结果,估计辞呈商品为二极品或三极品的概率约是多少(2)样本频率分布的条形图为:(3)此种产品为二极品或三极品的概率约为0.27+0.43=0.7. 点评:条形图中纵坐标一般是频数或频率.6.某中学对高三年级进行身高统计,测量随机抽取的40名学生的身高,其结果如下(单位:cm ) (1)列出频率分布表;(2)画出频率分布直方图;(3)估计数据落在[150,170]范围内的概率. 解析:(1)根据题意可列出频率分布表: (2)频率分布直方图如下:(3)数据落在[150,170]范围内的概率约为0.825.五、课堂小结:1.众数、中位数、平均数的异同(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量.(2)平均数的大小与一组数据里每个数据均有关系,任何一个数据的变动都会引起平均数的变动,而中位数和众数都不具备此性质.(3)众数考查各数据出现的频率,当一组数据中有不少数据多次出现时,众数往往更能反映问题.(4)中位数仅与数据的排列位置有关,中位数可能出现在所给数据中,也可能不在所给数据中,当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势.2.茎叶图刻画数据的优点(1)所有数据信息都可以在茎叶图中看到.(2)茎叶图便于记录和表示,且能够展示数据的分布情况.3.利用频率分布直方图估计样本的数字特征(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数的值.(2)平均数:平均数是频率分布直方图的“重心”,等于图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(3)众数:在频率分布直方图中,众数是最高的矩形底边的中点的横坐标.。
5.1.4用样本估计总体(原卷版)
频数
频率
10
24
2
合计
1
(1)写出表中 、 及图中 的值(不需过程);
(2)若该校高三年级学生有240人,试估计该校高三年级学生参加社区服务的次数在区间 上的人数;
(3)估计该校高三年级学生参加社区服务次数的中位数.(结果精确到0.01)
【变式11】4.(2023·高一课时练习)某校240名学生参加某次数学选择题测验(共10题每题1分),随机调查了20个学生的成绩如下:
A.a的值为0.005
B.估计这组数据的众数为75
C.估计这组数据的第85百分位数为86
D.估计成绩低于60分的有25人
【变式13】3.(2022·安徽·涡阳县第九中学高一期末)某县在创文明县城期间安排了“垃圾分类知识普及实践活动”.为了解市民的学习成果,该县从某社区随机抽取了160名市民作为样本进行测试,记录他们的成绩,测试卷满分为100分,将数据收集,并整理得到频率分布直方图,如图所示:
(1)求频率分布直方图中a的值;
(2)估计该100名射击爱好者的射击平均得分(求平均值时同一组数据用该组区间的中点值作代表);
(3)该俱乐部计划招募成绩位列前10%的滑雪爱好者组成集训队备战明年的滑雪俱乐部联盟赛,请根据图中信息,估计集训队入围成绩(记为k).
【变式21】3.(2023下·湖南益阳·高一统考期末)某校有高一学生1000人,其中男生 600人,女生 400人,为了解该校全体高一学生的身高信息,甲与乙分别进行了调查.
成绩
1分
2分
3分
4分
5分
6分
7分
8分
9分
10分
人数
6
0
0
2
4
2
《用样本估计总体》 讲义
《用样本估计总体》讲义在我们的日常生活和各种科学研究中,常常需要从部分数据(样本)来推断整体的情况(总体)。
这就好像我们通过观察一小部分苹果的质量,来推测整批苹果的质量好坏;或者根据部分学生的考试成绩,来估计整个班级的学习水平。
这种用样本估计总体的方法,是统计学中非常重要的一种手段。
一、为什么要用样本估计总体首先,我们来思考一下,为什么不能直接研究总体呢?这往往是因为总体的数量太大、获取全部数据的成本太高或者根本就不可能获取到全部数据。
比如说,要调查全国所有成年人的身高,这几乎是不可能完成的任务。
但如果我们抽取一部分具有代表性的成年人作为样本,通过对这些样本的测量和分析,就能够对全国成年人的身高情况做出一个相对准确的估计。
用样本估计总体还有一个重要的原因,那就是能够节省时间和资源。
想象一下,如果要对一个大型工厂生产的所有零件进行质量检测,那需要耗费大量的人力、物力和时间。
而通过抽取一定数量的零件作为样本进行检测,就能在较短的时间内,以较小的成本对整批零件的质量有一个大致的了解。
二、样本与总体的关系样本是从总体中抽取出来的一部分个体或观测值。
总体则是我们所关心的研究对象的全体。
样本应该具有代表性,也就是说,样本的特征应该能够反映总体的特征。
举个例子,如果要研究一个城市居民的收入水平,不能只抽取高收入人群作为样本,也不能只抽取低收入人群,而应该按照一定的比例,从不同收入层次的人群中抽取样本,这样得到的样本才能较好地代表总体的收入情况。
样本的大小也会影响估计的准确性。
一般来说,样本越大,估计的准确性就越高。
但样本大小也不是越大越好,因为过大的样本会增加调查的成本和难度。
所以,在实际应用中,需要根据具体情况,选择合适的样本大小。
三、抽样方法为了获得具有代表性的样本,我们需要采用合适的抽样方法。
常见的抽样方法有简单随机抽样、分层抽样和系统抽样。
简单随机抽样是最基本的抽样方法,就是从总体中随机地抽取个体,每个个体被抽取的概率相等。
课件1:5.1.4 用样本估计总体
课程标准
学科素养
理解并会运用样本的数字特征估 通过对用样本估计总体的学习,强
计总体的数字特征,用样本的分布 化数据分析、数学运算、数学建模
估计总体的分布,通过实例体会其 的核心素养.
意义和作用.
【自主预习】
知识点1 用样本的数字特征估计总体的数字特征
一般情况下,如果样本的容量恰当,抽样方法又合理的话,样本 的特征能够反映总体的特征.特别地,样本平均数(也称为样本均 值)、方差(也称为样本方差)与总体对应的值相差不会____太__大____.
[方法总结] 1.众数、中位数、平均数与频率分布表、频率分布直方图的关系 (1)众数:众数一般用频率分布表中频率最高的一小组的组中值来表示, 即在样本数据的频率分布直方图中,最高矩形的底边中点的横坐标.
(2)中位数:在频率分布表中,中位数是累计频率(样本数据小于某一数 值的频率叫作该数值点的累计频率)为0.5时所对应的样本数据的值,而 在样本中有50%的个体小于或等于中位数,也有50%的个体大于或等于 中位数.因此,在频率分布直方图中,中位数左边和右边的直方图的 面积应该相等.
探究三 在频率分布直方图中求平均数、中位数、众数
【例3】某校从参加高二年级学业水平测试的学生中抽出80名学生, 其数学成绩(均为整数)的频率分布直方图如图所示. (1)求这次测试数学成绩的众数; (2)求这次测试数学成绩的中位数; (3)求这次测试数学成绩的平均分.
解 (1)由图知众数为70+2 80=75.
【课堂小结】
1. 样本平均数与总体平均数的关系:①在简单随机抽样中,我们常 用样本平均数-y 去估计总体平均数-Y . ②一般地,大部分样本平均数离总体平均数不远,在总体平均数附近 波动.样本量越大,波动幅度越小. 2.众数、中位数分别是频率分布直方图中最高的小矩形的中间值、 累计频率为 0.5 时所对应的样本数据的值,平均数为每个小矩形底边 中点的横坐标与小矩形的面积的乘积之和.
用样本估算总体
用样本估算总体
◎ 用样本估算总体的定义
用样本估计总体的两个手段:
(1)用样本的频率分布估计总体的分布;
(2)用样本的数字特征估计总体的数字特征,需要从总体中抽取一个质量较高的样本,才能不会产生较大的估计偏差,且样本的容量越大,估计的结果也就越精确。
◎ 用样本估算总体的知识扩展
用样本估计总体的两个手段:
(1)用样本的频率分布估计总体的分布;
(2)用样本的数字特征估计总体的数字特征,需要从总体中抽取一个质量较高的样本,才能不会产生较大的估计偏差,且样本的容量越大,估计的结果也就越精确。
◎ 用样本估算总体的教学目标
1、通过实例,体会用样本估计总体的思想。
2、能够根据统计结果作出合理的判断和推测,能与同学进行交流,用清晰的语言表达自己的观点。
3、根据有关问题查找资料或调查,用随机抽样的方法选取样本,能用样本的平均数和方差,从而对总体有个体有个合理的估计和推测。
◎ 用样本估算总体的考试要求
能力要求:了解
课时要求:40
考试频率:选考
分值比重:2。
☆☆用样本估计总体
组距
0.5
4、列出频率分布表.(填写频率/组距一栏) 5、画出频率分布直方图。
思考: 频率分布条形图和频率分布直方图是两个 相同的概念吗? 有什么区别?
频率分布的条形图和频率分布直方图的区别
两者是不同的概念; 横轴:两者表示内容相同 纵轴:两者表示的内容不相同 频率分布条形图的纵轴(长方形的高)表示频率 频率分布直方图的纵轴(长方形的高)表示 频率与组距的比值, 其相应组距上的频率等于该组距上长方形的面积。
总体密度曲线反映了总体在各个范围内取值的
百分比,精确地反映了总体的分布规律。是研究总
体分布的工具.
用样本分布直方图去估计相应的总体分布时, 一般样本容量越大,频率分布直方图就会无限接 近总体密度曲线,就越精确地反映了总体的分布
规律,即越精确地反映了总体在各个范围内取值
百分比。
表示样本的分布的方法: 3.频率分布折线图 1.频率分布表 样本频率分布中, 分组 个数累计 频数 频率 当样本容量无限增 大,组距无限缩小
频率分布
样本中所有数据(或数据组)的频数和 样本容量的比,叫做该数据的频率。 所有数据(或数据组)的频数的分布 变化规律叫做样本的频率分布。
频率分布的表示形式有:
①样本频率分布表 ②样本频率分布图 样本频率分布条形图 样本频率分布直方图 ③样本频率分布折线图
1、抛掷硬币的大量重复试验的结果: 频率分布表: 样本容量为72 088
分 组 [0,0.5) [0.5,1) [1,1.5) [1.5,2) [2,2.5) [2.5,3) [3,3.5) [3.5,4) [4,4.5] 合计
频数 4 正 8 正 正 正 15 正 正 正 正 22 正 正 正 正 正 25 正 正 14 正 一 6 4 2 100
用样本估计总体
0.0005 0.0004 0.0003 0.0002 0.0001
频率/组距
月收入(元)
1000 1500 2000 2500 3000 3500 4000
课堂练习
3.为了解某校高三学生的视力情况,随机地抽
查了该校 100 名高三学生的视力情况,得到频率
分布直方图,如右,由于不慎将部分数据丢失,
但知道前 4 组的频数成等比数列,后 6 组的频数
频率
组成距 等差数列,设最大频率为 a,视力在 4.6 到 5.0
之间的学生数为 b,则 a,b 的值分别为( A )
A. 0.27,78
频率/组距
B. 0.27,83
C. 2.7,78
0.3
D. 2.7,83
0.2
0.16
0.1 0.08
0.1 0.08 0.04
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
月均用水量/t
同样一组数据,如果组距不同,横轴、纵轴的单位 不同,得到的图的形状也会不同.不同的形状给人以不 同的印象,这种印象有时会影响我们对总体的判断.分 别以1和0.1为组距重新作图,然后谈谈你对图的印象.
第一步: 求极差: (数据组中最大值与最小值的差距) 最大值= 4.3 最小值= 0.2 所以极差= 4.3-0.2 = 4.1
第二步: 决定组距与组数: (注意取整) 当样本容量不超过100时, 按照数据的多少, 常
分成5~12组.
为方便组距的选择应力求“取整”.
本题如果组距为0.5(t).
则
组数=
频率 组距 0.5 0.4 0.3 0.2 0.1
用样本估计总体(频率分布直方图、平均数、方差等)
s2
1 10
4 (2 5)2
2 (5 5)2
4 (8 5)2
7.2
3.(2015 江苏苏州市高三上调考)如图是小王
所做的六套数学附加题得分(满分 40)的茎叶
图,则其平均得分为 .
JSY33
第 3 题图
【考点】茎叶图.
【答案】 31.
【分析】 根据茎叶图的数据,得;
数据的平均分为
x = 18 28 30 32 38 40 =31. 6
55、在公路发展的早期,它们的趋势还能顺从地貌,即沿河流或森林的边缘发展。可 如今,公路已无所不在,狼、熊等原本可以自由游荡的动物种群被分割得七零八落。 与大型动物的种群相比,较小动物的种群在数量上具有更大的波动性,更容易发生杂 居现象。这段话主要讲述的是 。 A.公路发展的趋势 B.公路对动物的影响 C.动物生存状态的变化 D.不同动物的不同命运
56、从3月下旬到10月上旬,太阳在地球上直射位置的移动规律是: A.赤道→南回归线→赤道 B.赤道→北回归线→赤道 C.南回归线→赤道→北回归线
D.人权是个人权利和集体人权的统一
67、在觅食过程中,成百上千只蚂蚁在蚁穴和食物所在处之间来来往往,最终都能够 在相对最短时间内得到食物,却从来不会有拥堵现象出现。德国科学家赫尔冰发现, 避免道路拥堵是基于蚂蚁之间的交流。在一条路有可能出现拥堵时,返回的蚂蚁就向 迎面过来的同伴发出信息素,让它选择另一条路。他认为,人类可以采取相同方法减 少车辆拥塞现象。
这段文字的主旨是 。
A.城市发展面临危机 B.城市是人类文明的中心所在 C.城市的演进伴随着各种问题 D.城市要健康发展必须积极有效地应对各种挑战
69、1983年,沃伦和马歇尔发现人的胃内有幽螺菌(HP),并分离培养成功,为常见的 胃病病因和诊治作出了划时代的贡献。世界上约1/3人口感染HP,我国感染率较高, 儿童占50%以上,成人占70%以上。HP主要通过口口传播,也可经中介物如餐具、牙 具或患者排泄物污染他人的手或食物从而导致感染。防止儿童感染HP,在防止青少年 胃病,促进儿童健康成长和社会公共卫生等方面都有重大意义。
9.2用样本估计总体
授课主题用样本估计总体教学目标1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.3.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.4.会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题.教学内容1.频率分布直方图(1)列出样本数据的频率分布表和频率分布直方图的步骤:①计算极差:找出数据的最大值与最小值,计算它们的差;②决定组距与组数:当样本容量不超过100时,按照数据的多少分成5~12组,且=极差组距组数;③将数据分组:通常对组内数值所在区间区左闭右开区间,最后一组取闭区间;也可以将样本数据多取一位小数分组.④列频率分布表:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.⑤绘制频率分布直方图:以数据的值为横坐标,以频率组距的值为纵坐标绘制直方图。
(2)频率分布直方图的特点:①==⨯频率小长方形的面积组距频率组距,②个小长方形的面积等于1,③1==频率小长方形的高,所有小长方形的高的和组距组距.(3)频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义.(4)总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,频率分布直方图可以用一条光滑曲线()y f x=来描绘,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地n;n①众数、中位数、平均数都是描述一组数据集中趋势的量,平均数是最重要的量;x的平均数为x,则一组数,,n的平均数为用样本的标准差估计总体的标准差)数据的离散程度可以用极差、方差或标准差来描述;定义样本方差为222212()()()n x x x x x x s n-+-++-=;简化公式:22222121[()]n s x x x nx n=+++-=2222121()n x x x x n+++-(方差等于原数据平方的平均数减去平均数的平方)(4)样本的标准差是方差的算术平方根.样本标准差22212()()()0n x x x x x x s s n-+-++-=≥,.标准差越大数据离散程度越大,数据家分散;标准差越小,数据集中在平均数周围. (5)方差相关结论:①如果一组数12,,,n x x x 的方差为2s ,则一组数12,,,n x a x a x a +++的方差为2s ;②如果一组数12,,,n x x x 的方差为2s ,则一组数12,,,n kx kx kx 的方差为22k s 。
用样本估计总体
月收入(元)
1000 1500 2000 2500 3000 3500 4000
练习1、如图是150辆汽车通过某路段 时速度的频率分布直方图,则速度在[60, 60 辆. 70)的汽车大约有______
在频率分布直方图中,依次连接各小长 方形上端的中点,就得到一条折线,这条 折线称为频率分布折线图.
练习3、以往招生Biblioteka 计显示,某所大学录 取的新生高考总分的中位数基本稳定在550 分,若某同学今年高考得了520分,他想报 考这所大学还需收集哪些信息?
要点: (1)查往年录取的新生的平均分数.若平均数 小于中位数很多,说明最低录取线较低,可以 报考; (2)查往年录取的新生高考总分的标准差.若 标准差较大,说明新生的录取分数较分散,最 低录取线可能较低,可以考虑报考.
标准差的取值范围是什么?标准差为0 的样本数据有何特点? s≥0,标准差为0的样本数据都相等. 方差的意义: 方差(或标准差)越大离散程度越大,数 据较分散; 方差(或标准差)越小离散程度越小,数 据较集中在平均数周围.
例 2 、有两个班级,每班各自按学号随 机选出 5 名学生,测验铅球成绩,以考察 体育达标程度,测验成绩如下:单位(米) 甲 9.1 7.8 8.5 6.9 5.2 乙 8.8 7.2 7.3 7.5 6.7 两个班相比较,哪个班整体实力强一些 ?
制作频率分布直方图的方法: (1)求极差(即一组数据中最大值与最小 值的差); (2)决定组距与组数;(样本容量不超过
100时,组数常分成5~12组)
(3)将数据分组; (4)列频率分布表; (5)画频率分布直方图.
注:频率分布直方图中
第55讲 │ 用样本估计总体
用样本估计总体
第55讲 │ 考纲要求 考纲要求
1.了解分布的意义和作用,会列频率分布表,会画频率分布 直方图、频率折线图、茎叶图,理解它们各自的特点. 2.理解样本数据标准差的意义和作用,会计算数据标准差. 3. 能从样本数据中提取基本的数字特征(如平均数、 标准差), 并作出合理的解释. 4.会用样本的频率分布估计总体分布,会用样本的基本数字 特征估计总体的基本数字特征,理解用样本估计总体的思想. 5.会用随机抽样的基本方法和样本估计总体的思想解决一些 简单的实际问题.
第55讲 │ 知识梳理 知识梳理
1.用样本的频率分布估计总体分布 (1)样本中所有数据(或者数据组)的频数和样本容量的比, 就
频率 是该数据的________, 所有数据(或者数据组)的频率的分布变化 频率分布直方图 规律叫做________,可以用频率分布表、______________、频 频率分布
第55讲 │ 要点探究
[点评] 样本的频率分布直方图只刻画了样本的频率分布, 在这个直方图上已经没有样本容量,可以用这个样本的频率分 布去估计总体的频率(概率)分布.如果根据频率分布直方图求解 一些样本数量时,必须知道另外的条件,如某个段上的样本频 数.在样本的频率分布直方图上,小矩形的高是样本在该组的 频率除以组距,不是样本在该组的频率,只有组距等于 1 时, 才是样本在该组的频率,这点也要特别注意.
组数 组距 ________增加,________减小,相应的频率折线图会越来越接
近于一条________,统计中称这条________为总体密度曲线. 光滑曲线 光滑曲线
第55讲 │ 知识梳理
(4)茎叶图:统计中还有一种被用来表示数据的图叫茎叶 图,茎是指中间的________,叶是从茎的旁边________. 一列数 生长出来的数 在样本数据较少时, 用茎叶图表示数据的效果较好, 茎叶 图表示数据有两个突出的优点: 一是它较好地保留了________ 原始数据 分布 信息,二是能够展示数据的________情况,方便记录与表示. 2.样本的数字特征
《用样本估计总体》统计(总体取值规律的估计)
由于样本是总体的一个随机抽样,因 此样本方差可以作为总体方差的估计 。在统计学中,这种用样本方差来估 计总体方差的方法称为二次估计。二 次估计是一种对总体参数的间接估计 方法,通常用于描述一个未知的、但 感兴趣的参数。
估计的准确性
虽然样本方差可以作为总体方差的估 计,但这种估计的准确性取决于样本 的代表性。如果样本是总体的一个随 机抽样,那么样本方差与总体方差之 间的差异通常会较小,从而使得估计 较为准确。然而,如果样本不是随机 抽样,那么样本方差可能会偏离总体 方差,从而使得估计不准确。
估计的准确性
虽然样本中位数可以作为总体中位数 的估计,但这种估计的准确性取决于 样本的代表性。如果样本是总体的一 个随机抽样,那么样本中位数与总体 中位数之间的差异通常会较小,从而 使得估计较为准确。然而,如果样本 不是随机抽样,那么样本中位数可能 会偏离总体中位数,从而使得估计不 准确。
总体取值规律的估
加权中位数
将每个观测值乘以相应的权重后加总,再除以权重的 总和得到的值。它常用于分析不同组观测数据之间的 比较。
方差和标准差
要点一
方差
每个观测值与均值之差的平方的总和再除以观测次数 。它反映的是一组数据的离散程度。
要点二
标准差
方差的平方根。它也反映了一组数据的离散程度,并 且与方差一样,标准差越大,数据点越分散;标准差 越小,数据点越集的调查分析
总结词
通过抽样调查,我们能够了解该城市居民的收入情况 ,并估计总体特征。
详细描述
首先,我们需要在城市中随机抽取一定数量的居民作 为样本。然后,收集这些居民的收入数据,并计算样 本的平均收入、中位数、标准差等统计指标。通过这 些指标,我们可以估计该城市居民的总体平均收入、 中位数、标准差等特征。此外,我们还可以计算样本 的方差、标准误、置信区间等指标,以评估样本估计 总体的准确性。
用样本估计总体
基础知识
题型分类
思想方法
练出高分
由直方图可知众数为:100
中位数:设x为中位数,则有:
0.00610 0.02610 0.038x 95 0.5 得x 99.74
基础知识
题型分类
思想方法
练出高分
基础知识
度剖析
作茎叶图时, 将高位(十位与百位) 作为茎,低位 (个位)作为叶,逐 个统计;根据茎叶图分析两组数 据的特点,可以得出结论.
基础知识
题型分类
思想方法
练出高分
题型分类·深度剖析
题型二 茎叶图的应用
解析 探究提高 思维启迪 【例 2】 某良种培育基地正在培育一种小麦 新品种 A.将其与原有的一个优良品种 B 进 行对照试验.两种小麦各种植了 25 亩,所 解 (1)如下图 得亩产数据(单位:千克)如下: 品种 A: 357,359,367,368,375,388,392,399,400,405,41 2,414,415,421,423,423,427,430,430,434,443, 445,445,451,454 品种 B: 363,371,374,383,385,386,391,392,394,394,39 (2) 由于每个品种的数据都只有 25 个,样本不大,画茎叶图很方 5,397,397,400,401,401,403,406,407,410,412, 便;此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比 415,416,422,430 (1)作出数据的茎叶图; 较,没有任何信息损失,而且还可以随时记录新的数据. (2)用茎叶图处理现有的数据,有什么优点? (3) 通过观察茎叶图可以看出:①品种 A 的亩产平均数(或均值) (3)通过观察茎叶图,对品种 A 与 B 的亩产 比品种 B 高; ②品种 A 的亩产标准差(或方差)比品种 B 大, 故品 量及其稳定性进行比较,写出统计结论.
4.2 用样本估计总体
C.众数是6吨
答案:D
D.极差是4吨
3.(嘉兴·中考)李大伯有一片果林,共有80棵果树.某 日,李大伯开始采摘今年第一批成熟的果子,他随机选取 2棵果树共摘得10个果子,质量分别为(单位:㎏): 0.28,0.26,0.24,0.23,0.25,0.24,0.26,0.26,
0.25,0.23.以此估算,李大伯收获的这批果子的单个质
)
2.(凉山·中考)2010年因干旱影响,凉山州政府鼓 励居民节约用水,为了解居民用水情况,在某小区随机抽 查了20户家庭的月用水量,结果如下表: 月用水量(吨) 户数 4 4 5 5 6 7 8 3 9 1 )
则关于这20户家庭的月用水量,下列说法错误的是( A.中位数是6吨 B.平均数是5.8吨
4.2
用样本估计总体
1.计算样本平均数和标准差使学生认识到只有样本容量
足够大,才能比较准确地反映总体的特性,这样的样本 才可靠,体会只有可靠的样本,才能用样本去估计总体.
2.通过实例,使学生体会用样本估计总体的思想,能够
根据统计结果作出合理的判断和推测,能与同学进行交 流,用清晰的语言表达自己的观点.
随机数 (学号) 成绩
111 80
254 86
167 66
94 91
276 67
它的频数分布直方图、平均成绩和标准差分别如下:
另外,同学们也分别选取了一些样本,它们同样也包含 五个个体,如下表:
随机数 132 245 78 73 5 98 89 75 随机数 (学号) 成绩 90 72 167 86 86 83 275 82 54 82
(3)合适. (4)不合适.虽然调查的家庭很多,但仅仅增加调查的数量, 不一定能够提高调查质量,本题中所调查的仅代表上因特 网的家庭,不能代表全部的家庭,因此这样的抽样调查不 具有普遍代表性.
用样本估计总体
思考1:上述100个数据中的最大值和最 小值分别是什么?由此说明样本数据的 变化范围是什么?
0.2~4.3
思考2:样本数据中的最大值和最小值 的差称为极差.如果将上述100个数据 按组距为0.5进行分组,那么这些数据 共分为多少组?
(4.3-0.2)÷0.5=8.2
思考3:以组距为0.5进行分组,上述100 个数据共分为9组,各组数据的取值范围 可以如何设定?
(2)大部分居民的月均用水量集中在一个中间值 附近,只有少数居民的月均用水量很多或很少;
(3)居民月均用水量的分布有一定的对称性等.
思考4:样本数据的频率分布直方图是 根据频率分布表画出来的,一般地,频 率分布直方图的作图步骤如何?
第一步,画平面直角坐标系.
第二步,在横轴上均匀标出各组分点, 在纵轴上标出 [153.5,156.5) [156.5,159.5) [159.5,162.5) [162.5,165.5) [165.5,168.5) [168.5,171.5) [171.5,174.5) [174.5,177.5) [177.5,180.5]
合计
频数 1 1 4 5 8 11 6 2 1 1 40
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
频率 组距 0.5 0.4 0.3 0.2 0.1
宽度:组距
高度:
频率 组距
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
上图称为频率分布直方图,其中横轴 表示月均用水量,纵轴表示频率/组距. 频率分布直方图中各小长方形的和高 度在数量上有何特点?
3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《§6.2用样本估计总体》学案一、学习要求:1、掌握数据整理及其相关图表的制作方法2、会求样本的平均值和标准差3、能通过样本的分布和特征值来估计总体的分布和特征值4、通过具体的实际问题,感受用样本估计总体分布规律的思想二、学习重点、难点:重点:数据整理及其相关图表的制作;样本特征值的计算;对总体分布和特征值的估计。
难点:频数频率分布图表和累计频率分布折线图的作用和分析;如何用样本的分布和特征值来估计总体。
三、学时安排:共4学时第一学时:学习频率分布表,感受如何用样本频率分布表去估计总体分布,亲自体验制作频数频率分布表的过程。
第二学时:学习频率分布直方图,强化制作频率分布直方图的可操作性。
第三学时:学习平均数、方差和标准差的计算,熟悉并会用计算公式。
第四学时:建立用样本的分布估计总体的特征性质的思想,并小结本节内容四、学习过程:第一学时(一)课前尝试1、学法指导:(1)回顾初中已经学过的频数分布表(2)自学课本上P.8~10介绍的频数频率分布表。
2、尝试练习:从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,数据如下(单位:cm),试作出该样本频率分布表。
168 165 171 167 170 165 170 152 175 174165 170 168 169 171 166 164 155 164 158170 155 166 158 155 160 160 164 156 162160 170 168164 174 171 165 179 163 172 180 174 173159 163 172 167 160 164 169 151 168 158168 176 155 165 165 169 162 177 158 175165 169 151 163 166 163 167 178 165 158170 169 159 155 163 153 155 167 163 164158 168 167 161 162 167 168 161 165 174156 167 166 162 161 164 166(二)课堂探究:1、探究问题:频数频率分布表能较好地反映总体分布情况,在实际中应用很广,因此,如何来制作频数频率分布表呢?2、知识链接:对总体分布的估计(1)频数频率分布表(2)频数频率分布表的制作3、拓展练习:课本上P.9例1一般地,编制频率分布表的步骤如下:(1)求全距,决定组数和组距,组距组数全距 ; (2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;(3)登记频数,计算频率,列出频率分布表。
4、当堂训练:下面是某职业学校学生随机抽样的40名学生在一个月内的零花钱数据(单位:元).请列出这些学生零花钱的频数频率分布表.43,31,29,24,27,18,21,14,34,27,22,25,26,17,27,18,18,29,21,18,12,19,31,19,14,28,19,13,13,12,18,19,12,13,16,12,31,10,17,18.5、归纳总结:(三)课后拓展:1.一个容量为32的样本,已知某组样本的频率为0.125,则该组样本的频数为()A、 2B、4C、6D、82. 将容量为100的样本数据分为如下8组:则第3组的频率为()A、0.14B、0.03C、0.07D、0.213. 对某电子元件进行寿命追踪调查,情况如下表:编制频率分布表.(四)格言警句:生活是由一系列的经验组成。
每一个经验都会使我们变得成熟一些,虽则有时我们很难体会到这一点。
(福特)第二学时(一)课前尝试1、学法指导:(1)回忆编制频率分布表的步骤(2)熟悉频率分布直方图的制作方法(3)自学课本上P.10~12频率分布直方图(折线图)和累积频率折线图的制作2、尝试练习:从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100 的身高样本,数据如下(单位:cm),试作出该样本频率分布直方图。
168 165 171 167 170 165 170 152 175 174165 170 168 169 171 166 164 155 164 158170 155 166 158 155 160 160 164 156 162160 170 168 164 174 171 165 179 163 172180 174 173 159 163 172 167 160 164 169151 168 158 168 176 155 165 165 169 162177 158 175 165 169 151 163 166 163 167178 165 158 170 169 159 155 163 153 155167 163 164 158 168 167 161 162 167 168161 165 174 156 167 166 162 161 164 166(二)课堂探究:1、探究问题:从课本上P.9例1频数频率分布表,可以看出这批作为样本的灯泡使用寿命分布的大致情况,其缺陷是不太直观.为此在制作频数频率分布表的同时,常常配以频率分布直方图、频率分布折线图和累积频率折线图.那么如何完成这些工作呢?2、知识链接:①绘制频率分布直方图,②绘制频率分布折线图,③绘制累积频率折线图3、拓展练习:课本上P.11~12例题4、当堂训练:(1)为了了解一批灯泡(共1000只)的使用寿命,从中抽取了100只进行测试,其使用寿命如下表:①制作频率分布表;②绘制频率分布直方图;③根据样本的频率分布,估计使用寿命不低于1000h的的灯泡约有多少只?(2)下面是从某校高一学生中抽取的20名学生的学习用书的重量(单位:kg)8.4 10.1 6.3 7.1 6.2 6.5 7.6 8.0 8.5 6.410.3 8.8 5.2 4.6 7.8 3.9 4.8 7.2 8.0 6.8①作出频率分布直方图;②绘制频率分布折线图③绘制累积频率折线图5、归纳总结:(三)课后拓展:1、在频率分布直方图中,各个小长方形的面积表示()A、落在相应各组的数据频数B、相应各组的频率C、该样本所分成的组数D、该样本的样本容量2、在频率分布直方图中,所有矩形的面积和为。
3、对某电子元件进行寿命追踪调查,情况如下表:(1)列出频率分布表;(2)画出频率分布直方图或绘制频率分布折线图;(3)估计该电子元件寿命在100 h~400 h内的百分比;(4)估计该电子元件寿命在400 h以上的百分比。
(四)格言警句:思维世界的发展,在某种意义上说,就是对惊奇的不断摆脱。
(爱因斯坦)第三学时(一)课前尝试1、学法指导:(1)回顾如何制作频数频率分布表、频率分布直方图(折线图)和累积频率折线图,并找出它们的特点。
(2)思考:为怎样通过抽样的方法,用样本的特征数估计总体的特征数呢?(3)自学课本上P.13~15介绍的对总体特征值的估计。
2、尝试练习:(1)8个数据1,2,4,5,7,8,10,11的平均数是;(2)从某高校全体高考考生的数学成绩中任意抽取20名考生的成绩(总分150分)为 102,105,131,95,83,121,140,100,97,96,95,121,124,135,106,109,110,101,98,97试估计该校全体考生的数学平均成绩。
(二)课堂探究:1、探究问题:在实际问题中,有时更关心总体的某些特征数据,比如对课本上P.9例1问题,人们想了解灯泡的平均使用寿命是多少小时?使用寿命是否集中在平均寿命附近?这些特征数据是谓总体的特征值,包括总体的众数、中位数、平均值、方差等.在初中阶段大家其实也已经学过如何计算这些特征值,但那时涉及的总体都比较小,直接对总体作计算就能得到.如果总体比较大,或者测取数据耗费较多,就要抽取样本,通过计算样本的特征值来估计总体了.在统计中一般只对平均值和方差这两个特征值有兴趣,那么,平均数、方差如何计算呢?2、知识链接:(1)总体平均值的估计将样本数据全部加起来,再除以样本容量,就可以得到这组样本的平均值,即 x =n x x x n +++...21=∑=n i i x n 11. (2)对总体方差的估计设一组样本数据1x ,2x ,…,n x ,其平均数为x ,则称212)(1∑=-=n i i x x n σ 为这个样本的方差,其算术平方根21)(1∑=-=n i i x x n σ 为样本的标准差,分别简称为样本方差、样本标准差。
(3)使用计算器计算平均值和方差(4)应用频数频率分布表计算平均值和方差3、拓展练习:课本上P.13例2当总体较大时,对总体数据关于平均值分布的均衡程度,还是通过样本来估计,因此首先要给出对样本的衡量方式.样本方差或样本标准差就是比较好的一种衡量方式,若样本有较好的代表性且容量较大,就以公式21)(1∑=-=ni i x x n σ、212)(1∑=-=n i i x x n σ得到的样本标准差和样本方差,并可作为总体标准差和方差的估计值.4、当堂训练:(1)某单位年收入在10000到15000、15000到20000、20000到25000、25000到30000、30000到35000、35000到40000及40000到50000元之间的职工所占的比分别为10%、15%、20%、25%、15%、10%、和5%,试估计该单位职工平均年收入。
(2)为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换,已知某校作用的100只日光灯在必须换掉前的使用天数如下,试估计这种日光灯的平均使用寿命和标准差。
5、归纳总结:(三)课后拓展:1. 下面是从某校高一学生中抽取的20名学生的学习用书的重量(单位:kg)8.4 10.1 6.3 7.1 6.2 6.5 7.6 8.0 8.5 6.410.3 8.8 5.2 4.6 7.8 3.9 4.8 7.2 8.0 6.8(1)作出频率分布直方图;(2)利用频率分布直方图的组中值对总体平均数及方差进行估计,并与实际结果进行比较。
2.为了了解中年知识分子在知识分子中的比例,对某科研单位全体知识分子的年龄进行了登记,结果如下:(单位:岁)42,38,29,36,41,43,54,43,34,4440,59,39,42,44,50,37,44,45,2948,45,53,48,37,28,46,50,37,4442,39,51,52,58,47,59,46,45,5753,49,55,47,54,53,57,43,46,58列出频率分布表,绘制频率分布直方图。
(四)格言警句:除非你亲自尝试一下,否则你永远不知道你能够做些什么。