用样本估计总体1
1.5.1 用样本估计总体教学设计
1.5.1 用样本估计总体教学设计----高一数学组:王文英【教材分析】1、教材的地位与作用义务教育阶段的统计内容学生已经对数据统计全过程有所体验,高中阶段要求进一步培养学生的随机思想,发展学生的统计观念,其中包括:统计意识、统计方法及对统计结果的正确认识。
本节课《用样本估计总体》是高中必修三第一章第五节“用样本估计总体”的第一课时---估计总体的分布,是抽样方法及数据的数字特征内容后又一重要内容,通过本节课学习让学生进一步掌握对样本数据处理的重要方法之—画频率分布直方图,以及用样本估计总体的思想,同时为学生后面在选修1-2和选修2—3统计案例的学习及应用统计知识解决实际问题打下良好的基础。
2、教学目标根据本教材的结构和内容分析,结合高一年级学生他们的认知结构及其心理特征,我制定了以下的教学目标:(1)知识目标①通过实例进一步体会分布的意义和作用;②在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、频率折线图,并体会他们各自的特点。
;③利用频率分布直方图估计数据的总体分布。
(2)能力目标在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征;初步体会样本频率分布和数字特征的随机性。
(3)情感目标通过对现实生活和其他学科中统计问题的提出,体会用数学知识解决现实世界及各学科的方法,认识数学的重要性,培养学生的实践能力、思维能力及用数学的意识。
3、教学重难点教学重点:会列频率分布表,频率分布直方图的画法,并利用频率分布直方图估计数据的总体分布。
教学难点:利用样本数据对数据的总体进行估计。
【学情分析】1.高一的学生已经具备了相当的生活经验,对本节课所提供的生活实例也有所体会,为新知识的学习与新方法的掌握打下了基础。
2.学生学习该内容可能的困难:(1)学生生活经验的不足会影响对实际问题的理解与思考。
(2)学生虽然在初中对这部分内容有所学习,但因遗忘等原因,对频率分布直方图的绘制会有一定困难。
用样本估计总体
用样本估计总体一、用样本的频率分布估计总体分布(1)频数、频率将一批数据按要求分为若干个组,各组内数据的个数,叫做该组的频数。
每组数除以全体数据的个数的商叫做该组的频率。
频率反映数据在每组中所占比例的大小。
(2)样本的频率分布根据随机所抽样本的大小,分别计算某一事件出现的频率,这些频率的分布规律(取值状况),就叫做样本的频率分布。
为了能直观地显示样本的频率分布情况,通常我们会将样本的容量、样本中出现该事件的频数以及计算所得的频率列在一张表中,叫做样本频率分布表。
(3)用样本频率分布估计总体的分布从一个总体得到一个包含大量数据的样本时,我们很难从一个个数字中直接看出样本所含的信息。
如果把这些数据形成频数分布或频率分布,就可以比较清楚地看出样本数据的特征,从而估计总体的分布情况。
用样本估计总体,是研究统计问题的一个基本思想方法,而对于总体分布,我们总是用样本的频率分布对它进行估计。
(4)频率分布直方图的特点从频率分布直方图可以清楚地看出数据分布的总体态势,但是从直方图本身得不出原始的数据内容,所以,把数据表示成直方图后,原有的具体数据信息就被抹掉了。
(5)频率分布折线图把频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,如图所示。
为了方便看图,一般习惯于把频率分布折线图画成与横轴相连,所以横轴上的左右两端点没有实际意义。
(6)总体密度曲线①如果样本容量越大,所分组数越多,频率分布直方图中表示的频率分布就越接近于总体在各个小组内所取值的个数与总数比值的大小。
设想如果样本容量不断增大,分组的组距不断缩小,则频率分布直方图实际上是越来越接近于总体的分布,它可以用一条光滑曲线来描绘,这条光滑曲线就叫做总体密度曲线。
y f x()②总体密度曲线精确地反映了一个总体在各个区域内取值的百分比。
a b内的百分比就是图中带斜线部分的面积。
对本例来说,总体密度曲线呈产品尺寸落在(,)中间高两边低的“钟”形分布,总体的数据大致呈对称分布,并且大部分数据都集中在靠近中间的区间内。
1用样本估计总体----标准差
小结
1.标准差
s
2
1 [( x1 x )2 ( x2 x )2 ( xn x )2 ] n
2.方差:
1 2 2 2 s [( x1 x ) ( x2 x ) ( xn x ) ] n
课本P79 阅读与思考
生产过程中的质量控制图
标准差的取值范围: [0,+∞) 标准差为0的样本数据都等于样本平均数. 标准差表现为:标准差越大,表明数据的离散程 度就越大;反之,标准差越小,表明各数据的离 散程度就越小。 标准差的作用: 它用来描述样本数据的离散程度。在实际应用中, 标准差常被理解为稳定性。
标准差
标准差是样本数据到平均数的一种平均距离.它 用来描述样本数据的离散程度.在实际应用中,标准 差常被理解为稳定性.
从样本标准差看由于乙的高一些甲生产的零件的质量比于是可以作出判断比乙的稳定程度高得多因此甲生产的零件内径品种第一年第二年第三年第四年第五年第六年900920900850910920890960950850860890426甲乙两种水稻6年平均产量的平均数相同但甲的标准差比乙的小所以甲的生产比较稳定
2.2.2用样本的数字特征估 计总体的数字特征(二)
一个样本中的个体与平均数之间的距离关系 可用下图表示:
思考:对于一个容量为2的样本:
x1 x2 x2 x1 x1 , x2 ( x1 x2 ) x ,s 2 2 在数轴上,这两个统计数据有什么几何意义?由此 说明标准差的大小对数据的离散程度有何影响?
一个样本中的个体与平均数之间的距离关系可用 下图表示:
7 7
7 7
引例 有两位射击运动员在一次射击测试中各射靶 十次,每次命中的环数如下:
高中数学2.2.2 用样本的数字特征估计总体的数字特征1
2.(1)由平均数公式得 x=
(182×27+80×21)≈81.13(分).
48
(2)因为男生的中位数是75分,所以至少有14人得分不超过75
分.
又因为女生的中位数是80分,所以至少有11人得分不超过80分.
所以全班至少有25人得分不超过80分.
(3)男生的平均分与中位数的差别较大,说明男生中两极分化现
2.2.2 用样本的数字特征估计总体的数字特征
1.正确理解样本数据标准差的意义和作用,学会计算数据的标 准差. 2.能根据实际问题的需要合理地选取样本,从样本数据中提取 基本的数字特征(如平均数、标准差),并作出合理的解释. 3.会用样本的基本数字特征估计总体的基本数字特征,形成对 数据处理过程进行初步评价的意识.
x1 x2 xn
则 x =_______n_______.
2.方差、标准差 假设样本数据是x1,x2,x3,…,xn, x 是平均数,则 (1)方差是
s2=__n1[___x1___x_2____x_2 __x__2 ______x_n__x__2_].
(2)标准差为
s=__n1_[__x_1__x__2___x_2___x_2____ __x_n___x__2 ]_.
【解题指南】1.由平均数和方差的定义直接求解.
2.先画出茎叶图,再利用平均数和方差结合的形式分析稳定性.
【自主解答】1.
s2
1 [ 21
a1
x
2
a2 x
2
a20 x
2
xx
2
]
1 20 0.20 4 0.19.
21
21
答案:0.19
2.(1)作出茎叶图如下:
(2)派甲参赛比较合适.理由如下:
高中数学必修二 9 2 用样本估计总体(精讲)(含答案)
9.2 用样本估计总体(精讲)考法一总体取值规律的估计【例1】(2021·全国高一课时练习)某市2020年4月1日~4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45,(1)完成频率分布表;(2)作出频率分布直方图;(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,空间质量为良;在101~150之间时,空间质量为轻微污染;在151~200之间时,空间质量为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.【答案】(1)频率分布表见解析;(2)频率分布直方图见解析;(3)该市空气质量有待进一步改善.【解析】(1)频率分布表(2)频率分布直方图(3)答对下述两条中的一条即可:①该市一个月中空气污染指数有2天处于优的水平,占当月天数的1 15;有26天处于良的水平,占当月天数的13 15;处于优或良的天数共有28天,占当月天数的1415.说明该市空气质量基本良好.②轻微污染有2天,占当月天数的115.污染指数在80以上的接近轻微污染的天数有15天,加上处于轻微污染的天数,共有17天,占当月天数的1730,超过50%.说明该市空气质量有待进一步改善.【一隅三反】1.(2020·全国高一单元测试)某市为提倡节约用水,准备实行自来水“阶梯计费”方式,用户用水不超出基本用水量的部分享受基本价格,超出基本用水量的部分实行超价收费,为更好地决策,自来水公司随机抽取了部分用户的用水量数据,并绘制了如图不完整的统计图(每组数据包括右端点但不包括左端点),请你根据统计图解答下列问题:用户用水量频数直方图用户用水量扇形统计图(1)此次抽样调查的样本容量是________;(2)补全频数分布直方图,求扇形图中“15吨~20吨”部分的圆心角的度数;(3)如果自来水公司将基本用水量定为每户25吨,那么该地区6万用户中约有多少用户的用水全部享受基本价格.【答案】(1)答案见解析;(2)答案见解析,79.2°;(3)4.08万户.【解析】(1)1010%100÷=;(2)用水15~20吨的户数为100-10-36-24-8=22(户),“15~20吨”部分的圆心角的度数为22 36079.2100︒⨯=︒(3)1022366 4.08100++⨯=(万户)所以该地区6万用户中约有4.08万户的用水全部享受基本价格.2.(2020·全国高一单元测试)对某校高一年级学生参加社区服务次数进行统计,随机抽取M名学生作为样本,得到这M名学生参加社区服务的次数.根据此数据作出了频数与频率的统计表和频率分布直方图如下:(1)求出表中M,p及图中a的值;(2)若该校高一学生有360人,试估计该校高一学生参加社区服务的次数在区间[10,15)内的人数. 【答案】(1)M =40,0.075p =,0.125a =;(2)90人. 【解析】(1)由[10,15)内的频数是10,频率是0.25知,100.25M=,所以M =40. 因为频数之和为40,所以10+25+m +2=40,m =3.330.07540p M ===. 因为a 是对应分组[15,20)的频率与组距的商,所以250.125405a ==⨯. (2)因为该校高一学生有360人,分组[10,15)内的频率是0.25,所以估计该校高一学生参加社区服务的次数在此区间内的人数为3600.25⨯=90人.3.(2021·北京丰台区)为了解某市家庭用电量的情况,该市统计局调查了100户居民去年一年的月均用电量,发现他们的用电量都在50kW ·h 至350kW ·h 之间,进行适当分组后,画出频率分布直方图如图所示.(I )求a 的值;(Ⅱ)求被调查用户中,用电量大于250kW ·h 的户数;(III )为了既满足居民的基本用电需求,又提高能源的利用效率,市政府计划采用阶梯定价,希望使80%的居民缴费在第一档(费用最低),请给出第一档用电标准(单位:kW ·h )的建议,并简要说明理由. 【答案】(I )0.006;(Ⅱ)18;(III )245.5 kW ·h.【解析】(1)因为()0.00240.00360.00440.00240.0012501a +++++⨯=,所以0.006a =; (2)根据频率分布直方图可知:“用电量大于250kW ·h ”的频率为()0.00240.0012500.18+⨯=, 所以用电量大于250kW ·h 的户数为:1000.1818⨯=, 故用电量大于250kW ·h 有18户;(3)因为前三组的频率和为:()0.00240.00360.006500.60.8++⨯=<,前四组的频率之和为()0.00240.00360.0060.0044500.820.8+++⨯=>, 所以频率为0.8时对应的数据在第四组, 所以第一档用电标准为:0.80.620050245.50.22-+⨯≈kW ·h.故第一档用电标准为245.5 kW ·h.4.(2021·陕西咸阳市)某微商对某种产品每天的销售量(单位:件)进行为期一个月(按30天计算)的数据统计分析,并得出了这种产品该月销售量的频率分布直方图(如图).假设用直方图中所得的频率来估计相应事件发生的概率.(Ⅰ)求频率分布直方图中a 的值;(Ⅱ)若微商在一天的销售量不低于25件,则上级商企会给微商赠送100元的礼金,估计该微商在一年内获得的礼金数.【答案】(Ⅰ)0.02;(Ⅱ)10800元. 【解析】(Ⅰ)由题意可得1[1(0.010.060.070.04)5]0.025a =-+++⨯=. (Ⅱ)根据频率分布直方图知,日销售量不低于25件的天数为: ()0.040.025309+⨯⨯=(天), 一个月可获得的礼金数为9100900⨯=(元),依此可以估计该微商一年内获得的礼金数为9001210800⨯=元. 【点睛】本题考查频率的求法,考查频率分布直方图的性质等基础知识,考查样本估计总体以及运算求解能力、数形结合思想的应用,是基础题.考法二 总体百分数的估计【例2】(2020·天津和平区)已知一组数据为4,5,67,8,8,,第40百分位数是( ) A .8 B .7C .6D .5【答案】C【解析】因为有6位数,所以640 2.4⨯=%,所以第40百分位数是第三个数6.故选:C 【一隅三反】1.(2020·山东菏泽市·高一期末)数据1,2,3,4,5,6的60%分位数为( ) A .3 B .3.5C .3.6D .4【答案】D【解析】由6⨯60%=3.6,所以数据1,2,3,4,5,6的60%分位数是第四个数,故选:D2.(2021·山东高一期末)已知从某中学高一年级随机抽取20名女生,测量她们的身高(单位:cm ),把这20名同学的身高数据从小到大排序:148.0 149.0 150.0 152.0 154.0 154.0 155.0 155.5 157.0 157.0 158.0 159.0 161.0 162.0 163.0 164.0 165.0 170.0 171.0 172.0 则这组数据的第75百分位数是( ) A .163.0 B .164.0C .163.5D .164.5【答案】A【解析】因为这组数据从小到大已排序,所以这组数据的第75百分位数为第200.7515⨯=个数,即为163.0故选:A3.(2020·山东滨州市·高一期末)“幸福感指数”是指某个人主观地评价他对自己目前生活状态的满意程度的指标,常用区间[]0,10内的一个数来表示,该数越接近10表示满意程度越高,现随机抽取6位小区居号,他们的幸福感指数分别为5,6,7,8,9,5,则这组数据的第80百分位数是( ) A .7 B .7.5C .8D .9【答案】C【解析】该组数据从小到大排列为:5,5,6,7,8,9,且680% 4.8⨯=,故选:C.考法三 总体集中趋势的估计【例3】(2021·湖北荆州市)因受新冠疫情的影响,某企业的产品销售面临困难.为了改变现状,该企业欲借助电商和“网红”直播带货扩大销售.受网红效应的影响,产品销售取得了较好的效果.现将该企业一段时间内网上销售的日销售额统计整理后绘制成如下图所示的频率分布直方图:请根据图中所给数据,求: (1)实数a 的值;(2)该企业网上销售日销售额的众数和中位数; (3)该企业在统计时间段内网上销售日销售额的平均数. 【答案】(1)0.012;(2)55万元,57万元;(3)57.4万元. 【解析】(1)由频率分布直方图知:(0.0080.0160.0200.0180.0100.0042)101a ++++++⨯=,解得:0.012a =;(2)用频率分布直方图中最高矩形所在区间的中点值作为众数的近似值,得众数为55万元;因为第一个小矩形的面积为0.08,第二个小矩形的面积为0.12, 第三个小矩形的面积为0.16,0.080.120.160.36++=,设第四个小矩形中底边的一部分长为x ,则0.0200.50.36x ⨯=-,解得7x =, 所以中位数为50757+=万元; (3)依题意,日销售额的平均值为:250.08350.12450.16550.20650.18750.12850.10950.0457.4⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=所以该企业在统计时间段内网上销售日销售额的平均数为57.4万元. 【一隅三反】1.(2020·定边县第四中学高一期末)如图,从参加数学竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如图,观察图形,回答下列问题:(Ⅰ)79.5-89.5这一组的频数、频率分别是多少? (Ⅱ)估计这次数学竞赛的平均成绩是多少?(Ⅲ)估计这次数学竞赛的及格率(60分及以上为及格). 【答案】(Ⅰ)15;0.25;(Ⅱ)70.5;(Ⅲ)75%. 【解析】(Ⅰ)79.589.5这一组的频率为0.025100.25⨯=,79.589.5这一组的频数为600.2515⨯=;(Ⅱ)估计这次数学竞赛的平均成绩是:44.50.154.50.1564.50.1574.50.384.50.2594.50.0570.5⨯+⨯+⨯+⨯+⨯+⨯=.故估计这次数学竞赛的平均成绩是70.5.(Ⅲ)估计这次环保知识竞赛的及格率(60分及以上为及格)()10.010.0151075%P =-+⨯=. 2.(2021·河北唐山市·开滦第一中学高一期末)某校从参加高一年级期末考试的学生中抽出60名学生,将其物理成绩(均为整数)分成六段[)[)[]40,50,50,60,,90,100⋯后画出如下频率分布直方图.观察图形的信息,回答下列问题:(1)估计这次考试的众数m 与中位数n (结果保留一位小数); (2)估计这次考试的优秀率(80分及以上为及格)和平均分. 【答案】(1)75m =,73.3n =;(2)优秀率30%,平均分71分. 【解析】(1)众数是最高小矩形中点的横坐标,所以众数为75m =(分)前三个小矩形面积为0.01100.015100.015100.4⨯+⨯+⨯=, ∵中位数要平分直方图的面积, ∴0.50.47073.30.03n -=+=.(2)依题意,80及以上的分数所在的第五、六组, 频率和为 ()0.0250.005100.3+⨯=, 所以,抽样学生成绩的合格率是30%, 利用组中值估算抽样学生的平均分:450.1550.15650.15750.3850.25950.0571⨯+⨯+⨯+⨯+⨯+⨯=,估计这次考试的平均分是71分.3.(2021·吉林市)某城市100户居民的月平均用水量(单位:吨),以[0,2)[2,4)[4,6)[6,8)[8,10)[10,12)[12,14)分组的频率分布直方图如图.(1)求直方图中x 的值;并估计出月平均用水量的众数. (2)求月平均用水量的中位数及平均数;(3)在月平均用水量为[6,8),[8,10),[10,12),[12,14)的四组用户中,用分层抽样的方法抽取22户居民,则应在[10,12)这一组的用户中抽取多少户?(4)在第(3)问抽取的样本中,从[10,12)[12,14)这两组中再随机抽取2户,深入调查,则所抽取的两户不是来自同一个组的概率是多少?【答案】(1) x =0.075,7;(2) 6.4,5.36;(3) 2;(4)23. 【解析】(1)根据频率和为1,得2×(0.02+0.095+0.11+0.125+x +0.05+0.025)=1, 解得x =0.075;由图可知,最高矩形的数据组为[6,8),所以众数为()16872+=; (2) [2,6)内的频率之和为(0.02+0.095+0.11)×2=0.45;设中位数为y ,则0.45+(y −6)×0.125=0.5,解得y =6.4,∴中位数为6.4;平均数为()210.0230.09550.1170.12590.075110.025 5.36⨯+⨯+⨯+⨯+⨯+⨯=(3)月平均用电量为[10,12)的用户在四组用户中所占的比例为0.0520.1250.0750.050.02511=+++, ∴月平均用电量在[10,12)的用户中应抽取11×211=2(户). (4)月平均用电量在[12,14)的用户中应抽取11×111=1(户), 月平均用电量在[10,12)的用户设为A 、B , 月平均用电量在[12,14)的用户设为C ,从[10,12),[12,14)这两组中随机抽取2户共有 ,,AB AC BC ,3种情况,其中,抽取的两户不是来自同一个组的有,,AC BC ,2种情况, 所以,抽取的两户不是来自同一个组的概率为23. 考点四 总体离散程度的估计【例4】(2021·山东威海市·高一期末)如图所示的四组数据,标准差最小的是( )A .B .C .D .【答案】A【解析】对A ,()12106206302402516x =⨯+⨯+⨯+⨯=,s == 对B ,()16102202306402516x =⨯+⨯+⨯+⨯=,s == 对C ,()13105205303402516x =⨯+⨯+⨯+⨯=,10s ==, 对D ,()15103203305402516x =⨯+⨯+⨯+⨯=,s == 所以标准差最小的是A.故选:A.【一隅三反】1.(2020·全国高一)已知数据12,,,n x x x 的平均数为x ,方差为2s ,则123x +,223x +,…,23n x +的平均数和方差分别为( )A .x 和2sB .23x +和24sC .23x +和2sD .23x +和24129s s ++ 【答案】B【解析】因为数据12,,,n x x x 的平均数为x ,方差为2s ,所以123x +,223x +,…,23n x +的平均数和方差分别为23x +和24s故选:B2.(2020·安徽蚌埠市·蚌埠二中高一月考)一组数据中的每一个数据都乘以3,再减去50,得到一组新数据,若求得新的数据的平均数是1.6,方差是3.6,则原来数据的平均数和方差分别是( )A .17.2,3.6B .54.8,3.6C .17.2,0.4D .54.8,0.4 【答案】C【解析】设一组数据为i x (1,2,3,,)i n =,平均数为x ,方差为21s ,所得一组新数据为i y (1,2,3,,)i n =,平均数为y ,方差为22s ,则350i i y x =-(1,2,3,,)i n =,12 1.6n y y y y n +++==, 所以123503503501.6n x x x n -+-++-=, 所以350 1.6x -=,所以51.617.23x ==, 由题意得22222121()()() 3.6n s y y y y y y n ⎡⎤=-+-++-=⎣⎦, 所以222121(350 1.6)(350 1.6)(350 1.6) 3.6n x x x n⎡⎤--+--++--=⎣⎦, 所以2221219(17.2)(17.2)(17.2) 3.6n x x x n ⎡⎤⨯-+-++-=⎣⎦ 所以2221219()()() 3.6n x x x x x x n⎡⎤⨯-+-++-=⎣⎦, 所以219 3.6s =,所以210.4s =.故选:C.3.(2020·唐山市第十一中学)已知样本数据由小到大依次为2,3,3,7,a ,b ,12,13.7,18.3,20,且样本的中位数为10.5,若使该样本的方差最小,则a ,b 的值分别为( ).A .10,11B .10.5,9.5C .10.4,10.6D .10.5,10.5 【答案】D【解析】由于样本共有10个值,且中间两个数为a ,b ,依题意,得10.52a b +=,即21b a =-. 因为平均数为23371213.718.320101()0a b +++++++++÷=,所以要使该样本的方差最小,只需()()221010a b -+-最小.又()()()()222221010102110242221a b a a a a -+-=-+--=-+, 所以当4210.522a -=-=⨯时,()()221010a b -+-最小,此时10.5b =. 故选:D4.(2021·合肥市第六中学=)为了测试小班教学的实践效果,刘老师对A 、B 两班的学生进行了阶段测试,并将所得成绩统计如图所示;记本次测试中,A 、B 两班学生的平均成绩分别为A x ,B x ,A 、B 两班学生成绩的方差分别为2A s ,2B s ,则观察茎叶图可知( )A .AB x x <,22A B s s < B .A B x x >,22A B s s <C .A B x x <,22A B s s >D .A B x x >,22A B s s >【答案】B【解析】根据茎叶图中数据的分布可得,A 班学生的分数多集中在[]70,80之间, B 班学生的分数集中在[]50,70 之间,所以A B x x >.相对两个班级的成绩分布来说,A 班学生的分数更加集中,B 班学生的分数更加离散,所以22A B s s <.故选:B。
样本估计整体
探究: 我国是世界上严重缺水的 国家之一,城市 缺水问题较为突出。某市政府为了节约用 水,计划在 本市试行居民生活用水定额管 理,即确定一个居民月用水量标准a,用水 量不超过a的按平价收费,超过 a的按议价 收费。如果希望大部分居民的 日常生活不 受影响,那么标准a定为多少比较合理? 你认为,为了较为合理地确定出这个标准, 需要做什么工作?
2、中位数不受少数几个极端数据(即排序靠前或排序靠后的数据) 的影响,容易计算,它仅利用了数据中排在中间数据的信息。 当样本数据质量比较差,即存在一些错误数据(如数据的录入 错误、测量错误等)时,应该用抗极端数据强的中位数表示 数据的中心值。
3、平均数受样本中每一个数据的影响,“越离群”的数据,对平均 数的影响越大。与众数和中位数相比,平均数代表了数据更多 的信息。
表2-1
3.1 3.4 2.5 2.6
100位居民的月均用水量 (单位 :t )
2.0 2.2 2.0 1.5 1.0 1.6 1.8 1.9 1.6 2.2 1.5 1.2 0.2 0.4 0.3 0.4
3.2
3.3 3.2
2.7
2.8 2.9
2.3
2.3 2.4
2.1 1.6 1.2 3.7 1.5 0.5 3.8
图2.2-2 100位居民的月均用水量的频率分 布折线图
频率
组距
0
a
b
月均用水量/t
※总体密度曲线能够很好的反映总体在各个范围 内的百分比,能够提供更准确的信息。尽管有些 总体密度曲线是客观存在的,但是很难象函数图 象那样准确的地画出来。 ?思考一下图中阴影部分的面积表示什么?
甲
乙
8
4 6 3 3 6 8 3 8 9
思考1:2.03是通过频率直方图估计出来的中位数,
第02讲 用样本估计总体 (精讲)(教师版)
,nx +)标准差与方差据1x ,nx +,标22()(n x x x x +-++-2(n x x ++-知识点三:在频率分布直方图中,众数,中位数,平均数的估计值最高的小矩形底边中点的横坐标即是众数中位数左边和右边的所有小矩形的面积和是相等的“重心”,等于频率分布直方图中每个小矩形的面积乘小矩形底边中点的横坐标3,b ,3,b ,【答案】45 45.85379⨯=975%∴+=25m故选:B.例题4.(PM2.5的浓度(单位:知这组数据的极差为A.73 B.75 C.77 D.79,,n x 的平均数个分数分别为18,,,x x ,6,8,,x 的平均数为228361001081210++++-=x ,28624++=x 8610++++x ,即12864+++=x x x 2624888-⨯=故答案为:14..(2022·全国55%分位数,②众数这两个条件中任选一个,补充在下面问题中的横线上,并解答问题抗坏血酸,是一种水溶性维生素,是高等灵长类动物与其他少数2,3,,)n ,则下列结论正确的是(2,3,,)n ,则它们的众数也满足该关系,12(21)(21)(21)nn y x x x nn++-+-++-=1nx n++- 121b =-,故B 正确;由方差的性质可得2c =C 正确;23,x x ,…,,假设其第80百分位数为1d , 是整数时,x 21,2x x --30,,x 的平均数为10,,x 这10个数的平均数为8,方差为30,,x ___________. 【详解】由题意得12306x x x +++=2309x ++=⨯1081080x ++=⨯=,222121058690x x x =⨯+=++,所以剩余的20个数的平均数为18080520-=, 30221350690660x +=-=+,所以剩余的20个数的方差为66020258-=,故答案为:82022·全国·高一单元测试)敢于冒险奋进精神的载体,A.这组数据的极差为50 B.这组数据的众数为76(0.005+0.75800.3-+故选:CD例题2.(学生人数比例、[(1)估计总体400名学生中分数小于60的人数;分数小于60的频率为()10.020.040.02100.2-++⨯=,所以[)60,70x ∈,即()0.2600.010.25x +-⨯=,解得65x =,则本次考试的及格分数线为65分.例题3.(2022·全国·高一单元测试)中秋佳节来临之际,小李准备销售一种农特产,这段时间内,每售出1箱该特产获利50元,未售出的,每箱亏损30元.经调查,市场需求量的频率分布直方图如图所示.小李购进了160箱该特产,以x (单位:箱,100200x ≤≤)表示市场需求量,y (单位:元)表示经销该特产的利润.(1)根据频率分布直方图估计市场需求量的众数和平均数;(2)将y 表示为x 的函数;(3)根据频率分布直方图求利润不少于4800元的频率.【答案】(1)150,153(2)804800,1001608000,160200x x y x -≤<⎧=⎨≤≤⎩(3)0.9(1)由频率分布直方图,得市场需求量的众数的估计值是150,需求量为[100,120)的频率为0.005×20=0.1,需求量为[120,140)的频率为0.01×20=0.2,需求量为[140,160)的频率为0.015×20=0.3,需求量为[160,180)的频率为0.0125×20=0.25,需求量为[180,200]的频率为0.0075×20=0.15,则市场需求量的平均数约为110×0.1+130×0.2+150×0.3+170×0.25+190×0.15=153.(2)因为每售出1箱该特产获利50元,未售出的,每箱亏损30元,所以当100160≤<x 时,5030(160)804800y x x x =-⨯-=-,当160200x ≤≤时,160508000y =⨯=,所以804800,1001608000,160200x x y x -≤<⎧=⎨≤≤⎩. (3)当100160≤<x 时,由8048004800x -≥,得120160x ≤<;当160200x ≤≤时,80004800y =>,所以当120200x ≤≤时,利润不少于4800元,所以由(1)知利润不少于4800元的频率为10.10.9-=.同类题型归类练A.此次测试众数的估计值为85(1)求频率分布直方图中a的值;(1)求本次初赛成绩的平均数;(每组数据以区间中点值为代表)(1)求出表中m,p的值;(1)分别计算甲、乙两厂提供的10个轮胎宽度的平均数;(1)请你估计该地区所有用户评分的25%,95%分位数;(1)求频率分布直方图中x的值以及样本中身高不低于175cm的学生人数;(1m ii x x =-∑同理可得21s m ∴=+1⎡、、A .20B .40C .64D .80根据此频率分布直方图,下面结论中不正确的是( ) A .该地农户家庭年收入低于4.5万元的农户比率估计为6% B .该地农户家庭年收入不低于10.5万元的农户比率估计为10% C .估计该地农户家庭年收入的平均值不超过6.5万元D .估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间 【答案】C【详解】因为频率直方图中的组距为1,所以各组的直方图的高度等于频率.样本频率直方图中的频率即可作为总体的相应比率的估计值.该地农户家庭年收入低于4.5万元的农户的比率估计值为0.020.040.066%+==,故A 正确; 该地农户家庭年收入不低于10.5万元的农户比率估计值为0.040.0230.1010%+⨯==,故B 正确; 该地农户家庭年收入介于4.5万元至8.5万元之间的比例估计值为0.100.140.2020.6464%50%++⨯==>,故D 正确;该地农户家庭年收入的平均值的估计值为30.0240.0450.1060.1470.2080.2090.10100.10110.04120.02130.02140.027.68⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=(万元),超过6.5万元,故C 错误.综上,给出结论中不正确的是C. 故选:C.3.(多选)(2021·全国·高考真题)下列统计量中,能度量样本12,,,n x x x 的离散程度的是( )A .样本12,,,n x x x 的标准差B .样本12,,,n x x x 的中位数C .样本12,,,n x x x 的极差D .样本12,,,n x x x 的平均数【答案】AC【详解】由标准差的定义可知,标准差考查的是数据的离散程度; 由中位数的定义可知,中位数考查的是数据的集中趋势; 由极差的定义可知,极差考查的是数据的离散程度;。
必修三2.2.用样本估计总体(教案)
2.2 用样本估计总体教案 A第1课时教学内容§2.2.1 用样本的频率分布估计总体分布教学目标一、知识及技能1. 通过实例体会分布的意义和作用.2. 在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图.3.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.二、过程及方法通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法.三、情感、态度及价值观通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识及现实世界的联系.教学重点、难点重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图.难点:能通过样本的频率分布估计总体的分布.教学设想一、创设情境在NBA的2004赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕甲运动员得分﹕12,15,20,25,31,31,36,36,37,39,44,49,50乙运动员得分﹕8,13,14,16,23,26,28,38,39,51,31,29,33请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定?如何根据这些数据作出正确的判断呢?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布.二、探究新知探究1:我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较为合理地确定出这个标准,需要做哪些工作?(让学生展开讨论)为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.表格则是通过改变数据的构成形式,第 1 页为我们提供解释数据的新方式.下面我们学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.可以让我们更清楚的看到整个样本数据的频率分布情况.(一)频率分布的概念频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为:1.计算一组数据中最大值及最小值的差,即求极差;2.决定组距及组数;3.将数据分组;4.列频率分布表;5.画频率分布直方图.以教材P65制定居民用水标准问题为例,经过以上几个步骤画出频率分布直方图.(让学生自己动手作图)频率分布直方图的特征:1.从频率分布直方图可以清楚的看出数据分布的总体趋势.2.从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.探究2:同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同.不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,分别以0.1和1为组距重新作图,然后谈谈你对图的印象?(把学生分成两大组进行,分别作出两种组距的图,然后组织同学们对所作图的不同看法进行交流……)接下来请同学们思考下面这个问题:思考:如果当地政府希望使85%以上的居民每月的用水量不超出标准,根据频率分布表2-2和频率分布直方图2.2-1,(见教材P67)你能对制定月用水量标准提出建议吗?(让学生仔细观察表和图)(二)频率分布折线图、总体密度曲线1.频率分布折线图的定义:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.2.总体密度曲线的定义:在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.思考:1.对于任何一个总体,它的密度曲线是不是一定存在?为什么?2.对于任何一个总体,它的密度曲线是否可以被非常准确地画出来?为什么?实际上,尽管有些总体密度曲线是客观存在的,但一般很难像函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确.(三)茎叶图1.茎叶图的概念:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把第 3 页这样的图叫做茎叶图.(见教材P70例子)2.茎叶图的特征:(1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录及表示.(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.三、例题精析例1 下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm ):(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计身高小于134cm的人数占总人数的百分比.分析:根据样本频率分布表、频率分布直方图的一般步骤解题.解:(1)样本频率分布表如下:(2)其频率分布直方图如下:(3)由样本频率分布表可知身高小于134cm 的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm 的人数占总人数的19%.cm )例2 为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高及频数成正比,各组频数之和等于样本容量,频率之和等于1.解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小, 因此第二小组的频率为:40.0824171593=+++++, 又因为频率=.第二小组频数样本容量所以,12150.0.08===第二小组频数样本容量第二小组频率 (2)由图可估计该学校高一学生的达标率约为(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.四、课堂小结1. 总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布.2. 总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.五、评价设计1.P81习题2.2 A组1、2.第2课时教学内容§2.2.2 用样本的数字特征估计总体的数字特征教学目标一、知识及技能1. 正确理解样本数据标准差的意义和作用,学会计算数据的标准差.2. 能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.3. 会用样本的基本数字特征估计总体的基本数字特征.4. 形成对数据处理过程进行初步评价的意识.二、过程及方法在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法.三、情感、态度及价值观会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辩证地理解数学知识及现实世界的联系.教学重点、难点教学重点:用样本平均数和标准差估计总体的平均数及标准差.教学难点:能应用相关知识解决简单的实际问题.教学设想一、创设情境在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究——用样本的数字特征估计总体的数字特征(板出课题).二、探究新知(一)众数、中位数、平均数探究(1)怎样将各个样本数据汇总为一个数值,并使它成为样本数据的“中心点”?(2)能否用一个数值来描写样本数据的离散程度?(让学生回忆初中所学的一些统计知识,思考后展开讨论)初中我们曾经学过众数,中位数,平均数等各种数字特征,应当说,这些数字都能够为我们提供第 5 页关于样本数据的特征信息.例如前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t (最高的矩形的中点)(图见教材第72页)它告诉我们,该市的月均用水量为2. 25t 的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少.提问:请大家翻回到教材第66页看看原来抽样的数据,有没有2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?(请大家思考作答)分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失的原因,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差.提问:那么如何从频率分布直方图中估计中位数呢?分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边的直方图的面积应该相等.由此可以估计出中位数的值为2.02.(图略见教材73页图2.2-6)思考:2.02这个中位数的估计值,及样本的中位数值2.0不一样,你能解释其中的原因吗?(原因同上:样本数据的频率分布直方图把原始的一些数据给遗失了)图2.2-6显示,大部分居民的月均用水量在中部(2.02t 左右),但是也有少数居民的月均用水量特别高,显然,对这部分居民的用水量作出限制是非常合理的.思考:中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会成为缺点,你能举例说明吗?(让学生讨论,并举例)(二)标准差、方差1.标准差平均数为我们提供了样本数据的重要信息,可是,有时平均数也会使我们作出对总体的片面判断.某地区的统计显示,该地区的中学生的平均身高为176cm ,给我们的印象是该地区的中学生生长发育好,身高较高.但是,假如这个平均数是从五十万名中学生抽出的五十名身高较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身体素质.因此,只有平均数难以概括样本数据的实际状态.例如,在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?如果你是教练,选哪位选手去参加正式比赛? 我们知道,77x x ==乙甲,.两个人射击的平均成绩是一样的.那么,是否两个人就没有水平差距呢?(观察P74图2.2-7)直观上看,还是有差异的.很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们从另外的角度来考察这两组数据.考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本数据到平均数的一种平均距离,一般用s 表示.样本数据1,2,,n x x x 的标准差的算法:第 7 页(1) 算出样本数据的平均数x .(2) 算出每个样本数据及样本数据平均数的差:(1,2,)i x x i n -= (3) 算出(2)中(1,2,)i x x i n -=的平方.(4) 算出(3)中n 个平方数的平均数,即为样本方差.(5) 算出(4)中平均数的算术平方根,即为样本标准差.其计算公式为:显然,标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小.提问:标准差的取值范围是什么?标准差为0的样本数据有什么特点?从标准差的定义和计算公式都可以得出:s ≥0.当0s =时,意味着所有的样本数据都等于样本平均数.2.方差从数学的角度考虑,人们有时用标准差的平方2s (即方差)来代替标准差,作为测量样本数据分散程度的工具:在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差.三、例题精析例1 画出下列四组样本数据的直方图,说明他们的异同点.(1)5,5,5,5,5,5,5,5,5(2)4,4,4,5,5,5,6,6,6(3)3,3,4,4,5,6,6,7,7(4)2,2,2,2,5,8,8,8,8分析:先画出数据的直方图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组数据的标准差.解:(图见教材P76)四组数据的平均数都是5.0,标准差分别为:0.00,0.82,1.49,2.83.他们有相同的平均数,但他们有不同的标准差,说明数据的分散程度是不一样的.例2 甲乙两人同时生产内径为25.40mm 的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm ):甲 25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.3825.42 25.39 25.43 25.39 25.40 25.44 25.40 25.4225.45 25.35 25.41 25.39乙 25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.3625.34 25.49 25.33 25.43 25.43 25.32 25.47 25.3125.32 25.32 25.32 25.48从生产的零件内径的尺寸看,谁生产的质量较高?分析:比较两个人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数及标准差的大小即可,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本数据的平均数、标准差,以此作为两个总体之间的差异的估计值.解:四、课堂小结1. 用样本的数字特征估计总体的数字特征分两类:(1)用样本平均数估计总体平均数.(2)用样本标准差估计总体标准差.样本容量越大,估计就越精确.2. 平均数对数据有“取齐”的作用,代表一组数据的平均水平.3. 标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度.五、评价设计P81 习题 2.2 A组 3、4.教案 B第1课时教学内容§2.2.1 用样本的频率分布估计总体分布教学目标一、知识及技能1.通过实例体会分布的意义和作用.2.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图.3.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.二、过程及方法通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法.三、情感、态度及价值观通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识及现实世界的联系.教学重点、难点教学重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图.教学难点:能通过样本的频率分布估计总体的分布.教学设想一、创设情境,导入新课我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较为合理地确定出这个标准,需要做哪些工作?(让学生展开讨论)为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.表格则是通过改变数据的构成形式,为我们提供解释数据的新方式.下面我们学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.可以让我们更清楚的看到整个样本数据的频率分布情况.二、新课探知(一)频率分布的概念频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为:1. 计算一组数据中最大值及最小值的差,即求极差;2. 决定组距及组数;第 9 页cm ) 3. 将数据分组;4. 列频率分布表;5. 画频率分布直方图.以教材P65制定居民用水标准问题为例,经过以上几个步骤画出频率分布直方图.(让学生自己动手作图)例1 下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm ):(1)列出样本频率分布表;(2)一画出频率分布直方图;(3)估计身高小于134C m的人数占总人数的百分比.分析:根据样本频率分布表、频率分布直方图的一般步骤解题.解:(1)样本频率分布表如下:(2)其频率分布直方图:(3134cm 的男孩出现的,所以我们估计身高小 (1趋势. (2把数据抹掉了.曲线 1.频率分布折线图连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.2.总体密度曲线的定义:在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.(见教材P69)(三)茎叶图1.茎叶图的概念:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.(见教材P70例子)2.茎叶图的特征:(1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录及表示.(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.例2某赛季甲、乙两名篮球运动员每场比赛的得分情况如下:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.用茎叶图表示,你能通过该图说明哪个运动员的发挥更稳定吗?解:“茎”指的是中间的一列数,表示得分的十位数;“叶”指的是从茎的旁边生长出来的数,分别表示两人得分的个位数.画这组数据的茎叶图的步骤如下第一步,将每个数据分为“茎”(高位)和“叶”(低位)两部分;第二步,茎是中间的一列数,按从小到大的顺序排列;第三步,将各个数据的叶按大小次序写在茎右(左)侧.甲乙8 04 6 3 1 2 53 6 8 2 5 43 8 9 3 1 6 1 6 7 94 4 91 5 0从图中可以看出,乙运动员的得分基本上是对称的,页的分布是“单峰”的,有的叶集中在茎2,3,4上,中位数为36;甲运动员的得分除一个特殊得分(51分)外,也大致对称,叶的分布也是“单峰”的,有的叶主要集中在茎1,2,3上,中位数是26.由此可以看出,乙运动员的成绩更好. 另外i,从叶在茎上的分布情况看,乙运动员的得分更集中于峰值附近,这说明乙运动员的发挥更稳定.练习:在NBA的2010赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕甲运动员得分﹕12,15,20,25,31,31,36,36,37,39,44,49,50乙运动员得分﹕8,13,14,16,23,26,28,38,39,51,31,29,33学生画出茎叶图(略)三、巩固练习为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(见下页图示),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.第 11 页(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高及频数成正比,各组频数之和等于样本容量,频率之和等于1.解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:40.08 24171593=+++++,又因为频率=第二小组频数样本容量,所以,121500.08===第二小组频数样本容量第二小组频率.(2)由图可估计该学校高一学生的达标率约为(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.四、小结1. 总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布.2. 总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.五、布置作业P71练习1、2、3.第2课时教学内容§2.2.2 用样本的数字特征估计总体的数字特征教学目标一、知识及技能1. 正确理解样本数据标准差的意义和作用,学会计算数据的标准差.2. 能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.3. 会用样本的基本数字特征估计总体的基本数字特征.4. 形成对数据处理过程进行初步评价的意识.二、过程及方法在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法.三、情感、态度及价值观会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辩证地理解数学知识及现实世界的联系.教学重点、难点教学重点:用样本平均数和标准差估计总体的平均数及标准差.教学难点:能应用相关知识解决简单的实际问题.教学设想一、创设情境导入新课在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究——用样本的数字特征估计总体的数字特征.二、新课探究(一)众数、中位数、平均数初中我们曾经学过众数,中位数,平均数等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息.例如前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t(最高的矩形的中点)(图略见教材第72页)它告诉我们,该市的月均用水量为2. 25t的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少.提问:请大家翻回到教材第66页看看原来抽样的数据,有没有2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?(请大家思考作答)分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失的原因,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差.提问:那么如何从频率分布直方图中估计中位数呢?分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,第 13 页。
课件1:5.1.4 用样本估计总体
课程标准
学科素养
理解并会运用样本的数字特征估 通过对用样本估计总体的学习,强
计总体的数字特征,用样本的分布 化数据分析、数学运算、数学建模
估计总体的分布,通过实例体会其 的核心素养.
意义和作用.
【自主预习】
知识点1 用样本的数字特征估计总体的数字特征
一般情况下,如果样本的容量恰当,抽样方法又合理的话,样本 的特征能够反映总体的特征.特别地,样本平均数(也称为样本均 值)、方差(也称为样本方差)与总体对应的值相差不会____太__大____.
[方法总结] 1.众数、中位数、平均数与频率分布表、频率分布直方图的关系 (1)众数:众数一般用频率分布表中频率最高的一小组的组中值来表示, 即在样本数据的频率分布直方图中,最高矩形的底边中点的横坐标.
(2)中位数:在频率分布表中,中位数是累计频率(样本数据小于某一数 值的频率叫作该数值点的累计频率)为0.5时所对应的样本数据的值,而 在样本中有50%的个体小于或等于中位数,也有50%的个体大于或等于 中位数.因此,在频率分布直方图中,中位数左边和右边的直方图的 面积应该相等.
探究三 在频率分布直方图中求平均数、中位数、众数
【例3】某校从参加高二年级学业水平测试的学生中抽出80名学生, 其数学成绩(均为整数)的频率分布直方图如图所示. (1)求这次测试数学成绩的众数; (2)求这次测试数学成绩的中位数; (3)求这次测试数学成绩的平均分.
解 (1)由图知众数为70+2 80=75.
【课堂小结】
1. 样本平均数与总体平均数的关系:①在简单随机抽样中,我们常 用样本平均数-y 去估计总体平均数-Y . ②一般地,大部分样本平均数离总体平均数不远,在总体平均数附近 波动.样本量越大,波动幅度越小. 2.众数、中位数分别是频率分布直方图中最高的小矩形的中间值、 累计频率为 0.5 时所对应的样本数据的值,平均数为每个小矩形底边 中点的横坐标与小矩形的面积的乘积之和.
用样本估计总体
解析:甲比赛得分旳中位数为28,乙比赛得分旳中位 数为36,所以甲、乙两人比赛得分旳中位数之和为28 +36=64. 答案: 64
返回
4.(2023·台州联考)甲、乙两个体能康复训练小组各有 10名组员,经过一段时间训练后,某项体能测试成 果旳茎叶图如图所示,则这两个小组中体能测试平 均成绩较高旳是________组.
返回
[自主解答] (1)当X=8时,由茎叶图可知,乙组同学的植树棵数 是:8,8,9,10, 所以平均数为: x =8+8+49+10=345; 方差为:s2=14×[(8-345)2+(8-345)2+(9-345)2+(10-345)2]=1116.
返回
(2)记甲组四名同学为A1,A2,A3,A4,他们植树旳棵 数依次为9,9,11,11; 乙组四名同学为B1,B2,B3,B4,他们植树旳棵数依 次为9,8,9,10.分别从甲、乙两组中随机选用一名同学, 全部可能旳成果有16个: (A1,B1),(A1,B2),(A1,B3),(A1,B4), (A2,B1),(A2,B2),(A2,B3),(A2,B4), (A3,B1),(A3,B2),(A3,B3),(A3,B4), (A4,B1),(A4,B2),(A4,B3),(A4,B4),
返回
2.对原则差与方差旳了解: 原则差、方差描述了一组数据围绕平均数波动旳大 小.原则差、方差越大,数据旳离散程度越大,原则 差、方差越小,数据旳离散程度越小,因为方差与原 始数据旳单位不同,且平方后可能夸张了偏差旳程度, 所以虽然方差与原则差在刻画样本数据旳分散程度上 是一样旳,但在处理实际问题时,一般多采用原则差.
学生旳体重情况,将所得旳数据整顿后,画出了频率 分布直方图(如图),已知图中从左到右旳前3个小组旳 频率之比为1∶2∶3,第2小组旳频数为12,则报考飞 行员旳学生人数是________.
☆☆用样本估计总体
组距
0.5
4、列出频率分布表.(填写频率/组距一栏) 5、画出频率分布直方图。
思考: 频率分布条形图和频率分布直方图是两个 相同的概念吗? 有什么区别?
频率分布的条形图和频率分布直方图的区别
两者是不同的概念; 横轴:两者表示内容相同 纵轴:两者表示的内容不相同 频率分布条形图的纵轴(长方形的高)表示频率 频率分布直方图的纵轴(长方形的高)表示 频率与组距的比值, 其相应组距上的频率等于该组距上长方形的面积。
总体密度曲线反映了总体在各个范围内取值的
百分比,精确地反映了总体的分布规律。是研究总
体分布的工具.
用样本分布直方图去估计相应的总体分布时, 一般样本容量越大,频率分布直方图就会无限接 近总体密度曲线,就越精确地反映了总体的分布
规律,即越精确地反映了总体在各个范围内取值
百分比。
表示样本的分布的方法: 3.频率分布折线图 1.频率分布表 样本频率分布中, 分组 个数累计 频数 频率 当样本容量无限增 大,组距无限缩小
频率分布
样本中所有数据(或数据组)的频数和 样本容量的比,叫做该数据的频率。 所有数据(或数据组)的频数的分布 变化规律叫做样本的频率分布。
频率分布的表示形式有:
①样本频率分布表 ②样本频率分布图 样本频率分布条形图 样本频率分布直方图 ③样本频率分布折线图
1、抛掷硬币的大量重复试验的结果: 频率分布表: 样本容量为72 088
分 组 [0,0.5) [0.5,1) [1,1.5) [1.5,2) [2,2.5) [2.5,3) [3,3.5) [3.5,4) [4,4.5] 合计
频数 4 正 8 正 正 正 15 正 正 正 正 22 正 正 正 正 正 25 正 正 14 正 一 6 4 2 100
用样本估计总体
月收入(元)
1000 1500 2000 2500 3000 3500 4000
练习1、如图是150辆汽车通过某路段 时速度的频率分布直方图,则速度在[60, 60 辆. 70)的汽车大约有______
在频率分布直方图中,依次连接各小长 方形上端的中点,就得到一条折线,这条 折线称为频率分布折线图.
练习3、以往招生Biblioteka 计显示,某所大学录 取的新生高考总分的中位数基本稳定在550 分,若某同学今年高考得了520分,他想报 考这所大学还需收集哪些信息?
要点: (1)查往年录取的新生的平均分数.若平均数 小于中位数很多,说明最低录取线较低,可以 报考; (2)查往年录取的新生高考总分的标准差.若 标准差较大,说明新生的录取分数较分散,最 低录取线可能较低,可以考虑报考.
标准差的取值范围是什么?标准差为0 的样本数据有何特点? s≥0,标准差为0的样本数据都相等. 方差的意义: 方差(或标准差)越大离散程度越大,数 据较分散; 方差(或标准差)越小离散程度越小,数 据较集中在平均数周围.
例 2 、有两个班级,每班各自按学号随 机选出 5 名学生,测验铅球成绩,以考察 体育达标程度,测验成绩如下:单位(米) 甲 9.1 7.8 8.5 6.9 5.2 乙 8.8 7.2 7.3 7.5 6.7 两个班相比较,哪个班整体实力强一些 ?
制作频率分布直方图的方法: (1)求极差(即一组数据中最大值与最小 值的差); (2)决定组距与组数;(样本容量不超过
100时,组数常分成5~12组)
(3)将数据分组; (4)列频率分布表; (5)画频率分布直方图.
注:频率分布直方图中
《用样本估计总体》教案-01
《用样本预计整体》教课设计(一)本课目标1.会用样本去预计整体.2.再次领会样本预计整体的合理性.3.经过活动让学生知道不同的样本可能对整体给出不同的预计值是正常现象.(二)教课流程1.情境导入序言:人类对环境保护愈来愈重视,它直接影响着地球人类的生计,电视中一些大城市天气预告都预报空气质量状况,此刻电脑查问出北京2002 年空气污介入数和空气质量状况(媒体出示).2.合作研究(1)整体感知从学生所熟知的城市空气污介入数下手,让学生亲身利用随机抽样选用出来的样本去预计整体,再和整体的有关特点量比较,让学生进一步明确抽样检查的合理性.并利用活动内容再次让学生领会到不同的样本可能对整体给出不同的预计值,但在某一范围内这是同意的.(2)四边互动互动 1师:此刻来用样本预计北京整年的均匀污介入数和空气质量,那么如何选用样本?生:利用简单的随机抽样方法.师:样本选多少天?生 1:10 天.生 2:不可以,样本容量太小,选200 天.生 3:太多,不方便计算,选60 天.师:我们知道样本容量太小,预计不精准,容量太大,计算不方便,此刻用电脑随机抽样30 天,记录在黑板上.明确如何选用样本是能较正确预计整体的重要前提.互动 2师:算出均匀污介入数,并画出对于空气质量级别直方图.生:计算、沟通、画图.师:(出示整年 365?天均匀空气污介入数及空气质量级别直方图)与整体比较,样本能否有差别?差别大不大?生:有差别,差别不大.明确这说明用样本去预计整体是靠谱的、合理的.互动 3师:你能不可以找出一个更能精准地预计整体的样本.生:能,只需将样本容量增添.师:对,样本容量越大,预计越精准,利用课余时间,选用一个容量大于 30 的样本研究它对整体的预计能否精准.明确跟着样本容量的增添由样本获得的均匀值、方差常常会更靠近整体均匀数.互动 4师:阅读教材活动内容.师:从文中香烟浸出液显示对绿豆、赤豆的抽芽有显然的影响,有如何的影响?生:香烟浸出液浓度越大,对抽芽的影响越大.师:若重复此实验,实验数据与文中一致吗?生:不必定同样,由于豆子抽芽还受许很多多要素的影响,如温度、天气等.师:对!若以100 粒种子的样本,它的抽芽率与以50?粒种子为样本的抽芽率能否同样?生:不同样.师:能否是同样,同学们能够利用业余时间做一做,比一比,也能够采用其余种子.明确生活中很多现象都能够用样本去预计整体的方法去研究,它是研究现实世界的重要思想方法.互动 5师:能够用简易方法计算均匀数吗?生:能够,它就是算术均匀数,不过运算较简易一点.师:对.一般来说,假如在 n 个数中, x1出现 f 1次, x2出现 f 2次,, x k出现 f k?次( f 1+f 2+ +f k=n)那么这n 个数的均匀数能够表示为x1 f1x2 f2x k f kx=n明确当某个整体或样本的数占有重复,计算均匀数时能够用以上公式能使计算过程简易.互动 6师:阅读思虑后,再分组沟通回答下列问题.生:思虑、沟通运算.生 1:正确.生 2:不正确,由于四个班级的人数不同样.师:本题如何求均匀数呢?161.223162.325160.825160.724生:232525 24师:对!那什么状况下用此公式呢?生:当四个班的人数同样时.明确从以上两个思虑题能够看出有多种方法求均匀数,要注意不同条件下能够有不同的求法.3.达标反应ma nb ( 1)某人打靶,有m次每次中靶 a 环,有 n 次中靶 b 环,则均匀每次中靶的环数是m n .( 2)某单位对办公用房的面积进行了统计,结果以下表:2面积( m)13.51414.820间数2662求均匀每间办公用房的面积.【答案】15.0(3)某养鸡厂今年年初孵出小鸡500 只,经过一段时间饲养后,从中抽取10 只称得质量以下(单位:千克)1.10 , 0.95 , 1.00 , 1.05 , 1.15 ,0.90 ,1.20 ,0.85 , 1.10 , 1.00 ,预计这家鸡厂鸡的总质量是多少?【答案】 457.54.学习小结不同的样本对整体预计是有差别的,若这个差别在某个预计值的范围内,都是正常预计.特别地当样本容量增添时,这类预计越精准.(二)拓展延长1.链接生活(1)采集你家 2003 年每个月的缴纳电费单,计算一年均匀每个月的电费;( 2)为了认识汽车在某一路口的某一时段的月流量,请你与同学合作,?检查此月10 天里这一时段的汽车流量,而后预计出这个月这一时段汽车的总流量.2.稳固练习(1)已知两组数 x1, x2,, x n和 y1, y2,, y n的均匀数分别是 x 和 y,求:① 3x1,3x2,, 3x n的均匀数;②x1+y1, x2+y2,, x n+y n的均匀数.【答案】( 1)① 3x② x+y(2)某生选修三门课程:信息技术每周 2 课时,数学每周 5 课时,语文每周 6 课时,期末考试成绩分别为85 分, 80 分, 75 分.①假如不考虑各科每周上课的课时数,计算该生三科的均匀成绩;②假如考虑各科每周上课课时数是多少,计算该生三科的均匀成绩;③两种计算方法所得结果能否同样?你以为哪一种计算结果更加合理.8078.51( 3)某养鱼场为了要预计鱼塘中鱼的总数目,第一次从中网出100 条, ?把这 100 条带有标记后所有放回.过 1~ 2 天,预计这群带标记的鱼已完整混淆到塘中,再从中网出200 条,假设在第二次网出的200条中,带有第一次做标记的20 条,这时能否能预计塘中有鱼多少条?【答案】能, 1000( 4)若是你想经过抽样检查认识多少初中生能够说出父亲母亲亲诞辰,?你以为如何抽样好?为何?【答案】略(四)板书设计用样本预计整体结论:均匀数:(学生练习)。
用样本估计总体教案(绝对经典)
§11.2 统计图表、数据的数字特征、用样本估计总体会这样考 1.考查样本的频率分布(分布表、直方图、茎叶图)中的有关计算,样本特征数(众数、中位数、平均数、标准差)的计算.主要以选择题、填空题为主;2.考查以样本的分布估计总体的分布(以样本的频率估计总体的频率、以样本的特征数估计总体的特征数).1.统计数据(1)众数、中位数、平均数、极差、众数:在一组数据中,出现次数最多的数据叫作这组数据的众数.(可以没有或者多个). 中位数:将一组数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数).平均数:样本数据的算术平均数,即x =1n (x 1+x 2+…+x n ).(2)方差、标准差 方差()()()[]2222121x x x x x x nS n -++-+-=标准差S =1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2], 其中x n 是样本数据的第n 项,n 是样本容量,x 是平均数.标准差是反映总体波动大小的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差. 2.统计图表统计图表是表达和分析数据的重要工具,常用的统计图表有条形统计图、扇形统计图、折线统计图、茎叶图、频率分布直方图等.(1)当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录,给数据的记录和表示都带来方便. (2)在频率分布直方图中:①纵轴表示频率组距,②每小长方形的面积表示该组数据的频率或比例, ③各小长方形的面积之和等于1.3.用样本估计总体(1)通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的频率分布,另一种是用样本的数字特征估计总体的数字特征.(2)在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,称之为频率折线图.4.利用频率分布直方图估计样本的数字特征(1)众数:最高那组的组中值.(2)平均数:每个小长方形的面积与每个组中值的乘积之和. (3)中位数:等分面积那条线的横坐标. [难点正本 疑点清源] 1.作频率分布直方图的步骤(1)求极差;(2)确定组距和组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图. 频率分布直方图能很容易地表示大量数据,非常直观地表明分布的形状.1.一个容量为20的样本,数据的分组及各组的频数如下:[10,20),2;[20,30),3;[30,40),x ;[40,50),5;[50,60),4;[60,70),2;则x =________;根据样本的频率分布估计,数据落在[10,50)的概率约为________. 答案 4 0.72.某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生数是____.答案 6003.如上图所示是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.(注:方差s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x 为x 1,x 2,…,x n 的平均数)答案 6.84.某雷达测速区规定:凡车速大于或等于70 km/h 的汽车视为“超速”,并将受到处罚,如图是某路段的一个检测点对200辆汽车的车速进行检测所得结果的频率分布直方图,则从上图中可以看出被处罚的汽车大约有的辆数为________. 答案 40题型一 频率分布直方图的绘制与应用例1 (1)某校从参加高一年级期中考试的学生中随机抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的频率分布直方图,观察图形的信息,回答下列问题:(1)求分数在[70,80)内的频率,并补全这个频率分布直方图; (2)据此估计本次考试中的平均分和中位数(保留整数).思维启迪:利用各小长方形的面积和等于1求分数在[70,80)内的频率,再补齐频率分布直方图. 解 (1)设分数在[70,80)内的频率为x ,根据频率分布直方图,有(0.010+0.015×2+0.025+0.005)×10+x =1,可得x =0.3,所以频率分布直方图如图所示.(2)平均分为x =45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71(分).中位数为73 探究提高 频率分布直方图直观形象地表示了样本的频率分布,从这个直方图上可以求出样本数据在各个组的频率分布.根据频率分布直方图估计样本(或者总体)的平均值时,一般是采取组中值乘以各组的频率的方法.(2)从某小学随机抽取l00名同学,将他们的身高(单位:厘米)数据绘制成频率分布图(如上图).若要从身高在[120,130),[130,140),[l40,150]三组内的学生中,用分层抽样的方法选取30人参加一项活动,则从身高在[120,130)的学生中选取的人数应为 .答案:15题型二 茎叶图的应用例2 (1)甲、乙两名同学在5次数学考试中,成绩统计用茎叶图表示如图所示,若甲、乙两人的平均成绩分别用x 甲、x 乙表示,则下列结论正确的是( )A 、x x <甲乙;乙比甲成绩稳定B 、x x >甲乙;乙比甲成绩稳定C 、x x <甲乙;甲比乙成绩稳定D 、x x >甲乙;甲比乙成绩稳定答案及解析:D(2)某学校从高二甲、乙两个班中各选6名同掌参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如上图,其中甲班学生成绩的中位数数是81,乙班学生成绩的平均分为81,则成绩更稳定的班级为______.答案及解析:乙。
用样本估计总体分布 课件-高一上学期数学北师大版(2019)必修第一册
思考探究:频率分布直方图的应用
• 思考探究:频率分布直方图的应用
例:暑假期间某班为了增强学生的社会实践能力,把该 班学生分成四个小组
到一果园帮果农测量果树的产 量,某小组来到一片种植苹果的山地,他们随
机选 取 20 株作为样本测量每一株的果实产量(单位 : kg ),获得的数据按照
我们把这样的图称为频率分布直方图.
频率
频率
,即小长方形的高
;
1 纵轴表示
组距
组距
频率
频率;
2 小长方形的面积 组距
组距
3 各个小长方形的面积总和等于 1 .
• 二、频率分布直方图
基于上面的分析,思考:怎样根据样本数据画出频率分布直方图呢?
以教材例3为例,一起探究频率分布直方图的画法
3,分组,
由于8个组的总长度40mm>极差,可取第一组的左端点小于数据最小值,最后一组的
右端点大于数据最大值,分成 [120,125),[125,130), ,[155,160].
• 二、频率分布直方图
频率分布直方图的绘制
4.列表,统计出各组信息,如下表,
• 二、频率分布直方图
频率分布直方图的绘制
• 思考探究:频率分布直方图的应用
例:在某中学举行的物理知识竞赛中,将三个 年级参赛学生的成绩进行整理后分成 5 组,
绘制出 如图所示的频率分布直方图,图中从左到右依次为 第一、第二、第三、第四、
第五小组。已知第三小 组的频数是 15 .
(1 ) 求成绩在 50, 70 内的频率;
2 求这三个年级参赛学生的总人数;
思考探究:频率分布直方图的应用
用样本估计总体
组数
总体密度曲线
各个范围内取值的百分比
总体在
用样本的数字特征估计总体的数字特征 众数、中位数、平均数 众数:在一组数据中,出现次数 的数据叫做 这组数据的众数. 中位数:将一组数据按大小依次排列,把处在 位置的一个数据(或最中间两个数据的平均数) 叫做这组数据的 . 平均数:样本数据的算术平均数.即 = .
题型三
思维启迪
解析
探究提高
用样本的数字特征估计总体的数字特征
题型分类·深度剖析
题型三
思维启迪
解析
探究提高
用样本的数字特征估计总体的数字特征
题型分类·深度剖析
D
思想方法·感悟提高
方 法 与 技 巧
思想方法·感悟提高 失 误 与 防 范
A组 专项基础训练
2
3
4
5
6
7
8
9
1
练出高分
解 析
最多
最中
间
中位数
(2)样本方差、标准差 标准差s= 其中xn是 ,n是 , 是 . 是反映总体波动大小的特征数,样本方差是 标准差的 .通常用样本方差估计总体方差,当 时,样本方差很接近总体方差.
2
3
4
5
6
7
8
9
1
练出高分
解 析
A组 专项基础训练
2
3
4
5
6
7
8
9
1
练出高分
解 析
A组 专项基础训练
2
3
4
5
6
7
8
9
1
练出高分
解 析
1,1,3,3
A组 专项基础训练
用样本估计总体教学设计
用样本估计总体教学设计一、课程名称:(适用大部分课程教案)二、授课对象九年级学生三、授课时间45分钟四、授课教师张老师五、教学目标1、知识与技能目标学生能够理解并掌握用样本估计总体的基本概念和原理;能够运用适当的统计方法对样本数据进行分析,从而对总体进行合理估计。
2、过程与方法目标通过小组合作、实际操作、数据分析等教学活动,培养学生动手实践能力、团队协作能力和问题解决能力。
3、情感态度价值观目标培养学生对数据的敏感性和严谨的科学态度,激发学生对统计学在现实生活中的应用产生兴趣。
六、教学重占和难点1、教学重点用样本估计总体的基本原理和方法;对样本数据进行分析和处理。
2、教学难点理解并运用适当的统计方法进行样本估计;在实际问题中,如何选取合适的样本并进行有效的数据分析。
七、教学过程1、导入新课(5分钟)- 教师通过展示日常生活中的一个统计问题,例如“根据班级部分学生的身高数据来估计全年级学生的平均身高”,来引发学生对用样本估计总体概念的思考。
- 提问学生对“样本”和“总体”的理解,以及他们是否有过类似的经验。
- 通过简短讨论,引出本节课的核心问题:如何通过有限的样本数据来估计一个更大的群体(总体)的特征。
2、新知讲授(20分钟)- 教师介绍用样本估计总体的基本原理,包括随机抽样、样本大小、估计的准确性等概念。
- 使用图表、示例和公式来解释不同类型的估计方法,如点估计、区间估计等。
- 结合具体实例,如通过调查问卷收集的数据,展示如何进行样本估计的计算步骤。
3、合作探究(15分钟)- 将学生分成小组,每组分配一个实际的问题和数据集,要求他们通过小组合作,选择合适的统计方法进行样本估计。
- 教师巡回指导,帮助学生解决在估计过程中遇到的问题,提供必要的数学和统计支持。
4、巩固练习(10分钟)- 教师提供一些练习题,让学生独立完成,以加深对样本估计方法的理解和应用。
- 选择几道题目进行全班讨论,让学生分享解题思路和答案,确保学生对关键概念的理解。
用样本估计总体
思考1:上述100个数据中的最大值和最 小值分别是什么?由此说明样本数据的 变化范围是什么?
0.2~4.3
思考2:样本数据中的最大值和最小值 的差称为极差.如果将上述100个数据 按组距为0.5进行分组,那么这些数据 共分为多少组?
(4.3-0.2)÷0.5=8.2
思考3:以组距为0.5进行分组,上述100 个数据共分为9组,各组数据的取值范围 可以如何设定?
(2)大部分居民的月均用水量集中在一个中间值 附近,只有少数居民的月均用水量很多或很少;
(3)居民月均用水量的分布有一定的对称性等.
思考4:样本数据的频率分布直方图是 根据频率分布表画出来的,一般地,频 率分布直方图的作图步骤如何?
第一步,画平面直角坐标系.
第二步,在横轴上均匀标出各组分点, 在纵轴上标出 [153.5,156.5) [156.5,159.5) [159.5,162.5) [162.5,165.5) [165.5,168.5) [168.5,171.5) [171.5,174.5) [174.5,177.5) [177.5,180.5]
合计
频数 1 1 4 5 8 11 6 2 1 1 40
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
频率 组距 0.5 0.4 0.3 0.2 0.1
宽度:组距
高度:
频率 组距
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
上图称为频率分布直方图,其中横轴 表示月均用水量,纵轴表示频率/组距. 频率分布直方图中各小长方形的和高 度在数量上有何特点?
3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2