《2.2.2用样本的数字特征估计总体的数字特征》教学案2
高中数学第二章统计2_2用样本估计总体2_2_2用样本的数字特征估计总体的数字特征教学案

2.2.2 用样本的数字特征估计总体的数字特征(1)如何根据样本数据的频率分布直方图,分别估计总体的众数、中位数和平均数?(2)如何理解众数、中位数、平均数与极端数据的关系?(3)平均数向我们提供了样本数据的重要信息,平均数会使我们作出对总体的片面判断吗?(4)方差、标准差有什么区别与联系?[新知初探]1.众数、中位数、平均数的概念(1)众数:一组数据中出现次数最多的数.(2)中位数:一组数据按大小顺序排列后,处于中间位置的数.如果个数是偶数,则取中间两个数据的平均数.(3)平均数:一组数据的和除以数据个数所得到的数.2.三种数字特征的比较名称优点缺点众数①体现了样本数据的最大集中点;②容易计算①它只能表达样本数据中很少的一部分信息;②无法客观地反映总体的特征中位数①不受少数几个极端数据(即排序靠前或靠后的数据)的影响;对极端值不敏感预习课本P3~6,思考并完成以下问题3.标准差、方差的概念与计算公式 (1)标准差:标准差是样本数据到平均数的一种平均距离,一般用s 表示,s = 1nx 1-x2+x 2-x2+…+x n -x2].(2)方差:标准差的平方s 2叫做方差.s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中,x n 是样本数据,n 是样本容量,x 是样本平均数. [点睛](1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.(2)标准差、方差的取值范围:[0,+∞).标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性.[小试身手]1.下列说法不正确的是( ) A .方差是标准差的平方 B .标准差的大小不会超过极差C .若一组数据的值大小相等,没有波动变化,则标准差为0D .标准差越大,表明各个样本数据在样本平均数周围越集中;标准差越小,表明各个样本数据在样本平均数周围越分散解析:选D 标准差越小,表明各个样本数据在样本平均数周围越集中;标准差越大,表明各个样本数据在样本平均数的周围越分散.2.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a ,中位数为b ,众数为c ,则有( )A .a >b >cB .b >c >aC .c >a >bD .c >b >a解析:选D 将数据从小到大排列为10,12,14,14,15,15,16,17,17,17,则平均数a =110(10+12+14×2+15×2+16+17×3)=14.7,中位数b =15,众数c =17, 显然a <b <c ,选D.3.奥运会体操比赛的计分规则为:当评委亮分后,其成绩先去掉一个最高分,去掉一个最低分,再计算剩下分数的平均值,这是因为( )A .减少计算量B .避免故障C .剔除异常值D .活跃赛场气氛解析:选C 因为在体操比赛的评分中使用的是平均分,记分过程中采用“去掉一个最高分,去掉一个最低分”的方法,就是为了防止个别裁判的人为因素给出过高或过低的分数对选手的得分造成较大的影响,从而降低误差,尽量公平.4.样本中共有五个个体,其值分别为a,0,1,2,3,若该样本的平均值为1,则样本方差为________.解析:由题意知15(a +0+1+2+3)=1,解得a =-1.所以样本方差为s 2=15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.答案:2[典例] (单位:岁):甲群:13,13,14,15,15,15,15,16,17,17; 乙群:54,3,4,4,5,6,6,6,6,56.(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映甲群市民的年龄特征?(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映乙群市民的年龄特征?[解] (1)甲群市民年龄的平均数为13+13+14+15+15+15+15+16+17+1710=15(岁),中位数为15岁,众数为15岁.平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征. (2)乙群市民年龄的平均数为54+3+4+4+5+6+6+6+6+5610=15(岁),中位数为6岁,众数为6岁.由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.平均数、众数、中位数的计算方法平均数一般是根据公式来计算的;计算众数、中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据各自的定义计算.[活学活用](广东高考)已知样本数据x 1,x 2,…,x n 的均值x =5,则样本数据2x 1+1,2x 2+1,…,2x n +1的均值为________.解析:由条件知x =x 1+x 2+…+x n n =5,则所求均值x 0=2x 1+1+2x 2+1+…+2x n +1n=x 1+x 2+…+x n +nn=2x +1=2×5+1=11.答案:11标准差(方差)的计算及应用[典例] 甲:8,6,7,8,6,5,9,10,4,7; 乙:6,7,7,8,6,7,8,7,9,5.(1)分别计算以上两组数据的平均数; (2)分别求出两组数据的方差;(3)根据计算结果,估计两名战士的射击情况.若要从这两人中选一人参加射击比赛,选谁去合适?[解] (1)x 甲=110×(8+6+7+8+6+5+9+10+4+7)=7(环),x 乙=110×(6+7+7+8+6+7+8+7+9+5)=7(环).(2)由方差公式s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],得s 2甲=3,s 2乙=1.2.(3)x 甲=x 乙,说明甲、乙两战士的平均水平相当.又s2甲>s2乙,说明甲战士射击情况波动比乙大.因此,乙战士比甲战士射击情况稳定.从成绩的稳定性考虑,应选择乙参加比赛.计算标准差的5步骤(1)求出样本数据的平均数x.(2)求出每个样本数据与样本平均数的差x i-x(i=1,2,…,n).(3)求出x i-x(i=1,2,…,n)的平方值.(4)求出上一步中n个平方值的平均数,即为样本方差.(5)求出上一步中平均数的算术平方根,即为样本标准差.[活学活用]从甲、乙两种玉米的苗中各抽10株,分别测它们的株高如下:(单位:cm)甲:25 41 40 37 22 14 19 39 21 42;乙:27 16 44 27 44 16 40 40 16 40.问:(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得齐?解:(1)x甲=110(25+41+40+37+22+14+19+39+21+42)=110×300=30(cm),x乙=110(27+16+44+27+44+16+40+40+16+40)=110×310=31(cm).所以x甲<x乙.即乙种玉米苗长得高.(2)s2甲=110[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]=110(25+121+100+49+64+256+121+81+81+144)=110×1 042=104.2(cm2),s2乙=110[2×(27-31)2+3×(16-31)2+2×(44-31)2+3×(40-31)2]=110×1 288=128.8(cm2).所以s2甲<s2乙.即甲种玉米苗长得齐.[典例] 某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.(1)求这次测试数学成绩的众数; (2)求这次测试数学成绩的中位数. [解] (1)由题图知众数为70+802=75.(2)由题图知,设中位数为x ,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,得0.1=0.03(x -70),所以x ≈73.3.众数、中位数、平均数与频率分布直方图的关系[活学活用]为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量得到频率分布直方图如图,则(1)这20名工人中一天生产该产品数量在[55,75)的人数是________.(2)这20名工人中一天生产该产品数量的中位数为________. (3)这20名工人中一天生产该产品数量的平均数为________. 解析:(1)在[55,75)的人数为(0.040×10+0.025×10)×20=13. (2)设中位数为x ,则0.2+(x -55)×0.04=0.5,x =62.5. (3)0.2×50+0.4×60+0.25×70+0.1×80+0.05×90=64. 答案:(1)13 (2)62.5 (3)64[层级一 学业水平达标]1.甲、乙两名篮球运动员在某几场比赛中得分的茎叶图如图所示,则甲、乙两人这几场比赛得分的中位数之和是( )A .63B .64C .65D .66解析:选 A 甲、乙两人在这几场比赛中得分的中位数分别是36和27,则中位数之和是36+27=63.2.下列说法中,不正确的是( ) A .数据2,4,6,8的中位数是4,6 B .数据1,2,2,3,4,4的众数是2,4C .一组数据的平均数、众数、中位数有可能是同一个数据D .8个数据的平均数为5,另3个数据的平均数为7,则这11个数据的平均数是8×5+7×311解析:选A 数据2,4,6,8的中位数为4+62=5,显然A 是错误的,B 、C 、D 都是正确的.故选A.3.已知一组数据,现将每个数据都加上m ,则新的一组数据的平均数与原来一组数的平均数相比( )A .扩大到m 倍B .增加m 倍C .数值不变D .增加m解析:选D 设原来一组数据为x 1,x 2,…,x n ,平均数x ,那么加上m 后得到的一组新数据为x 1+m ,x 2+m ,…,x n +m ,其平均数x ′=m +x 1+x 2+…+x nn=m +x .故答案为D.4.如图是一次考试结果的统计图,根据该图可估计,这次考试的平均分数为( )A .46B .36C .56D .60解析:选A 根据题中统计图,可估计有4人成绩在[0,20)之间,其考试分数之和为4×10=40;有8人成绩在[20,40)之间,其考试分数之和为8×30=240;有10人成绩在[40,60)之间,其考试分数之和为10×50=500;有6人成绩在[60,80)之间,其考试分数之和为6×70=420;有2人成绩在[80,100)之间,其考试分数之和为2×90=180,由此可知,考生总人数为4+8+10+6+2=30,考试总成绩为40+240+500+420+180=1 380,平均数为1 38030=46.5.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.求:(1)高一参赛学生的成绩的众数、中位数; (2)高一参赛学生的平均成绩. 解:(1)由图可知众数为65, ∵第一个小矩形的面积为0.3,∴设中位数为60+x ,则0.3+x ×0.04=0.5,得x =5, ∴中位数为60+5=65.(2)依题意,平均成绩为55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67, 故平均成绩约为67.[层级二 应试能力达标]1.如图为甲、乙两名篮球运动员每场比赛得分情况的茎叶图,则甲和乙得分的中位数的和是( )A .56分B .57分C .58分D .59分解析:选B 易得甲得分的中位数是32,乙得分的中位数是25,其和为32+25=57. 2.在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为( )A .9.4,0.484B .9.4,0.016C .9.5,0.04D .9.5,0.016解析:选D x =9.4×3+9.6+9.75=9.5,s 2=15(0.12×4+0.22)=0.016.3.如图,样本A 和B 分别取自两个不同的总体,它们的样本平均数分别为x A 和x B ,样本标准差分别为s A 和s B ,则( )A.x A >x B ,s A >s BB.x A <x B ,s A >s BC.x A >x B ,s A <s BD.x A <x B ,s A <s B解析:选B 由图易得x A <x B ,又A 波动性大,B 波动性小,所以s A >s B .4.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为m e ,众数为m 0,平均值为x ,则( )A .m e =m 0=xB .m e =m 0<xC .m e <m 0<xD .m 0<m e <x解析:选D 由题目所给的统计图可知,30个数据按大小顺序排列好后,中间两个数为5,6,故中位数为m e =5+62=5.5.又众数为m 0=5,平均值x =130(3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×2)=17930,∴m 0<m e <x .5.五个数1,2,3,4,a 的平均数是3,则a =________,这五个数的标准差是________. 解析:由1+2+3+4+a5=3,得a =5;由s 2=15[(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2]=2,得标准差s = 2.答案:526.某医院急救中心随机抽取20位病人等待急诊的时间记录如下表:用上述分组资料计算出病人平均等待时间的估计值x =________. 解析:x =120(2.5×4+7.5×8+12.5×5+17.5×2+22.5×1)=9.5.答案:9.57.某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4. 则:(1)平均命中环数为________; (2)命中环数的标准差为________.解析:(1)x =110(7+8+7+9+5+4+9+10+7+4)=7.(2)s 2=110[(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=4,所以s =2. 答案:(1)7 (2)28.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表).(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?解:(1)频率分布直方图如图所示:(2)质量指标值的样本平均数为:x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为:s2=(80-100)2×0.06+(90-100)2×0.26+(100-100)2×0.38+(110-100)2×0.22+(120-100)2×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.9.(广东高考)某工厂36名工人的年龄数据如下表.到的年龄数据为44,列出样本的年龄数据.(2)计算(1)中样本的均值x 和方差s 2.(3)36名工人中年龄在x -s 与x +s 之间有多少人?所占的百分比是多少(精确到0.01%)?解:(1)36人分成9组,每组4人,其中第一组的工人年龄为44,所以它在组中的编号为2,所以所有样本数据的编号为4n -2(n =1,2,…,9), 其年龄数据为:44,40,36,43,36,37,44,43,37. (2)由均值公式知:x =44+40+…+379=40,由方差公式知:s 2=19[(44-40)2+(40-40)2+…+(37-40)2]=1009.(3)因为s 2=1009,s =103,所以36名工人中年龄在x -s 和x +s 之间的人数等于年龄在区间[37,43]上的人数, 即40,40,41,…,39,共23人.所以36名工人中年龄在x -s 和x +s 之间的人数所占的百分比为2336×100%≈63.89%.。
2.2.2 用样本的数字特征估计总体的数字特征(2)

x甲 x乙
∴乙种玉米的苗长得高.
(2)由方差公式得:
1 s甲= [(25-30)2+(41-30)2+…+(42-30)2]=104.2, 10
2
2 同:乙种玉米苗长得高,甲种玉米苗长得齐.
2
2
课后作业
1.甲、乙两种水稻试验品种连续 5 年的平均单位面积产量如 下(单位:t/hm2),试根据这组数据估计哪一种水稻品种的产 量比较稳定.
课堂练习
1.如图是某校举行的元旦诗歌朗诵比赛中, 七位评委为某位选手打出分数的茎叶统计图 ,
去掉一个最高分和一个最低分,所剩数据
的平均数和方差分别为( (A)84,4.84 (B)84,1.6 )
(C)85,1.6
(D)85,0.4
【解析】选C.得分是79,84,84,86,84,87,93,最高分是93,最低分 是79,则去掉一个最高分和一个最低分后该选手得分是84,84, 86,84,87,计算得平均数是85,方差是1.6.
(2)因平均数为300,由表格中所列出的数据可见,只有经理 在平均数以上,其余的人都在平均数以下,故用平均数不能 客观真实地反映该工厂的工资水平.
因此,在例子中的解答过程可表述为: 解:由数据可得:
1 1 7 x甲 (7 8 7 4) 7, x乙 (9 5 7 7) 10 10
x甲 x乙
∴从平均成绩看甲、乙二人的成绩无明显差异。
1 7 72 8 72 4 72 2 s甲 10
|x1- x |+|x2- x |+„+|xn- x | S= .由于上式含有绝对值, n
运算不太方便,因此,通常改用如下公式来计算标准差:
s= 1 2 2 2 [ x - x + x - x +„+ x - x ]. 2 n n 1
用样本的数字特征估计总体的数字特征教案

2.2.2用样本的数字特征估计总体的数字特征一.学习要点:用样本的数字特征估计总体的数字特征二.学习过程:用样本平均数估计总体平均数:◆ 几个概念:众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.中位数:将一组数据按大小依次排列,把处在中间位置的一个数据(或中间两个数据的平均数)叫做这组数据的中位数.平均数:如果有n 个数123x , x , x , , x,那么123n 1x = ( x + x + x + + x )n 叫作这n 个数的平均数.总体平均数:总体中所有个体的平均数叫做总体平均数. 样本平均数:样本中所有个体的平均数叫作样本平均数. 加权平均数:如果在n 个数中,1x 出现1f 次,2x 出现2 f 次,…,k x 出现k f 次(这里12k f + f + + f = n),那么x =1122k k 1(x f + x f + + x f )n 叫做这n 个数的加权平均数.其中12k f , f , , f 叫做权.(2)这个问题中,平均数能客观地反映该工厂的工资水平吗?为什么?◆ 用样本平均数估计总体平均数:通常我们用样本平均数估计总体平均数,一般说来,样本容量越大,这种估计就越准确.例2为了估计一次性木质筷子的用量, 2004年从某县共600家高、中、低档饭店中抽取10家,得到这些饭店每天消耗的一次性筷子的数据如下(单位:盒):0.6 , 3.7 , 2.2 , 1.5 , 2.8 , 1.7 , 1.2 , 2.1 , 3.2 , 1.0,通过对样本数据的计算,估计该县2004年共消耗了多少盒一次性筷子(每年按350个营业日计算).● 用样本标准差估计总体标准差:◆ 概念:样本方差:一般地,设样本的元素为123n x , x , x , , x ,样本的平均数为x ,定义()()()2222121s = n x x x x x x n ⎡⎤-+-++-⎣⎦,我们就称2s 为样本方差;样本标准差:.. ◆计算标准差的算法:S1 算出样本数据的平均数;S2 算出每个样本数据与样本平均数的差(1,2,3,,)i x x i n -=; S3 算出2()(1,2,3,,)i x x i n -=;S4 算出2()(1,2,3,,)i x x i n -=这n 个数的平均数,即为样本方差2 s ; S5 算出方差的算术平方根,即为样本标准差s . 例3某班40人随机平均分成两组,两组学生一次考试的成绩情况如下◆用样本标准差估计总体标准差:总体方差是反映总体波动大小的特征数,通常用样本方差估计总体方差,当样本容量很大时,样本方差很接近总体方差. ◆关于统计的计算:(1)求方差的公式:①定义法:2222121s = [()()()]n x x x x x x n-+-++-; ②简化法:2222212n 1s = ( x + x + + x - nx )n课堂练习:教材第70页练习课后作业:见作业(5)。
2.2.2用样本的数字特征估计总体的数字特征自学完美教案

分别求这些运动员成绩的众数、 中位数、 平均数(保留到小 数点后两位).并分析这些数据的含义.
(1)求出该工厂员工工资的众数、中位数、平均数. (2)在这个问题中, 平均数能客观地反映该工厂员工的工资 水平吗?为什么?
-2-
启航书院
高中数学必修三
2.2.2 用样本的数字特征估计总体的数字特征
例 2:在实施城乡清洁工作计划过程中,某校对各个班级 教室卫生情况的考评包括以下几项:黑板、门窗、桌椅、 地 面.一天,两个班级的各项卫生成绩分别下表:(单位:分)
⑶某城市只月份 I 日至 I0 日的最低气温随时间变化的图 象.
①根据左图提供的信息,在右图中补全直方图; ②在 10 天中最低气温的众数是_____℃,最低气温的中位 数是____℃,最低气温的平均数是_____℃.
-3-
启航书院
高中数学必修三
2.2.2 用样本的数字特征估计总体的数字特征
例 4:甲、乙两人数学成绩的茎叶图如图,试求这两位同学 的数学成绩的众数、中位数、平均数.
-1-
启航书院
高中数学必修三
2.2.2 用样本的数字特征估计总体的数字特征
4.平均数、中位数和众数的异同: (1)平均数、中位数和众数都是描述一组数据“集中趋势”的统计量,平均数是最重要的量. (2)平均数的大小与这一组数据里每一个数据均有关系,任何一个数据变化都会相应地引起平均数的变化. (3)中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响.中位数可能在所给的数据中,也可能不在所给 的数据中.当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势. (4)众数考察各数据出现的频率,大小只与这组数据中的部分数据有关,当一组数据中有不少数据重复出现时,众数往往 更能反映问题. 5.三种数字特征的优缺点:
高中数学 (2.2.2 用样本的数字特征估计总体的数字特征)教案 新人教A版必修3

高考数学 2.2.2 用样本的数字特征估计总体的数字特征整体设计教学分析教科书结合实例展示了频率分布的众数、中位数和平均数.对于众数、中位数和平均数的概念,重点放在比较它们的特点,以及它们的适用场合上,使学生能够发现,在日常生活中某些人通过混用这些(描述平均位置的)统计术语进行误导.另一方面,教科书通过思考栏目让学生注意到,直接通过样本计算所得到的中位数与通过频率直方图估计得到的中位数不同.在得到这个结论后,教师可以举一反三,使学生思考对于众数和平均数,是否也有类似的结论.进一步,可以解释对总体众数、总体中位数和总体平均数的两种不同估计方法的特点.在知道样本数据的具体数值时,通常通过样本计算中位数、平均值和众数,并用它们估计总体的中位数、均值和众数.但有时我们得到的数据是整理过的数据,比如在媒体中见到的频数表或频率表,用教科书中的方法也可以得到总体的中位数、均值和众数的估计.教科书通过几个现实生活的例子,引导学生认识到:只描述平均位置的特征是不够的,还需要描述样本数据离散程度的特征.通过对如何描述数据离散程度的探索,使学生体验创造性思维的过程.教科书通过例题向学生展示如何用样本数字特征解决实际问题,通过阅读与思考栏目“生产过程中的质量控制图”,让学生进一步体会分布的数字特征在实际中的应用.三维目标1.能利用频率分布直方图估计总体的众数、中位数、平均数;能用样本的众数、中位数、平均数估计总体的众数、中位数、平均数,并结合实际,对问题作出合理判断,制定解决问题的有效方法;初步体会、领悟“用数据说话”的统计思想方法;通过对有关数据的搜集、整理、分析、判断,培养学生“实事求是”的科学态度和严谨的工作作风.2.正确理解样本数据标准差的意义和作用,学会计算数据的标准差;能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;会用样本的基本数字特征估计总体的基本数字特征,形成对数据处理过程进行初步评价的意识.3.在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法;会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系.重点难点教学重点:根据实际问题对样本数据中提取基本的数据特征并作出合理解释,估计总体的基本数字特征;体会样本数字特征具有随机性.教学难点:用样本平均数和标准差估计总体的平均数与标准差;能应用相关知识解决简单的实际问题.课时安排2课时教学过程第1课时众数、中位数、平均数导入新课思路1在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员:7,8,6,8,6,5,8,10,7,4;乙运动员:9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥得更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究.——用样本的数字特征估计总体的数字特征.(板书课题)思路2在日常生活中,我们往往并不需要了解总体的分布形态,而是更关心总体的某一数字特征,例如:买灯泡时,我们希望知道灯泡的平均使用寿命,我们怎样了解灯泡的使用寿命呢?当然不能把所有灯泡一一测试,因为测试后灯泡则报废了.于是,需要通过随机抽样,把这批灯泡的寿命看作总体,从中随机取出若干个个体作为样本,算出样本的数字特征,用样本的数字特征来估计总体的数字特征.推进新课新知探究提出问题(1)什么是众数、中位数、平均数?(1)如何绘制频率分布直方图?(3)如何从频率分布直方图中估计众数、中位数、平均数?活动:那么学生回忆初中所学的一些统计知识,思考后展开讨论,教师提示引导.讨论结果:(1)初中我们曾经学过众数(在一组数据中,出现次数最多的数称为众数)、中位数(在按大小顺序排列的一组数据中,居于中间的数称为中位数)、平均数(一般是一组数据和的算术平均数)等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息. (2)画频率分布直方图的一般步骤为:计算一组数据中最大值与最小值的差,即求极差;决定组距与组数;将数据分组;列频率分布表;画频率分布直方图.(3)教材前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25 t(最高的矩形的中点),它告诉我们,该市的月均用水量为2.25 t的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少.请大家翻回到课本看看原来抽样的数据,有没有 2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?(请大家思考作答)分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失了,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差.提问:那么如何从频率分布直方图中估计中位数呢?分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边的直方图的面积应该相等.由此可以估计出中位数的值为2.02.思考:2.02这个中位数的估计值,与样本的中位数值2.0不一样,你能解释其中的原因吗?(原因同上:样本数据的频率分布直方图把原始的一些数据给遗失了)课本显示,大部分居民的月均用水量在中部(2.02 t左右),但是也有少数居民的月均用水量特别高,显然,对这部分居民的用水量作出限制是非常合理的.思考:中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会成为缺点,你能举例说明吗?(让学生讨论,并举例)对极端值不敏感有利的例子:考察课本中表21中的数据,如果把最后一个数据错写成22,并不会对样本中位数产生影响.也就是说对极端数据不敏感的方法能够有效地预防错误数据的影响,而在实际应用中,人为操作的失误经常造成错误数据.对极端值不敏感有弊的例子:某人具有初级计算机专业技术水平,想找一份收入好的工作,这时如果采用各个公司计算机专业技术人员收入的中位数作为选择工作的参考指标就会冒这样的风险:很可能所选择公司的初级计算机专业技术水平人员的收入很低,其原因是中位数对极小的数据不敏感.这里更好的方法是同时用平均工资和中位数来作为参考指标,选择平均工资较高且中位数较大的公司就业.对极端值不敏感的方法,不能反映数据中的极端情况.同样的,可以从频率分布直方图中估计平均数,上图就显示了居民用水的平均数,它等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.由估计可知,居民的月均用水量的平均值为2.02 t.显示了居民月均用水量的平均数,它是频率分布直方图的“重心”.由于平均数与每一个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变.这是中位数、众数都不具有的性质.也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.从图上可以看出,用水量最多的几个居民对平均数影响较大,这是因为他们的月均用水量与平均数相差太多了.利用频率分布直方图估计众数、中位数、平均数:估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点) 估计中位数:中位数把频率分布直方图分成左右两边面积相等.估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. 总之,众数、中位数、平均数都是对数据中心位置的描述,可以作为总体相应特征的估计.样本众数易计算,但只能表达样本数据中的很少一部分信息,不一定唯一;中位数仅利用了数据中排在中间数据的信息,与数据的排列位置有关;平均数受样本中的每一个数据的影响,绝对值越大的数据,对平均数的影响也越大.三者相比,平均数代表了数据更多的信息,描述了数据的平均水平,是一组数据的“重心”.应用示例思路1例1 (1)若M 个数的平均数是X,N 个数的平均数是Y,则这M+N 个数的平均数是___________;(2)如果两组数x 1,x 2,…,x n 和y 1,y 2,…,y n 的样本平均数分别是x 和y,那么一组数x 1+y 1,x 2+y 2,…,x n +y n 的平均数是___________.活动:学生思考或交流,教师提示,根据平均数的定义得到结论.解:(1)NM NY MX ++; (2)2y x +. 例2 某校高一年级的甲、乙两个班级(均为50人)的语文测试成绩如下(总分:150分),试确定这次考试中,哪个班的语文成绩更好一些.甲班:112 86 106 84 100 105 98 102 94 10787 112 94 94 99 90 120 98 95 119108 100 96 115 111 104 95 108 111 105104 107 119 107 93 102 98 112 112 9992 102 93 84 94 94 100 90 84 114乙班:116 95 109 96 106 98 108 99 110 10394 98 105 101 115 104 112 101 113 96108 100 110 98 107 87 108 106 103 97107 106 111 121 97 107 114 122 101 107107 111 114 106 104 104 95 111 111 110分析:我们可用一组数据的平均数衡量这组数据的集中水平,因此,分别求出甲、乙两个班的平均分即可.解:用计算器分别求出甲班的平均分为101.1,乙班的平均分为105.4,故这次考试乙班成绩要好于甲班.思路2例1 下面是某校学生日睡眠时间抽样频率分布表(单位:h),试估计该校学生的日平均睡眠时间.睡眠时间人数频率[6,6.5) 5 0.05[6.5,7) 17 0.17[7,7.5) 33 0.33[7.5,8) 37 0.37[8,8.5) 6 0.06[8.5,9) 2 0.02合计100 1分析:要确定这100名学生的平均睡眠时间,就必须计算其总睡眠时间,由于每组中的个体睡眠时间只是一个范围,可以用各组区间的组中值近似地表示.解法一:总睡眠时间约为6.25×5+6.75×17+7.25×33+7.75×37+8.25×6+8.75×2=739(h),故平均睡眠时间约为7.39 h.解法二:求组中值与对应频率之积的和6.25×0.05+6.75×0.17+7.25×0.33+7.75×0.37+8.25×0.06+8.75×0.02=7.39(h). 答:估计该校学生的日平均睡眠时间约为7.39 h.例2 某单位年收入在10 000到15 000、15 000到20 000、20 000到25 000、25 000到30 000、30 000到35 000、35 000到40 000及40 000到50 000元之间的职工所占的比分别为10%,15%,20%,25%,15%,10%和5%,试估计该单位职工的平均年收入.分析:上述百分比就是各组的频率.解:估计该单位职工的平均年收入为12 500×10%+17500×15%+22 500×20%+27 500×25%+32 500×15%+37 500×10%+45 000×5%=26 125(元).答:估计该单位人均年收入约为26 125元.知能训练从甲、乙两个公司各随机抽取50名员工月工资:甲公司:800 800 800 800 800 1 000 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 0001 2001 2001 2001 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 2001 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 5001 500 1 500 1 500 1 500 1 500 1 5002 000 2 000 2 0002 000 2 000 2 500 2 500 2 500乙公司:700 700 700 700 700 700 700 700 700700 700 700 700 700 700 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 0001 000 1 000 6 000 8 000 10 000试计算这两个公司50名员工月工资平均数、众数、中位数,并估计这两个企业员工平均工资. 答案:甲公司:员工月工资平均数1 240,众数1 200,中位数1 200;乙公司:员工月工资平均数1 330,众数1 000,中位数1 000;从总体上看乙公司员工月工资比甲公司少,原因是乙公司有几个收入特高的员工影响了工资平均数.拓展提升“用数据说话”, 这是我们经常可以听到的一句话.但是,数据有时也会被利用,从而产生误导.例如,一个企业中,绝大多数是一线工人,他们的年收入可能是一万元左右,另有一些经理层次的人,年收入可以达到几十万元.这时,年收入的平均数会比中位数大得多.尽管这时中位数比平均数更合理些,但是这个企业的老板到人力市场去招聘工人时,也许更可能用平均数来回答有关工资待遇方面的提问.你认为“我们单位的收入水平比别的单位高”这句话应当怎么解释?这句话的目的是谨防利用人们对统计术语的模糊认识进行误导(蒙骗).使学生能够正确理解在日常生活中像“我们单位的收入水平比别的单位高”这类话的模糊性,这里的“收入水平”是指员工收入数据的某个中心点,即可以是中位数、平均数或众数,不同的解释有不同的含义.在这里应该注意以下几点:1.样本众数通常用来表示分类变量的中心值,容易计算,但是它只能表达样本数据中的很少一部分信息,通常用于描述分类变量的中心位置.2.中位数不受少数几个极端数据(即排序靠前或排序靠后的数据)的影响,容易计算,它仅利用了数据中排在中间数据的信息.当样本数据质量比较差,即存在一些错误数据(如数据的录入错误、测量错误等)时,应该用抗极端数据强的中位数表示数据的中心值,可以利用计算机模拟样本,向学生展示错误数据对样本中位数的影响程度.3.平均数受样本中的每一个数据的影响,“越离群”的数据,对平均数的影响也越大.与众数和中位数相比,平均数代表了数据更多的信息.当样本数据质量比较差时,使用平均数描述数据的中心位置可能与实际情况产生较大的误差.可以利用计算机模拟样本,向学生展示错误数据对样本平均数的影响程度.在体育、文艺等各种比赛的评分中,使用的是平均数.计分过程中采用“去掉一个最高分,去掉一个最低分”的方法,就是为了防止个别裁判的人为因素而给出过高或过低的分数对选手的得分造成较大的影响,从而降低误差,尽量保证公平性4.如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中极端数据的信息,帮助我们作出决策.5.使用者常根据自己的利益去选取使用中位数或平均数来描述数据的中心位置,从而产生一些误导作用.课堂小结1.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(平均数),会用样本的基本数字特征估计总体的基本数字特征;2.平均数对数据有“取齐”的作用,代表一组数据的平均水平;3.形成对数据处理过程进行初步评价的意识.作业习题2.2A组3.设计感想本堂课在初中学习的众数、中位数、平均数的基础上,学习了利用频率分布直方图估计众数、中位数、平均数,这是一种近似估计,但都能说明总体的分布特征,各有优缺点,讲解时紧扣课本内容,讲清讲透,使学生活学活用,会画频率分布直方图,会利用频率分布直方图估计众数、中位数、平均数,对总体作出正确的估计.(设计者:路波)第2课时标准差导入新课思路1平均数为我们提供了样本数据的重要信息,但是,有时平均数也会使我们作出对总体的片面判断.某地区的统计显示,该地区的中学生的平均身高为176 cm,给我们的印象是该地区的中学生生长发育好,身高较高.但是,假如这个平均数是从五十万名中学生抽出的五十名身高较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身体素质.因此,只有平均数难以概括样本数据的实际状态.所以我们学习从另外的角度来考察样本数据的统计量——标准差.(教师板书课题)思路2在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员:7,8,7,9,5,4,9,10,7,4;乙运动员:9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥得更稳定些吗?如果你是教练,选哪位选手去参加正式比赛?我们知道,x甲=7,x乙=7.两个人射击的平均成绩是一样的.那么,是否两个人就没有水平差距呢?从上图直观上看,还是有差异的.很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们从另外的角度来考察这两组数据——标准差.推进新课新知探究提出问题(1)如何通过频率分布直方图估计数字特征(中位数、众数、平均数)?(2)有甲、乙两种钢筋,现从中各抽取一个标本(如下表)检查它们的抗拉强度(单位:kg/mm2),通过计算发现,两个样本的平均数均为125.甲110 120 130 125 120 125 135 125 135 125 乙115 100 125 130 115 125 125 145 125 145 哪种钢筋的质量较好?(3)某种子公司为了在当地推行两种新水稻品种,对甲、乙两种水稻进行了连续7年的种植对比实验,年亩产量分别如下:(千克)甲:600, 880, 880, 620, 960, 570, 900(平均773)乙:800, 860, 850, 750, 750, 800, 700(平均787)请你用所学统计学的知识,说明选择哪种品种推广更好?(4)全面建设小康社会是我们党和政府的工作重心,某市按当地物价水平计算,人均年收入达到1.5万元的家庭即达到小康生活水平.民政局对该市100户家庭进行调查统计,它们的人均收入达到了1.6万元,民政局即宣布该市民生活水平已达到小康水平,你认为这样的结论是否符合实际?(5)如何考查样本数据的分散程度的大小呢?把数据在坐标系中刻画出来,是否能直观地判断数据的离散程度?讨论结果:(1)利用频率分布直方图估计众数、中位数、平均数:估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点)估计中位数:中位数把频率分布直方图分成左右两边面积相等.估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. (2)由上图可以看出,乙样本的最小值100低于甲样本的最小值110,乙样本的最大值145高于甲样本的最大值135,这说明乙种钢筋没有甲种钢筋的抗拉强度稳定.我们把一组数据的最大值与最小值的差称为极差(range).由上图可以看出,乙的极差较大,数据点较分散;甲的极差小,数据点较集中,这说明甲比乙稳定.运用极差对两组数据进行比较,操作简单方便,但如果两组数据的集中程度差异不大时,就不容易得出结论.(3)选择的依据应该是,产量高且稳产的品种,所以选择乙更为合理.(4)不符合实际.样本太小,没有代表性.若样本里有个别高收入者与多数低收入者差别太大.在统计学里,对统计数据的分析,需要结合实际,侧重于考察总体的相关数据特征.比如,市民平均收入问题,都是考察数据的分散程度.(5)把问题(3)中的数据在坐标系中刻画出来.我们可以很直观地知道,乙组数据比甲组数据更集中在平均数的附近,即乙的分散程度小, 如何用数字去刻画这种分散程度呢? 考察样本数据的分散程度的大小,最常用的统计量是方差和标准差.标准差:考察样本数据的分散程度的大小,最常用的统计量是标准差(standard deviation).标准差是样本数据到平均数的一种平均距离,一般用s表示.所谓“平均距离”,其含义可作如下理解:假设样本数据是x 1,x 2,…,x n ,x 表示这组数据的平均数.x i 到x 的距离是|x i -x |(i=1,2,…,n).于是,样本数据x 1,x 2,…,x n 到x 的“平均距离”是S=nx x x x x x n ||||||21-++-+- . 由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差: s=])()()[(122221x x x x x x nn -++-+- . 意义:标准差用来表示稳定性,标准差越大,数据的离散程度就越大,也就越不稳定.标准差越小,数据的离散程度就越小,也就越稳定.从标准差的定义可以看出,标准差s≥0,当s=0时,意味着所有的样本数据都等于样本平均数.标准差还可以用于对样本数据的另外一种解释.例如,在关于居民月均用水量的例子中,平均数x =1.973,标准差s=0.868,所以x +s=2.841,x +2s=3.709;x -s=1.105,x -2s=0.237.这100个数据中,在区间[x -2s,x +2s ]=[0.237,3.709]外的只有4个,也就是说,[x -2s, x +2s ]几乎包含了所有样本数据.从数学的角度考虑,人们有时用标准差的平方s 2——方差来代替标准差,作为测量样本数据分散程度的工具:s 2=n1[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. 显然,在刻画样本数据的离散程度上,方差与标准差是一样的.但在解决实际问题时,一般多采用标准差.需要指出的是,现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道的.如何求得总体的平均数和标准差呢?通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.这与前面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.两者都是描述一组数据围绕平均数波动的大小,实际应用中比较广泛的是标准差.如导入中的运动员成绩的标准差的计算器计算.用计算器计算运动员甲的成绩的标准差的过程如下:即s 甲=2.用类似的方法,可得s 乙≈1.095.由s 甲>s 乙可以知道,甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙比甲的射击成绩稳定.应用示例思路1例1 画出下列四组样本数据的条形图,说明它们的异同点.(1)5,5,5,5,5,5,5,5,5;(2)4,4,4,5,5,5,6,6,6;(3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8.分析:先画出数据的条形图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组数据的标准差.解:四组样本数据的条形图如下:四组数据的平均数都是5.0,标准差分别是:0.00,0.82,1.49,2.83.它们有相同的平均数,但它们有不同的标准差,说明数据的分散程度是不一样的.例2 甲、乙两人同时生产内径为25.40 mm 的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm):甲25.46 25.32 25.45 25.39 25.3625.34 25.42 25.45 25.38 25.4225.39 25.43 25.39 25.40 25.4425.40 25.42 25.35 25.41 25.39乙25.40 25.43 25.44 25.48 25.4825.47 25.49 25.49 25.36 25.3425.33 25.43 25.43 25.32 25.4725.31 25.32 25.32 25.32 25.48从生产的零件内径的尺寸看,谁生产的质量较高?分析:每一个工人生产的所有零件的内径尺寸组成一个总体.由于零件的生产标准已经给出(内径25.40 mm),生产质量可以从总体的平均数与标准差两个角度来衡量.总体的平均数与内径标准尺寸25.40 mm 的差异大时质量低,差异小时质量高;当总体的平均数与标准尺寸很接近时,总体的标准差小的时候质量高,标准差大的时候质量低.这样,比较两人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数与标准差的大小即可.但是,这两个总体的平均数与标准差都是不知道的,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本的平均数、标准差,以此作为两个总体之间差异的估计值.解:用计算器计算可得甲x ≈25.401,乙x ≈25.406;s 甲≈0.037,s 乙≈0.068.从样本平均数看,甲生产的零件内径比乙的更接近内径标准(25.40 mm),但是差异很小;从样本标准差看,由于s 甲<s 乙,因此甲生产的零件内径比乙的稳定程度高得多.于是,可以作出判断,甲生产的零件的质量比乙的高一些.点评:从上述例子我们可以看到,对一名工人生产的零件内径(总体)的质量判断,与所抽取的零件内径(样本数据)直接相关.显然,我们可以从这名工人生产的零件中获取许多样本.这样,尽管总体是同一个,但由于样本不同,相应的样本频率分布与平均数、标准差等都会发生改变,这就会影响到我们对总体情况的估计.如果样本的代表性差,那么对总体所作出的估计就会产生偏差;样本没有代表性时,对总体作出错误估计的可能性就非常大.这也正是我们在前面讲随机抽样时反复强调样本代表性的理由.在实际操作中,为了减少错误的发生,条件许可时,通常采取适当增加样本容量的方法.当然,关键还是要改进抽样方法,提高样本的代表性. 变式训练某地区全体九年级的3 000名学生参加了一次科学测试,为了估计学生的成绩,从不同学校的不同程度的学生中抽取了100名学生的成绩如下:100分12人,90分30人,80分18人,70分24人,60分12人,50分4人.请根据以上数据估计该地区3 000名学生的平均分、合格率(60或60分以上均属合格). 解:运用计算器计算得:100450126024701880309012100⨯+⨯+⨯+⨯+⨯+⨯=79.40, (12+30+18+24+12)÷100=96%,所以样本的平均分是79.40分,合格率是96%,由此来估计总体3 000名学生的平均分是79.40分,合格率是96%.思路2例1 甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm 2),试根据这组数据估计哪一种水稻品种的产量比较稳定.品种第1年 第2年 第3年 第4年 第5年 甲9.8 9.9 10.1 10 10.2 乙 9.4 10.3 10.8 9.7 9.8解:甲品种的样本平均数为10,样本方差为[(9.8-10)2 +(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]÷5=0.02.乙品种的样本平均数也为10,样本方差为[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]÷5=0.24.因为0.24>0.02,所以,由这组数据可以认为甲种水稻的产量比较稳定.例 2 为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换.已知某校使用的100只日光灯在必须换掉前的使用天数如下,试估计这种日光灯的平均使用寿命和标准差. 天数151—180 181—210 211—240 241—270 271—300 301—330 331—360 361—390 灯泡数 1 11 18 20 25 16 7 2 分析:用每一区间内的组中值作为相应日光灯的使用寿命,再求平均寿命.解:各组中值分别为165,195,225,255,285,315,345,375,由此算得平均数约为165×1%+195 ×11%+225×18%+255×20%+285×25%+315×16%+345×7%+375×2%=267.9≈268(天). 这些组中值的方差为1001×[1×(165-268)2+11×(195-268)2+18×(225-268)2+20×(255-268)2+。
高中数学 2.2.2用样本的数字特征估计总体的数字特征教学案新人教必修3

2.2.2用样本的数字特征估计总体的数字特征[自我认知]: 1.如果5个数1x ,2x ,3x ,4x ,5x 的平均数是7 ,那么1x +1,2x +1,3x +1,4x +1,5x +1这5个数的平均数是 ( )A.5B.6C.7D.82.下面说法:①如果一组数据的众数是5,那么这组数据中出现次数最多的数是5;②如果一组数据的平均数是0,那么这组数据的中位数为0 ;③如果一组数据1,2,x ,4的中位数是3 ,那么x =4;④如果一组数据的平均数是正数,那么这组数据都是正数其中错误的个数是 ( )A.1B.2C.3D.43. 一组数据12,15,24,25,31,31,36,36,37,39,44,49,50的中位数是 ( )A.31B.36C.35D.344.某农科所种植的甲、乙两种水稻,连续六年在面积相等的两块稻田中作对比试验,试验得出平均产量是x 甲=x 乙=415㎏,方差是2s 甲=794,2s 乙=958,那么这两个水稻品种中产量比较稳定的是 ( )A.甲B.乙C.甲、乙一样稳定D.无法确定5.对一射击选手的跟踪观测,其环数及相应频率如下:环数 6 7 8 9 10频率 15% 25% 40% 10% 10%求该选手的平均成绩__________。
6.五个数1,2,3,4, a 的平均数是3 ,则a =_______,这五个数的标准差是___________.7.已知2,4,2x ,4y 四个数的平均数是5而5,7,4x ,6y 四个数的平均数是9,则x y 的值是___________.8.已知样本数据1x ,2x ,…n x 的方差为4,则数据21x +3,22x +3,…2n x +3的标准差是_____.9.甲.乙两名射手在相同条件下射击10次,环数如下:甲:7 8 8 9 9 9 9 10 10 10乙:7 7 8 9 9 9 10 10 10 10问哪一名选手的成绩稳定?10.样本101,98,102,100,99的标准差为______[课后练习]:11.在统计中,样本的标准差可以近似地反映总体的 ( ) 班次 姓名A.平均状态B.分布规律C.波动大小D.最大值和最小值12.两个样本甲和乙,其中x甲=10,x乙=10,2s甲=0.055,2s乙=0.015,那么样本甲比样本乙波动A. 大B. 相等C. 小D.无法确定 ( )13.频率分布直方图的重心是 ( )A.众数B.中位数C.标准差D.平均数14.能反映一组数据的离散程度的是 ( )A.众数B.平均数C.标准差D.极差15.与原数据单位不一样的是 ( )A.众数B.平均数C.标准差D.方差16.下列数字特征一定是数据组中数据的是 ( )A.众数B.中位数C.标准差D.平均数17.数据:1,1,3,3的众数和中位数分别是 ( )A. 1或3,2B. 3,2C. 1或3,1或3D. 3,318.某医院为了了解病人每分钟呼吸次数,对20名病人进行测量,记录结果如下:12,20,16,18,20,28,23,16,15,18,20,24,18,21,18,19,18,31,18,13,求这组数据的平均数,中位数,众数.19.某班进行个人投篮比赛,受污损的下表记录了在规定时间内投进n个球的人数分布情况:同时,已知进球3个或3个以上的人平均每人投进3.5个球,进球4个或4个以下人平均每人投进2.5个球.那么投进3个球和4个球的各有多少人?20.某纺织厂订购一批棉花,其各种长度的纤维所占的比例如下表所示:⑴请估计这批棉花纤维的平均长度与方差;⑵如果规定这批棉花纤维的平均长度为4.90厘米,方差不超过1.200,两者允许误差均 不超过0.10视为合格产品.请你估计这批棉花的质量是否合格?2.2.2用样本的数字特征估计总体的数字特征甲11.C 12.A 13.D 14.C 15.D 16.A 17.A18.解:平均数3891920x =≈,中位数是18,众数为18. 19.解:设投进3个球和4个球的各有x,y 人,则3410 3.5221434 2.510x y x y x y x y++⎧=⎪++⎪⎨+++⎪=⎪++⎩ .化简得,6318x y x y -=⎧⎨+=⎩ 解之得:126x y =⎧⎨=⎩答:投进3个球和4个球的分别有12人和6人.20.解:⑴由题知,这批棉花纤维长度的样本平均值为:4.85(厘米),棉花纤维长度的方差为:()()()2223 4.850.255 4.850.46 4.850.35-⨯+-⨯+-⨯=1.3275(平方厘米).由此估计这批棉花纤维的平均长度为4.85(厘米),方差为1.3275(平方厘米).⑵棉花纤维长度的平均值达到标准,而方差超过标准,可以认为这批产品为不合格.。
222用样本的数字特征估计总体的数字特征(2)方差标准差讲解

性质归纳:kan b的平均数和方差:
已知a1,a2,,an的平均数是3,方差是2. 则a1 b,a2 b,,an b的平均数是3 b, 方差是2. ka1,ka2,,kan的平均数是3k,方差是2k 2.
标准差是样本平均数的一种平均距离,一般用s表示.
所谓“平均距离”,其含义可作如下理解:
假设样本数据是x1,x2,...xn ,x 表示这组数据的平均数,xi到 x
的距离是
-
xi - x (i = 1,2,… ,n).
, :
-
于是
样本数据x1,
x2,
x
到
n
x
的“平均距离”是
x1 x x2 x xn x
2.2.2用样本的数字特征估计总体 的数字特征(2) 方差、标准差
学习目标 1.明确标准差、方差等数字特征的意义,深刻 体会它们所反映的样本特征。 2.会用样本的数字特征估计总体的的数字特征, 初步体会样本的数字特征的随机性
复习回顾
一.什么是一组数据的众数、中位数及平均数?
众数:一组数据中出现次数最多的数据。
[解析] (1)甲组成绩的众数为 90 分,乙组成绩的众数为
70 分,从成绩的众数比较看,甲组成绩好些.
(2)s
2
甲
=
1 2+5+10+13+14+6
×[2×(50
-
80)2
+
5×(60
- 80)2 + 10×(70 - 80)2 + 13×(80 - 80)2 + 14×(90 - 80)2 +
A.众数 B.平均数
用样本的数字特征估计总体的数字特征 优秀教案

《2.2.2 用样本的数字特征估计总体的数字特征》教学设计(第一课时众数、中位数、平均数)【教材分析】:“2.2.2用样本的数字特征估计总体的数字特征(众数、中位数、平均数)”是《普通高中课程标准实验教科书数学必修三》(人教A版)第二章第二节第二小节第一课时的教学内容。
这节课我们将学习如何从样本中提取基本信息(众数、中位数、平均数)来推断总体的情况。
统计学是研究如何收集、整理、分析数据的科学,它可以为人们制定决策提供依据。
【学情分析】:我们班级是双语班,大多数同学相对于平行班基础要弱一点,上课学习安排的内容相对少点,讲解比较细致,语速也比较慢,只安排了众数、中位数、平均数,在频率分布直方图下求众数、中位数是重点讲解,就把在频率分布直方图下求平均数安排在下一节课上,这节课我们将学习如何从样本中提取基本信息(众数、中位数、平均数)来推断总体的情况。
【三维目标】:★知识与技能:1. 能够用样本的基本数字特征来估计总体的基本数字特征。
2. 能用样本的众数、中位数、平均数估计总体的众数、中位数、平均数,并结合实际对问题作出合理的判断,制定解决问题的有效方法。
★过程与方法:1.初步体会、领悟“用数据说话”的统计思想方法。
★情感态度与价值观:1.通过对有关数据的收集、整理、分析、判断培养学生“实事求是”的科学态度。
【教学重点】:1. 根据实际问题的样本数据中提取基本的数据特征并作出合理解释,估计总体的基本数字特征。
【教学难点】:【课前准备】:多媒体课件、教学设计、导学案(提前发给同学们预习使用).【教学方法】:启发式、探究式【教学过程】:★【复习导入】:对一个未知总体,我们常用样本的频率分布来估计总体的频率分布,其中表示样本数据的频率分布的基本方法有哪些?★【学生回答】:图、表、总体数据的数字特征.★【老师提问】:下图是某赛季东、西部球队数据,那么如何比较东部赛区与西部赛区的优劣呢?(高中生对NBA的热爱超乎我们的想象,他们感兴趣的话题就更愿意去探讨与研究.)★【老师总结】如果要求我们根据上面的数据,估计、比较某赛季东部赛区与西部赛区的优劣,就得有相应的数据作为比较依据,即通过样本数据对总体的数字特征进行研究,用样本的数字特征来估计总体的数字特征.★【学生复习回顾初中知识】众数、中位数、平均数.(把导学案的知识点过一遍.)1.众数的定义: 在一组数据中,出现数据叫做这一组数据的众数.2.中位数的定义: 将一组数据按依次排列,把处在位置的一个数据(或两个数据的)叫做这组数据的中位数.3.平均数的定义:一组数据的除以数据的所得到的数.4.一组数据中的众数可能,中位数是的,求中位数时,必须先.5.众数规定为频率分布直方图中.6.中位数左右两边的直方图的面积 .★【问题1】众数、中位数及平均数中,哪个量最能反映总体的情况?学生回答:由于与每个数都相关,所以最能反映总体的情况.★【问题2】单纯依据众数、中位数及平均数中的一个量能对总体做出准确的判断吗?(目的让学生体会它们各自的优缺点)学生回答: .★【练习】:求下列一组数的众数、中位数、平均数.(请两位同学上黑板,题目简单,预测都可以做正确。
2.2.2用样本的数字特征估计总体的数字特征教学设计

2.2.2用样本的数字特征估计总体的数字特征教学设计D(1)学生在初中已经学习过平均数、中位数、众数、方差等数字特征,但部分学生已经遗忘。
(2)学生初步掌握了频率分布直方图、茎叶图的概念及应用。
(3)学生思维活泼,积极性高,已初步形成对数学问题的合作探究能力。
(4)学生层次参差不齐,部分学生计算能力差,个体差异比较明显。
二、目标分析新课标指出“三维目标”是一个密切联系的有机整体,这要求我们在教学中以知识技能的培养为主线,渗透情感态度与价值观,并把这两者充分体现在教学过程中,新课标指出教学的主体是学生,因此目标的制定和设计必须从学生的角度出发,根据本节内容在教材内容中的地位与作用,结合学情分析,本节课教学应实现如下教师教学目标以及学生学习目标:(一)教师教学目标1.知识与技能(1)能利用频率颁布直方图估计总体的众数,中位数,平均数;(2)通过选取不同样本数据得到不同的数字特征,体会数字特征的随机性;(3)能用样本的众数,中位数,平均数估计总体的众数,中位数,平均数,并结合实际对问题作出合理判断,制定解决问题的有效方法。
2.过程与方法通过对本节课知识的学习,初步体会、领悟“用数据说话”的统计思想方法。
3.情感态度与价值观会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够理解数学知识与现实世界的联系。
(二)学生学习目标(1)能利用频率颁布直方图估计总体的众数,中位数,平均数;(2)能用样本的众数,中位数,平均数估计总体的众数,中位数,平均数,并结合实际对问题作出合理判断,制定解决问题的有效方法;(3)初步体会、领悟“用数据说话”的统计思想方法。
重点难点本节课的教学重点是利用频率颁布直方图估计总体的众数,中位数,平均数,会用样本的数字特征估计总体的平均水平;教学难点是观察各数字特征与真实数据的关系,体会数字特征具有随机性。
三、教法、学法分析(一)教法基于本节课的内容特点和高一学生的年龄特征,采用探究――体验教学法为主来完成教学,为了实现本节课的教学目标,在教法上我采取了:1.通过学生熟悉的实际生活问题引入课题,创设情境,拉近数学与现实的距离,激发学生求知欲,调动学生主动参与的积极性.2.在鼓励学生主动参与的同时,不可忽视教师的主导作用,要教会学生清晰的思维、严谨的推理,并顺利地完成书面表达.(二)学法在学法上我重视了:1、让学生利用图形直观启迪思维完成从感性认识到理性思维的质的飞跃;2、让学生从问题中质疑、尝试、归纳、总结、运用,由学生自主完成课堂内容。
2.2.2 用样本的数字特征估计总体的数字特征(2)

测量样本数据分散程度的工具 :
− − − 1 2 2 s = ( x1 − x) + ( x2 − x) + ⋯ + ( xn − x) 2 . n 2
甲乙两人同时生产内径为25.40mm的一种零件 的一种零件. 例2 甲乙两人同时生产内径为 的一种零件 为了对两人的生产质量进行评比,从他们生产的零件 为了对两人的生产质量进行评比 从他们生产的零件 中各抽出20件 量得其内径尺寸如下 单位:mm) 量得其内径尺寸如下(单位 中各抽出 件,量得其内径尺寸如下 单位 甲 25.46, 25.32, 25.45, 25.39, 25.36 25.34, 25.42, 25.45, 25.38, 25.42 25.39, 25.43, 25.39, 25.40, 25.44 25.40, 25.42, 25.35, 25.41, 25.39 乙 25.40, 25.43, 25.44, 25.48, 25.48 25.47, 25.49, 25.49, 25.36, 25.34 25.33, 25.43, 25.43, 25.32, 25.47 25.31, 25.32, 25.32, 25.32, 25.48
x甲 = 25.4005, x乙 = 25,4008; s甲 = 0.038, s乙 = 0.074
−
−
从样本平均数看,甲生产的零件内径比乙生产的更接 从样本平均数看 甲生产的零件内径比乙生产的更接 近内径标准(25.40mm),但是差异很小 从样本标准差看 但是差异很小;从样本标准差看 近内径标准 但是差异很小 从样本标准差看, 由于
−
−
x =5
S=0.82
−
x=5
S=1.49
1 2 3 45 (2)
高中数学优质教学设计5:2.2.2 用样本的数字特征估计总体的数字特征 教案

2.2.2 用样本的数字特征估计总体的数字特征三维目标1.知识与技能(1)能利用频率分布直方图估计总体的众数,中位数,平均数.(2)结合实际,能选取恰当的样本数字特征,对问题作出合理判断,制定解决问题的有效方法.2.过程与方法在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法.3.情感、态度与价值观通过对有关数据的搜集、整理、分析、判断培养学生“实事求是”的科学态度和严谨的工作作风.重点难点重点:利用频率分布直方图估计总体的众数、中位数、平均数.难点:(1)从频率分布直方图中计算出中位数;(2)选取恰当的样本数字特征来估计总体,从而正确的对实际问题做出决策.教学建议1.本节课让学生通过熟知的一组数据的代表-众数、中位数、平均数,并辅以计算器、多媒体手段,通过一定手脑结合的训练,让学生感受在只能得到频率分布直方图的情况下也可以估计总体数字特征.在课堂结构上,建议根据学生的认知水平,采取“仔细观察—分析研究—小组讨论—总结归纳”的方法,使知识的获得与知识的发生过程环环相扣,层层深入,从而顺利完成教学目标.2.教学方法与手段分析(1)教学方法:结合本节课的教学内容和学生的认知水平,在教法上,建议采用“问答探究”式的教学方法,层层深入.充分发挥教师的主导作用,让学生真正成为教学活动的主体.(2)教学手段:通过多媒体辅助教学,充分调动学生参与课堂教学的主动性与积极性.(3)本节课的教学过程重视学生探究知识的过程,突出了以教师为主导,学生为主体的教学理念.教师通过提供一些可供学生研究的素材,引导学生自己去研究问题,探究问题的结论.教学流程创设问题情境引出问题⇒引导学生结合初中学过的众数、中位数、平均数的概念感受这三个数字特征 ⇒教师通过多媒体展示这三个数字特征,通过分组讨论总结求法 ⇒通过例1的展示及变式训练的强化使学生进一步体会这三个数字特征通过例2及变式训练使学生掌握求方差及标准差的方法,体会方差的应用⇒引导学生探究方差及标准差的特征及求法,分组讨论说明方差的实际意义 ⇒归纳整理进行课堂小结,整体把握本节知识 ⇒完成当堂双基达标,巩固所学知识并进行反馈矫正课标解读 1.会求样本的众数、中位数、平均数、标准差、方差.(重点) 2.理解用样本的数字特征来估计总体数字特征的方法.(重点) 3.会应用相关知识解决统计实际问题.(难点)知识1众数、中位数、平均数的概念1.众数:一组数据中重复出现次数最多的数叫做这组数的众数.2.中位数:把一组数据按从小到大的顺序排列,把处于最中间位置的那个数称为这组数据的中位数.当数据个数为奇数时,中位数是按从小到大的顺序排列的最中间的那个数;当数据个数为偶数时,中位数是按从小到大的顺序排列的最中间两个数的平均数.3.平均数:如果有n 个数x 1,x 2,x 3,…,x n ,那么x =1n (x 1+x 2+…+x n )叫这n 个数的平均数.知识2标准差、方差【问题导思】甲、乙两名战士在相同条件下各射靶两次,每次命中的环数分别是: 甲:8,6,7,8,6,5,9,10,4,7 乙:6,7,7,8,6,7,8,7,9,51.甲、乙两战士命中环数的平均数x 甲、x 乙各是多少? 【提示】 x 甲=7环;x 乙=7环. 2.由x 甲,x 乙能否判断两人的射击水平? 【提示】 由于x 甲=x 乙,故无法判断.3.观察上述两组数据,你认为哪个人的射击水平更稳定?【提示】 从数字分布来看,甲命中的环数较分散,乙命中的环数较集中,故乙的射击水平更稳定.1.标准差的计算公式标准差是样本数据到平均数的一种平均距离,一般用s 表示,s = 1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. 2.方差的计算公式 标准差的平方s 2叫做方差.s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2].其中,x i (i =1,2,…,n )是样本数据,n 是样本容量,x 是样本平均数.类型1众数、中位数、平均数的应用例1 某公司的33名人员的月工资如下: 职务 董事长 副董事长董事 总经理 经理 管理员 职员 人数 11215320工资 (元)5 5005 0003 5003 0002 5002 0001 500(1)求该公司人员月工资的平均数、中位数、众数(精确到元);(2)假设副董事长的工资从5 000元提升到20 000元;董事长的工资从5 500元提升到30 000元,那么新的平均数、中位数、众数又是什么?(精确到元)(3)你认为哪个统计量更能反映这个公司人员的工资水平?结合此问题谈一谈你的看法. 【思路探究】 由平均数定义→计算平均数→将数据从小到大排列→得中位数、平均数→结论解 (1)平均数是x =(5 500+5 000+3 500×2+3 000+2 500×5+2 000×3+1 500×20)÷33≈2 091(元),中位数是1 500元,众数是1 500元.(2)平均数是x ′=(30 000+20 000+3 500×2+3 000+2 500×5+2 000×3+1 500×20)÷33≈3 288(元),中位数是1 500元,众数是1 500元.(3)在这个问题中,中位数和众数均能反映该公司人员的工资水平.因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司人员的工资水平. 规律方法1.深刻理解和把握平均数、中位数、众数在反映样本数据上的特点,并结合实际情况,灵活应用.2.如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中极端数据的信息,帮助我们作出决策.3.平均数对极端值敏感,而中位数对极端值不敏感.因此两者结合,可较好地分析总体的情况.变式训练高一(3)班有男同学27名,女同学21名,在一次语文测验中,男同学的平均分是82分,中位数是75分,女同学的平均分是80分,中位数是80分.(1)求这次测验全班平均分(精确到0.01);(2)估计全班成绩在80分以下(含80分)的同学至少有多少人?(3)分析男同学的平均分与中位数相差较大的主要原因是什么?解(1)利用平均数计算公式得x=148(82×27+80×21)≈81.13(分).(2)∵男同学的中位数是75,∴至少有14名男同学得分不超过75分.又∵女同学的中位数是80,∴至少有11名女同学得分不超过80分.∴全班至少有25人得分低于80分(含80分).(3)男同学的平均分与中位数的差别较大,说明男同学中两极分化现象严重,得分高的和低的相差较大.类型2用频率分布表或直方图求数字特征例2已知一组数据:125121123125127129125128130129126124 125127126122124125126128(1)填写下面的频率分布表:分组频数累计频数频率[120.5,122.5)[122.5,124.5)[124.5,126.5)[126.5,128.5)[128.5,130.5]合计(2)作出频率分布直方图;(3)根据频率分布直方图或频率分布表求这组数据的众数、中位数和平均数.【思路探究】将数据分组后依次填写分布表.然后画出直方图,最后根据数字特征在直方图中的求法求解.解 (1)分组 频数累计频数 频率 [120.5,122.5) 20.1 [122.5,124.5) 3 0.15 [124.5,126.5)8 0.4 [126.5,128.5) 4 0.2 [128.5,130.5]3 0.15 合计201(2)(3)在[124.5,126.5)中的数据最多,取这个区间的中点值作为众数的近似值,得众数为125.5,事实上,众数的精确值为125.图中虚线对应的数据是124.5+2×58=125.75,事实上中位数为125.5.使用“组中值”求平均数:x -=121.5×0.1+123.5×0.15+125.5×0.4+127.5×0.2+129.5×0.15=125.8,事实上平均数的精确值为x -=125.75. 规律方法1.利用频率分布直方图求数字特征: (1)众数是最高的矩形的底边的中点. (2)中位数左右两侧直方图的面积相等.(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.2.利用直方图求众数、中位数、平均数均为近似值,往往与实际数据得出的不一致,但它们能粗略估计其众数、中位数和平均数. 变式训练下表是某校学生的睡眠时间抽样的频率分布表(单位:h),试估计该校学生的日平均睡眠时间.睡眠时间[6, 6.5)[6.5, 7)[7, 7.5)[7.5, 8)[8, 8.5)[8.5, 9]合计频数 5 17 33 37 6 2 100 频率0.050.170.330.370.060.021解 法一 日平均睡眠时间为 x =1100×(6.25×5+6.75×17+7.25×33+7.75×37+8.25×6+8.75×2)=1100×739=7.39(h). 法二 求组中值与对应频率之积的和:x =6.25×0.05+6.75×0.17+7.25×0.33+7.75×0.37+8.25×0.06+8.75×0.02=7.39(h). 所以,估计该校学生的日平均睡眠时间约为7.39 h.类型3标准差与方差的应用例3 甲、乙两机床同时加工直径为100 cm 的零件,为检验质量,从中抽取6件测量数据为:甲:99 100 98 100 100 103 乙:99 100 102 99 100 100 (1)分别计算两组数据的平均数及方差;(2)根据计算说明哪台机床加工零件的质量更稳定. 解 (1)x 甲=16[99+100+98+100+100+103]=100,x 乙=16[99+100+102+99+100+100]=100,s 2甲=16[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=73, s 2乙=16[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.(2)由(1)知x 甲=x 乙,比较它们的方差,∵s 2甲>s 2乙,故乙机床加工零件的质量更稳定.规律方法1.在实际问题中,仅靠平均数不能完全反映问题,还要研究其偏离平均值的离散程度(即方差或标准差):方差大说明取值分散性大,方差小说明取值分散性小或者取值集中、稳定.2.关于统计的有关性质及规律:(1)若x 1,x 2,…,x n 的平均数为x ,那么mx 1+a ,mx 2+a ,…,mx n +a 的平均数是m x +a .(2)数据x 1,x 2,…,x n 与数据x 1+a ,x 2+a ,…,x n +a 的方差相等. (3)若x 1,x 2,…,x n 的方差为s 2,那么ax 1,ax 2,…,ax n 的方差为a 2s 2.变式训练对划艇运动员甲、乙在相同的条件下进行了6次测试,测得他们每次的最大速度(m/s)如下:甲:27,38,30,37,35,31 乙:33,29,38,34,28,36根据以上数据,试判断他们谁更优秀. 解 x 甲=16×(27+38+30+37+35+31)=33,s 2甲=16×[(27-33)2+(38-33)2+…+(31-33)2]=16×94≈15.7, x 乙=16×(33+29+38+34+28+36)=1986=33,s 2乙=16×[(33-33)2+(29-33)2+…+(36-33)2]=16×76≈12.7. 所以x 甲=x 乙,s 2甲>s 2乙.这说明甲、乙两运动员的最大速度的平均值相同,但乙比甲更稳定,故乙比甲更优秀.巧用分类讨论思想求数字特征典例 某班4个小组的人数为10,10,x,8,已知该组数据的中位数与平均数相等,求这组数据的中位数.【思路点拨】 x 的大小未知,可根据x 的取值不同分别求中位数.解 该组数据的平均数为14(x +28),中位数一定是其中两个数的平均数,由于x 不知是多少,所以要分几种情况讨论.(1)当x ≤8时,原数据按从小到大的顺序排列为x,8,10,10,其中位数为12×(10+8)=9.若14(x +28)=9,则x =8,此时中位数为9.4分(2)当8<x ≤10时,原数据按从小到大的顺序排列为8,x,10,10,其中位数为12(x +10).若14(x +28)=12(x +10),则x =8,而8不在8<x ≤10的范围内,所以舍去.8分 (3)当x >10时,原数据按从小到大的顺序排列为8,10,10,x ,其中位数为12×(10+10)=10.若14(x +28)=10,则x =12,此时中位数为10.综上所述,这组数据的中位数为9或10.12分思维启迪当在数据中含有未知数x ,求该组数据的中位数时,由于x 的取值不同,所以数据由小到大(或由大到小)排列的顺序不同,由于条件的变化,问题的结果有多种情况,不能用同一标准或同一种方法解决,故需分情况讨论,讨论时要做到全面合理,不重不漏.课堂小结1.一组数据的中位数是唯一的,求中位数时,必须先将这组数据按从小到大(或从大到小)的顺序排列,如果数据的个数为奇数,那么,最中间的一个数据是这组数据的中位数,如果数据的个数为偶数,那么,最中间两个数据的平均数是这组数据的中位数.2.利用直方图求数字特征:①众数是最高的矩形的底边的中点.②中位数左右两边直方图的面积应相等.③平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.3.样本标准差反映了各样本数据聚集于样本平均值周围的程度,标准差越小,表明各个样本数据在样本平均数周围越集中;反之,标准差越大,表明各样本数据在样本平均数的两边越分散.当堂达标1.一组观察值4,3,5,6出现的次数分别为3,2,4,2,则样本平均值为( )A .4.55B .4.5C .12.5D .1.64【解析】 x =4×3+3×2+5×4+6×23+2+4+2≈4.55.【答案】 A2.一个样本数据按从小到大的顺序排列为:13,14,19,x,23,27,28,31,中位数为22,则x =________.【解析】 由题意知x +232=22,则x =21.【答案】 213.五个数1,2,3,4,a 的平均数是3,则a =________,这组数据的标准差是________.【解析】 由平均数公式得1+2+3+4+a 5=3,则a =5,s 2=15[(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2]=2.∴s = 2.【答案】 524.2012年青年歌手大奖赛民族唱法组中,6位评委现场给每位歌手打分,去掉一个最高分和一个最低分后,其余分数的平均数作为歌手的成绩,已知6位评委给某位歌手的打分是:9.2 9.5 9.4 9.6 9.8 9.5求这位歌手的得分及6位评委打分的众数和中位数.解 这位歌手的得分为x =14(9.5+9.4+9.6+9.5)=9.5分.在这组数据中,9.5出现了2次,出现的次数最多,所以6位评委打分的众数是9.5分,将这组数据按照从小到大的顺序排列后,位于最中间的两个数都是9.5,所以6位评委打分的中位数是9.5分.。
山东省高中数学《2.2.2用样本的数字特征估计总体的数字特征》教案2新人教A版必修3

, 选哪位选
手去参加正式比赛?
我们知道 甲, 乙. 两个人射击的平均成绩是一样的 . 那么 , 是否两个人就没有水平差距呢?
从上图直观上看 , 还是有差异的 . 很明显 , 甲的成绩比较分散 , 乙的成绩相对集中 , 因此我
们从另外的角度来考察这两组数据——标准差 .
推进新课
新知探究
提出问题
() 如何通过频率分布直方图估计数字特征(中位数、众数、平均数)?
, 你认为这样的结论是否符合实际 ?
() 如何考查样本数据的分散程度的大小呢 ?把数据在坐标系中刻画出来 , 是否能直观地判断
数据的离散程度 ?
讨论结果:
() 利用频率分布直方图估计众数、中位数、平均数:
估计众数:频率分布直方图面积最大的方条的横轴中点数字
. (最高矩形的中点)
估计中位数:中位数把频率分布直方图分成左右两边面积相等
数据点较分散;甲的极差小 , 数据点较集中 , 这说明甲比乙稳定 . 运用极差对两组数据进行比
较, 操作简单方便 , 但如果两组数据的集中程度差异不大时 , 就不容易得出结论 .
() 选择的依据应该是 , 产量高且稳产的品种 , 所以选择乙更为合理 .
() 不符合实际 .
样本太小 , 没有代表性 . 若样本里有个别高收入者与多数低收入者差别太大
平均 )
乙: , , , , , , (
平均 )
请你用所学统计学的知识 , 说明选择哪种品种推广更好 ?
() 全面建设小康社会是我们党和政府的工作重心
, 某市按当地物价水平计算 , 人均年收入达
到万元的家庭即达到小康生活水平 . 民政局对该市户家庭进行调查统计 , 它们的人均收入达
到了万元 , 民政局即宣布该市民生活水平已达到小康水平
2.2.2 用样本的数字特征估计总体的数字特征(教、学案) (2)

2. 2.2 用样本的数字特征估计总体的数字特征〖教学目标〗1. 正确理解样本数据标准差的意义和作用,学会计算数据的标准差2. 能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释;3. 会用样本的基本数字特征估计总体的基本数字特征,形成对数据处理过程进行初步评价的意识。
〖教学重难点〗教学重点用样本平均数和标准差估计总体的平均数与标准差。
教学难点能应用相关知识解决简单的实际问题。
〖教学过程〗一、复习回顾作频率分布直方图分几个步骤?各步骤需要注意哪些问题?二、创设情境在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?上节课我们学习了用图表的方法来研究,为了从整体上更好地把握总体的规律,我们这节课要通过样本的数据对总体的数字特。
三、新知探究众数、中位数、平均数众数—一组数中出现次数最多的数;在频率分布直方图中,我们取最高的那个小长方形横坐标的中点。
中位数——当一组数有奇数个时等于中间的数,当有偶数个时等于中间两数的平均数;在频率分布直方图中,是使图形左右两边面积相等的线所在的横坐标。
平均数——将所有数相加再除以这组数的个数;在频率分布直方图中,等于每个小长方形的面积乘以其底边中点的横坐标的和。
思考探究:分别利用原始数据和频率分布直方图求出众数、中位数、平均数,观察所得的数据,你发现了什么问题?为什么会这样呢?你能说说这几个数据在描述样本信息时有什么特点吗?由此你有什么样的体会?答:(1)从频率分布直方图得到的众数和中位数与从数据中得到的不一样,因为频率分布直方图损失了一部分样本信息,所以不如原始数据准确。
(2)众数和中位数不受极端值的影响,平均数反应样本总体的信息,容易受极端值的影响。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《2.2.2用样本的数字特征估计总体的数字特征》教学案2 一、教材分析教科书结合实例展示了频率分布的众数、中位数和平均数.对于众数、中位数和平均数的概念,重点放在比较它们的特点,以及它们的适用场合上,使学生能够发现,在日常生活中某些人通过混用这些(描述平均位置的)统计术语进行误导.另一方面,教科书通过思考栏目让学生注意到,直接通过样本计算所得到的中位数与通过频率直方图估计得到的中位数不同.在得到这个结论后,教师可以举一反三,使学生思考对于众数和平均数,是否也有类似的结论.进一步,可以解释对总体众数、总体中位数和总体平均数的两种不同估计方法的特点.在知道样本数据的具体数值时,通常通过样本计算中位数、平均值和众数,并用它们估计总体的中位数、均值和众数.但有时我们得到的数据是整理过的数据,比如在媒体中见到的频数表或频率表,用教科书中的方法也可以得到总体的中位数、均值和众数的估计.教科书通过几个现实生活的例子,引导学生认识到:只描述平均位置的特征是不够的,还需要描述样本数据离散程度的特征.通过对如何描述数据离散程度的探索,使学生体验创造性思维的过程.教科书通过例题向学生展示如何用样本数字特征解决实际问题,通过阅读与思考栏目“生产过程中的质量控制图”,让学生进一步体会分布的数字特征在实际中的应用.二、教学目标1、知识与技能(1)正确理解样本数据标准差的意义和作用,学会计算数据的标准差.(2)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.(3)会用样本的基本数字特征估计总体的基本数字特征.(4)形成对数据处理过程进行初步评价的意识.2、过程与方法在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法.3、情感态度与价值观会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系.三、重点难点教学重点:根据实际问题对样本数据中提取基本的数据特征并作出合理解释,估计总体的基本数字特征;体会样本数字特征具有随机性.教学难点:用样本平均数和标准差估计总体的平均数与标准差;能应用相关知识解决简单的实际问题.四、课时安排2课时五、教学设计第1课时众数、中位数、平均数(一)导入新课思路1在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员:7,8,6,8,6,5,8,10,7,4;乙运动员:9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥得更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究.——用样本的数字特征估计总体的数字特征.(板书课题)思路2在日常生活中,我们往往并不需要了解总体的分布形态,而是更关心总体的某一数字特征,例如:买灯泡时,我们希望知道灯泡的平均使用寿命,我们怎样了解灯泡的使用寿命呢?当然不能把所有灯泡一一测试,因为测试后灯泡则报废了.于是,需要通过随机抽样,把这批灯泡的寿命看作总体,从中随机取出若干个个体作为样本,算出样本的数字特征,用样本的数字特征来估计总体的数字特征.(二)推进新课、新知探究、提出问题(1)什么是众数、中位数、平均数?(1)如何绘制频率分布直方图?(3)如何从频率分布直方图中估计众数、中位数、平均数?活动:那么学生回忆初中所学的一些统计知识,思考后展开讨论,教师提示引导.讨论结果:(1)初中我们曾经学过众数(在一组数据中,出现次数最多的数称为众数)、中位数(在按大小顺序排列的一组数据中,居于中间的数称为中位数)、平均数(一般是一组数据和的算术平均数)等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息.(2)画频率分布直方图的一般步骤为:计算一组数据中最大值与最小值的差,即求极差;决定组距与组数;将数据分组;列频率分布表;画频率分布直方图.(3)教材前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t(最高的矩形的中点),它告诉我们,该市的月均用水量为2.25t的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少.请大家翻回到课本看看原来抽样的数据,有没有2.25这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?(请大家思考作答)分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失了,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差.提问:那么如何从频率分布直方图中估计中位数呢?分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边的直方图的面积应该相等.由此可以估计出中位数的值为2.02.思考:2.02这个中位数的估计值,与样本的中位数值2.0不一样,你能解释其中的原因吗?(原因同上:样本数据的频率分布直方图把原始的一些数据给遗失了)课本显示,大部分居民的月均用水量在中部(2.02t左右),但是也有少数居民的月均用水量特别高,显然,对这部分居民的用水量作出限制是非常合理的.思考:中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会成为缺点,你能举例说明吗?(让学生讨论,并举例)对极端值不敏感有利的例子:考察课本中表21中的数据,如果把最后一个数据错写成22,并不会对样本中位数产生影响.也就是说对极端数据不敏感的方法能够有效地预防错误数据的影响,而在实际应用中,人为操作的失误经常造成错误数据.对极端值不敏感有弊的例子:某人具有初级计算机专业技术水平,想找一份收入好的工作,这时如果采用各个公司计算机专业技术人员收入的中位数作为选择工作的参考指标就会冒这样的风险:很可能所选择公司的初级计算机专业技术水平人员的收入很低,其原因是中位数对极小的数据不敏感.这里更好的方法是同时用平均工资和中位数来作为参考指标,选择平均工资较高且中位数较大的公司就业.对极端值不敏感的方法,不能反映数据中的极端情况.同样的,可以从频率分布直方图中估计平均数,上图就显示了居民用水的平均数,它等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.由估计可知,居民的月均用水量的平均值为2.02t.显示了居民月均用水量的平均数,它是频率分布直方图的“重心”.由于平均数与每一个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变.这是中位数、众数都不具有的性质.也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.从图上可以看出,用水量最多的几个居民对平均数影响较大,这是因为他们的月均用水量与平均数相差太多了.利用频率分布直方图估计众数、中位数、平均数:估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点)估计中位数:中位数把频率分布直方图分成左右两边面积相等.估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. 总之,众数、中位数、平均数都是对数据中心位置的描述,可以作为总体相应特征的估计.样本众数易计算,但只能表达样本数据中的很少一部分信息,不一定唯一;中位数仅利用了数据中排在中间数据的信息,与数据的排列位置有关;平均数受样本中的每一个数据的影响,绝对值越大的数据,对平均数的影响也越大.三者相比,平均数代表了数据更多的信息,描述了数据的平均水平,是一组数据的“重心”.(三)应用示例思路1例1 (1)若M 个数的平均数是X ,N 个数的平均数是Y ,则这M +N 个数的平均数是___________;(2)如果两组数x 1,x 2,…,x n 和y 1,y 2,…,y n 的样本平均数分别是x 和y ,那么一组数x 1+y 1,x 2+y 2,…,x n +y n 的平均数是___________.活动:学生思考或交流,教师提示,根据平均数的定义得到结论.解:(1)NM NY MX ++; (2)2y x +. 例2 某校高一年级的甲、乙两个班级(均为50人)的语文测试成绩如下(总分:150分),试确定这次考试中,哪个班的语文成绩更好一些.甲班:112 86 106 84 100 105 98 102 94 10787 112 94 94 99 90 120 98 95 119108 100 96 115 111 104 95 108 111 105104 107 119 107 93 102 98 112 112 9992 102 93 84 94 94 100 90 84 114乙班:116951099610698108991101039498105101115104112101113961081001109810787108106103971071061111219710711412210110710711111410610410495111111110分析:我们可用一组数据的平均数衡量这组数据的集中水平,因此,分别求出甲、乙两个班的平均分即可.解:用计算器分别求出甲班的平均分为101.1,乙班的平均分为105.4,故这次考试乙班成绩要好于甲班.思路2例1下面是某校学生日睡眠时间抽样频率分布表(单位:h),试估计该校学生的日平均睡眠时间.个体睡眠时间只是一个范围,可以用各组区间的组中值近似地表示.解法一:总睡眠时间约为6.25×5+6.75×17+7.25×33+7.75×37+8.25×6+8.75×2=739(h),故平均睡眠时间约为7.39h.解法二:求组中值与对应频率之积的和6.25×0.05+6.75×0.17+7.25×0.33+7.75×0.37+8.25×0.06+8.75×0.02=7.39(h).答:估计该校学生的日平均睡眠时间约为7.39h.例2某单位年收入在10000到15000、15000到20000、20000到25000、25000到3 0000、30000到35000、35000到40000及40000到50000元之间的职工所占的比分别为1 0%,15%,20%,25%,15%,10%和5%,试估计该单位职工的平均年收入.分析:上述百分比就是各组的频率.解:估计该单位职工的平均年收入为12500×10%+17500×15%+22500×20%+27500×25%+32500×15%+37500×10%+45 000×5%=26125(元).答:估计该单位人均年收入约为26125元.(四)知能训练从甲、乙两个公司各随机抽取50名员工月工资:甲公司:800800800800800100010001000100010001000100010001000100012001200120012001200120012001200120012001200120012001200120012001200120012001200150015001500150015001500150020002000200020002000250025002500乙公司:700700700700700700700700700700700700700700700100010001000100010001000100010001000100010001000100010001000100010001000100010001000100010001000100010001000100010001000100010006000800010000试计算这两个公司50名员工月工资平均数、众数、中位数,并估计这两个企业员工平均工资.答案:甲公司:员工月工资平均数1240,众数1200,中位数1200;乙公司:员工月工资平均数1330,众数1000,中位数1000;从总体上看乙公司员工月工资比甲公司少,原因是乙公司有几个收入特高的员工影响了工资平均数.(五)拓展提升“用数据说话”,这是我们经常可以听到的一句话.但是,数据有时也会被利用,从而产生误导.例如,一个企业中,绝大多数是一线工人,他们的年收入可能是一万元左右,另有一些经理层次的人,年收入可以达到几十万元.这时,年收入的平均数会比中位数大得多.尽管这时中位数比平均数更合理些,但是这个企业的老板到人力市场去招聘工人时,也许更可能用平均数来回答有关工资待遇方面的提问.你认为“我们单位的收入水平比别的单位高”这句话应当怎么解释?这句话的目的是谨防利用人们对统计术语的模糊认识进行误导(蒙骗).使学生能够正确理解在日常生活中像“我们单位的收入水平比别的单位高”这类话的模糊性,这里的“收入水平”是指员工收入数据的某个中心点,即可以是中位数、平均数或众数,不同的解释有不同的含义.在这里应该注意以下几点:1.样本众数通常用来表示分类变量的中心值,容易计算,但是它只能表达样本数据中的很少一部分信息,通常用于描述分类变量的中心位置.2.中位数不受少数几个极端数据(即排序靠前或排序靠后的数据)的影响,容易计算,它仅利用了数据中排在中间数据的信息.当样本数据质量比较差,即存在一些错误数据(如数据的录入错误、测量错误等)时,应该用抗极端数据强的中位数表示数据的中心值,可以利用计算机模拟样本,向学生展示错误数据对样本中位数的影响程度.3.平均数受样本中的每一个数据的影响,“越离群”的数据,对平均数的影响也越大.与众数和中位数相比,平均数代表了数据更多的信息.当样本数据质量比较差时,使用平均数描述数据的中心位置可能与实际情况产生较大的误差.可以利用计算机模拟样本,向学生展示错误数据对样本平均数的影响程度.在体育、文艺等各种比赛的评分中,使用的是平均数.计分过程中采用“去掉一个最高分,去掉一个最低分”的方法,就是为了防止个别裁判的人为因素而给出过高或过低的分数对选手的得分造成较大的影响,从而降低误差,尽量保证公平性.4.如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中极端数据的信息,帮助我们作出决策.5.使用者常根据自己的利益去选取使用中位数或平均数来描述数据的中心位置,从而产生一些误导作用.(六)课堂小结1.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(平均数),会用样本的基本数字特征估计总体的基本数字特征;2.平均数对数据有“取齐”的作用,代表一组数据的平均水平;3.形成对数据处理过程进行初步评价的意识.(七)作业习题2.2A组3.。