高中数学第2章统计2.3总体特征数的估计2.3.1平均数及其估计知识导引学案苏教版必修3

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2.3.1 平均数及其估计
案例探究
为了了解某地区高三学生的身体发育情况,抽查了地区内100名年龄为17.5~18岁的男生的体重情况,结果如下(单位:kg)
根据上述数据我们可以画出样本的频率分布直方图,并对相应的总体分布作出估计.
由于图中各小长方形的面积等于相应各组的频率,这个图形的面积反映了数据落在各个小组的频率的大小.在得到了样本的频率后,就可以对相应的总体情况作出估计.例如从这些样本数据的频率分布直方图可以看出,体重在(64.5,66.5)kg的学生比体重为其他值的学生数多,但他并没有告诉我们多多少.
试问:怎样将各个样本数据汇总为一个数值,并使它成为样本数据的“中心点”?
能否用一个数值来描写样本数据的离散程度?
初中我们曾经学过众数、中位数、平均数等各种数字特征.应当说,这些数字都能够为我们提供关于样本数据的特征信息.
我们常用算术平均数∑=n
i i a n 1
1(其中a i (i=1,2,…,n)为n 个实验数据)作为体重的最
理想的近似值,它的依据是什么呢?
处理实验数据的原则是使这个近似值与实验数据之间的离差最小,设这个近似值为x ,那么它与n 个实验值a i (i=1,2,…,n)的离差分别为-a 1,x -a 2,x -a 3,…,x-a n .由于上述离差有正有负,故不宜直接相加.可以考虑将各个离差的绝对值相加,研究|x-a 1|+|x-a 2|+…+|x -a n |取最小值时x 的值.但由于含有绝对值,运算不太方便,所以,考虑离差的平方和,即
(x -a 1)2+(x -a 2)2+…+(x -a n )2
, 当此和最小时,对应的x 的值作为近似值.因为
(x -a 1)2+(x -a 2)2+…+(x -a n )2=nx 2-2(a 1+a 2+…+a n )x+a 12+a 22+…+a n 2
, 所以当x=
n a a a n )(21+++ 时离差的平方和最小,故可用n
a a a n )
(21+++ 作为表
示体重的理想近似值,称其为这n 个数据a 1,a 2,…,a n 的平均数(average )或均值(mean ),一般记为x =
n
a a a n )
(21+++ .
这样,我们可以用计算器求得,该地区内100名年龄为17.5~18岁的男生的体重的最佳近似值为x =65.5(kg ).
这样我们就得到了样本平均数的求解方法: 样本数据的算术平均数,即x =
n
x x x n )
(21+++ .
Excel 中函数“AVERAGE ( )”可直接用于计算给定数据的平均数.如求12,12.4,12.8,13,12.2,12.8,12.3,12.5,12.5的平均数,可直接把它们输到工作表中A1∶J1区域后,在某空白单元格中输入“=AVERAGE (A1∶H1)”即可,即得它们的平均数为12.5(如下图).
自学导引
1.在频率分布直方图中,众数是指最高矩形的中点的横坐标,中位数是指样本数据中累积频率为0.5时所对应的样本数据值,平均数是指样本数据的算术平均数 2.下列数字特征一定是数据组中数据的是( )
A .众数
B .中位数
C .标准差
D .平均数 答案:A
3.数据:1,1,3,3的众数和中位数分别是( )
A.1或3,2 B.3,2
C.1或3,1或3 D.3,3
答案:A
4.频率分布直方图的重心是()
A.众数 B.中位数
C.标准差 D.平均数
答案:D
疑难剖析
【例1】某校高一年级的甲、乙两个班级(均为50人)的语文测试成绩如下:(总分:150)
甲班:112 86 106 84 100 105 98 102 94 107 87 112 94 94 99 90 120 98 95 119 108 100 96 115 111 104 95 108 111 105 104 107 119 107 93 102 98 112 112 99 92 102 93 84 94 94 100 90 84 114 乙班:116 95 109 96 106 98 108 99 110 103 94 98 105 101 115 104 112 101 113 96 108 100 110 98 107 87 108 106 103 97 107 106 111 121 97 107 114 122 101 107 107 111 114 106 104 104 95 111 111 110
试确定这次考试中,哪个班的语文成绩更好些.
思路分析:我们可用一组数据的平均数衡量这组数据的水平,因此,分别求得甲、乙两个班级的平均分即可.
解析:用科学计算器或计算机分别求得甲班的平均分为101.1,乙班的平均分为105.4,故这次考试乙班成绩要好于甲班.
【例2】某教师出了一份共3道题的测试卷,每题1分,全班得3分、2分、1分和0分的学生所占比例分别为0.3、0.5、0.1和0.1.
(1)若全班共10人,则平均分是多少?
(2)若全班共20人,则平均分是多少?
(3)若该班人数未知,能求出该班的平均分吗?
思路分析:上述所占比例就是各数据的频率.
解:由题意,
平均分=3×0.3+2×0.5+1×0.1=2.
答:全班的平均分为2分
思维启示:各数据频率确定时,平均数不受样本容量的影响.
【例3】某工厂人员及工资构成如下表:
(1)指出这个问题中周工资的众数、中位数、平均数;
(2)这个问题中,平均数能客观地反映该工厂的工资水平吗?为什么?
思路分析:根据众数、中位数、平均数各自的特点,选择合适的数据反映该厂的工资水平.
解析:由表格可知:众数=200, ∵23的中间位置众数是12, ∴中位数=220.
平均数=(2 200+1 500+1 100+2 000+100)÷23=300.
虽然平均数为300元/周,但由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平.
思维启示:平均数受数据中的极端值的影响较大,妨碍了对总体估计的可靠性,这时平均数反而不如众数、中位数更能反映客观情况.
拓展迁移
【拓展点1】 以往的招生统计数据显示,某大学录取的新生高考总分的中位数基本上稳定在550分.你的一位校友在今年的高考中得了520分,你是立即劝阻他报考这所大学,还是先查阅一下这所大学招生的其他信息?解释一下你的选择. 提示:应该查阅一下这所大学的其他招生信息,例如平均信息、最低录取分数线信息等,尽管该校友的分数位于中位数之下,而中位数本身并不能提供更多录取分数分布的信息.在已知最低录取分数线的情况下,很容易作出判断;在已知平均数的情况下,如果平均数小于中位数很多,则说明最低录取分数线较低,可以推荐该校友报考这所大学,否则还要获取其他的信息(如标准差的信息)来作出判断.
【拓展点2】 在一次人才招聘会上,有一家公司的招聘员告诉你,“我们公司的收入水平很高”,“去年,在50名员工中,最高年收入达到了100万,他们年收入的平均数是3.5万”.如果你希望获得年薪2.5万元,
(1)你是否能够判断自己可以成为此公司的一名高收入者? (2)如果招聘员继续告诉你,“员工收入的变化范围是从0.5万到100万”,这个信息是否足以使你作出自己是否受聘的决定?为什么?
(3)如果招聘员继续给你提供了如下信息,员工收入的中间0.5(即去掉最少的0.25和最多的0.25后所剩下的)的变化范围是1万到3万,你又该如何使用这条信息来作出是否受聘的决定?
(4)你能估计出收入的中位数是多少吗?为什么均值比估计出的中位数高很多? 答案:(1)不能,因为平均收入和最高收入相差太多,说明高收入的职工只占极少数.现在已经知道至少有一个人的收入为x 50=100万元,那么其他员工的收入之和为
∑=49
1
i i
x
=3.5×50-100=75(万元),每人平均只有1.53万元.如果再有几个收入特别高者,
那么初进公司的员工的工资会更低. (2)公司的员工的收入将会很低. (3)可以确定有0.75的员工工资在1万元以上,其中0.25的员工工资在3万元以上. (4)收入的中位数大约是2万元.因为有年收入100万这个极端值的影响,使得年平均收入比中位数高许多.。

相关文档
最新文档