[精品]新人教A版必修三高中数学第二章2.2.2用样本的数字特征估计总体的数字特征导学案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.22 用样本的数字特征估计总体的数字特征
1.掌握众数、中位数、平均数、标准差、方差的定义和特征.
2.会求众数、中位数、平均数、标准差、方差,并能用之解决有关问题.
1.众数
(1)定义:一组数据中出现次数的数称为这组数据的众数.
(2)特征:一组数据中的众数可能个,也可能没有,反映了该组数据的.
众数体现了样本数据的最大集中点,但它对其他数据信息的忽视使其无法客观地反映总体特征.
【做一做1】 数据组8,-1,0,4,17
,4,3的众数是. 2.中位数
(1)定义:一组数据按从小到大的顺序排成一列,处于位置的数称为这组数据的中位数.
(2)特征:一组数据中的中位数是的,反映了该组数据的.在频率分布直方图中,中位数左边和右边的直方图的面积.
中位数不受少数几个极端值的影响,这在某些情况下是优点,
但它对极端值的不敏感有时也会成为缺点.
【做一做2】数据组-5,7,9,6,-1,0的中位数是.
3.平均数
(1)定义:一组数据的和与这组数据的个数的商.数据1,
的平均数为\t()=
2,…,n
(2)特征:平均数对数据有“取齐”的作用,代表该组数据的.任何一个数据的改变都会引起平均数的变化,这是众数和中位数都不具有的性质.所以与众数、中位数比较起,平均数可以反映出更多的关于样本数据全体的,但平均数受数据中的影响较大,使平均数在估计总体时可靠性降低.
【做一做3】 10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,则其平均数是.
4.标准差
(1)定义:标准差是样本数据到平均数的一种平均距离,一般用s表示,通常用以下公式计算
s=
可以用计算器或计算机计算标准差.
(2)特征:标准差描述一组数据围绕波动的大小,反映了一组数据变化的幅度和离散程度的大小.标准差较大,数据的离散程度较;标准差较小,数据的离散程度较.
【做一做4】一组数据的单位是,平均数是\t(),标准差为s,则( )
A.\t()与s的单位都是B.\t()与s的单位都是c
.\t()与s的单位都是D.\t()与s的单位不同
5.方差[]
(1)定义:标准差的平方,即
s2=
(2)特征:与的作用相同,描述一组数据围绕平均数波动程度的大小.
(3)取值范围:
数据组1,2,…,n的平均数为\t(),方差为s2,标准差为s,则数据组a1+b,a2+b,…,a n+b(a,b为常数)的平均数为a\t()+b,方差为a2s2,标准差为as
【做一做5】下列刻画一组数据离散程度的是( )
A.平均数B.方差.中位数
D.众数
6.用样本估计总体
现实中的总体所包含的个体数往往很多,总体的平均数、众数、中位数、标准差、方差是不知道的,因此,通常用的平均数、众数、中位数、标准差、方差估计.这与上一节用的频率分布近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理
的,也是可以接受的.
用样本的数字特征估计总体的数字特征分两类:用样本平均数估计总体平均数;用样本标准差估计总体标准差.样本容量越大,估计就越精确.
【做一做6-1】下列判断正确的是( )
A.样本平均数一定小于总体平均数
B.样本平均数一定大于总体平均数
.样本平均数一定等于总体平均数[]
D.样本容量越大,样本平均数越接近总体平均数
【做一做6-2】电池厂从某日生产的电池中抽取10个进行寿命测试,得数据如下(单位:小时):30,35,25,25,30,34,26,25,29,21,则该日生产电池的平均寿命估计为( )
A.27 B.28 .29 D.30
答案:1.(1)最多(2)不止一集中趋势
【做一做1】 4
2.(1)中间(2)唯一集中趋势相等[]
【做一做2】 3 将该组数据按从小到大排列为-5,-1,
0,6,7,9,则中位数是0+6
2
=3
3.(1)1+2+…+n n
(2)平均水平 信息 极端值 【做一做3】 147 平均数是110
(15+17+14+10+15+17+17+16+14+12)=147
4
.(1)
错误! (2)平均数 大 小 【做一做4】 \t()与s 的单位都与数据组中的数据单位相同,是
5.(1)1n
[(1-\t())2+(2-\t())2+…+(n -\t())2] (2)标准差 (3)[0,+∞)
【做一做5】 B 方差刻画一组数据离散程度的大小.
6.样本 样本
【做一做6-1】 D
【做一做6-2】 B 这10个数据的平均数是110
(30+35+25+25+30+34+26+25+29+21)=28,则该日生产的电池的平均寿命估计为28小时.
1.理解众数、中位数、平均数
剖析:(1)众数体现了样本数据的最大集中点,容易计算,但它只能表达样本数据中很少一部分信息,显然对其他数据信息的忽略使其无法客观地反映总体特征.
(2)中位数不受少数几个极端值的影响,容易计算,但它对极端值的不敏感有时也会成为缺点.
(3)由于平均数与每一个样本的数据有关,“越离群”的数据,对平均数的影响也越大,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质.
也正因为这个原因,与众数、中位数比较起,平均数可以反映出更多的关于样本数据全体的信息.但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低.如在体育、文艺等各种比赛的评分中,使用的是平均数,计分过程中采用“去掉一个最高分,去掉一个最低分”的方法,就是为了防止由于个别裁判的人为因素而给出过高或过低的分数,对选手的得分造成较大的影响,从而降低误差,尽量保证公平性.
(4)在一组数据中,它们的众数、中位数、平均数可能相同,也可能不同,而实际问题中,计算平均数时应该注意按实际要求进行计算.
(5)实际问题中求得的平均数、众数和中位数应带上单位.
2.众数、中位数、平均数与频率分布直方图的关系
剖析:(1)在样本数据的频率分布直方图中,众数的估计值就是最高矩形的中点的横坐标.
(2)在频率分布直方图中,中位数左右两侧的直方图的面积相等,但是因为样本数据的频率分布直方图只是直观地表明分布的特征,因而从直方图本身得不出原始的数据内容,所以由频率分布直
方图得到的中位数估计值往往与样本的实际中位数的值不一致.
(3)平均数显然是频率分布直方图的“重心”.我们知道,n个
样本数据1,2,…,n的平均数\t()=1
n
(1+2+3+…+n),则就有
n\t()=1+2+3+…+n,所以\t()对数据有“取齐”的作用,代表了一组数据的数值平均水平.在频率分布直方图中,平均数是直方图的平衡点,假设横轴表示一块放置直方图的跷跷板,则支点取在平均数处时跷跷板达到平衡.
3.理解方差与标准差
剖析:(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.
(2)标准差、方差的取值范围是[0,+∞).
标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性.
(3)因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.
题型一计算方差(标准差)
【例题1】从某项综合能力测试中抽取100人的成绩,统计如下表,则这100人成绩的标准差为.
反思:求一组数据的方差和标准差的步骤如下:
①先求平均数\t()
②代入公式得方差和标准差
s2=1
n
[(1-\t())2+(2-\t())2+…+(n-\t())2],
s=错误!
题型二众数、中位数、平均数的应用
【例题2】某工厂人员及月工资构成如下:
(1)指出这个问题中的众数、中位数、平均数.
(2)这个问题中,平均数能客观地反映该工厂的月工资水平吗?为什么?
分析:(由平均数的定义)→(计算平均数)→(已知数据从小到大排列)→(得中位数、众数)→(结论) 反思:(1)如果样本平均数大于样本中位数,说明数据中存在许
多较大的极端值;反之,说明数据中存在许多较小的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中的极端数据信息,帮助我们作出决策.
(2)众数、中位数、平均数三者比较,平均数更能体现每个数据的特征,它是各个数据的重心.
题型三方差的应用
【例题3】甲、乙两台包装机同时包装质量为200克的糖果,从中各抽出10袋,测得其实际质量分别如下(单位:克):甲:203 204 202 196 199 201 205 197 202 199
乙:201 200 208 206 210 209 200 193 194 194
(1)分别计算两个样本的平均数与方差.
(2)从计算结果看,哪台包装机包装的10袋糖果的平均质量更接近于200克?哪台包装机包装的10袋糖果的质量比较稳定?
反思:研究两个样本的波动情况或比较它们的稳定性、可靠性、平整性等性能好坏的这类题,先求平均数,比较一下哪一个更接近标准.若平均数相等,则再比较两个样本方差的大小作出判断.在计算过程中,要仔细观察所给样本数据的特征,选择恰当的公式计算平均数和方差,这样可避免计算的烦琐,降低错误率.题型四易错辨析
【例题4】小明是班里的优秀生,他的历次数成绩是96,98,95,93分,但最近的一次考试成绩只有45分,原因是他带病参加了考试.期末评价时,怎样给小明评价?
错解:这五次数考试的平均分是
96+98+95+93+455
=854,则按平均分给小明一个“良好”. 错因分析:这种评价是不合理的,尽管平均分是反映一组数据平均水平的重要特征,但任何一个数据的改变都会引起它的变化,而中位数则不受某些极端值的影响.本题中的5个成绩从小到大排列为:45,93,95,96,98,中位数是95,较为合理地反映了小明的数水平,因而应该用中位数衡量小明的数成绩.
答案:
【例题1】 2105
这100人的总成绩为5×20+4×10+3×30+2×30+1×10=300,平均成绩为300100=3,则该100人成绩的标准差为
错误! =2105
【例题2】 解:(1)由表格可知,众数为2 000元.
把23个数据按从小到大(或从大到小)的顺序排列,排在中间的数应是第12个数,其值为2 200,故中位数为2 200元.
平均数为(22 000+15 000+11 000+20 000+1 000)÷23=69 000÷23=3 000(元).
(2)虽然平均数为3 000元/月,但由表格中所列出的数据可见,
只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平.
【例题3】解:(1)\t()甲=1
10
(3+4+2-4-1+1+5-3+2-1)+200=2008
\t()乙=1
10
(1+0+8+6+10+9+0-7-6-6)+200=2015
s\al(2,甲)=796,s\al(2,乙)=3805
(2)∵200<\t()甲<\t()乙,
∴甲台包装机包装的10袋糖果的平均质量更接近于200克.
∵s\al(2,甲)<s\al(2,乙),
∴甲台包装机包装的10袋糖果的质量比较稳定.
【例题4】正解:小明5次考试成绩,从小到大排列为45,93,95,96,98,中位数是95,应评定为“优秀”.
1.如图,是某篮球运动员在一个赛季的30场比赛中得分的茎叶图,则得分的中位数与众数分别为( )
A.3与3 B.23与3 .3与23
D.23与23
2.(2011·北京海淀二模,理5)某赛季甲、乙两名篮球运动员
各13场比赛的得分情况用茎叶图表示如下:
根据上图,对这两名运动员的成绩进行比较,下列四个结论中,不正确的是( )
A.甲运动员得分的极差大于乙运动员得分的极差
B.甲运动员得分的中位数大于乙运动员得分的中位数
.甲运动员的得分平均值大于乙运动员的得分平均值
D.甲运动员的成绩比乙运动员的成绩稳定
3.抛硬币20次,抛得正面朝上12次,反面朝上8次.如果抛到正面朝上得3分,抛到反面朝上得1分,则平均得分是,得分的方差是.
4.某人5次上班途中所花的时间(单位:分钟)分别为,y,10,11,9已知这组数据的平均数为10,方差为2,则2+y2=5.某校高二年级在一次数选拔赛中,由于甲、乙两人的竞赛成绩相同,从而决定根据平时在相同条件下进行的六次测试确定出最佳人选,这六次测试的成绩数据如下:
求两人比赛成绩的平均数以及方差,并且分析成绩的稳定性,从中选出一位参加数竞赛.
答案:1.D 中位数是指一组数据按从小到大(或从大到小)的顺序依次排列,处在中间位置的一个数(或最中间两个数据的平均数),从茎叶图中可知中位数为23;众数是指一组数据中出现次数最多的数,从茎叶图中可知23出现了3次,次数最多,因此众数也是23,所以选D.
2.D 甲运动员比赛得分的最高分为47,最低分为18,极差为29,乙运动员比赛得分的最高分为33,最低分为17,极差为16,所以A项正确;甲运动员比赛得分的中位数为30,乙运动员比赛得分
(18的中位数为26,所以B项正确;甲运动员的得分平均值x甲=1
13
+18+19+20+21+26+30+32+33+35+40+41+47)=343
,乙
13
(17+17+19+19+22+25+26+27+运动员的得分平均值x乙=1
13
,甲运动员的得分平均值大于乙运动员29+29+30+32+33)=325
13
的得分平均值,所以项正确;由茎叶图知甲得分较为分散,乙得分较为集中,故甲的成绩没有乙的成绩稳定.
=3.22 096 总得分为12×3+8×1=44,则平均分是44
20
[(3-22)2×12+(1-22)2×8]=096
22,方差s2=1
20
=10,4.208 由平均数为10,得(+y+10+11+9)×1
5
则+y=20;
又由于方差为2,则[(-10)2+(y-10)2+(10-10)2+(11-
=2,
10)2+(9-10)2]×1
5
整理得2+y2-20(+y)=-192,
则2+y2=20(+y)-192=20×20-192=208 5.解:设甲乙两人成绩的平均数分别为x甲,x乙,则x甲=130+1(380751)
6
-+++++=133,
x乙=130+1
(318426)
6
-++-+=133,
2 s 甲=222222
1
[(6)5(3)42(2)]
6
-++-+++-=47
3
,
2 s 乙=222222
1
[0(4)51(5)3]
6
+-+++-+=38
3
因此,甲与乙的平均数相同,由于乙的方差较小,所以乙的成绩比甲的成绩稳定,应该选乙参加竞赛比较合适.。