第十章 统计与概率10-2用样本估计总体
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
注意以下结论: (1)如果x1、x2、„、xn的平均数为 - ,则ax1+b,ax2 x +b,„,axn+b的平均数为a -+b. x
(2)数据x1、x2、„、xn与数据x1+m、x2+ m、„、xn+m的方差相等. (3)若x1、x2、„、xn的方差为s2,则kx1, kx2,„,kxn的方差为k2s2. 计算方差时,要依据所给数据的特点恰当选 取公式以简化计算.
3.茎叶图 统计中还有一种被用来表示数据的图叫做茎 叶图. 茎是指中间的一列数,叶是从茎的旁边生长 出来的数. 在样本数据较少、较为集中,且位数不多时, 用茎叶图表示数据的效果较好,它当 样本数据较多时,茎叶图就不太方便.
4.平均数、中位数和众数
把样本方差的算术平方根叫做这组数据的样 本标准差.
(3)数据的离散程度可以通过极差、方差或
误区警示 1.对频率分布直方图和茎叶图识图不准是常见的错 误.在频率分布直方图中,小矩形的高= 频率 组距 =
频数 频率 .频率= ×组距=小矩形的面积. 组距×样本容量 组距
2.中位数可能不在样本数据中. 3.计算公式用错或计算错误.计算平均数、 方差、标准差等时计算量大,要注意计算结 果的准确性.
③将数据分组:通常对组内数值所在区间取 左闭右开区间,最后一组取闭区间,也可以 将样本数据多取一位小数分组;
④列频率分布表:登记频数,计算频率,列 出频率分布表. 将样本数据分成若干小组,每个小组内的样 本个数称作频数,频数与样本容量的比值叫 做这一小组的频率.频率反映数据在每组 所占比例 的大小.
方差:s12= 100)2]≈3.43. 乙车间:
1 [(102-100)2+(101-100)2+„+(99- 7
1 平均值: x2 = 7 (110+115+90+85+75+115+110)= 100, 方差:s22= 100)2]≈228.57. ∵ x1 = x2 ,s12<s22,∴甲车间产品稳定. 1 [(110-100)2+(115-100)2+„+(110- 7
重点难点 重点:用样本的频率分布估计总体分布;用 样本的数字特征估计总体的数字特征. 难点:频率分布直方图的理解和应用.
知识归纳 1.编制频率分布直方图的步骤如下: ①求极差:极差是一组数据的最大值与最小 值的差. ②决定组距和组数:当样本容量不超过100时,常分
极差 成5~12组.组距= . 组数
(1)画出A、B的茎叶图; (2)用茎叶图处理现有的数据,有什么优点? (3)通过观察茎叶图,对品种A与B的亩产量 稳定性进行比较,写出统计结论.
[解析]
(1)
(2)由于每个品种的数据都只有25个,样本 数不大,画茎叶图很方便;此时茎叶图不仅 清晰明了的展示了数据的分布情况,便于比 较,没有任何信息损失,而且还可以随时记 录新的数据. (3)通过观察茎叶图可以看出:品种B的亩产 量集中在383~416之间,而品种A的亩产量 则较分散,故可就亩产量的稳定性得出结论: B品种较稳定.
分析:系统抽样又称等距抽样,从传送带上 每隔30min抽取一包产品符合等距抽样的特 征;又样本数据都是两位数或三位数,故取 十位,百位为茎,个位为叶,制作茎叶图; 比较两个车间生产的产品的稳定性可通过计 算方差作出判断.
解析:(1)因为间隔时间相同,故是系统抽 样. (2)茎叶图如下:
(3)甲车间: 1 平均值: x1 = 7 (102+101+99+98+103+98+99) =100,
a4 得d=-5.∴b=a4+a5+a6+a7=78,a=100=0.27.
[例2] (09·江苏)某校甲、乙两个班级各有5 名编号为1,2,3,4,5的学生进行投篮练习,每 人投10次,投中的次数如下表:
学生 1号 2号 3号 4号 5号 7 7 8 7 甲班 6 7 6 7 9 乙班 6 则以上两组数据的方差中较小的一个为s2= ________.
点评:也可以先求各小组的频数解答如下: 设第i组的频数为ai(i=1,2,„,9),
a1 由图知 =0.1,∴a1=1.同理a2=3. 100×0.1 ∵前4组频数成等比数列,∴a3=9,a4=27. 又后6组频数成等差数列,设公差d,
a =27 4 则 a4+a5+„+a9=100-1+3+9
1 解析: x 甲= (10.05+10.02+9.97+9.96+10.00)=10. 5 1 s甲 = 4 [(10.05-10)2+(10.02-10)2+(9.97-10)2+
2
2 ∴s甲 <s乙 ,∴方差中较小的一个为s甲 ,∴s =5. 2 答案:5
2 2 2 2
点评:(1)如果注意观察两组数据可以发现, 前两个数据相同,后三个数据,甲班更接近, 故方差较小,可不必计算乙班的方差.
1 (2)注意样本方差的两个计算公式s = n
2
(xi-
i=1
n
1 n 2 -2 -) 和s = x i - x 各自的适用条件,灵活选用公式 x n i=1
⑤绘制频率分布直方图:把横轴分成若干段,每一段
对应一个组距,然后以线段为底作一矩形,它的高等于该 频率 组的 ,这样得出一系列的矩形,每个矩形的面积恰好 组距 是该组上的频率.这些矩形就构成了频率分布直方图.
在频率分布直方图中,纵轴表示“频率/组 距”,数据落在各小组内的频率用小矩形的 面积表示,各小矩形的面积总和等于1.
[例1] (09·湖北)如图是样本容量为200的频 率分布直方图.根据样本的频率分布直方图 估计,样本数据落在[6,10)内的频数为 ________,数据落在[2,10)内的概率约为 ________. 解析:200×(0.08×4)=64; (0.02+0.08)×4=0.4. 答案:64;0.4
A.0.27,78 C.2.7,78
B.0.27,83 D.2.7,83
解析:由直方图可知,前4组的公比为3,最大频率a =0.1×33×0.1=0.27,设后6组的频数公差为d,则1- 5×6 (0.01+0.03+0.09)=0.27×6+ 2 d,
解得:d=-0.05,∴后6组的频数公差为- 0.05, 所以视力在4.6到5.0之间的学生数为 (0.27+0.22+0.17+0.12)×100=78人. 答案:A
解析:(80-70)×0.01×200=20. 答案:C
(理)为了解某校高三学生的视力情况,随机 地抽查了该校100名高三学生的视力情况, 得到频率分布直方图如下图;由于不慎将部 分数据丢失,但知道前4组的频数成等比数 列,后6组的频数成等差数列,设最大频率 为a,视力在4.6到5.0之间的学生数为b,则 a、b的值分别为( )
解题技巧
1.样本频率直方图与样本的数字特征.
在频率分布直方图中,平均数的估计值等于
频率分布直方图中每个小矩形的面积乘以小
矩形底边中点的横坐标之和;中位数的估计
值,应使中位数左右两边的直方图面积相等;
最高小长方形的中点所对应的数据值即为这
组数据的众数.
2.方差是刻画一组数据离散程度的量,方
答案:B
[例3] 某化肥厂甲、乙两个车间包装肥料, 在自动包装传送带上每隔30min抽取一包产 品,称其重量,分别记录抽查数据如下: 甲:102,101,99,98,103,98,99; 乙:110,115,90,85,75,115,110. (1)这种抽样方法是哪一种? (2)将这两组数据用茎叶图表示; (3)将两组数据比较,说明哪个车间产品较 稳定.
A.83 C.85
B.84 D.86
解析:去掉最高分93分,最低分79分,所剩数据的 -=80+1(4+4+6+4+7)=85. 平均数为 x 5
答案:C
(理)(09·安徽)某良种培育基地正在培育一种 小麦新品种A.将其与原有的一个优良品种B 进行对照试验.两种小麦各种植了25亩,所 得亩产数据(单位:千克)如下: 品种A: 357,359,367,368,375,388,392,399,400,405 ,412,414,415,421,423,423,427,430,430,43 4,443,445,445,451,454 品种B:3 63,371,374,383,385,386,391,392,394,394, 395,397,397,400,401,401,403,406,407,410 ,412,415,416,422,430
分析:所给数据都是一位数,且比较集中,因此使 1 用方差的两个计算公式都可以,但用公式S = n
2
(xi-
i=1
n
-)2计算更简便. x
解析:-甲=7, x 1 2 2 2 2 2 2 s甲 =5(1 +0 +0 +1 +0 )=5,
2
-乙=7, x 1 2 6 2 2 2 2 s乙 =5(1 +0 +1 +0 +2 )=5,
2 2
以减少计算量.
(2010·山东文)在某项体育比赛中,七位裁 判为一选手打出的分数如下: 90 89 90 95 93 94 93 去掉一个最高分和一个最低分后,所剩数据 的平均值和方差分别为( ) A.92,2 B.92,2.8 C.93,2 D.93,2.8
解析:去掉最低分89,最高分95,然后各减去90 3+4+3+0+0 得,0,0,3,4,3.∵ =2,∴平均数为92,方差 5 2-02+2-02+2-32+2-42+2-32 为 =2.8,选 5 B.
(1)平均数:一组数据的总和除以数据的个
数所得的商就是平均数.
(2)中位数:如果将一组数据按从小到大的
顺序依次排列,当数据有奇数个时,处在最
中间的一个数是这组数据的中位数;当数据
有偶数个时,处在最中间两个数的平均数,
是这组数据的中位数.
(3)众数:出现次数最多的数(若有两个或几
(4)在频率分布直方图中,最高小长方形的 中点所对应的数据值即为这组数据的众 数.而在频率分布直方图上的中位数左右两 侧的直方图面积应该相等,因而可以估计其 近似值.平均数的估计值等于频率分布直方 图中每个小矩形的面积乘以小矩形底边中点 的横坐标之和.
点评:1.依据频率分布直方图计算时要牢记, 纵轴为频率/组距,小矩形的面积才表示频 率. 2.可以用样本的频率估计概率.
(文)(2010·广东玉湖中学)200辆汽车经过某 一雷达地区,时速频率分布直方图如图所示, 则时速超过70km/h的汽车数量为( ) A.1辆 B.10辆 C.20辆 D.70辆
点评:从茎叶图可看出,甲车间产品重量主 要集中在98~103之间,而乙车间产品重量 分布则较分散,故不计算方差也可直观作出 判断:甲车间产品较稳定.
(文)(2010·湖南省湘潭市)下图是2009年央 视挑战主持人大赛中,7位评委为某选手打 出的分数的茎叶统计图,去掉一个最高分和 一个最低分后,所剩数据的平均数为 ( )
[例4] 要加工一圆形零件,按图纸要求,直 径为10 mm,现在由甲、乙两人加工此种零 件,在他们的产品中各抽5件测得直径如下: 甲:10.05 10.02 9.97 9.96 10.00 乙:10.00 10.01 10.02 9.97 10.00 问甲、乙两人谁生产的零件较好? 分析:通过计算两组数据的和s2,然后加以 比较,再作出判断.
5.方差、标准差 (1)设样本数据为x1,x2,„,xn样本平均数为-,则s2 x 1 - )2+(x2- - )2+„+(xn-- )2]= 1 [(x12+x22+„ = n [(x1- x x x n +xn2)-n x 2]叫做这组数据的方差,用来衡量这组数据的 波动大小,一组数据方差越大,说明这组数据波动越大.
2.频率分布折线图 (1)把频率分布直方图各个长方形上边的中 点用线段连接起来,就得到频率分布折线 图. (2)总体密度曲线 如果样本容量不断增大,分组的组距不断缩 小,则频率分布直方图实际上越来越接近于 总体的分布,它可以用一条光滑曲线y=f(x) 来描绘,这条光滑的曲线就叫总体密度曲 线.