最新-2021年高中数学人教A版必修三课件:2.2 222 用样本的数字特征估计总体的数字特征 精品

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章 统 计
2.2.2 用样本的数字特征估计总体的数 字特征
第二章 统 计
1.会求样本的众数、中位数、平均数、标准差、方差. 2. 理解用样本的数字特征来估计总体数字特征的方法. 3.会应用相关知识解决简单的统计实际问题.
1.众数、中位数、平均数的概念 (1)众数:在一组数据中,出现_次__数__最多的数据(即频率分布最 大值所对应的样本数据)叫这组数据的众数. 若有两个或两个以上的数据出现得最多,且出现的次数一样, 则这些数据都叫众数;若一组数据中每个数据出现的次数一样 多,则没有众数.
(2)样本平均值应是频率分布直方图的“重心”,即所有数据的 平均值,即每个小矩形底边的中点的横坐标乘以每个小矩形的 面积求和即可. 所 以 平 均 成 绩 为 45×(0.004×10) + 55×(0.006×10) + 65×(0.02×10) + 75×(0.03×10) + 85×(0.024×10) + 95×(0.016×10)=76.2.
1.样本数为 9 的四组数据,它们的平均数都是 5,条形图如图所示,则标准差最大的一组是( )
A.第一组
B.第二组
C.第三组
D.第四组
解析:选 D.法一:第一组中,样本数据都为 5,标准差为 0;
第二组中,样本数据为 4,4,4,5,5,5,6,6,6,标准差
为 36;第三组中,样本数据为 3,3,4,4,5,6,6,7,7, 标准差为235;第四组中,样本数据为 2,2,2,2,5,8,8, 8,8,标准差为 2 2,故标准差最大的一组是第四组.
【解】 (1)甲群市民年龄的平均数为 13+13+14+15+15+15+15+16+17+17
10 =15(岁),
中位数为 15 岁,众数为 15 岁.
平均数、中位数和众数相等,因此它们都能较好地反映甲群市
民的年龄特征.
(2)乙群市民年龄的平均数为 54+3+4+4+51+06+6+6+6+56=15(岁), 中位数为 6 岁,众数为 6 岁. 由于乙群市民大多数是儿童,所以中位数和众数能较好地反映
已知五个数据 3,5,7,4,6,则该样本的标准差为________. 解析:因为-x =51×(3+5+7+4+6)=5, 所以 s= 15×[(3-5)2+…+(6-5)2]= 2. 答案: 2
探究点 1 众数、中位数、平均数的计算及应用 某小区广场上有甲、乙两群市民正在进行晨练,两群
市民的年龄如下(单位:岁): 甲群:13,13,14,15,15,15,15,16,17,17; 乙群:54,3,4,4,5,6,6,6,6,56. (1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪 个统计量能较好地反映甲群市民的年龄特征? (2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪 个统计量能较好地反映乙群市民的年龄特征?
判断正误.(对的打“√”,错的打“×”) (1)数据 5,4,4,3,5,2 的众数为 4.( × ) (2)数据 2,3,4,5 的标准差是数据 4,6,8,10 的标准差的 一半.( √ ) (3)方差与标准差具有相同的单位.( × ) (4)如果一组数中每个数减去同一个非零常数,则这组数的平均 数改变,方差不变.( √ ) 解析:(1)中的众数应为 4 和 5;(2)正确;(3)二者单位不一致; (4)正确,平均数也应减去该常数,方差不变.
下列说法中正确的个数为( )
①数据的极差越小,样本数据分布越集中、稳定;
②数据的平均数越小,样本数据分布越集中、稳定;
③数据的标准差越小,样本数据分布越集中、稳定;
④数据的方差越小,样本数据分布越集中、稳定.
A.1
B.2
C.3
D.4
解析:选 C.由数据的极差、标准差、方差的定义可知,它们 都可以影响样本数据的分布和稳定性,而数据的平均数则与之 无关,故②不正确,①③④正确.
【解】 (1) -x 甲=61(99+100+98+100+100+103)=100, -x 乙=61(99+100+102+99+100+100)=100, s 2甲=61 [(99 - 100)2 + (100 - 100)2 + (98 - 100)2 + (100 - 100)2 + (100-100)2+(103-100)2]=73, s 2乙=61 [(99 - 100)2 + (100 - 100)2 + (102 - 100)2 + (99 - 100)2 + (100-100)2+(100-100)2]=1.
(2)中位数:将一组数据按大小依次排列,把处在最__中__间___位置 的一个数据(或中间两个数据的平均数)叫这组数据的中位数. (3)平均数:指样本数据的算术平均数.
即-x =__n1_(_x_1+__x_2_+__…__+__x_n_)____.
2.标准差与方差 (1)标准差:标准差是样本数据到平均数的一种平均距离,一般 用 s 表示,计算时通常用公式
数量/双 2 5 9 16 9 5 3 2
如果你是鞋店经理,最关心的是哪种鞋号的鞋销量最大,那么
下列统计量中对你来说最重要的是( )
A.平均数
B.众数
C.中位数
D.方差
解析:选 B.鞋店经理最关心的是哪种鞋号的鞋销量最大,即 数据的众数.由表可知,鞋号为 37 的鞋销量最大,共销售了 16 双,所以这组数据的众数为 37.
s2乙=110[2×(27-31)2+3×(16-31)2+2×(44-31)2+3×(40- 31)2] =110×1 288=128.8(cm2). 所以 s2甲<s2乙.
即甲种玉米苗长得齐.
探究点 3 统计图中的数字特征 从高三抽出 50 名学生参加数学竞赛,由成绩得到如下
的频率分布直方图.
从甲、乙两种玉米苗中各抽 10 株,分别测它 们的株高如下:(单位:cm) 甲:25 41 40 37 22 14 19 39 21 42 乙:27 16 44 27 44 16 40 40 16 40 问:(1)哪种玉米苗长得高? (2)哪种玉米苗长得齐?
解:(1) -x 甲=110(25+41+40+37+22+14+19+39+21+42) =110×300=30(cm), -x 乙=110(27+16+44+27+44+16+40+40+16+40) =110×310=31(cm). 所以-x 甲<-x 乙.
(1)频率分布直方图的数字特征 ①众数:众数一般用频率分布表中频率最高的一小组的组中值 来显示,即在样本数据的频率分布直方图中,最高矩形的底边 中点的横坐标; ②中位数:在频率分布直方图中,中位数左边和右边的直方图 的面积应该相等; ③平均数:平均数在频率分布表中等于组中值与对应频率之积 的和.
(2)频率分布折线图、条形图中的数字特征 这两种图中的数字特征都与图的横纵坐标的统计意义有关. ①可根据图中的折点(或条形图中每条的横纵坐标)得出相应 的样本数据,然后按公式定义得出特征数据; ②也可根据图形的趋势大体估计出样本的数据特征.
3.平均数、方差的性质 若 x1,x2,x3,…,xn 的平均数为-x ,方差为 s2 那么 ax1+b, ax2+b,ax3+b,…,axn+b 的平均数为-x ′=a-x +b;方差 s′2 =a2s2.
众数、中位数、平均数、方差(标准差)特征数的含义:它们都 是描述一组数据集中趋势的量. (1)众数:体现了样本数据最大集中点,当一组数据中部分数据 多次重复出现时,众数往往更能反映问题. (2)中位数:它与样本数据的排列位置有关,不受样本中某些极 端值的影响,它可能在所给的样本数据中,也可能不在其中. (3)平均数:它与样本中每一个数据都有关系,它反映数据的平 均值,但极易受极端值的影响. (4)方差(标准差):描述一组数据围绕平均数波动程度的大小, 方差(标准差)越大(小),则样本数据的离散程度越大(小).
(2017·高考全国卷Ⅰ)为评估一种农作物的种植效果,选了 n 块地作试验田.这 n 块地的亩产量(单位:kg)分别为 x1,x2,…, xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程 度的是( ) A.x1,x2,…,xn 的平均数 B.x1,x2,…,xn 的标准差 C.x1,x2,…,xn 的最大值 D.x1,x2,…,xn 的中位数 解析:选 B.标准差能反映一组数据的稳定程度.故选 B.
s= ___n1_[_(__x_1_-__-x__)__2+__(__x_2_-__-x__)__2+ ___…__+__(__x_n-__-_x_)__2_]___. 显然,标准差越大,数据的离散程度越大;标准差越小,数据 的离散程度越小. (2)方差:标准差 s 的平方 s2,即 s2=
_n1_[_(_x_1-__-_x__)2_+__(x__2-__-_x_)_2+__…__+ ___(x_n_-__-x__)_2]______________ 叫 做 这组数据的方差,同标准差一样,方差也是用来测量样本数据 的分散程度的特征数.
探究点 2 标准差、方差的计算及应用 甲、乙两机床同时加工直径为 100 cm 的零件,为检验
质量,从中抽取 6 件测量数据为: 甲:99 100 98 100 100 103 乙:99 100 102 99 100 100 (1)分别计算两组数据的平均数及方差; (2)根据计算说明哪台机床加工零件的质量更稳定.
法二:从四个图形可以直观看出第一组数据没有波动性,第二、 三组数据的波动性都比较小,而第四组数据的波动性相对较 大,利用标准差的意义可以直观得到答案.
由于一些数据丢失,试利用频率分布直方图求: (1)这 50 名学生成绩的众数与中位数; (2)这 50 名学生的平均成绩.
【解】 (1)由众数的概念可知,众数是出现次数最多的数.在 直方图中高度最高的小长方形的底边中点的横坐标即为所求, 所以众数应为 75. 由于中位数是所有数据中的中间值,故在频率分布直方图中体 现的是中位数的左右两边频数应相等,即频率也相等,从而就 是小矩形的面积和相等.因此在频率分布直方图中将所有小矩 形的面积一分为二的垂直于横轴的直线与横轴交点的横坐标 所对应的成绩即为所求.
乙群市民的年龄特征,而平均数的可靠性较差.
Hale Waihona Puke 平均数、众数、中位数的计算方法 平均数一般是根据公式来计算的;计算众数、中位数时,可先 将这组数据按从小到大或从大到小的顺序排列,再根据各自的 定义计算. [注意] 如果样本平均数大于样本中位数,说明数据中存在较 大的极端值.
某鞋店试销一种新女鞋,销售情况如下表: 鞋号 34 35 36 37 38 39 40 41
因为 0.004×10+0.006×10+0.02×10 =0.04+0.06+0.2=0.3, 所以前三个小矩形面积的和为 0.3.而第四个小矩形面积为 0.03×10=0.3,0.3+0.3>0.5, 所以中位数应位于第四个小矩形内. 设其底边为 x,高为 0.03,所以令 0.03x=0.2,得 x≈6.7, 故中位数应约为 70+6.7=76.7.
(2)由(1)知-x 甲=-x 乙,比较它们的方差,因为 s2甲>s2乙,故乙机
床加工零件的质量更稳定.
用样本的标准差、方差估计总体的方法 (1)用样本估计总体时,样本的平均数、标准差只是总体的平均 数、标准差的近似.实际应用中,当所得数据的平均数不相等 时,需先分析平均水平,再计算标准差(方差)分析稳定情况. (2)标准差、方差的取值范围是[0,+∞). (3)因为标准差与原始数据的单位相同,且平方后可能夸大了偏 差的程度,所以虽然方差与标准差在刻画样本数据的离散程度 上是一样的,但在解决实际问题时,一般多采用标准差.
即乙种玉米苗长得高.
(2)s2甲=110[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22- 30)2+ (14-30)2+ (19-30)2+ (39-30)2+ (21- 30)2+ (42- 30)2] =110(25+121+100+49+64+256+121+81+81+144)=110 ×1 042 =104.2(cm2),
相关文档
最新文档