数学同步导学练人教B全国通用版必修三课件:第二章 统计2.2.2
(人教B版)高中数学必修三同步课件:2-3

= (yi-a-bxi)2作为总离差,并使之达到 最小. 这样,回归
i=1
n
直线就是所有直线中Q取 最小值 的那一条,由于平方又叫二 乘方,所以这种使“ 离差平方和最小 ”的方法,叫做最小二 乘法.
4.回归直线方程的系数计算公式 回归直线方程 回归系数
n
^的计 系数a 算公式
公式方 程或
^ ^+b ^x y =a
第二章 统
计
§2.3
变量的相关性
课前预习目标
课堂互动探究
课前预习目标
梳理知识 夯实基础
学习目标 1.会作散点图,并对变量间的正相关或负相关关系作出直 观判断. 2.了解最小二乘法的含义,知道最小二乘法的思想,能 根据给出的线性回归方程系数公式建立线性回归方程. 3.会用线性回归方程进行预测.
课前预习 1.相关关系 变量与变量之间的关系常见的有两类:一类是确定性的
其结果不一定是个确定值.
2.在求回归直线方程的系数时,如何减少出错的可能? 提示 通过列表,逐一求系数公式中的各个数据,可以有 效地减少出错的可能.
课前热身 1.下列各量之间的关系中:①正方体的体积与棱长间的关 系;②一块农田的小麦产量与施肥量的关系;③儿童的身高与 年龄;④家庭的收入与支出;⑤某户家庭用电量与水价间的关 系. 以上是相关关系个数的是( A.2个 C.4个 ) B.3个 D.5个
解析 ①是函数关系;②③④是相关关系;⑤中用电量与 水价之间不具有相关关系.故选B.
答案 B
2.观察下列散点图,则①正相关,②负相关,③不相 关.这三句话与散点图的位置相对应的是( )
A.①②③ C.②①③
B.②③① D.①③②
解析 第一个散点图是正相关关系;第二个散点图不具有 相关关系;第三个散点图是负相关关系.故选D.
人教B版必修3高中数学第二章《统计》ppt复习课件

A.分层抽样法,系统抽样法 B.分层抽样法,简单随机抽样法 C.系统抽样法,分层抽样法 D.简单随机抽样法,分层抽样法
答案 B
规律技巧 要掌握三种抽样方法的定义及适用范围.
例3 将一个总体的100个个体编号为0,1,2,…,99,并依 次将其分为10个组,组号为0,1,2,…,9.要用系统抽样法抽取 一个容量为10的样本,如果在第0组(号码为0~9)随机抽取的 号码为2,则所抽取的10个号码为________.
x3 4 5 6 7 8 9 y 66 69 73 81 89 90 91
7
7
7
已知:x2i =280,yi2=45309,xiyi=3487,
i=1
i=1
i=1
(1)求 x , y ; (2)画出散点图; (3)求纯利y与每天销售件数x之间的回归直线方程.
解析 (1) x =3+4+5+67+7+8+9=6, y =66+69+73+871+89+90+91≈79.86. (2)散点图如下:
编后语
老师上课都有一定的思路,抓住老师的思路就能取得良好的学习效果。在上一小节中已经提及听课中要跟随老师的思路,这里再进一步论述听课时如何 抓住老师的思路。
① 根据课堂提问抓住老师的思路。老师在讲课过程中往往会提出一些问题,有的要求回答,有的则是自问自答。一般来说,老师在课堂上提出的问 题都是学习中的关键,若能抓住老师提出的问题深入思考,就可以抓住老师的思路。
专题三 用样本的数字特征估计总体的数字特征 例6 佛山市在每年的春节后,市政府都会发动公务员参 与到植树活动中去.林管部门在植树前,为保证树苗的质量, 都会在植树前对树苗进行检测.现从甲乙两种树苗中各抽测了 10株树苗的高度,量出的高度如下(单位:厘米) 甲:37,21,31,20,29,19,32,23,25,33 乙:10,30,47,27,46,14,26,10,44,46
数学同步导学练人教B全国通用版必修三课件:第二章 统计2.1.1

题型一
题型二
题型三
解:其方法和步骤如下: (1)将30辆汽车编号,号码是01,02,…,30; (2)将号码分别写在形状、大小相同的号签上; (3)将得到的号签放入一个不透明的袋子中,并搅拌均匀; (4)从袋子中依次抽取3个号签,并记录上面的号码; (5)所得号码对应的3辆汽车就是要抽取的对象.
反思一个抽样试验能否用抽签法,关键看两点:一是制签是否方便; 二是号签是否容易被搅匀.一般地,当样本容量和总体容量较小时 可用抽签法.
知识梳理
【做一做2-2】 抽签法中确保样本代表性的关键是 ( )
A.制签
B.搅拌均匀
C.逐一抽取 D.抽取不放回
答案:B
重难聚焦
1.简单随机抽样的特点 剖析:(1)它要求被抽取样本的总体的个数有限,这样便于通过随 机抽取的样本对总体进行分析. (2)它是从总体中逐个地进行抽取,这样便于在抽样实践中进行操 作. (3)它是一种不放回抽样.由于抽样实践中多采用不放回抽样,使 其具有较广泛的实用性,而且由于所抽取的样本中没有被重复抽取 的个体,便于进行有关的分析和计算. (4)它每一次抽取时总体中的各个个体有相同的可能性被抽到,从 而保证了这种抽样方法的公平性.
重难聚焦
2.使用随机数表法的注意事项 剖析:(1)第一个数的选择必须是任意的,这样才能保证抽样的随 机性,同时我们读数的顺序并不固定,你可以向上、向下、向左、 向右等等. (2)在对100个个体进行编号时,一般是将起始编号编为00,它的好 处在于可使100个个体都用两位数码表示,这样确定的起始号便于 我们使用随机数表. (3)要注意将数字大于个体编号和重复的数字跳过去,直到取出和 样本容量相等的个体数为止.
2.1 随机抽样
-1-
(人教B版)高中数学必修三全册同步ppt课件:2-2-2

s表示样本标准差.
思考探究 1.在某项体育比赛中,七位裁判为一选手打出的分数如 下:90 89 90 95 93 94 93计算平均分时,一般要去掉
一个最高分和一个最低分,其目的是什么? 提示 消去极端值的影响.
2.在实际决策中,是否一定采用方差小的一种方案? 提示 当平均数差异较大时,不必考虑方差;在体育比赛 中,若两人平均水平都比对手稍差,则应选派方差大的,以期 超水平发挥.
2
85)2]=1.6.
答案 C
4.甲、乙、丙三名射箭运动员在某次测试中各射箭20 次,三人的测试成绩如下表s1,s2,s3,分别表示甲、乙、丙三 名运动员这次测试成绩的标准差,则有( 甲的成绩 环数 频数 7 5 8 5 9 5 10 5 )
乙的成绩 环数 频数 7 6 8 4 9 4 10 6
答案 B
3.如图是2012年元旦晚会举办的挑战主持人大赛上,七位 评委为某选手打出的分数的茎叶统计图,去掉一个最高分和一 个最低分后,所剩数据的平均数和方差分别为( 7 9 4 4 6 4 8 7 3 9 A.84,4.84 C.85,1.6 B.84,1.6 D.85,4 )
解析 该选手去掉一个最高分93,一个最低分79,得分为 84、84、86、84、87,平均数为 84+84+86+84+87 - x= =85. 5 1 s = 5 [(84-85)2+(84-85)2+(86-85)2+(84-85)2+(87-
17 2 1 17 2 2 s 3 =(7- ) × +(8- ) × 2 5 2 17 2 1 21 2 ) ×5=20.
2 2 ∴s2 > s 2 1>s3,∴s2>s1>s3.
3 17 2 3 10 +(9- 2 ) × 10 +(10-
(人教B版)高中数学必修三全册同步ppt课件:2-1-2

3 1 解析 每个学生被抽到的可能性为54=18.
答案 B
3.为了了解某校2012年1252名高一新生的视力情况,决 定采用系统抽样的方式抽取一个容量为50的样本,那么抽样间 隔和随机剔除的个体数目分别为( A.25,2 C.5,52 B.50,52 D.25,52 )
解析 1252÷ 50=25…2,故抽样间隔为25,需随机剔除的 个体数目为2.
N N 是整数时,取k= n ;当 n 不是整数时,从总体中剔除一些个 体,使剩下的总体中个体的个数N′能被n整除,这时k= N′ n ,并将剩下的总体重新编号;
S3 l(l≤k); S4
在第一段用简单随机抽样确定第一个个体的编号
按照一定的规则抽取样本,通常是将l加上间隔k得到
第2个个体的编号l+k,再加k得到第3个个体的编号l+2k,依 次进行下去,直到获取整个样本.
课堂互动探究
剖析归纳 触类旁通
典例剖析
例1
下列问题中,最适合用系统抽样抽取样本的是(
)
A.从10名学生中随机抽2名学生参加义务劳动 B.从全校3000名学生中随机抽100名学生参加义务劳动 C.某市30000名学生中,小学生有14000人,初中生有 10000人,高中生有6000人,抽取300名生了解该市学生的近视 情况 D.从某班周二值日的6人中随机抽取1人擦黑板
剖析 根据系统抽样的特征判断. 解析 A中个体无差异,但个数较少,适合用简单随机抽 样;同样D也适合用简单随机抽样;C中个体有差异,不适合 用系统抽样;B中,总体中有3000个个体,个数较多且无差 异,适合用系统抽样.
答案
B
规律技巧
系统抽样适用于个体数较多的总体.判断一种
抽样是否为系统抽样,首先看在抽样前是否知道总体是由什么 构成的,抽样的方法能否保证将总体分成几个均衡的部分,并 保证每个个体等可能入样.
2017-2018学年高中数学人教B版必修3 同步导学案:第2章 2-2 用样本估计总体 含答案 精品

3.茎叶图
1).茎叶图的概念:
当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.
为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.
分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息。表格则是通过改变数据的构成形式,为我们提供解释数据的新方式.
课题
2.2.1用样本的频率分布估计总体分布
总课时
2
教学要求
1.通过实例体会分布的意义和作用;
2.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图;
3.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.
教学重点难点
(3)由样本频率分布表可知身高小于134cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm的人数占总人数的19%.
例2:为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.
2018-2019数学新学案同步必修三人教B版全国通用版讲义:第二章 统计章末复习 Word版含答案

章末复习学习目标 1.会根据不同的特点选择适当的抽样方法获得样本数据.2.能利用图、表对样本数据进行整理分析,用样本和样本的数字特征估计总体.3.能利用散点图对两个变量是否相关进行初步判断,能用回归直线方程进行预测.1.抽样方法(1)用随机数表法抽样时,对个体所编号码位数要相同,当问题所给位数不同时,以位数较多的为准,在位数较少的数前面添“0”,凑齐位数.(2)用系统抽样法时,如果总体容量N 能被样本容量n 整除,抽样间隔为k =Nn ;如果总体容量N 不能被样本容量n 整除,先用简单随机抽样剔除多余个体,抽样间隔为k =Kn (其中K =N-多余个体数). (3)三种抽样方法的异同点类别 共同点各自特点 相互联系适用范围 简单随机抽样抽样过程中每个个体被抽到的可能性相同从总体中逐个抽取总体中的个体数较少 系统抽样将总体平均分成几部分,按事先确定的规则分别在各部分中抽取在起始部分抽样时,采用简单随机抽样总体中的个体数较多 分层抽样将总体分成几层,按各层个体数之比抽取 在各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成2.用样本估计总体 (1)用样本估计总体用样本频率分布估计总体频率分布时,通常要对给定的一组数据作频率分布表与频率分布直方图.当样本只有两组数据且样本容量比较小时,用茎叶图刻画数据比较方便. (2)样本的数字特征样本的数字特征可分为两大类:一类是反映样本数据集中趋势的,包括众数、中位数和平均数;另一类是反映样本波动大小的,包括方差及标准差.3.变量间的相关关系(1)两个变量之间的相关关系的研究,通常先作变量的散点图,根据散点图判断这两个变量最接近于哪种确定性关系(函数关系). (2)求回归直线方程的步骤:①先把数据制成表,从表中计算出x ,y,∑ni =1x 2i ,∑n i =1x i y i ; ②计算回归系数a ^,b ^.公式为⎩⎨⎧b ^=∑ni =1x i y i-n x y ∑n i =1x 2i-n x 2,a ^=y -b ^x .③写出回归直线方程y ^=b ^x +a ^.类型一 用样本的频率分布估计总体例1 某制造商生产一批直径为40 mm 的乒乓球,现随机抽样检查20个,测得每个球的直径(单位:mm ,保留两位小数)如下:40.03 40.00 39.98 40.00 39.99 40.00 39.98 40.01 39.98 39.99 40.00 39.99 39.95 40.01 40.02 39.98 40.00 39.99 40.00 39.96 (1)完成下面的频率分布表,并画出频率分布直方图;分组 频数 频率 [39.95,39.97) [39.97,39.99) [39.99,40.01) [40.01,40.03]合计(2)假定乒乓球的直径误差不超过0.02 mm 为合格品.若这批乒乓球的总数为10 000,试根据抽样检查结果估计这批产品的合格个数. 解 (1)频率分布表如下:分组 频数 频率 [39.95,39.97) 2 0.10 [39.97,39.99)40.20[39.99,40.01) 10 0.50 [40.01,40.03]4 0.20 合计201.00频率分布直方图如图:(2)∵抽样的20个产品中在[39.98,40.02]范围内的有17个,∴合格品频率为1720×100%=85%.∴10 000×85%=8 500.故根据抽样检查结果,可以估计这批产品的合格个数为8 500. 反思与感悟 总体分布中相应的统计图表主要包括:频率分布表、频率分布直方图、频率分布折线图等.通过这些统计图表给出的相应统计信息可以估计总体.跟踪训练1 为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道后5组频数和为62,视力在4.6到4.8之间的学生数为a ,最大频率为0.32,则a 的值为( )A .64B .54C .48D .27 答案 B解析 [4.7,4.8)之间频率为0.32,[4.6,4.7)之间频率为1-0.62-0.05-0.11=1-0.78=0.22, ∴a =(0.22+0.32)×100=54.类型二 用样本的数字特征估计总体的数字特征例2 某市共有50万户居民,城市调查队按千分之一的比例进行入户调查,抽样调查的结果如表:家庭人均月[200,500) [500,800)[800, [1 100, [1 400,1 700] 合计求:(1)工作人员家庭人均月收入的估计值x1及方差的估计值s21;(2)管理人员家庭人均月收入的估计值x2及方差的估计值s22;(3)总体人均月收入的估计值x及总体方差的估计值s2.解(1)x1=1400×(20×350+60×650+200×950+80×1 250+40×1 550)=995,s21=1400×[20×(350-995)2+60×(650-995)2+200×(950-995)2+80×(1 250-995)2+40×(1550-995)2]=83 475.(2)x2=1100×(5×350+10×650+50×950+20×1 250+15×1 550)=1 040,s22=1100×[5×(350-1 040)2+10×(650-1 040)2+50×(950-1 040)2+20×(1 250-1 040)2+15×(1 550-1 040)2]=90 900.(3)x=1500×(25×350+70×650+250×950+100×1 250+55×1 550)=1 004,s2=1500×[25×(350-1 004)2+70×(650-1 004)2+250×(950-1 004)2+100×(1 250-1 004)2+55×(1 550-1 004)2]=85 284.反思与感悟样本的数字特征分为两大类:一类是反映样本数据集中趋势的特征数,例如平均数;另一类是反映样本数据波动大小的特征数,例如方差和标准差.通常我们用样本的平均数和方差(标准差)来近似代替总体的平均数和方差(标准差),从而实现对总体的估计.跟踪训练2对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测数据如下:问:甲、乙谁的平均成绩好?谁的各门功课发展较平衡?解甲的平均成绩为x甲=74,乙的平均成绩为x乙=73.所以甲的平均成绩好.甲的方差是s2甲=15[(-14)2+62+(-4)2+162+(-4)2]=104,乙的方差是s2乙=15×[72+(-13)2+(-3)2+72+22]=56.因为s 2甲>s 2乙,所以乙的各门功课发展较平衡.类型三 用回归直线方程对总体进行估计例3 某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下:零件的个数x (个) 2 3 4 5 加工的时间y (小时)2.5344.5(注:b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,a ^=y -b ^x )(1)在给定的坐标系中画出表中数据的散点图;(2)求出y 关于x 的回归直线方程y ^=b ^x +a ^,并在坐标系中画出回归直线; (3)试预测加工10个零件需要多少小时? 解 (1)散点图如图.(2)由表中数据得:∑i =14x i y i =52.5,x =3.5,y =3.5,∑i =14x 2i =54,∴b ^=0.7,∴a ^=1.05,∴y ^=0.7x +1.05,回归直线如图所示.(3)将x =10代入回归直线方程, 得y ^=0.7×10+1.05=8.05,故预测加工10个零件约需要8.05小时.反思与感悟 对两个变量进行研究,通常是先作出两个变量之间的散点图,根据散点图直观判断两个变量是否具有线性相关关系,如果具有,就可以应用最小二乘法求回归直线方程.由于样本可以反映总体,所以可以利用所求的回归直线方程,对这两个变量所确定的总体进行估计,即根据一个变量的取值,预测另一个变量的取值.跟踪训练3 理论预测某城市2020到2024年人口总数与年份的关系如下表所示:年份202x (年) 0 1 2 3 4 人口数y (十万)5781119(1)请画出上表数据的散点图; (2)指出x 与y 是否线性相关;(3)若x 与y 线性相关,请根据上表提供的数据,用最小二乘法求出y 关于x 的回归直线方程y ^=b ^x +a ^;(4)据此估计2025年该城市人口总数.(参数数据:0×5+1×7+2×8+3×11+4×19=132,02+12+22+32+42=30) 解 (1)数据的散点图如图:(2)由散点图可知,样本点基本上分布在一条直线附近,故x 与y 呈线性相关. (3)由表知x =15×(0+1+2+3+4)=2,y =15×(5+7+8+11+19)=10.∴b ^=∑i =15x i y i -5x y∑i =15x 2i -5x2=3.2,a ^=y -b ^x =3.6,∴回归直线方程为y ^=3.2x +3.6. (4)当x =5时,y ^=19.6(十万)=196万. 故2025年该城市人口总数约为196万.1.10个小球分别编有号码1,2,3,4,其中1号球4个,2号球2个,3号球3个,4号球1个,则数0.4是指1号球占总体分布的( ) A .频数 B .频率 C .累积频率 D .以上都不对答案 B2.现有10个数,其平均数是4,且这10个数的平方和是200,那么这组数的标准差是( ) A .1 B .2 C .3 D .4答案 B解析 设这10个数为a 1,a 2,…,a 10,则有a 21+a 22+…+a 210=200,且a 1+a 2+…+a 10=40,所以(a 1-4)2+(a 2-4)2+…+(a 10-4)210=a 21+a 22+…+a 210-8(a 1+a 2+…+a 10)+16010=200-8×40+16010=4,∴标准差为4=2.3.某班50名学生的一次数学质量测验成绩的频率分布直方图如图所示,则成绩不低于70分的学生人数是____________________________________________________.答案 35解析 低于70分的频率为(0.012+0.018)×10=0.3,所以不低于70分的频率为0.7,故不低于70分的人数为 50×0.7=35.4.某农田施肥量x (单位:kg)与小麦产量y (单位:kg)之间的回归直线方程是y ^=4x +250,则当施肥量为50 kg 时,可以预测小麦的产量为________kg. 答案 450解析 直接将x =50代入回归直线方程中,可得y ^=4×50+250=450.5.从某学校的男生中随机抽取50名测量身高,被测学生身高全部介于155 cm 和195 cm 之间,将测量结果按如下方式分成八组;第一组[155,160),第二组[160,165),…,第八组[190,195].如图是按上述分组方法得到的频率分布直方图的一部分,已知第一组与第八组的人数相同,第六组的人数为4.(1)求第七组的频率;(2)估计该校的800名男生的身高的中位数以及身高在180 cm 以上(含180 cm)的人数. 解 (1)第六组的频率为450=0.08,所以第七组的频率为1-0.08-5×(0.008×2+0.016+0.04×2+0.06)=0.06.(2)身高在第一组[155,160)的频率为0.008×5=0.04, 身高在第二组[160,165)的频率为0.016×5=0.08,身高在第三组[165,170)的频率为0.04×5=0.2,身高在第四组[170,175)的频率为0.04×5=0.2,由于0.04+0.08+0.2=0.32<0.5,0.04+0.08+0.2+0.2=0.52>0.5,估计这所学校的800名男生的身高的中位数为m,则170<m<175,由0.04+0.08+0.2+(m-170)×0.04=0.5,得m=174.5,所以可估计这所学校的800名男生的身高的中位数为174.5,由直方图得后三组频率之和为0.06+0.08+0.008×5=0.18,所以身高在180 cm以上(含180 cm)的人数为0.18×800=144.1.用频率分布直方图解决相关问题时,应正确理解图中各个量的意义,识图掌握信息是解决该类问题的关键.频率分布直方图有以下几个特点:(1)纵轴表示频率/组距;(2)频率分布直方图中各小长方形高的比就是相应各组的频率之比;(3)直方图中各小长方形的面积是相应各组的频率,所有的小长方形的面积之和等于1,即频率之和为1.2.平均数、中位数、众数与方差、标准差都是重要的数字特征,利用它们可对总体进行一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数可描述总体的集中趋势,方差和标准差可描述波动大小.一、选择题1.在某次商品促销活动中,某人可得到4件不同的奖品,这些奖品要从40件不同的奖品中随机抽取决定.用系统抽样的方法确定这个人所得到的4件奖品的编号,有可能的是() A.3,9,15,11 B.3,12,21,40C.8,20,32,40 D.2,12,22,32答案D解析由系统抽样的方法可知,这个人所得到的4件奖品的编号的间隔相等,且平均分布在1~10,11~20,21~30,31~40中,故A ,B ,C 均不正确,D 正确.2.某中学有高中生3 500人,初中生1 500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n 的样本,已知从高中生中抽取70人,则n 等于( ) A .100 B .150 C .200 D .250 答案 A解析 ∵n 3 500+1 500=703 500,∴n =100.3.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为m e ,众数为m o ,平均值为x ,则( )A .m e =m o =xB .m e =m o <xC .m e <m o <xD .m o <m e <x答案 D解析 30个数中第15个数是5,第16个数是6,所以中位数m e =5+62=5.5,众数m o =5,平均值x =3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×230=17930,∴m o <m e <x .4.为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( )A .50B .40C .25D .20 答案 C解析 间隔=1 00040=25.5.某工厂生产甲、乙、丙三种型号的产品,产品数量之比为3∶5∶7,现用分层抽样的方法抽出容量为n 的样本,其中甲种产品有18件,则样本容量n 等于( ) A .54 B .90 C .45 D .126 答案 B解析 分层抽样的核心是等比例抽取.所以18n =315,解得n =90.6.有一容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间[10,12]内的频数为( )A .18B .36C .54D .72 答案 B解析 ∵样本数据落在[10,12]内的频率为 1-2×(0.02+0.05+0.15+0.19) =1-0.82 =0.18,∴频数为200×0.18=36.7.一个样本的容量为72,分成5组,已知第一、五组的频数都为8,第二、四组的频率都为29,则第三组的频数为( ) A .16 B .24 C .32 D .48 答案 B解析 因为频率=频数样本容量,所以第二、四组的频数都为72×29=16.所以第三组的频数为72-2×8-2×16=24.8.某公司10位员工的月工资(单位:元)为x 1,x 2,…,x 10,其平均数和方差分别为x 和s 2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( ) A.x ,s 2+1002 B.x +100,s 2+1002 C.x ,s 2 D.x +100,s 2答案 D解析 设工资增加后员工下月工资的平均数和方差分别为y ,s 2y ,据已知易得 y =x 1+x 2+…+x 10+10×10010=x +100,又s 2y =[x 1+100-(x +100)]2+…+[x 10+100-(x +100)]210=s 2,故选D. 二、填空题9.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):甲 10 8 9 9 9 乙1010799如果甲、乙两人中只有1人入选,那么入选的最佳人选应是________. 答案 甲 解析x甲=9,x 乙=9,s 2甲=15×2=25, s 2乙=15×6=65,甲的方差较小,成绩较稳定. 10.某校高中年级开设了丰富多彩的课程,甲、乙两班各随机抽取了5名学生的学分,用茎叶图表示(如图).s 1,s 2分别表示甲、乙两班抽取的5名学生学分的标准差,则s 1______s 2.(填“>”“<”或“=”)答案 <解析 标准差反映了数据的离散程度.显然甲的学分更集中.也可用公式计算得出. 11.甲、乙两人在10天中每天加工零件的个数用茎叶图表示如图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天甲、乙两人日加工零件的平均数分别为________和________.答案 24 23 解析 x 甲=110(10×2+20×5+30×3+17+6+7)=24, x乙=110(10×3+20×4+30×3+17+11+2)=23.12.某电子商务公司对10 000名网络购物者在2016年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a=________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.答案(1)3(2)6 000解析由频率分布直方图及频率和等于1可得0.2×0.1+0.8×0.1+1.5×0.1+2×0.1+2.5×0.1+a×0.1=1,解得a=3.于是消费金额在区间[0.5,0.9]内的频率为0.2×0.1+0.8×0.1+2×0.1+3×0.1=0.6,所以消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000.三、解答题13.下面是60名男生每分钟脉搏跳动次数的频率分布表.分组频数频率频率/组距[51.5,57.5)40.0670.011[57.5,63.5)60.10.017[63.5,69.5)110.1830.031[69.5,75.5)200.3340.056[75.5,81.5)110.1830.031[81.5,87.5)50.0830.014[87.5,93.5]30.050.008(1)作出频率分布直方图;(2)根据直方图的各组中值估计总体平均数;(3)已知标准差s≈8.784,估计每分钟脉搏跳动次数的范围.解(1)频率分布直方图如图.(2)由各组中值估计总体平均数为(54.5×4+60.5×6+66.5×11+72.5×20+78.5×11+84.5×5+90.5×3)÷60=72. (3)∵s ≈8.784,∴每分钟脉搏跳动次数的范围大致为[x -s ,x +s ],即[63.216,80.784],取整数为[63,81]. 14.某校从参加高一年级期末考试的学生中抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后画出如下频率分布直方图.观察图形的信息,回答下列问题:(1)估计这次考试的众数m 与中位数n (结果保留一位小数); (2)估计这次考试的及格率(60分及以上为及格)和平均分. 解 (1)众数是最高小矩形底边中点的横坐标, ∴众数为m =75.前三个小矩形面积为0.01×10+0.015×10+0.015×10=0.4. ∵中位数平分直方图的面积, ∴n =70+0.5-0.40.3×10≈73.3.(2)依题意60分及以上的分数所在的第三、四、五、六组的频率和为(0.015+0.03+0.025+0.005)×10=0.75,∴抽样学生成绩的合格率是75%. 利用组中值估算抽样学生的平均分为45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71. 估计这次考试的平均分是71分.。
高中数学必修三(人教B版)同步教学课件:第二章+统计(6份)221

解析 (1)本组数据中的大值为180,最小值为151,极 差为29.
极差 (2)样本数据为100个,极差为29,取组距为3,则 组距 = 239=923,∴将本组数据分为10组. (3)第一组起点定为150.5,组距为3,这样分出的10个组 为:
第1组:150.5~153.5 第2组:153.5~156.5 第3组:156.5~159.5 第4组:159.5~162.5 第5组:162.5~165.5 第6组:165.5~168.5 第7组:168.5~171.5 第8组:171.5~174.5 第9组:174.5~177.5 第10组:177.5~180.5 (4)列出频率分布表
(2)总体密度曲线的实际意义在于:总体密度曲线与x轴、 直线x=a,x=b围成的面积等于总体在(a,b)内取值时的百分 比.
4.茎叶图的特点 (1)茎叶图表示数据有两个突出的优点:一是从统计图上 没有原始信息的损失,所有的数据都可以从茎叶图中得到;二 是茎叶图可以在比赛时随时记录,方便记录与表示. (2)它只便于表示两位数的数据,而且茎叶图只方便记录 两组数据,两组以上的数据虽然能够记录,但没有表示两组数 据那么直观、清晰.
[40,50),2;[50,60),3;[60,70),10;[70,80),15; [80,90)12;[90,100),8.
(1)列出样本的频率分布表(含累积频率); (2)画出频率分布直方图; (3)估计成绩在[60,90)分的学生比例.
课前热身
1.一个容量为32的样本,已知某组样本的频率为0.25,则
该组样本的频数为( )
A.4
B.8
C.10
D.12
解析 该组样本的频数为32×0.25=8.故选B. 答案 B
2.为了了解高三学生的数学成绩,抽取了某班60名学 生,将所得数据整理后,画出其频率分布直方图(如图所示), 已知从左到右各长方形高的比为2:3:5:6:3:1,则该班学生数学 成绩在(80,100)之间的学生人数是( )
2019-2020数学同步导学练人教B全国通用版必修三课件:第二章 统计2.1.3-2.1.4

个体数之比进行抽 机抽样或系 几部分组
取
统抽样
成
重难聚焦
2.分层抽样中各层的入样要求 剖析:当已知总体由差异明显的几部分组成时,应将总体分成互 不交叉的几部分,然后按照各部分所占的比例,从各部分中独立抽取 一定数量的个体,再将各部分抽出的个体合在一起作为样本,这就是 分层抽样.其中所分成的每一部分称为层. 由于层与层之间有明显的区别,而层内个体间差异很小,为了使样本 更能充分地反映总体的情况,抽取样本时,必须照顾到各个层中的个 体.因此,每层中所抽取的个体数应按各层个体数在总体中所占的比 例抽取,也就是各层抽取的比例都等于样本容量在总体中的比例,即 样 总本 体容 容量 量.
知识梳理
归纳总结使用分层抽样抽取样本时,需注意以下几个问题:
(1)必须先判断所考察的总体中的个体是否具有明显的差异,若
是,则用分层抽样,若不是,则应用简单随机抽样或系统抽样.
(2)为获取各层入样数目,需先正确计算出抽样比
k=
样本容量 总体容量
.
若k
与
某层个体数的积不是整数时,可四舍五入取整.
(3)分层抽样仍属于等可能抽样.
180户,低收入的家庭45户,为了了解生活购买力的某项指标,要从中 抽取一个容量为50的样本
C.从1 000名工人中,抽取100人调查上班途中所用的时间 D.从生产流水线上,抽取样本检查产品质量 解析:生活购买力的某项指标与家庭的收入情况密切相关,因此 可认为总体中这300户家庭生活购买力的某项指标存在明显差异, 故适合采用分层抽样的方法抽取样本,故选B. 答案:B
A.9
B.10
C.12
D.13
题型一
题型二
题型三
题型四
2019-2020数学同步导学练人教B全国通用版必修三课件:第二章 统计2.3 .pdf

一组观察值都能得到具有代表意义的回归直线方程.
A.①②③
B.①③④
C.②③④
D.①②④
答案:A
2已知x,y之间的一组数据如下:
x
0
1
2
3
y
1
3
5
7
^^ ^
则 y 与 x 的线性回归直线������ = b������ + ������必过点( )
A.(2,2) B.(1.5,0)
C.(1,2) D.(1.5,4)
分类 函数关系 特征 两变量关系确定
相关关系 两变量关系带有随机性
【做一做 1】 下列关系不属于相关关系的是( ) A.产品的样本数量与生产数量 B.正方形的周长与面积 C.家庭的支出与收入 D.人的年龄与体重 答案:B
知识梳理
2.散点图与线性相关 (1)散点图:将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐 标系中得到的图形. (2)正相关与负相关:
典例透析
题型一
题型二
题型三
题型四
相关关系的判断 【例1】 下列两个变量之间的关系为相关关系的是( )
A.角度和它的正弦值 B.圆的半径和圆的面积 C.正n边形的边数和内角之和 D.一定时间段内的人的年龄和身高 解析:角与它的正弦值是函数关系;圆的半径r与面积S=πr2是函数 关系;正n边形的边数与内角之和h(n)=(n-2)·180°是函数关系;而一 定时间段内的人的年龄和身高则具有相关关系. 答案:D 反思此问题为非数据型两个变量的相关性判断,要根据两个变量 之间是否具有确定性关系或相关关系来判断.
的取值及意义, 事实上, 因为������
=
������∑=1������������������������-������������ ������ ������=∑������1������2������ -������������2
2019-2020数学同步导学练人教B全国通用版必修三课件:第二章 统计本章整合2 .pdf

[151,154) 9 0.15
[154,157) 9 0.15
[157,160) 18 0.30
[160,163) 7 0.12
[163,166) 5 0.08
[166,169] 3 0.05 合计 60 1.00
综合应用
专题1 专题2 专题3 专题4 专题5
(2)中位数在[157,160) cm 之间,众数在[157,160) cm 之间,在众数范围 内的人数有 60×0.3=18;
这里运用的抽样方法是
.
提示:这是考查抽样方法的常见题型,即判断给出的问题采用何
种抽样方法,应抓住每种抽样方法的特点进行判断.
答案:系统抽样
专题1 专题2 专题3 专题4 专题5
综合应用
应用 2 某班共有 60 名学生,领到 10 张电影票,请你采用适当方 式把这 10 张电影票分下去.
提示:因人数较少,可采用简单随机抽样,用抽签法和随机数表法 均可.
中位数:最中间的一个数或最中间两个数的平均数
众数:出现次数最多的数
方差:������2
=
1 ������
[(������1-������)2
+
(������2-������)2
+
…
+
(������������ -������)2]
标准差:������ = ������2
变量间的关系 函数关系:确定性 相关关系:随机性
专题1 专题2 专题3 专题4 专题5
综合应用
(1)从平均数和中位数看,谁的成绩好些? (2)从折线图中两人成绩的走势看,谁更有潜力? (3)从方差上看,你能得出什么结论? 解:(1)甲的得分数据为 10,13,12,14,16,所以甲的平均数为 13 分, 中位数为 13 分;乙的得分数据为 13,14,12,12,14,所以乙的平均数为 13 分,中位数为 13 分. 因此,单纯从平均数和中位数无法确定谁的成绩更好一些. (2)从折线图中两人成绩的走势看,甲的潜力更大一些. (3)甲得分的方差为 4,乙得分的方差为 0.8,结论:乙的成绩较稳 定,甲的成绩在不断提高,而乙的成绩则无明显提高.
2018-2019数学同步导学练课件试题人教B版必修3全国通用版第2章

修
③
·
人
教
B
版
感谢大家观看
最新学习可编辑资料 Latest learning materials
统抽样、分层抽样的概念以及它们的联系和区别.同时,本章内容与初中的“统
计初步”的联系非常密切,在学习过程中,要注意沟通前后知识的联系,使统
计这部分知识成为一个整体,统计是与数据打交道的,处理问题计算量大且比
较复杂,对于这一点在线性回归中表现得更加突出.同学们在本章的学习中应重
数
学 必
视用科学计算器处理统计数据的技能训练.
新课标导学
数学
必修③ ·人教B版
第二章
统计
第二章 统 计
ห้องสมุดไป่ตู้数 学 必 修 ③ · 人 教 B 版
第二章 统 计
掌握基本的概念和计算方法.第二章和第三章分别是统计和概率.统计是研究
随机现象的数学方法.在“课标”中占有较大比重,是“课标”进行教材改革的
重要组成部分.在这章的学习中,我们应掌握基本的概念,如简单随机抽样、系
数学新学案同步必修三人教B讲义:第二章 统计2.2.2 Word含答案

2.2.2 用样本的数字特征估计总体的数字特征学习目标 1.能合理地选取样本,并从中提取基本的数字特征.2.了解众数、中位数、平均数的概念,会计算方差和标准差.3.进一步体会用样本估计总体的思想,会用样本的数字特征估计总体的数字特征.知识点一 众数、中位数、平均数思考1 平均数、中位数、众数中,哪个量与样本的每一个数据有关,它有何缺点? 答案 平均数与样本的每一个数据有关,它可以反映出更多的关于样本数据总体的信息,但它的缺点是平均数受数据中极端值的影响较大.思考2 在电视大奖赛中,计算评委打分的平均值时,为什么要去掉一个最高分和一个最低分? 答案 为了避免平均值受数据中个别极端值的影响,增大它在估计总体时的可靠性,故计算评委打分时要去掉一个最高分和一个最低分. 梳理 众数、中位数、平均数定义 (1)众数:一组数据中出现次数最多的数.(2)中位数:把一组数据按从小到大(或从大到小)的顺序排列,处在中间位置的数(或中间两个数的平均数)叫做这组数据的中位数.(3)平均数:如果n 个数x 1,x 2,…,x n ,那么x =1n (x 1+x 2+…+x n )叫做这n 个数的平均数.知识点二 方差、标准差思考1 当样本数据的标准差为0时,该组数据有何特点? 答案 当样本数据的标准差为0时,该组数据都相等. 思考2 标准差、方差的意义是什么?答案 标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小. 梳理 标准差、方差的概念及计算公式(1)标准差是样本数据到平均数的一种平均距离,一般用s 表示.s = 1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2](x n 是样本数据,n 是样本容量,x 是样本平均数). (2)标准差的平方s 2叫做方差.s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2](x n 是样本数据,n 是样本容量,x 是样本平均数).(3)标准差(或方差)越小,数据越稳定在平均数附近.s =0时,每一组样本数据均为x . 知识拓展:平均数、方差公式的推广:1.若数据x 1,x 2,…,x n 的平均数为x ,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x +a .2.设数据x 1,x 2,…,x n 的平均数为x ,方差为s 2,则 a .s 2=1n[(x 21+x 22+…+x 2n )-n x 2]; b .数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2; c .数据ax 1,ax 2,…,ax n 的方差为a 2s 2.知识点三 用样本的基本数字特征估计总体的基本数字特征 1.样本的基本数字特征包括众数、中位数、平均数、标准差.2.平均数向我们提供了样本数据的重要信息,但是平均数有时也会使我们作出对总体的片面判断,因为这个平均数掩盖了一些极端的情况,而这些极端情况显然是不能忽视的.因此,还需要用标准差来反映数据的分散程度.3.现实中的总体所包含的个体数往往是很多的,虽然总体的平均数与标准差客观存在,但是我们无从知道.所以通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.虽然样本具有随机性,不同的样本测得的数据不一样,与总体的数字特征也可能不同,但只要样本的代表性好,这样做就是合理的,也是可以接受的.1.中位数是一组数据中间的数.( × ) 2.众数是一组数据中出现次数最多的数.( √ )3.一组数据的标准差越小,数据越稳定,且稳定在平均数附近.( √ )类型一 众数、中位数和平均数的理解与应用 命题角度1 众数、中位数、平均数的计算例1 某公司的33名职工的月工资(单位:元)如下表:(1)求该公司职工月工资的平均数;(2)若董事长、副董事长的工资分别从5 500元、5 000元提升到30 000元、20 000元,那么公司职工月工资新的平均数又是什么? 解 (1)公司职工月工资的平均数为x =5 500+5 000+3 500×2+3 000+2 500×5+2 000×3+1 500×2033=69 00033≈2 091(元).(2)若董事长、副董事长的工资提升后,职工月工资的平均数为x =30 000+20 000+3 500×2+3 000+2 500×5+2 000×3+1 500×2033=108 50033≈3 288(元).反思与感悟 (1)众数、中位数与平均数都是描述一组数据集中趋势的量,平均数是最重要的量. (2)众数考查各个数据出现的频率,大小只与这组数据中的部分数据有关,当一组数据中部分数据多次重复出现时,众数往往更能反映问题.(3)中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响,中位数可能在所给的数据中,也可能不在所给的数据中.(4)平均数的大小与一组数据里每个数据均有关系,任何一个数据的变动都会引起平均数的变动.(5)因为平均数与每一个样本数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数不具有的性质,也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于全体样本数据的信息.但平均数受数据的极端值的影响较大,使平均数在估计总体时可靠性降低.跟踪训练1对于数据3,3,2,3,6,3,10,3,6,3,2,有下列结论:①这组数据的众数是3;②这组数据的众数与中位数的数值不相等;③这组数据的中位数与平均数的数值相等;④这组数据的平均数与众数的数值相等.其中正确结论的个数为()A.1 B.2 C.3 D.4答案 A解析在这11个数中,数3出现了6次,频率最高,故众数是3;将这11个数按从小到大的顺序排列得2,2,3,3,3,3,3,3,6,6,10,中间数据是3,故中位数是3;而平均数x=2×2+3×6+6×2+1011=4.故只有①正确.命题角度2用频率分布直方图估算众数、中位数、平均数例2已知一组数据:125121123125127129125128130129 126124125127126122124125126128(1)填写下面的频率分布表:(2)作出频率分布直方图;(3)根据频率分布直方图或频率分布表求这组数据的众数、中位数和平均数.解(1)频率分布表如下:(2)频率分布直方图如下:(3)在[125,127)中的数据最多,取这个区间的中点值作为众数的近似值,得众数126,事实上,众数的精确值为125.图中虚线对应的数据是125+2×58=126.25,事实上中位数为125.5.使用“组中值”求平均数:x =122×0.1+124×0.15+126×0.4+128×0.2+130×0.15=126.3,平均数的精确值为x =125.75.反思与感悟 (1)利用频率分布直方图估计数字特征: ①众数是最高的矩形的底边中点的横坐标; ②中位数左右两侧直方图的面积相等;③平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.(2)利用直方图求众数、中位数、平均数均为估计值,与实际数据可能不一致.跟踪训练2 一批乒乓球,随机抽取100个进行检查,球的直径频率分布直方图如图.试估计这个样本的众数、中位数和平均数.解 众数=39.99+40.012=40;四个矩形的面积分别是0.02×5=0.1, 0.02×10=0.2, 0.02×25=0.5, 0.02×10=0.2.中位数为39.99+0.225=39.998;平均数为39.96×0.1+39.98×0.2+40×0.5+40.02×0.2=39.996.类型二 标准差、方差的应用例3 计算数据89,93,88,91,94,90,88,87的方差和标准差(标准差结果精确到0.1). 解 ①x =90+18[(-1)+3+(-2)+1+4+0+(-2)+(-3)]=90+18×0=90;②计算x i -x (i =1,2,…,8),得各数据为-1,3,-2,1,4,0,-2,-3; ③计算(x i -x )2(i =1,2,…,8),得各数据为1,9,4,1,16,0,4,9; ④计算方差:s 2=18(1+9+4+1+16+0+4+9)=448=5.5;⑤计算标准差:s = 5.5≈2.3.所以这组数据的方差为5.5,标准差约为2.3.反思与感悟 (1)方差和标准差都是用来描述一组数据波动情况的特征数,常用来比较两组数据的波动大小.(2)样本标准差反映了各样本数据围绕样本平均数波动的大小,标准差越小,表明各样本数据在样本平均数周围越集中;反之,标准差越大,表明各样本数据在样本平均数的两边越分散.(3)若样本数据都相等,则s =0.(4)当样本的平均数相等或相差无几时,就要用样本数据的离散程度来估计总体的数字特征,而样本数据的离散程度是由标准差来衡量的.跟踪训练3 甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.(1)分别求出两人得分的平均数与方差;(2)根据图和(1)中算得的结果,对两人的训练成绩作出评价.解 (1)由题图可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分;乙:13分,14分,12分,12分,14分. x甲=10+13+12+14+165=13,x 乙=13+14+12+12+145=13,s 2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4, s 2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8. (2)由s 2甲>s 2乙可知乙的成绩较稳定.从折线图来看,甲的成绩基本上呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩无明显提高.1.某市2017年各月的平均气温(℃)数据的茎叶图如图,则这组数据的中位数是( )A .19B .20C .21.5D .23答案 B解析 由茎叶图知,平均气温在20℃以下的有5个月,在20℃以上的也有5个月,恰好是20℃的有2个月,由中位数的定义知,这组数据的中位数为20.故选B.2.设样本数据x 1,x 2,…,x 10的平均数和方差分别为1和4,若y i =x i +a (a 为非零常数,i =1,2,…,10),则y 1,y 2,…,y 10的平均数和方差分别为( ) A .1+a,4 B .1+a,4+a C .1,4 D .1,4+a 答案 A解析 ∵x 1,x 2,…,x 10的平均数x =1,方差s 21=4, 且y i =x i +a (i =1,2,…,10),∴y 1,y 2,…,y 10的平均数y =110·(y 1+y 2+…+y 10)=110·(x 1+x 2+…+x 10+10a )=110·(x 1+x 2+…+x 10)+a =x +a =1+a ,其方差s 22=110·[(y 1-y )2+(y 2-y )2+…+(y 10-y )2]=110[(x 1-1)2+(x 2-1)2+…+(x 10-1)2]=s 21=4.故选A.3.已知一组数据4,6,5,8,7,6,那么这组数据的平均数为________. 答案 6解析 由已知得,所求平均数为4+6+5+8+7+66=6.4.若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为________. 答案 16解析 设样本数据x 1,x 2,…,x 10的标准差为s ,则s =8,可知数据2x 1-1,2x 2-1,…,2x 10-1的标准差为2s =16.5.某校医务室抽查了高一10位同学的体重(单位:kg)如下: 74,71,72,68,76,73,67,70,65,74.(1)求这10个学生体重数据的平均数、中位数、方差、标准差; (2)估计高一所有学生体重数据的平均数、中位数、方差、标准差.解 (1)这10个学生体重数据的平均数为x =110×(74+71+72+68+76+73+67+70+65+74)=71.这10个学生体重数据从小到大依次为65,67,68,70,71,72,73,74,74,76,位于中间的两个数是71,72,∴这10个学生体重数据的中位数为71+722=71.5.这10个学生体重数据的方差为 s 2=110×[(74-71)2+(71-71)2+(72-71)2+(68-71)2+(76-71)2+(73-71)2+(67-71)2+(70-71)2+(65-71)2+(74-71)2]=11, 这10个学生体重数据的标准差为s =s 2=11.(2)由样本估计总体得高一所有学生体重数据的平均数为71,中位数为71.5,方差为11,标准差为11.1.利用直方图求数字特征:①众数是最高的矩形的底边的中点.②中位数左右两边直方图的面积应相等.③平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和. 2.标准差的平方s 2称为方差,有时用方差代替标准差测量样本数据的离散程度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差.3.现实中的总体所包含的个体数往往很多,总体的平均数与标准差是未知的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性.一、选择题1.某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各1人,则该小组数学成绩的平均数,众数,中位数分别为( ) A .85分,85分,85分 B .87分,85分,86分 C .87分,85分,85分 D .87分,85分,90分答案 C解析 平均数为100+95+90×2+85×4+80+7510=87,众数为85,中位数为85,故选C.2.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a ,中位数为b ,众数为c ,则有( )A .a >b >cB .b >c >aC .c >a >bD .c >b >a 答案 D解析 由已知得a =110×(15+17+14+10+15+17+17+16+14+12)=14.7,b =12×(15+15)=15,c =17,∴c >b >a .故选D. 3.样本a,3,5,7的平均数是b ,且a ,b 是方程x 2-5x +4=0的两根,则这个样本的方差是( ) A .3 B .4 C .5 D .6 答案 C解析 x 2-5x +4=0的两根是1,4. 当a =1时,a,3,5,7的平均数是4;当a =4时,a,3,5,7的平均数不是1.∴a =1,b =4,则方差s 2=14×[(1-4)2+(3-4)2+(5-4)2+(7-4)2]=5.4.如图所示的茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为( ) A .2,5 B .5,5 C .5,8 D .8,8 答案 C解析 由茎叶图及已知得x =5,又乙组数据的平均数为16.8,即9+15+10+y +18+245=16.8,解得y =8,选C.5.某高三学生在连续五次月考中的数学成绩为(单位:分):90,90,93,94,93,则该学生在这五次月考中数学成绩数据的平均数和方差分别为( ) A .92,2.8 B .92,2 C .93,2 D .93,2.8答案 A解析 该学生在这五次月考中数学成绩数据的平均数为 x =15×(90+90+93+94+93)=92,方差为s 2=15×[(90-92)2+(90-92)2+(93-92)2+(94-92)2+(93-92)2]=2.8.故选A.6.高三学生李丽在一年的五次数学模拟考试中的成绩为(单位:分):x ,y,105,109,110.已知该同学五次数学成绩数据的平均数为108,方差为35.2,则|x -y |的值为( ) A .15 B .16 C .17 D .18 答案 D解析 由题意得,x +y +105+109+1105=108,①(x -108)2+(y -108)2+9+1+45=35.2,②由①②解得⎩⎪⎨⎪⎧ x =99,y =117或⎩⎪⎨⎪⎧x =117,y =99,所以|x -y |=18.故选D. 7.某省农科所经过5年对甲、乙两棉种的实验研究,将连续5年棉花产量(千克/亩)的统计数据用茎叶图表示,如图所示,则平均产量较高与产量较稳定的分别是( )A .甲棉种;甲棉种B .乙棉种;甲棉种C .甲棉种;乙棉种D .乙棉种;乙棉种 答案 C解析 根据茎叶图的数据知,甲棉种产量为68,69,70,71,72;乙棉种产量为68,68,69,69,71. ∴甲棉种的平均值x甲=15×(68+69+70+71+72)=70; 乙棉种的平均值x 乙=15×(68+68+69+69+71)=69. 甲的方差s 2甲=15×[(68-70)2+(69-70)2+(70-70)2+(71-70)2+(72-70)2]=2, 乙的方差s 2乙=15×[(68-69)2+(68-69)2+(69-69)2+(69-69)2+(71-69)2]=1.2. ∴甲棉种平均产量较高,乙棉种产量较稳定.故选C.二、填空题8.如图所示的茎叶图是甲、乙两组各5名学生的数学竞赛成绩(70分~99分),若甲、乙两组学生的平均成绩一样,则a =________;甲、乙两组学生的成绩相对稳定的是________.答案 5 甲组解析 由题意可知75+88+89+98+90+a 5= 76+85+89+98+975=89,解得a =5.因为s 2甲=15×[(-14)2+(-1)2+0+92+62]=3145,s 2乙=15×[(-13)2+(-4)2+0+92+82]=3305,所以s 2甲<s 2乙,故成绩相对稳定的是甲组.9.已知一组数据x 1,x 2,…,x 10的方差是2,且(x 1-3)2+(x 2-3)2+…+(x 10-3)2=380,则这组数据的平均数x =________.答案 -3或9解析 ∵数据x 1,x 2,…,x 10的方差为2,∴110[(x 1-x )2+(x 2-x )2+…+(x 10-x )2]=2, 即(x 1-x )2+(x 2-x )2+…+(x 10-x )2=20.又∵(x 1-3)2+(x 2-3)2+…+(x 10-3)2=380,∴90-10x 2+(2x -6)×10x =360,∴x 2-6x -27=0,解得x =-3或x =9.10.一组数据2,x,4,6,10的平均数是5,则此组数据的标准差是________.答案 2 2解析 ∵一组数据2,x,4,6,10的平均数是5,∴2+x +4+6+10=5×5,解得x =3,∴此组数据的方差s 2=15×[(2-5)2+(3-5)2+(4-5)2+(6-5)2+(10-5)2]=8, ∴此组数据的标准差s =2 2.11.某企业三个分厂生产同一种电子产品,三个分厂的产量分布如图所示.现在用分层抽样方法从三个分厂生产的产品中共抽取100件进行使用寿命的测试,则第一分厂应抽取的件数为________;测试结果为第一、二、三分厂取出的产品的平均使用寿命分别为1 020小时,980小时,1 030小时,估计这个企业生产的产品的平均使用寿命为________小时.答案 50 1 015解析 由分层抽样可知,第一分厂应抽取100×50%=50(件).由样本的平均数估计总体的平均数,可知这批电子产品的平均使用寿命为1 020×50%+980×20%+1 030×30%=1 015(小时).三、解答题12.从甲、乙两班某项测试成绩中各随机抽取5名同学的成绩,得到如图所示的茎叶图.已知甲班成绩数据的中位数为13,乙班成绩数据的平均数为16.(1)求x ,y 的值;(2)试估计甲、乙两班在该项测试中整体水平的高低.(注:方差s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x 为x 1,x 2,…,x n 的平均数) 解 (1)由茎叶图知甲班成绩数据依次为9,12,10+x,20,26,所以中位数为10+x =13,得x =3;乙班成绩数据的平均数x乙=15(9+15+10+y +18+20)=16, 得y =8.(2)乙班整体水平较高.理由:由题意及(1)得x 甲=15×(9+12+13+20+26)=16, s 2甲=15×[(9-16)2+(12-16)2+(13-16)2+(20-16)2+(26-16)2]=38,x 乙=16, s 2乙=15×[(9-16)2+(15-16)2+(18-16)2+(18-16)2+(20-16)2]=745=14.8. 因为s 2甲>s 2乙,所以乙班的整体水平较高.13.某工厂36名工人的年龄数据如表所示.(1)用系统抽样法从36名工人中抽取容量为9的样本,且在第一分段里用随机抽样法抽到的年龄数据为44,列出样本的年龄数据;(2)计算(1)中样本的平均数x 和方差s 2;(3)36名工人中年龄在x -s 与x +s 之间的有多少人?所占的百分比是多少(精确到0.01%)? 解 (1)由系统抽样,将36名工人分为9组(4人一组),每组抽取一名工人.因为在第一分段里抽到的是年龄为44的工人,即编号为2的工人,故所抽样本的年龄数据为44,40,36,43,36,37,44,43,37.(2)平均数x =44+40+36+43+36+37+44+43+379=40; 方差s 2=19×[(44-40)2+(40-40)2+(36-40)2+(43-40)2+(36-40)2+(37-40)2+(44-40)2+(43-40)2+(37-40)2]=1009. (3)由(2)可知s =103.由题意,年龄在⎝⎛⎭⎫40-103,40+103内的工人共有23人,所占的百分比为2336×100%≈63.89%. 14.从某企业生产的某种产品中随机抽取100件,测量这些产品的某项质量指标,由测量结果得到如下频数分布表:(1)(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?解 (1)频率分布直方图如图:(2)质量指标值的样本平均数为80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104. 所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.。
人教B版高中数学必修三第二章统计2.2.1.docx

2.2.1用样本的频率分布估计总体的分布课时目标 1.通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.2.在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的频率分布估计总体的分布,初步体会样本频率分布的随机性.1.极差的概念极差是一组数据的__________________的差,它反映了一组数据__________,极差又叫________.2.频数、频率的概念将一批数据按要求分为若干组,对落在各个小组内数据的________进行累计,这个累计数叫做各个小组的________,各个小组的________除以__________,即得该小组的________.3.频率分布直方图在频率分布直方图中,纵轴表示________________,各小长方形的面积等于________________,所有长方形面积之和等于____.4.频率分布折线图把频率分布直方图中各个长方形____________用线段连接起来,就得到频率分布折线图.5.总体密度曲线如果样本容量越大,所分组数越多,频率分布直方图中表示的频率分布就越接近于总体在各个小组内所取值的__________________的大小;当样本容量不断增大,分组的组距不断缩小时,频率分布直方图实际上越来越接近于______________,它可以用一条______________来描绘,这条光滑曲线就叫做_______________________________.6.茎叶图用茎叶图表示数据的两个优点在于:一是从茎叶图上没有__________的损失,所有的数据信息都可以从茎叶图中得到;二是茎叶图可以在比赛时__________,方便记录与表示.一、选择题1.下列说法不正确的是()A.频率分布直方图中每个小矩形的高就是该组的频率B.频率分布直方图中各个小矩形的面积之和等于1C.频率分布直方图中各个小矩形的宽一样大D.频率分布折线图是依次连接频率分布直方图的每个小矩形上端中点得到的2.一个容量为100的样本,其数据的分组与各组的频数如下:组别(0,10] (10,20] (20,30] (30,40] (40,50] (50,60] (60,70]频数12 13 24 15 16 13 7则样本数据落在(10,40]上的频率为()A.0.13 B.0.39 C.0.52 D.0.643.如图是总体密度曲线,下列说法正确的是()A.组距越大,频率分布折线图越接近于它B.样本容量越小,频率分布折线图越接近于它C.阴影部分的面积代表总体在(a,b)内取值的百分比D.阴影部分的平均高度代表总体在(a,b)内取值的百分比4.一个容量为35的样本数据,分组后,组距与频数如下:[5,10),5个;[10,15),12个;[15,20),7个;[20,25),5个;[25,30),4个;[30,35),2个.则样本在区间[20,+∞)上的频率为()A.20% B.69% C.31% D.27%5.某工厂对一批产品进行了抽样检测.如图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是()A.90 B.75C.60 D.45题号 1 2 3 4 5答案二、填空题6.将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n=________. 7.在如图所示的茎叶图中,甲、乙两组数据的中位数分别是________.8.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在各组上的频率为m,该组上直方图的高为h,则|a-b|=________.三、解答题9.美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51, 54,51,60,62,43,55,56,61,52,69,64,46,54,48(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图.(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.10.抽查100袋洗衣粉,测得它们的重量如下(单位:g):494498493505496492485483508 511495494483485511493505488 501491493509509512484509510 495497498504498483510503497 502511497500493509510493491 497515503515518510514509499 493499509492505489494501509 498502500508491509509499495 493509496509505499486491492 496499508485498496495496505 499505496501510496487511501496(1)列出样本的频率分布表:(2)画出频率分布直方图,频率分布折线图;(3)估计重量在[494.5,506.5]g的频率以及重量不足500 g的频率.能力提升11.在某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17在某报纸的一篇文章中,每个句子的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22(1)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,你会得到什么结论?绘制频率分布直方图的具体步骤:①求极差:找出一组数据中的最大值和最小值,最大值与最小值的差是极差(正值).②确定组距与组数:组数与样本容量有关,当样本容量不超过100时,按照数据的多少,常分成5~12组;组距的选择力求“取整”,组数=极差组距.③将数据分组:将数据分成互不相交的组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间.④列频率分布表:一般分“分组”、“频数累计”、“频数”、“频率”四列,最后一行是合计.注意频数的合计是样本容量,频率的合计是1.⑤绘制频率分布直方图:根据频率分布表绘制频率分布直方图,其中纵轴表示频率与组距的比值,其相应组距上的频率等于该组距上的矩形的面积,即每个矩形的面积=组距×频率组距=频率.这样频率分布直方图就以面积的形式反映了数据落在各个小组的频率的大小,各小矩形的面积的总和等于1.第二章 统 计§2.2 用样本估计总体2.2.1 用样本的频率分布估计总体的分布知识梳理1.最大值与最小值 变化的幅度 全距 2.个数 频数 频数 样本容量 频率 3.频率与组距的比值 相应各组的频率 1 4.上边的中点 5.个数与总数比值 总体的分布 光滑曲线y =f(x) 总体密度曲线 6.原始信息 随时记录作业设计1.A2.C [样本数据落在(10,40]上的频数为13+24+15=52,故其频率为52100=0.52.] 3.C4.C [由题意,样本中落在[20,+∞)上的频数为5+4+2=11,∴在区间[20,+∞)上的频率为1135≈0.31.] 5.A [∵样本中产品净重小于100克的频率为(0.050+0.100)×2=0.3,频数为36,∴样本总数为360.3=120. ∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.75,∴样本中净重大于或等于98克并且小于104克的产品的个数为120×0.75=90.]6.60解析 ∵n·2+3+42+3+4+6+4+1=27,∴n =60. 7.45,46解析 由茎叶图及中位数的概念可知x 甲中=45,x 乙中=46.8.m h解析 频率组距=h ,故|a -b|=组距=频率h =m h . 9.解 (1)以4为组距,列表如下:(2)从频率分布表中可以看出,将近60%的美国总统就任时的年龄在50岁至60岁之间,45岁以下以及65岁以上就任的总统所占的比例相对较小.10.解 (1)在样本数据中,最大值是518,最小值是483,它们相差35,若取组距为4,由于354=834,要分9组,组数合适,于是决定取组距为4 g ,分9组,使分点比数据多一位小数,且把第一组起点稍微减小一点,得分组如下:[482.5,486.5),[486.5,490.5),…,[514.5,518.5). 列出频率分布表:分组 个数累计 频数 频率 累积 频率[482.5,486.5) 正8 0.08 0.08 [486.5,490.5) 3 0.03 0.11 [490.5,494.5) 正正正 17 0.17 0.28[494.5,498.5) 正正正正- 21 0.21 0.49[498.5,502.5) 正正14 0.14 0.63 [502.5,506.5) 正9 0.09 0.72 [506.5,510.5) 正正正 19 0.19 0.91[510.5,514.5) 正-6 0.06 0.97 [514.5,518.5]3 0.03 1.00 合计100 1.00 (2)频率分布直方图与频率分布折线图如图.(3)重量在[494.5,506.5]g 的频率为:0.21+0.14+0.09=0.44.设重量不足500 g 的频率为b ,根据频率分布表,b -0.49500-498.5≈0.63-0.48502.5-498.5,故b ≈0.55.因此重量不足500 g 的频率约为0.55. 11.解 (1)(2)电脑杂志上每个句子的字数集中在10~30之间;而报纸上每个句子的字数集中在20~40之间.还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.说明电脑杂志作为科普读物需要通俗易懂、简明.。
数学同步新导学案人教B必修三讲义:第二章 统计 2.3 Word含答案

2.3变量的相关性学习目标 1.了解变量间的相关关系,会画散点图.2.根据散点图,能判断两个变量是否具有相关关系.3.了解线性回归思想,会求回归直线的方程.知识点一变量间的相关关系思考1粮食产量与施肥量间的相关关系是正相关还是负相关?答案在施肥不过量的情况下,施肥越多,粮食产量越高,所以是正相关.思考2怎样判断一组数据是否具有线性相关关系?答案画出散点图,若点大致分布在一条直线附近,就说明这两个变量具有线性相关关系,否则不具有线性相关关系.梳理1.相关关系的定义变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的,那么这两个变量之间的关系叫做相关关系,两个变量之间的关系分为函数关系和相关关系.2.散点图将样本中n个数据点(x i,y i)(i=1,2,…,n)描在平面直角坐标系中得到的图形叫做散点图.3.正相关与负相关(1)正相关:如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.(2)负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.知识点二两个变量的线性相关思考任何一组数据都可以由最小二乘法得出回归直线方程吗?答案用最小二乘法求回归直线方程的前提是先判断所给数据是否具有线性相关关系(可利用散点图来判断),否则求出的回归直线方程是无意义的.梳理回归直线方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归直线方程:回归直线对应的方程叫做回归直线方程. (3)最小二乘法:求回归直线方程y ^=b ^x +a ^时,使得样本数据的点到回归直线的离差平方和最小的方法叫做最小二乘法.⎩⎪⎨⎪⎧b ^=∑i =1n(x i-x )(y i-y )∑i =1n (x i-x )2=∑i =1nx i y i-n x y ∑i =1n x 2i-n x 2,a ^=y -b ^x ,其中,b ^是回归直线方程的斜率,a ^是回归直线方程在y 轴上的截距.1.人的身高与年龄之间的关系是相关关系.( × ) 2.农作物的产量与施肥量之间的关系是相关关系.( √ ) 3.回归直线过样本点中心(x ,y ).( √)题型一 变量间相关关系的判断例1 下列两个变量之间是相关关系的是( ) A .圆的面积与半径之间的关系 B .球的体积与半径之间的关系 C .角度与它的正弦值之间的关系D .降雪量与交通事故的发生率之间的关系 答案 D解析 由题意知A 表示圆的面积与半径之间的关系S =πr 2,B 表示球的体积与半径之间的关系V =4πr 33,C 表示角度与它的正弦值之间的关系y =sin α,都是确定的函数关系,只有D是相关关系,故选D.反思与感悟函数关系是一种确定的关系,而相关关系是非随机变量与随机变量的关系.函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.跟踪训练1下列两个变量间的关系不是函数关系的是()A.正方体的棱长与体积B.角的度数与它的正切值C.单产为常数时,土地面积与粮食总产量D.日照时间与水稻的单位产量答案 D解析函数关系与相关关系都是指两个变量之间的关系,但是这两种关系是不同的,函数关系是指当自变量一定时,函数值是确定的,是一种确定性的关系.因为A项V=a3,B项y =tan α,C项y=ax(a>0,且a为常数),所以这三项均是函数关系.D项是相关关系.题型二散点图的应用例25名学生的数学和物理成绩(单位:分)如下:判断它们是否具有线性相关关系.解以x轴表示数学成绩,y轴表示物理成绩,得相应的散点图如图所示.由散点图可知,各点分布在一条直线附近,故两者之间具有线性相关关系.反思与感悟(1)判断两个变量x和y间具有哪种相关关系,最简便的方法是绘制散点图.变量之间可能是线性的,也可能是非线性的(如二次函数),还可能不相关.(2)画散点图时应注意合理选择单位长度,避免图形偏大或偏小,或者是点的坐标在坐标系中画不准,使图形失真,导致得出错误结论.跟踪训练2 下列图形中两个变量具有线性相关关系的是( )答案 C解析 A 是一种函数关系;B 也是一种函数关系;C 中从散点图中可看出所有点看上去都在某条直线附近波动,具有相关关系,而且是一种线性相关;D 中所有的点在散点图中没有显示任何关系,因此变量间是不相关的. 题型三 回归直线的求解与应用例3 一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器运转速度的变化而变化,下表为抽样试验的结果:(1)画出散点图;(2)如果y 对x 有线性相关关系,请画出一条直线近似地表示这种线性关系;(3)在实际生产中,若它们的近似方程为y =5170x -67,允许每小时生产的产品中有缺点的零件最多为10件,那么机器的运转速度应控制在什么范围内? 解 (1)散点图如图所示:(2)近似直线如图所示:(3)由y ≤10得5170x -67≤10,解得x ≤14.9,所以机器的运转速度应控制在14转/秒内.引申探究1.本例中近似方程不变,若每增加一个单位的转速,生产有缺点的零件数近似增加多少? 解 因为y =5170x -67,所以当x 增加一个单位时,y 大约增加5170.2.本例中近似方程不变,每小时生产有缺点的零件件数是7,估计机器的转速. 解 因为y =5170x -67,所以当y =7时,7=5170x -67,解得x ≈11.反思与感悟 求回归直线方程的一般步骤(1)收集样本数据,设为(x i ,y i )(i =1,2,…,n )(数据一般由题目给出). (2)作出散点图,确定x ,y 具有线性相关关系. (3)把数据制成表格x i ,y i ,x 2i ,x i y i . (4)计算x ,y,∑i =1nx 2i ,∑i =1nx i y i . (5)代入公式计算b ^,a ^,公式为⎩⎪⎨⎪⎧b ^=∑i =1n x i y i-n x y∑i =1n x 2i-n x2,a ^=y -b ^x .(6)写出回归直线方程y ^=b ^x +a ^.跟踪训练3 某种产品的广告费支出x (单位:百万元)与销售额y (单位:百万元)之间有如下对应数据:(1)画出散点图; (2)求回归直线方程. 解 (1)散点图如图所示.(2)列出下表,并用科学计算器进行有关计算.于是可得,b ^=∑i =15x i y i -5x y∑i =15x 2i -5x2=1 380-5×5×50145-5×52=6.5,a ^=y -b ^x =50-6.5×5=17.5.于是所求的回归直线方程是y ^=6.5x +17.5.1.设有一个回归直线方程为y ^=2-1.5x ,则变量x 增加1个单位时,y 平均( ) A .增加1.5个单位 B .增加2个单位 C .减少1.5个单位 D .减少2个单位答案 C2.工人工资y (元)与劳动生产率x (千元)的相关关系的回归直线方程为y ^=50+80x ,下列判断正确的是( )A .劳动生产率为1 000元时,工人工资为130元B .劳动生产率提高1 000元时,工人工资平均提高80元C .劳动生产率提高1 000元时,工人工资平均提高130元D .当月工资为250元时,劳动生产率为2 000元 答案 B解析 因为回归直线的斜率为80,所以x 每增加1,y 平均增加80,即劳动生产率提高1 000元时,工人工资平均提高80元.3.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归直线方程为y ^=0.85x -85.71,则下列结论中不正确的是( ) A .y 与x 具有正的线性相关关系 B .回归直线过样本点中心(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg 答案 D解析 当x =170时,y ^=0.85×170-85.71=58.79,体重的估计值为58.79 kg.4.已知回归直线的斜率的估计值是1.23,且过定点(4,5),则回归直线方程是________.答案 y ^=1.23x +0.08解析 回归直线的斜率的估计值为1.23,即b ^=1.23,又回归直线过定点(4,5),∴a ^=5-1.23×4=0.08,∴y ^=1.23x +0.08.5.某地区近10年居民的年收入x 与年支出y 之间的关系大致符合y ^=0.8x +0.1(单位:亿元),预计今年该地区居民收入为15亿元,则今年支出估计是________亿元. 答案 12.1解析 将x =15代入y ^=0.8x +0.1,得y ^=12.1.1.判断变量之间有无相关关系,一种简便可行的方法就是绘制散点图.根据散点图,可以很容易看出两个变量是否具有相关关系,是不是线性相关,是正相关还是负相关. 2.求回归直线方程时应注意的问题(1)知道x 与y 成线性相关关系,无需进行相关性检验,否则应首先进行相关性检验,如果两个变量之间本身不具有相关关系,或者说,它们之间的相关关系不显著,即使求出回归直线方程也是毫无意义的,而且用其估计和预测的量也是不可信的.(2)用公式计算a ^,b ^的值时,要先计算b ^,然后才能算出a ^.3.利用回归直线方程,我们可以进行估计和预测.例如,若回归直线方程为y ^=b ^x +a ^,则x =x 0处的估计值为y ^0=b ^x 0+a ^.一、选择题1.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归直线方程可能是( )A.y ^=-10x +200B.y ^=10x +200C.y ^=-10x -200 D.y ^=10x -200答案 A解析 x 的系数为负数,表示负相关,排除B ,D ,由实际意义可知x >0,y >0,C 中,散点图在第四象限无意义,故选A.2.对变量x ,y 有观测数据(x i ,y i )(i =1,2,3,…,10),得散点图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,3,…,10),得散点图2,由这两个散点图可以断定( )A .x 与y 正相关,u 与v 正相关B .x 与y 正相关,u 与v 负相关C .x 与y 负相关,u 与v 正相关D .x 与y 负相关,u 与v 负相关答案 C解析 由图1可知,点散布在从左上角到右下角的区域,各点整体呈递减趋势,故x 与y 负相关;由图2可知,点散布在从左下角到右上角的区域,各点整体呈递增趋势,故u 与v 正相关. 3.已知x 与y 之间的一组数据:已求得关于y 与x 的回归直线方程为y ^=2.2x +0.7,则m 的值为( ) A .1 B .0.85 C .0.7 D .0.5 答案 D解析 x =0+1+2+34=1.5,y =m +3+5.5+74,将其代入y ^=2.2x +0.7,可得m =0.5,故选D.4.根据如下样本数据得到的回归直线方程为y ^=b ^x +a ^,则( )A.a ^>0,b ^>0B.a ^>0,b ^<0C.a ^<0,b ^>0 D.a ^<0,b ^<0答案 B解析 画出散点图,知a ^>0,b ^<0.5.已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的回归直线方程可能是( )A.y ^=0.4x +2.3B.y ^=2x -2.4C.y ^=-2x +9.5 D.y ^=-0.3x +4.4答案 A解析 由变量x 与y 正相关知C ,D 均错,又回归直线经过样本点的中心(3,3.5),代入验证得A 正确,B 错误. 故选A.6.已知x 与y 之间的一组数据:若y 与x 线性相关,则y 与x 的回归直线y ^=b ^x +a ^必过( ) A .点(2,2) B .点(1.5,0) C .点(1,2) D .点(1.5,4) 答案 D解析 ∵x =0+1+2+34=1.5,y =1+3+5+74=4,∴回归直线必过点(1.5,4).故选D. 7.已知x ,y 的取值如表所示:如果y 与x 线性相关,且回归直线方程为y ^=b ^x +132,则b ^等于( )A .-12 B.12 C .-110 D.110答案 A 解析 ∵x =2+3+43=3,y =6+4+53=5, ∴回归直线过点(3,5), ∴5=3b ^+132,∴b ^=-12,故选A.8.某产品的广告费用x (单位:万元)与销售额y (单位:万元)的统计数据如下表:根据上表可得回归方程y ^=b ^x +a ^中的b ^为9.4,据此模型预报广告费用为6万元时销售额为( ) A .63.6万元 B .65.5万元 C .67.7万元 D .72.0万元答案 B解析 x =4+2+3+54=3.5,y =49+26+39+544=42.因为回归直线过点(x ,y ),所以42=9.4×3.5+a ^,解得a ^=9.1.故回归方程为y ^=9.4x +9.1.所以当x =6时,y ^=6×9.4+9.1=65.5. 二、填空题9.为了研究某种细菌在特定环境下随时间变化的繁殖规律,得到了下表中的数据,计算得回归直线方程为y ^=0.85x -0.25.由以上信息,可得表中c 的值为________.答案 6 解析x =3+4+5+6+75=5,y =2.5+3+4+4.5+c 5=14+c 5,代入回归直线方程中得14+c5=0.85×5-0.25,解得c =6.10.如图所示的五组数据(x ,y )中,去掉________后,剩下的四组数据相关性增强.答案 (4,10)解析 去掉点(4,10)后,其余四点大致在一条直线附近,相关性增强. 11.在一次试验中测得(x ,y )的四组数据如下:根据上表可得回归直线方程y ^=-5x +a ^,据此模型预报当x =20时,y 的值为________. 答案 26.5 解析x =16+17+18+194=17.5,y =50+34+41+314=39,∴回归直线过点(17.5,39),∴39=-5×17.5+a ^,∴a ^=126.5, ∴当x =20时,y =-5×20+126.5=26.5.12.某工厂对某产品的产量与成本的资料分析后有如下数据:由表中数据得到的回归直线方程y ^=b ^x +a ^中b ^=1.1,预测当产量为9千件时,成本约为________万元. 答案 14.5解析 由表中数据得x =4,y =9,代入回归直线方程得a ^=4.6,∴当x =9时,y ^=1.1×9+4.6=14.5. 三、解答题13.某地最近十年粮食需求量逐年上升,下表是部分统计数据:(1)利用所给数据求两变量之间的回归直线方程y =b x +a ;(2)利用(1)中所求出的回归直线方程预测该地第6年的粮食需求量. 解 (1)由所给数据得x =3,y =5.8,b ^=∑i =15(x i -x )(y i -y )∑i =15(x i -x )2=1.1,a ^=y -b ^x =2.5,∴y ^=1.1x +2.5.故所求的回归直线方程为y ^=1.1x +2.5.(2)第6年的粮食需求量约为y ^=1.1×6+2.5=9.1(万吨).14.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑i =110x i =80,∑i =110y i =20,∑i =110x i y i =184,∑i =110x 2i =720.(1)求家庭月储蓄y (千元)关于月收入x (千元)的回归直线方程; (2)若该居民区某家庭的月收入为7千元,预测该家庭的月储蓄. 解 (1)由题意知n =10,x =1n ∑i =110x i =110×80=8,y =1n ∑i =110y i =110×20=2,又∑i =110x 2i -n x 2=720-10×82=80, ∑i =110x i y i -n x y =184-10×8×2=24,由此得b ^=2480=0.3,a ^=y -b ^x =2-0.3×8=-0.4,故所求回归直线方程为y ^=0.3x -0.4.(2)将x =7代入回归直线方程,可以得到该家庭的月储蓄约为y ^=0.3×7-0.4=1.7(千元).。
人教版高中数学必修三第二章统计§2.2习题课课时作业含答案

§2.2 习题课课时目标 1.进一步巩固基础知识,学会用样本估计总体的思想、方法.2.提高学生分析问题和解决实际应用问题的能力.1.要了解全市高一学生身高在某一范围的学生所占比例的大小,需知道相应样本的( )A .平均数B .方差C .众数D .频率分布2.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,那么由此求出的平均数与实际平均数的差等于( )A .3.5B .-3C .3D .-0.53.对于样本频率分布直方图与总体密度曲线的关系,下列说法中正确的是( )A .频率分布直方图与总体密度曲线无关B .频率分布直方图就是总体密度曲线C .样本容量很大的频率分布直方图就是总体密度曲线D .如果样本容量无限增大,分组的组距无限减小,那么频率分布直方图就会无限接近于总体密度曲线4.容量为100的样本数据,按从小到大的顺序分为8组,如下表:组号 1 2 3 4 5 6 7 8频数 10 13 x 14 15 13 12 9第三组的频数和频率分别是( )A .14和0.14B .0.14和14C .114和0.14D .13和1145.某中学高三(2)班甲、乙两名同学自高中以来每次考试成绩的茎叶图如图,下列说法正确的是( )A .乙同学比甲同学发挥稳定,且平均成绩也比甲同学高B .乙同学比甲同学发挥稳定,但平均成绩不如甲同学高C .甲同学比乙同学发挥稳定,且平均成绩比乙同学高D .甲同学比乙同学发挥稳定,但平均成绩不如乙同学高6.数据70,71,72,73的标准差是________.一、选择题1.一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000中再用分层抽样方法抽出100人作出一步调查,则在[2 500,3 000](元)/月收入段应抽出的人数为( )A.20 B.25 C.40 D.502.一组数据的平均数是4.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别是()A.55.2,3.6 B.55.2,56.4C.64.8,63.6 D.64.8,3.63.一容量为20的样本,其频率分布直方图如图所示,样本在[30,60)上的频率为() A.0.75 B.0.65 C.0.8 D.0.94.甲、乙两种冬小麦试验品种连续5年的平均单位面积产量如下(单位:t/km2):品种第1年第2年第3年第4年第5年甲9.8 9.9 10.1 10 10.2乙9.4 10.3 10.8 9.7 9.8其中产量比较稳定的小麦品种是()A.甲B.乙C.稳定性相同D.无法确定5.某校在“创新素质实践行”活动中组织学生进行社会调查,并对学生的调查报告进行了评比,下面是将某年级60篇学生调查报告进行整理,分成5组画出的频率分布直方图(如图所示).已知从左至右4个小组的频率分别为0.05,0.15,0.35,0.30,那么在这次评比中被评为优秀的调查报告有(分数大于或等于80分为优秀且分数为整数)()A.18篇B.24篇C.25篇D.27篇题号 1 2 3 4 5答案二、填空题6.甲、乙两人在10天中每天加工零件的个数用茎叶图表示如下图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天甲、乙两人日加工零件的平均数分别为________和________.7.将容量为n的样本中的数据分成6组,绘制频率分布直方图,若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n=________.8.某地区为了解中学生的日平均睡眠时间(单位:h),随机选择了n位中学生进行调查,根据所得数据画出样本的频率分布直方图如图所示,且从左到右的第1个、第4个、第2个、第3个小长方形的面积依次相差0.1,又第一小组的频数是10,则n=________.三、解答题9.对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:甲27 38 30 37 35 31乙33 29 38 34 28 36(1)画出茎叶图,由茎叶图你能获得哪些信息?(2)分别求出甲、乙两名自行车赛手最大速度(m/s)数据的平均数、极差、方差,并判断选谁参加比赛比较合适?10.潮州统计局就某地居民的月收入调查了10 000人,并根据所得数据画出了样本的频率分布直方图(每个分组包括左端点,不包括右端点,如第一组表示收入在[1 000,1 500)).(1)求居民月收入在[3 000,3 500)的频率;(2)根据频率分布直方图算出样本数据的中位数;(3)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这10 000人中用分层抽样方法抽出100人作进一步分析,则月收入在[2 500,3 000)的这段应抽多少人?能力提升11.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量,产品数量的分组区间为[45,55),[55,65),[65,75),[75,85),[85,95].由此得到频率分布直方图如图,则由此估计该厂工人一天生产该产品数量在[55,70)的人数约占该厂工人总数的百分率是________.1.方差反映了一组数据偏离平均数的大小,一组数据方差越大,说明这组数据波动越大.即方差反应了样本偏离样本中心(x ,y )的情况.标准差可以使其单位与样本数据的单位一致,从另一角度同样衡量这组数据的波动情况.2.在求方差时,由于对一组数据都同时加上或减去相同的数只是平均数发生了变化,其方差不变,因此可以转化为一组较简单的新数求方差较为简捷.答案: §2.2 习题课双基演练 1.D [样本的平均数、方差、众数都不能反应样本在某一范围的个数所占样本容量的比例,故选D .]2.B [少输入90,9030=3,平均数少3,求出的平均数减去实际的平均数等于-3.] 3.D4.A [频数为100-(10+13+14+15+13+12+9)=14;频率为14100=0.14.] 5.A [从茎叶图可知乙同学的成绩在80~90分分数段的有9次,而甲同学的成绩在80~90分分数段的只有7次;再从题图上还可以看出,乙同学的成绩集中在90~100分分数段的最多,而甲同学的成绩集中在80~90分分数段的最多.故乙同学比甲同学发挥较稳定且平均成绩也比甲同学高.] 6.52解析 X =70+71+72+734=71.5, s =14×[(70-71.5)2+(71-71.5)2+(72-71.5)2+(73-71.5)2] =52.作业设计1.B [由题意可知:在[2 500,3 000](元)/月的频率为0.000 5×500=0.25,故所求的人数为0.25×100=25.]2.D [每一个数据都加上60时,平均数也应加上60,而方差不变.]3.B [由图可知,样本在[30,60)上的频率为0.02×10+0.025×10+0.02×10=0.2+0.25+0.2=0.65,故选择B .]4.A [方法一 x 甲=15×(9.8+9.9+10.1+10+10.2)=10, x 乙=15×(9.4+10.3+10.8+9.7+9.8)=10, 即甲、乙两种冬小麦的平均单位面积产量的均值都等于10,其方差分别为s 2甲=15×(0.04+0.01+0.01+0+0.04)=0.02, s 2乙=15×(0.36+0.09+0.64+0.09+0.04)=0.244, 即s 2甲<s 2乙,表明甲种小麦的产量比较稳定. 方法二 (通过特殊的数据作出合理的推测)表中乙品种在第一年的产量为9.4,在第三年的产量为10.8,其波动比甲品种大得多,所以甲种冬小麦的产量比较稳定.]5.D [第5个小组的频率为1-0.05-0.15-0.35-0.30=0.15,∴优秀的频率为0.15+0.30=0.45∴优秀的调查报告有60×0.45=27(篇).]6.24 23解析 x 甲=110(10×2+20×5+30×3+17+6+7)=24, x 乙=110(10×3+20×4+30×3+17+11+2)=23. 7.60解析 ∵第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,∴前三组频数为2+3+420·n =27,故n =60. 8.100解析 设第1个小长方形的面积为S ,则4个小长方形的面积之和为S +(S +0.1)+(S +0.2)+(S +0.3)=4S +0.6.由题意知,4S +0.6=1,∴S =0.1.又10n=0.1,∴n =100. 9.解 (1)画茎叶图、中间数为数据的十位数.从茎叶图上看,甲、乙的得分情况都是分布均匀的,只是乙更好一些.乙发挥比较稳定,总体情况比甲好.(2)x 甲=27+38+30+37+35+316=33. x 乙=33+29+38+34+28+366=33. s 2甲=16[(27-33)2+(38-33)2+(30-33)2+(37-33)2+(35-33)2+(31-33)2]≈15.67. s 2乙=16[(33-33)2+(29-33)2+(38-33)2+(34-33)2+(28-33)2+(36-33)2]≈12.67. 甲的极差为11,乙的极差为10.综合比较以上数据可知,选乙参加比赛较合适.10.解 (1)月收入在[3 000,3 500)的频率为0.000 3×(3 500-3 000)=0.15.(2)∵0.000 2×(1 500-1 000)=0.1,0.000 4×(2 000-1 500)=0.2,0.000 5×(2 500-2 000)=0.25,0.1+0.2+0.25=0.55>0.5.∴样本数据的中位数为2 000+0.5-(0.1+0.2)0.000 5=2 000+400=2 400(元). (3)居民月收入在[2 500,3 000)的频率为0.000 5×(3 000-2 500)=0.25,所以10 000人中月收入在[2 500,3 000)的人数为0.25×10 000=2 500(人),再从10 000人中分层抽样方法抽出100人,则月收入在[2 500,3 000)的这段应抽取100×2 50010 000=25(人). 11.52.5%解析 结合直方图可以看出:生产数量在[55,65)的人数频率为0.04×10=0.4,生产数量在[65,75)的人数频率为0.025×10=0.25,而生产数量在[65,70)的人数频率约为0.25×12=0.125,那么生产数量在[55,70)的人数频率约为0.4+0.125=0.525,即52.5%.附赠材料答题六注意 :规范答题不丢分提高考分的另一个有效方法是减少或避免不规范答题等非智力因素造成的失分,具体来说考场答题要注意以下六点: 第一,考前做好准备工作。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
重难聚焦
众数并没有通常意义上的“平均”的含义.但众数在数据中出现的 次数最多,说明该数值在数据中最具有代表性.众数不会受到数据 中极端值的影响,但并不是每一组数据都是具有众数的.对于分组 数据而言,众数常常依赖于分组的情况,分组数改变时,众数可能就 有较大的变化,稳定性较差.同时众数也可能是不唯一的.
−
������)2+(x2
−
������)2+…+(xn−������)2],展
开整理可得
s2
=
1 ������
[(������12
+
������22
+
⋯
+
���������2��� )-n(������)2],
这里由题设知 n=10, ������12 + ������22 + ⋯ + ������120 = 208, ������ = 4,
甲:78,76,74,90,82;乙:90,70,75,85,80. (1)用茎叶图表示这两组数据. (2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认 为选派哪位同学参加更合适?试说明理由. 分析:分别计算两位同学的成绩的平均数、方差,从平均水平和 稳定性方面作出判断.
题型一
题型二
题型三
频率分别为0.012 5×20=0.25,0.025×20=0.5,0.006 5×20=0.13,0.003×20=0.06,0.003×20=0.06,因此平均数为 10×0.25+30×0.5+50×0.13+70×0.06+90×0.06=33.6(min);
众数为频率最大的一组的组中值,即为30 min;
映数据的波动大小及离散程度,所以应选C.
答案:C
2已知某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图如图, 则( ) A.甲的中位数为21,乙的众数为26 B.甲的众数为21,乙的中位数为25 C.甲的中位数为21,乙的众数为31 D.甲的众数为21,乙的中位数为31 答案:C
3将某小区100户居民的月均用水量进行统计,得到样本的频率分布 直方图如图,估计此样本的众数、中位数分别为( )
知识梳理
知识梳理
重难聚焦
1.平均数、中位数、众数的区别与联系 剖析:平均数在度量一组数据的集中化趋势的统计量中是应用最 广泛的.计算平均数时全部数据都参加运算,因此,用它来反映一组 数据的集中化趋势比较好.但是它也有缺点,主要的问题是平均数 是根据一组数据中的全部数据来计算的,会受到数据中那些没有代 表性的极端值的影响.因此,有时在计算平均数时,先剔除个别缺乏 代表性的特殊值,所得到的结果可能会更具有代表性. 中位数主要受一组数据中的中间位置上的数值的影响,用中位数 来反映一组数据中各数据大小的一般水平并不很精确.但中位数计 算简单,与平均数相比,中位数不受数据中极端值的影响.从这个意 义出发,它可以作为数据平均指标的代表值.
题型一
题型二
题型三
题型四
典例透析
反思对于常用的平均数、方差、标准差的公式要能够熟练记忆, 不能记错公式,造成计算上的失误,使得统计的结果失去真实的意 义.另外,应用求得的标准差的结论时,要特别注意标准差较大,数据 的离散程度较大;标准差较小,数据的离散程度较小.
题型一
题型二
题型三
题型四
Байду номын сангаас
典例透析
【变式训练2】 甲、乙两位同学参加数学竞赛培训,在培训期间 他们参加了5项预赛,成绩记录如下:
A.2,2.5 C.2.25,2.5
B.2.25,2.02 D.2.5,2.25
解析:样本的众数为最高矩形底边中点对应的横坐标,为
2+2.5 2
=
2.25, 排除A,D;中位数是频率为 0.5 时,对应的样本数据,由于
(0.08+0.16+0.30+0.44)×0.5=0.49,(0.08+0.16+0.30+0.44+0.50)×0.5
������
=
1.2.
因此,
������1+������2+…+������������ ������
=
������'
1+������'
2+…+������' ������
������+80������
=
1.2 + 80 = 81.2. 又方差是刻画数据离散程度的量,故各数据减去(或
加上)同一个数后,方差的大小不变.
+
(84
−
83.2)2
+
(85
−
83.2)2
+
(89
−
83.2)2 + (79 − 83.2)2 + (80 − 83.2)2 + (91 − 83.2)2 + (89 −
83.2)2 + (79 − 83.2)2 + (74 − 83.2)2] = 26.36,
������乙2
=
1 10
[(90
−
=0.74,则中位数在 2 与 2.5 之间,排除 C,故选 B.
答案:B
4已知一个样本数据是1,3,2,5,x,它的平均数是3,则这个样本的标准
差是
.
解析:由
1 5
(1
+
3
+
2
+
5
+
������
)
=
3,
解得x=4.
因为
s2=
1 5
[(1
−
3)2
+
(3
−
3)2
+
(2
−
3)2
+
(5
−
3)2
+
(4
−
3)2] = 2,
∴ ������甲2 < ������乙2 , ������甲 = ������乙, ∴ 从统计学的角度考虑,选甲参加更合适.
题型一
题型二
题型三
题型四
由统计图表估计总体的数字特征 【例3】 某学校为了了解高一新生上学所需时间的情况,从高一新 生中随机抽取了部分同学,调查其上学所需时间,获得相应数据,制 成了频率分布直方图(如图所示).
设中位数为x,则有0.25+(x-20)×0.025=0.5,解得x=30,
即中位数为30 min. (2)由频率分布直方图可知,新生上学所需时间不少于1 h的频率
为(0.003+0.003)×20=0.12. 因为1 200×0.12=144,所以1 200名新生中大约有144名学生可以
申请在学校住宿.
所以标准差 s= 2.
答案: 2
5一组数据的每一个数据都减去80,得一组新数据.若求得新数据的
平均数是1.2,方差是4.4,则原来数据的平均数和方差分别
是
、
.
解析:设这组数据为 x1,x2,…,xn,都减去 80 后,新数据为 x'1,x'2,…,x'n,则
������'
1+������'
2+…+������' ������
84)2
+
(76
−
84)2
+
(86
−
84)2
+
(81
−
84)2
+ (84 − 84)2 + (87 − 84)2 + (86 − 84)2 + (82
− 84)2 + (85 − 84)2 + (83 − 84)2] = 13.2,
所以 s甲 = 26.36≈5.13,s乙 = 13.2≈3.63.
典例透析
(1)试计算该校高一新生上学所需时间的平均数、中位数、众数; (2)如果上学所需时间不少于1 h的学生可申请在学校住宿,请估 计该校1 200名新生中大约有多少名学生可以申请在学校住宿?
题型一
题型二
题型三
题型四
分析:(1)按照频率分布直方图下各种数字特征的求法分别计算; (2)先求上学所需时间不少于1 h的频率,再求相应的人数. 解:(1)上学所需时间在[0,20),[20,40),[40,60),[60,80),[80,100]内的
(1)求该样本数据的平均数、中位数、众数; (2)试估计全校教师中,上学期使用多媒体教学次数在[15,25)内 的人数.
题型一
题型二
题型三
题型四
典例透析
题型一
题型二
题型三
题型四
易错辨析
易错点:公式使用不当致错
【例 4】 若 10 个正整数的平方和是 208,平均数是 4,则这组数
据的方差为多少?将这组数据同时减去 3,则新数据的平均数为多少?
重难聚焦
题型一
题型二
题型三
题型四
典例透析
题型一
题型二
题型三
题型四
典例透析
反思1.通常情况下,一组数据给出后,可根据平均数、中位数、众 数的定义及其计算公式分别计算求值.
2.求中位数时,必须先将数据按从大到小或从小到大的顺序排列.
题型一
题型二
题型三
题型四
典例透析
题型一
题型二
题型三
题型四
典例透析
重难聚焦
2.方差、极差和标准差的特点 剖析:方差、极差和标准差从不同角度描述一组数据的离散趋势. 它们各自的特点及应用如下: 极差没有充分利用数据,不能提供更确切的信息,但由于只涉及 两个数据,计算非常简便,所以极差在实际现场检查时经常利用,但 极差没有考虑各中间值. 方差充分利用了所得到的数据,提供了更确切的信息.在统计中, 方差能够较好地区别出不同组数据的分散情况或程度,但方差的单 位是原始观测数据的单位的平方.而标准差能够和方差一样区分数 据的分散情况,且其单位与原始观测数据的单位相同.