2018高考新课标数学文二轮专题复习课件:专题六第1讲统计与统计案例 精品

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.抽样方法
抽样方法包括简单随机抽样、系统抽样、分层抽样, 三种抽样方法都是等概率抽样,体现了抽样的公平性, 但又各有其特点和适用范围.
在系统抽样,如果遇到Nn 不是整数的情况,可以先从 总体中随机剔除几个个体,使得总体中剩余的个体能被 样本容量整除.
2.统计中的四个数据特征
(1)众数:在样本数据中,出现次数最多的那个数据. (2)中位数:样本数据中,将数据按大小排列,位于 最中间的数据.如果数据的个数为偶数,就取中间两个 数据的平均数作为中位数.
角度 1 茎叶图与样本的数字特征
[例 2-1] (2016·广州调研)为比较甲、乙两地某月 14 时的气温情况,随机选取该月中的 5 天,将这 5 天中 14 时的气温数据(单位:℃)制成如图所示的茎叶图.考虑 以下结论:
①甲地该月 14 时的平均气温低于乙地该月 14 时的平 均气温;
②甲地该月 14 时的平均气温高于乙地该月 14 时的平 均气温;
(2)(2016·江苏卷)已知一组数据 4.7,4.8,5.1,5.4, 5.5,则该组数据的方差是________.
解:(1)由频率分布直方图,该市居民该月用水量在 区间[0.5,1],(1,1.5],(1.5,2],(2,2.5],(2.5,3]内的 频率依次为 0.1,0.15,0.2,0.25,0.15.
频率 0.1 0.15 0.2 0.25 0.15 0.05 0.05 0.05
根据题意,该市居民该月的人均水费估计为: 4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17 ×0.05+22×0.05+27×0.05=10.5(元).
角度 2 用样本的频率分布估计总体分布
解:(1)频率分布直方图如图.
(2) 质 量 指 标 值 的 样 本 平 均 数 为 -x = 80×0.06 + 90×0.26+100×0.38+110×0.22+120×0.08=100.
质量指标值的样本方差为 s2=(-20)2×0.06+(-10)2 ×0.26+0×0.38+102×0.22+202×0.08=104.
D.23
解析:由茎叶图可知这组数据由小到大依次为 8,9, 12,15,18,20,20,23,23,28,31,32,所以中位数
20+20 为 2 =20.
答案:B
3.(2015·福建卷)为了解某社区居民的家庭年收入与 年支出的关系,随机调查了该社区 5 户家庭,得到如下统 计数据表:
10. 11. 11. 收入x(万元) 8.2 8.6
5.独立性检验
对于取值分别是{x1,x2}和{y1,y2}的分类变量 X 和 Y, 其样本频数列联表是:
Y y1 y2 总计
X
x1
a b a+b
x2
c d c+d
总计 a+c b+d n
则 K2=(a+b)(cn+(da)d-(bac+)c2)(b+d)(其中 n =a+b+c+d 为样本容量).
③甲地该月 14 时的气温的标准差小于乙地该月 14 时的气温的标准差;
④甲地该月 14 时的气温的标准差大于乙地该月 14 时的气温的标准差.
其中根据茎叶图能得到的统计结论的编号为( ) A.①③ B.①④ C.②③ D.②④ 解析:甲地 5 天的气温为:26,28,29,31,31,
其平均数为-x 甲=26+28+259+31+31=29; 方差为 s2甲=15[(26-29)2+(28-29)2+(29-29)2+(31 -29)2+(31-29)2]=3.6;
(2)某班级有 50 名学生,现要利用系统抽样在这 50 名学生中抽出 10 名学生,将这 50 名学生随机编号 1~50 号,并分组,第一组 1~5 号,第二组 6~10 号,…,第 十组 46~50 号,若在第三组中抽得号码为 13 的学生,则 在第八组中抽得号码为________的学生.
解析:(1)设男生抽取 x 人,则有94050=900-x 400, 解得 x=25. (2)∵13=5×2+3,即第三组抽出的是第三名学生, 所以每一组都相应抽出第三名学生,∴在第八组中抽得号 码为 5×7+3=38 的学生. 答案:(1)25 (2)38
(2)中位数为平分频率分布直方图面积且垂直于横轴 的直线与横轴交点的横坐标.
(3)平均数等于频率分布直方图中每个小矩形的面积 乘以小矩形底边中点的横坐标之和.
[变式训练 2] (1)(2015·广东卷)已知样本数据 x1, x2,…,xn 的均值-x =5,则样本数据 2x1+1,2x2+1,…, 2xn+1 的均值为________.
(3)平均数:样本数据的算术平均数,即 -x =n1(x1+x2+…+xn). (4)方差与标准差. 方差:s2=n1[(x1--x )2+(x2--x )2+…+(xn--x )2]. 标准差:
s= n1[(x1--x )2+(x2--x )2+…+(xn--x )2]
3.直方图的两个结论
频率 (1)小长方形的面积=组距×组距=频率. (2)各小长方形的面积之和等于 1. 4.回归直线^y=^bx+^a经过样本点的中心点(-x ,-y ), 若 x 取一个值代入回归直线方程^y=^bx+^a中,可求出 y 的估计值.
答案:B
[规律方法] 1.平均数与方差都是重要的数字特征, 是对数据的一种简明描述,它们所反映的情况有着重要的 实际意义.平均数、中位数、众数描述数据的集中趋势, 方差和标准差描述数据的波动大小.
2.众数、中位数、平均数与频率分布直方图的关系: (1)众数为频率分布直方图中最高矩形的底边中点的 横坐标.
[例 1] (1)(2015·北京卷)某校老年、中年和青年教师 的人数见下表,采用分层抽样的方法调查教师的身体状 况,在抽取的样本中,青年教师有 320 人,则该样本中的 老年教师人数为( )
类别 人数
老年教师 900
中年教师 1 800
青年教师 1 600
合计 4 300
A.90
B.100
C.180
A.简单随机抽样 B.按性别分层抽样 C.按学段分层抽样 D.系统抽样 解析:因为男女视力情况差异不大,但学段的视力情 况有较大差异,所以应按学段分层抽样. 答案:C
2.(2015·重庆卷)重庆市 2013 年各月的平均气温(℃) 数据的茎叶图如下图,则这组数据的中位数是( )
A.19
B.20
C.21.5
2.分层抽样的关键是根据样本特征的差异进行分层, 实质是等比例抽样.分层抽样中分多少层、如何分层要视 具体情况而定,总的原则是层内样本的差异要小,两层之 间的样本差异要大,且互不重叠.
[变式训练 1] (1)某校高一年级有 900 名学生,其中
女生 400 名,按男女比例用分层抽样的方法,从该年级学 生中抽取一个容量为 45 的样本,则应抽取的男生人数为 ________.
解:(1)由频率分布直方图,可知:月均用水量在[0, 0.5)的频率为 0.08×0.5=0.04.
同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5, 4),[4,4.5)组的频率分别为 0.08,0.21,0.25,0.06,0.04, 0.02.
由 1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)= 0.5×a+0.5×a.
[例 2-2] (2016·四川卷)我国是世界上严重缺水的 国家,某市为了制定合理的节水方案,对居民用水情况 进行了调查.通过抽样,获得了某年 100 位居民每人的月 均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…, [4,4.5]分成 9 组,制成了如图所示的频率分布直方图.
(1)求直方图中 a 的值; (2)设该市有 30 万居民,估计全市居民中月均用水量 不低于 3 吨的人数,说明理由; (3)估计居民月均用水量的中位数.
D.300
(2)(2016·长沙雅礼中学质检)在一次马拉松比赛中, 35 名运动员的成绩(单位:分钟)的茎叶图如图所示.
若将运动员按成绩由好到差编为 1~35 号,再用系统 抽样方法从中抽取 7 人,则其中成绩在区间[139,151]上 的运动员人数是________.
解析:(1)设该样本中的老年教师人数为 x,由题意及 分层抽样的特点得9x00=1362000,故 x=180.
039 支出y(万元) 6.2 7.5 8.0 8.5 9.8
根据上表可得回归直线方程^y =^bx+^a,其中^b= 0.76,^a=-y -^b-x .据此估计,该社区一户年收入为 15 万元家庭的年支出为( )
A.11.4 万元 B.11.8 万元 C.12.0 万元 D.12.2 万元 解析:-x =8.2+8.6+10.50+11.3+11.9=10,
所以这种产品质量指标值的平均数的估计值为 100, 方差的估计值为 104.
(3)质量指标值不低于 95 的产品所占比例的估计值为 0.38+0.22+0.08=0.68.
由于该估计值小于 0.8,故不能认为该企业生产的这 种产品符合“质量指标值不低于 95 的产品至少要占全部 产品 80%”的规定.
质量指 标值分

频数
[75, 85)
6
[85, 95)
26
[95, [105, [115, 105) 115) 125)
38
22
8
百度文库1)作出这些数据的频率分布直方图;
(2)估计这种产品质量指标值的平均数及方差(同一组 中的数据用该组区间的中点值作代表);
(3)根据以上抽样调查数据,能否认为该企业生产的 这种产品符合“质量指标值不低于 95 的产品至少要占全 部产品 80%”的规定?
解得 a=0.30.
(2)由(1),100 位居民月均用水量不低于 3 吨的频率为 0.06+0.04+0.02=0.12.
由以上样本的频率分布,可以估计 30 万居民中月均 用水量不低于 3 吨的人数为 300 000×0.12=36 000.
(3)设中位数为 x 吨. ∵前 5 组的频率之和为 0.04+0.08+0.15+0.21+0.25 =0.73>0.5.
(2)依题意,可将编号为 1~35 号的 35 个数据分成 7 组,每组有 5 个数据.
在区间[139,151]上共有 20 个数据,分在 4 个小组 内,每组抽取 1 人,共抽取 4 人.
答案:(1)C (2)4
[规律方法] 1.在系统抽样的过程中,要注意分段间 隔,需要抽取 n 个个体,样本就需要分成 n 个组,则分 段间隔即为Nn(N 为样本容量,且 N 能被 n 整除),首先确 定在第一组中抽取的个体的号码数,再从后面的每组中按 规则抽取每个个体.
所以该月用水量不超过 3 立方米的居民占 85%,用 水量不超过 2 立方米的居民占 45%.依题意,w 至少定为 3.
(2)由用水量的频率分布直方图及题意,得居民该月
用水费用的数据分组与频率分布表:
组号 1 2 3 4 5 6 7 8 (8, (10, (12, (17, (22,
分组 [2,4] (4,6] (6,8] 10] 12] 17] 22] 27]
专题六 概率与统计
第 1 讲 统计与统计案例
1.(2013·全国Ⅰ卷)为了解某地区的中小学生的视力 情况,拟从该地区的中小学生中抽取部分学生进行调查, 事先已了解到该地区小学、初中、高中三个学段学生的视 力情况有较大差异,而男女视力情况差异不大.在下面的 抽样方法中,最合理的抽样方法是( )
(导学号 53130043)
标准差为 s 甲= 3.6.
乙地 5 天的气温为:28,29,30,31,32,
其平均数为-x 乙=28+29+350+31+32=30; 方差为 s2乙=15[(28-30)2+(29-30)2+(30-30)2+(31 -30)2+(32-30)2]=2; 标准差为 s 乙= 2.∴-x 甲<-x 乙,s 甲>s 乙.
-y =6.2+7.5+85.0+8.5+9.8=8,
∴ ^a=8-0.76×10=0.4, ∴回归直线^y=0.76x+0.4. ∴当 x=15 时,^y=0.76×15+0.4=11.8(万元). 答案:B
4.(2014·全国Ⅰ卷)从某企业生产的某种产品中抽取 100 件,测量这些产品的一项质量指标值,由测量结果得 如下频数分布表:
相关文档
最新文档