2016届高考数学二轮复习 第1部分 专题7 必考点16 统计、统计案例课件 文
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大题 规范
类型一 样本频率分布、数字特征(重点)——突破概念应用
[例 1] (2015·高考全国卷Ⅱ)(本小题满分 12 分)某公司为了解用户对其产 品的满意度,从 A,B 两地区分别随机调查了 40 个用户,根据用户对产 品的满意度评分,得到 A 地区用户满意度评分的频率分布直方图和 B 地 区用户满意度评分的频数分布表.
因此 y 关于 x 的回归方程为y^=100.6+68 x.
(6 分)
大题 规范
类型二 线性回归分析(难点)——突破计算的准确性
(3)已知这种产品的年利润 z 与 x,y 的关系为 z=0.2y-x.根据(2)的结果回
答下列问题:
①年宣传费 x=49 时,年销售量及年利润的预报值是多少?
②年宣传费 x 为何值时,年利润的预报值最大?
知识 回扣
必记知识
重要结论
2.用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数
数字特征
样本数据
频率分布直方图
众数 出现次数最多的数据
取最高的小长方形底边中点的 横坐标
将数据按大小依次排列,处 把频率分布直方图划分左右两
中位数 在最中间位置的一个数据(或 个面积相等的分界线与 x 轴交 最中间两个数据的平均数) 点的横坐标
知识 回扣
必记知识
重要结论
1.随机抽样 (1)简单随机抽样特点是从总体中逐个抽取.适用范围:总体中的个体较 少. (2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中 抽取.适用范围:总体中的个体数较多. (3)分层抽样特点是将总体分成几层,分层进行抽取.适用范围:总体由 差异明显的几部分组成.
频率 (1)小长方形的面积=组距×组距=频率; (2)各小长方形的面积之和等于 1; (3)小长方形的高=频 组率 距,所有小长方形的高的和为组1距.
知识 回扣
必记知识
重要结论
4.回归直线方程过定点( x , y ). 5.x1,x2,x3,…,xn 的平均数为 x ,方差为 s2,则 bx1+a,bx2+a,bx3 +a,…,bxn+a 的平均数为 b x +a,方差为 b2s2. 6.散点在一条直线上时,其相关系数为 1 或-1.
则 K2=a+bcn+add-ab+cc2b+d(其中 n=a+b+c+d 为样本容量).
知识 回扣
必记知识
重要结论
1.从 m 个个体中抽取 n 个个体组成样本,每个个体被抽取的可能性都相 同,在整个抽样中,被抽取的概率为mn . 2.从 m 个个体中按系统抽样抽取 n 个个体,其抽样间隔为mn. 3.频率分布直方图
日期
1 月 11 日 1 月 12 日 1 月 13 日 1 月 14 日 1 月 15 日
平均气温 x(℃) 9
10
12
11
8
销量 y(杯)
23
25
30
26
21
大题 规范
类型二 线性回归分析(难点)——突破计算的准确性
自我挑战
(1)若先从这 5 组数据中抽出 2 组,求抽出的 2 组数据恰好是相邻 2 天数 据的概率; 设“选取的 2 组数据恰好是相邻 2 天数据”为事件 A, ∵所有基本事件(m,n)(其中 m,n 为 1 月份的日期数)有:(11,12),(11,13), (11,14),(11,15),(12,13),(12,14),(12,15),(13,14),(13,15),(14,15), 共 10 个. 事件 A 包括的基本事件有(11,12),(12,13),(13,14),(14,15),共 4 个. ∴抽出的 2 组数据恰好是相邻 2 天数据的概率 P(A)=140=52.
8
8
8
x
y
w
8
i=1 (xi- x )2
i=1 (wi-
i=1 (xi-
i=1 (wi-
w )2
x )(yi- y ) w )(yi- y )
46.6 563 6.8
289.8
1.6
1 469
108.8
表中 wi= xi, w =81i=81wi.
大题 规范
类型二 线性回归分析(难点)——突破计算的准确性
大题 规范
类型一 样本频率分布、数字特征(重点)——突破概念应用
自我挑战
1.(2015·高考广东卷)某工厂 36 名工人的年龄数据如下表.
工人编号
1 2 3 4 5 6 7 8 9
年龄
40 44 40 41 33 40 45 42 43
工人编号 年龄
10
36
11
31
12
38
13
39
14
43
15
45
自我挑战
(1)用系统抽样法从 36 名工人中抽取容量为 9 的样本,且在第一分段里用 随机抽样法抽到的年龄数据为 44,列出样本的年龄数据; 36 人分成 9 组,每组 4 人,其中第一组的工人年龄为 44,所以它在组中 的编号为 2, 所以所有样本数据的编号为 4n-2(n=1,2,…,9), 其年龄数据为:44,40,36,43,36,37,44,43,37.
类型二 线性回归分析(难点)——突破计算的准确性
自我挑战
2.(2016·南宁市模拟)某位同学进行寒假社会实践活动,为了对白天平均
气温与某奶茶店的某种饮料销量之间的关系进行分析研究,他分别记录
了 1 月 11 日至 1 月 15 日的白天平均气温 x(℃)与该奶茶店的这种饮料销 量 y(杯),得到如下数据:
专题复习·数学(文)
专题七 概率与统计 必考点十六 统计、统计案例
类
类型一 样本频率分布、数字特征(重点)——突破概念应用
型
类型二 线性回归分析(难点)——突破计算的准确性
类型三 独立性检验(难点)——突破解题程序
高考·预测 运筹帷幄之中
1 利用三种抽样方法解决抽样问题. 2 利用频率分布直方图、茎叶图,求样本的数据特征,估计总体的数字 特征. 3 对相关变量进行独立性检验.
大题 规范
类型二 线性回归分析(难点)——突破计算的准确性
[例 2] (2015·高考全国卷Ⅰ)(本小题满分 12 分)某公司为确定下一年度投入
某种产品的宣传费,需了解年宣传费 x(单位:千元)对年销售量 y(单位:t)
和年利润 z(单位:千元)的影响.对近 8 年的年宣传费 xi 和年销售量 yi(i= 1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线 v=α+βu 的斜率和截距的最小二乘估计分别为
n
β^=i=1
ui-
n
u
vi-
v
^ ,α=
v
-^β
u.
i=1 ui- u 2
大题 规范
类型二 线性回归分析(难点)——突破计算的准确性
①由(2)知, 当 x=49 时, 年销售量 y 的预报值y^=100.6+68 49=576.6, 年利润 z 的预报值^z=576.6×0.2-49=66.32. ②根据(2)的结果知,年利润 z 的预报值 ^z=0.2(100.6+68 x)-x=-x+13.6 x+20.12. 所以当 x=132.6=6.8,即 x=46.24 时,^z取得最大值. 故年宣传费为 46.24 千元时,年利润的预报值最大.
大题 规范
类型一 样本频率分布、数字特征(重点)——突破概念应用
用样本估计总体的两种方法 (1)用样本的频率分布(频率分布表、频率分布直方图、茎叶图等)估计总体 的频率分布.其频率视为概率. (2)用样本的数字特征(众数、中位数、平均数、方差、标准差)估计总体的 数字特征.注意从图中寻求这些数字方法
(1)根据散点图判断,y=a+bx 与 y=c+d x哪一个适宜作为年销售量 y 关于年宣传费 x 的回归方程类型?(给出判断即可,不必说明理由)
由散点图可以判断,y=c+d x适宜作为年销售量 y 关于年宣传费 x 的回
归方程类型.
(2 分)
大题 规范
类型二 线性回归分析(难点)——突破计算的准确性
n
通过求 Q= (yi-a-bxi)2 最小时,得到线性回归方程y^=^bx+^a的方法叫
i=1
做最小二乘法.
知识 回扣
必记知识
重要结论
4.独立性检验
对于取值分别是{x1,x2}和{y1,y2}的分类变量 X 和 Y,其样本频数列联表 是
y1
y2 总计
x1
a
b a+b
x2
c
d c+d
总计 a+c b+d n
大题 规范
类型一 样本频率分布、数字特征(重点)——突破概念应用
自我挑战
(2)计算(1)中样本的均值 x 和方差 s2;
由均值公式知: x =44+40+9 …+37=40, 由方差公式知:s2=91[(44-40)2+(40-40)2+…+(37-40)2]=1900.
大题 规范
类型一 样本频率分布、数字特征(重点)——突破概念应用
如图所示.
(6 分)
通过两地区用户满意度评分的频率分布直方图可以看出,B 地区用户满意
度评分的平均值高于 A 地区用户满意度评分的平均值;B 地区用户满意
度评分比较集中,而 A 地区用户满意度评分比较分散.
(8 分)
大题 规范
类型一 样本频率分布、数字特征(重点)——突破概念应用
(2)根据用户满意度评分,将用户的满意度分为三个等级:
16
39
17
38
18
36
工人编号
19 20 21 22 23 24 25 26 27
年龄
27 43 41 37 34 42 37 44 4
工人编号
28 29 30 31 32 33 34 35 36
年龄
34 39 43 38 42 53 37 49 39
大题 规范
类型一 样本频率分布、数字特征(重点)——突破概念应用
(2)根据(1)的判断结果及表中数据,建立 y 关于 x 的回归方程;
令 w= x,先建立 y 关于 w 的线性回归方程.
8
wi- w yi- y
i=1
由于^d=
8
=110.86.8=68,
wi- w 2
i=1
c^= y -^d w =563-68×6.8=100.6,
所以 y 关于 w 的线性回归方程为y^=100.6+68w,
(9 分) (12 分)
大题 规范
类型二 线性回归分析(难点)——突破计算的准确性
1根据散点图中的点的分布规律作出判断. 2若 x,y 线性相关,可直接求其线性回归方程,若 x,y 为非线性相关, 可通过换元先建立线性回归方程,然后再转化为非线性回归方程. 3利用2中求出的回归方程求最大预报值.
大题 规范
平均数 样本数据的算术平均数
每个小矩形的面积乘以小矩形 底边中点的横坐标之和
知识 回扣
必记知识
重要结论
(2)方差:s2=1n[(x1- x )2+(x2- x )2+…+(xn- x )2].
标准差:s=
1n[x1- x 2+x2- x 2+…+xn- x 2].
知识 回扣
必记知识
重要结论
3.变量的相关性与最小二乘法 (1)相关关系的概念、正相关和负相关、相关系数. (2)最小二乘法:对于给定的一组样本数据(x1,y1),(x2,y2),…,(xn,yn),
大题 规范
类型一 样本频率分布、数字特征(重点)——突破概念应用
A 地区用户满意度评分的频数分布直方图
图①
大题 规范
类型一 样本频率分布、数字特征(重点)——突破概念应用
B 地区用户满意度评分的频数分布表
满意度评 [50,60) [60,70) [70,80) [80,90) [90,100]
分分组
频数
2
8
14
10
6
大题 规范
类型一 样本频率分布、数字特征(重点)——突破概念应用
(1)在图②中作出 B 地区用户满意度评分的频率分布直方图,并通过直方 图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给 出结论即可).
图②
大题 规范
类型一 样本频率分布、数字特征(重点)——突破概念应用
满意度评分 低于 70 分 70 分到 89 分 不低于 90 分
满意度等级 不满意
满意
非常满意
估计哪个地区用户的满意度等级为不满意的概率大?说明理由. A 地区用户的满意度等级为不满意的概率大.
记 CA 表示事件:“A 地区用户的满意度等级为不满意”;CB 表示事件: “B 地区用户的满意度等级为不满意”.由直方图得 P(CA)的估计值为 (0.01+0.02+0.03)×10=0.6,P(CB)的估计值为(0.005+0.02)×10=0.25.
自我挑战
(3)36 名工人中年龄在 x -s 与 x +s 之间有多少人?所占的百分比是多少 (精确到 0.01%)? 因为 s2=1900,s=130, 所以 36 名工人中年龄在 x -s 和 x +s 之间的人数等于年龄在区间[37,43] 上的人数, 即 40,40,41,…,39,共 23 人. 所以 36 名工人中年龄在 x -s 和 x +s 之间的人数所占的百分比为2336 ×100%≈63.89%.
(11 分)
所以 A 地区用户的满意度等级为不满意的概率大.
来自百度文库
(12 分)
大题 规范
类型一 样本频率分布、数字特征(重点)——突破概念应用
得分点及踩点说明 (1)第一问中的频率分布直方图的每个长方形都要达到相应的高度;否则, 错一个扣 1 分 (2)第一问中的“评价”是从两个方面:平均数和分散情况,缺一方面扣 1 分 (3)第二问中缺少结论或者概率计算错,每一种情况都扣 1 分