高考数学(理科)二轮配套课件:专题7(第3讲)统计与统计案例
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
所以y1,y2,…,y10的均值为1+a,方差不变仍为4.
故选A.
热点三 统计案例
例3 (1)以下是某年2月某地区搜集到的新房屋的销售
价格y和房屋的面积x的数据.
思维启迪 回归直线
房屋面积 11
10 过 样 本 点 中
x/m2
110 80 135
5
5
心(
);
x,y
销售价格y/ 24. 21. 18. 29.
系 统 抽 样 方 法 抽 取 42 人 做 问 卷 调 查 , 将 840 人 按
1,2,…,840随机编号,则抽取的42人中,编号落
入区间[481,720]的人数为( )
A.11
B.12
C.13 D.14
思维启迪 系统抽样时需要抽取几个个体,样本就分成几组,且抽
取号码的间隔相同;
解析 由 840 =20,即每20人抽取1人, 42
数字特 样本数 频率分布直方
征
据
图
出现次 取最高的小长
众数 数最多 方形底边中点
将数据按大小依 把频率分布直方 次排列,处在最 图划分左右两个 中位数 中间位置的一个 面积相等的分界 数据(或最中间两 线与x轴交点的横 个数据的平均数) 坐标
每个小矩形的面 样本数据的算术 积乘以小矩形底 平均数
(2)方差:s2=1n[(x1- x)2+(x2- x)2+…+(xn- x)2]. 标准差: s= 1n[x1- x 2+x2- x 2+…+xn- x 2].
第三组中没有疗效的有6人,则第三组中有疗效的人
数为( )
思维启迪 根据第一组与第二组
的人数和对应频率估计 样本总数,然后利用第 三组的频率和无疗效人 数计算;
A.6
B.8 C.12 D.18
解析 志愿者的总人数为0.16+200.24×1=50,
所以第三组人数为50×0.36=18, 有疗效的人数为18-6=12. 答案 C
所以x=10.
0.40 x
(2)(2014·陕西)设样本数据x1,x2,…,x10的均值和方
差分别为1和4,若yi=xi+a(a为非零常数,i=1,2,…,
10),则y1,y2,…,y10的均值和方差分别为( )
A.1+a,4
B.1+a,4+a
A
C.1,4
D.1,4+a
解析 x1+x2+10…+x10=1,yi=xi+a,
K2=52×20×4×322×0-161×6×36122=633670.
C中,a=8,b=12,c=8,d=24,a+b=20,c+d =32,a+c=16,b+d=36,n=52,
K2=522×0×8×322×4-161×2×3682=1130.
D中,a=14,b=6,c=2,d=30,a+b=20,c +d=32,a+c=16,b+d=36,n=52,
0.066 + 0.071 + 0.073 + 0.073 + 0.084 + 0.086 + 0.097)÷12≈0.068 9,
x乙=(0.041+0.042+0.043+0.046+0.059+0.062+
0.069 + 0.079 + 0.087 + 0.092 + 0.094 + 0.096)÷12≈0.067 5,
答案 31.244 2
(2)(2014·江西)某人研究中学生的性别与成绩、视力、 智商、阅读量这4个变量的关系,随机抽查52名中学生, 得到统计数据如表1至表4,则与性别有关联的可能性 最大的变量是( )
表1
成 绩 性别
不及 格
男6
及格 14
总计 20
女 10 22 32
总计 16 36 52
表2
Biblioteka Baidu式训练1
(1) 某 校 高 一 、 高 二 、 高 三 分 别 有 学 生 人 数 为
495,493,482,现采用系统抽样方法,抽取49人做问
卷调查,将高一、高二、高三学生依次随机按
1,2,3,…,1 470编号,若第1组有简单随机抽样方法
抽取的号码为23,则高二应抽取的学生人数为( )
A.15
点在回归直线上建立方程求解;(2)独立性检验
思
维 问题,要确定2×2列联表中的对应数据,然后
升 华
代入K2(χ2)计算公式求其值,根据K2(χ2)取值范
围求解即可.
变式训练3 (1)已知x、y取值如下表:
x0 1 4 5 68
1.
9.
从所得的散y点1图.3分析8可知5:.6y 6与.1x 7线.4性相3关,且y^=
4.变量的相关性与最小二乘法 (1)相关关系的概念、正相关和负相关、相关系数.
(2)最小二乘法:对于给定的一组样本数据(x1,y1),(x2,
n
y2),…,(xn,yn),通过求 Q= (yi-a-bxi)2 最小时,
i=1
得到线性回归方程y^=b^x+a^的方法叫做最小二乘法.
5.独立性检验 对于取值分别是{x1,x2}和{y1,y2}的分类变量X和Y, 其样本频数列联表是
y1 x1 a
y2 总计 则 K2(χ2)=
nad-bc2
b a+b a+bc+da+cb+d
x2 c d c+d
总 计
a+c b+d
n
(其中 n=a+b+c+d 为样 本容量).
热点分类突破
➢ 热点一 抽样方法 ➢ 热点二 用样本估计总体 ➢ 热点三 统计案例
热点一 抽样方法
例1 (1)(2013·陕西)某单位有840名职工,现采用
(1)反映样本数据分布的主要方式:频率分布表、
频率分布直方图、茎叶图.关于频率分布直方图
要明确每个小矩形的面积即为对应的频率,其
思 高低能够描述频率的大小,高考中常常考查频
维
升 率分布直方图的基本知识,同时考查借助频率
华
分布直方图估计总体的概率分布和总体的特征
数,具体问题中要能够根据公式求解数据的均
根据上万表元可得线性8 回归6 方程4y^=b^2x+2a^中2 的b^=0.196 2,
则面积为 150 m2 的房屋的销售价格约为________万元.
解析 由表格可知 x=15(115+110+80+135+105)=109, y =15(24.8+21.6+18.4+29.2+22)=23.2. 所以a^= y-b^ x=23.2-0.196 2×109=1.814 2. 所以所求线性回归方程为y^=0.196 2x+1.814 2. 故当 x=150 时,销售价格的估计值为 y^=0.196 2×150+1.814 2=31.244 2(万元).
(2)(2014·广东)已知某地区中小学生人数和近视情况分别 如图①和图②所示.为了解该地区中小学生的近视形成原 因,用分层抽样的方法抽取2%的学生进行调查,则样本 容量和抽取的高中生近视人数分别为( )
A.200,20 C.200,10
B.100,20 D.100,10
解析 该地区中、小学生总人数为 3 500+2 000+4 500=10 000, 则样本容量为10 000×2%=200, 其中抽取的高中生近视人数为 2 000×2%×50%=20,故选A. 答案 A
s2= 1 [(0.042-0.068 9)2+(0.053-0.068 9)2+…+ (0.09172-0.068 9)2]≈0.000 212.
s2= 1 [(0.041-0.067 5)2+(0.042-0.067 5)2+…+ (0.09162-0.067 5)2]≈0.000 429.
所以甲、乙两地浓度的方差较小的是甲地. 答案 A
K2=522×0×143×2×301-6×6×3622=3176507.
∵1 14340<1130<633670<3176507,
∴与性别有关联的可能性最大的变量是阅读量. 答案 D
(1)线性回归方程求解的关键在于准确求出样本
点中心.回归系数的求解可直接把相应数据代入
公式中求解,回归常数的确定则需要利用中心
专题七 概率与统计
第 3讲 统计与统计案例
主干知识梳理 热点分类突破 真题与押题
1.该部分常考内容:样本数字特征的计算、各种统
计图表、线性回归方程、独立性检验等;有时也会
在知识交汇点处命题,如概率与统计交汇等.
考
情 2.从考查形式上来看,大部分为选择题、填空题, 解 重在考查基础知识、基本技能,有时在知识交汇点
热点二 用样本估计总体
例2 (1)(2014·山东)为了研究某药品的疗效,选取若干 名志愿者进行临床试验,所有志愿者的舒张压数据(单 位 : kPa) 的 分 组 区 间 为 [12,13) , [13,14) , [14,15) , [15,16),[16,17],将其按从左到右的顺序分别编号为 第一组,第二组,…,第五组,如图是根据试验数据 制成的频率分布直方图.已知第一组与第二组共有20人,
解析 本题属于分层抽样,设该学校的教师人数为x,
所以3126000=160-x 150,所以 x=200.
(1)随机抽样各种方法中,每个个体被抽到的概率
思 都是相等的;(2)系统抽样又称“等距”抽样,被 维 抽到的各个号码间隔相同;分层抽样满足:各层
升
华 抽取的比例都等于样本容量在总体容量中的比例.
B.16
C.17 D.18
解析 由系统抽样方法,知按编号依次每30个编号作 为一组,共分49组, 高二学生的编号为496到988,在第17组到第33组内, 第17组抽取的编号为16×30+23=503,为高二学生, 第33组抽取的编号为32×30+23=983,为高二学生, 故共抽取高二学生人数为33-16=17,故选C. 答案 C
思 值、众数和中位数、方差等.
维 升
(2)由样本数据估计总体时,样本方差越小,数
华 据越稳定,波动越小.
变式训练2
(1)某商场在庆元宵促销活动中,对
元宵节9时至14时的销售额进行统
计,其频率分布直方图如图所示,
已知9时至10时的销售额为2.5万
元,则11时至12时的销售额为____
万元.
10
解析 由频率分布直方图可知:0.10=2.5,
(2)PM2.5是指大气中直径小于或等于 2.5微米的颗粒物,也称为可入肺颗
粒物,如图是根据某地某日早7点至
晚8点甲、乙两个PM2.5监测点统计的 数据(单位:毫克/每立方米)列出的茎
叶图,则甲、乙两地浓度的方差较小的是( )
A.甲
B.乙
C.甲乙相等
D.无法确定
思维启迪
直接根据公式计算方差.
解析 x甲=(0.042+0.053+0.059+0.061+0.062+
解析 A中,a=6,b=14,c=10,d=22,a+b =20,c+d=32,a+c=16,b+d=36,n=52,
K2=52×20×6×322×2-161×4×36102=1
13 440.
B中,a=4,b=16,c=12,d=20,a+b=20,c +d=32,a+c=16,b+d=36,n=52,
2.常用的统计图表 (1)频率分布直方图
频率 ①小长方形的面积=组距×组距=频率;
②各小长方形的面积之和等于1;
③小长方形的高=频组率距,所有小长方形的高的和为组1距.
(2)茎叶图 在样本数据较少时,用茎叶图表示数据的效果较好. 3.用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数
读
处命题,也会出现解答题,都属于中、低档题.
主干知识梳理
1.随机抽样 (1)简单随机抽样特点是从总体中逐个抽取.适用范围:总 体中的个体较少. (2)系统抽样特点是将总体均分成几部分,按事先确定的 规则在各部分中抽取.适用范围:总体中的个体数较多. (3)分层抽样特点是将总体分成几层,分层进行抽取.适用 范围:总体由差异明显的几部分组成.
0.95x+a^,则a^等于( )
A.1.30 B.1.45 C.1.65 D.1.80
解析 依题意得, x=16×(0+1+4+5+6+8)=4, y =16(1.3+1.8+5.6+6.1+7.4+9.3)=5.25; 又直线y^=0.95x+a^必过样本点中心( x, y),
所以抽取编号落入区间[481,720]的人数为
720-480=240 =12. 20 20
答案 B
(2)某学校共有师生3 200人,现用分层抽样的方法,从所 有师生中抽取一个容量为160的样本,已知从学生中抽取 的人数为150,那么该学校的教师人数是________.
200
思维启迪 分层抽样最重要的是各层的比例.
视 力 好 差 总计 性别 男 4 16 20 女 12 20 32 总计 16 36 52
表3
智 商 性别 男 女 总计
偏高
8 8 16
正常 总计
12 20 24 32 36 52
表4
阅
读量 丰富 不丰富 总计
性别 男 女
思维启迪
14
6
20
根据列
联表,计
2
30
32
算K2的值
A.成总绩 计 B.视力16 C.智3商6 D.5阅2读量
故选A.
热点三 统计案例
例3 (1)以下是某年2月某地区搜集到的新房屋的销售
价格y和房屋的面积x的数据.
思维启迪 回归直线
房屋面积 11
10 过 样 本 点 中
x/m2
110 80 135
5
5
心(
);
x,y
销售价格y/ 24. 21. 18. 29.
系 统 抽 样 方 法 抽 取 42 人 做 问 卷 调 查 , 将 840 人 按
1,2,…,840随机编号,则抽取的42人中,编号落
入区间[481,720]的人数为( )
A.11
B.12
C.13 D.14
思维启迪 系统抽样时需要抽取几个个体,样本就分成几组,且抽
取号码的间隔相同;
解析 由 840 =20,即每20人抽取1人, 42
数字特 样本数 频率分布直方
征
据
图
出现次 取最高的小长
众数 数最多 方形底边中点
将数据按大小依 把频率分布直方 次排列,处在最 图划分左右两个 中位数 中间位置的一个 面积相等的分界 数据(或最中间两 线与x轴交点的横 个数据的平均数) 坐标
每个小矩形的面 样本数据的算术 积乘以小矩形底 平均数
(2)方差:s2=1n[(x1- x)2+(x2- x)2+…+(xn- x)2]. 标准差: s= 1n[x1- x 2+x2- x 2+…+xn- x 2].
第三组中没有疗效的有6人,则第三组中有疗效的人
数为( )
思维启迪 根据第一组与第二组
的人数和对应频率估计 样本总数,然后利用第 三组的频率和无疗效人 数计算;
A.6
B.8 C.12 D.18
解析 志愿者的总人数为0.16+200.24×1=50,
所以第三组人数为50×0.36=18, 有疗效的人数为18-6=12. 答案 C
所以x=10.
0.40 x
(2)(2014·陕西)设样本数据x1,x2,…,x10的均值和方
差分别为1和4,若yi=xi+a(a为非零常数,i=1,2,…,
10),则y1,y2,…,y10的均值和方差分别为( )
A.1+a,4
B.1+a,4+a
A
C.1,4
D.1,4+a
解析 x1+x2+10…+x10=1,yi=xi+a,
K2=52×20×4×322×0-161×6×36122=633670.
C中,a=8,b=12,c=8,d=24,a+b=20,c+d =32,a+c=16,b+d=36,n=52,
K2=522×0×8×322×4-161×2×3682=1130.
D中,a=14,b=6,c=2,d=30,a+b=20,c +d=32,a+c=16,b+d=36,n=52,
0.066 + 0.071 + 0.073 + 0.073 + 0.084 + 0.086 + 0.097)÷12≈0.068 9,
x乙=(0.041+0.042+0.043+0.046+0.059+0.062+
0.069 + 0.079 + 0.087 + 0.092 + 0.094 + 0.096)÷12≈0.067 5,
答案 31.244 2
(2)(2014·江西)某人研究中学生的性别与成绩、视力、 智商、阅读量这4个变量的关系,随机抽查52名中学生, 得到统计数据如表1至表4,则与性别有关联的可能性 最大的变量是( )
表1
成 绩 性别
不及 格
男6
及格 14
总计 20
女 10 22 32
总计 16 36 52
表2
Biblioteka Baidu式训练1
(1) 某 校 高 一 、 高 二 、 高 三 分 别 有 学 生 人 数 为
495,493,482,现采用系统抽样方法,抽取49人做问
卷调查,将高一、高二、高三学生依次随机按
1,2,3,…,1 470编号,若第1组有简单随机抽样方法
抽取的号码为23,则高二应抽取的学生人数为( )
A.15
点在回归直线上建立方程求解;(2)独立性检验
思
维 问题,要确定2×2列联表中的对应数据,然后
升 华
代入K2(χ2)计算公式求其值,根据K2(χ2)取值范
围求解即可.
变式训练3 (1)已知x、y取值如下表:
x0 1 4 5 68
1.
9.
从所得的散y点1图.3分析8可知5:.6y 6与.1x 7线.4性相3关,且y^=
4.变量的相关性与最小二乘法 (1)相关关系的概念、正相关和负相关、相关系数.
(2)最小二乘法:对于给定的一组样本数据(x1,y1),(x2,
n
y2),…,(xn,yn),通过求 Q= (yi-a-bxi)2 最小时,
i=1
得到线性回归方程y^=b^x+a^的方法叫做最小二乘法.
5.独立性检验 对于取值分别是{x1,x2}和{y1,y2}的分类变量X和Y, 其样本频数列联表是
y1 x1 a
y2 总计 则 K2(χ2)=
nad-bc2
b a+b a+bc+da+cb+d
x2 c d c+d
总 计
a+c b+d
n
(其中 n=a+b+c+d 为样 本容量).
热点分类突破
➢ 热点一 抽样方法 ➢ 热点二 用样本估计总体 ➢ 热点三 统计案例
热点一 抽样方法
例1 (1)(2013·陕西)某单位有840名职工,现采用
(1)反映样本数据分布的主要方式:频率分布表、
频率分布直方图、茎叶图.关于频率分布直方图
要明确每个小矩形的面积即为对应的频率,其
思 高低能够描述频率的大小,高考中常常考查频
维
升 率分布直方图的基本知识,同时考查借助频率
华
分布直方图估计总体的概率分布和总体的特征
数,具体问题中要能够根据公式求解数据的均
根据上万表元可得线性8 回归6 方程4y^=b^2x+2a^中2 的b^=0.196 2,
则面积为 150 m2 的房屋的销售价格约为________万元.
解析 由表格可知 x=15(115+110+80+135+105)=109, y =15(24.8+21.6+18.4+29.2+22)=23.2. 所以a^= y-b^ x=23.2-0.196 2×109=1.814 2. 所以所求线性回归方程为y^=0.196 2x+1.814 2. 故当 x=150 时,销售价格的估计值为 y^=0.196 2×150+1.814 2=31.244 2(万元).
(2)(2014·广东)已知某地区中小学生人数和近视情况分别 如图①和图②所示.为了解该地区中小学生的近视形成原 因,用分层抽样的方法抽取2%的学生进行调查,则样本 容量和抽取的高中生近视人数分别为( )
A.200,20 C.200,10
B.100,20 D.100,10
解析 该地区中、小学生总人数为 3 500+2 000+4 500=10 000, 则样本容量为10 000×2%=200, 其中抽取的高中生近视人数为 2 000×2%×50%=20,故选A. 答案 A
s2= 1 [(0.042-0.068 9)2+(0.053-0.068 9)2+…+ (0.09172-0.068 9)2]≈0.000 212.
s2= 1 [(0.041-0.067 5)2+(0.042-0.067 5)2+…+ (0.09162-0.067 5)2]≈0.000 429.
所以甲、乙两地浓度的方差较小的是甲地. 答案 A
K2=522×0×143×2×301-6×6×3622=3176507.
∵1 14340<1130<633670<3176507,
∴与性别有关联的可能性最大的变量是阅读量. 答案 D
(1)线性回归方程求解的关键在于准确求出样本
点中心.回归系数的求解可直接把相应数据代入
公式中求解,回归常数的确定则需要利用中心
专题七 概率与统计
第 3讲 统计与统计案例
主干知识梳理 热点分类突破 真题与押题
1.该部分常考内容:样本数字特征的计算、各种统
计图表、线性回归方程、独立性检验等;有时也会
在知识交汇点处命题,如概率与统计交汇等.
考
情 2.从考查形式上来看,大部分为选择题、填空题, 解 重在考查基础知识、基本技能,有时在知识交汇点
热点二 用样本估计总体
例2 (1)(2014·山东)为了研究某药品的疗效,选取若干 名志愿者进行临床试验,所有志愿者的舒张压数据(单 位 : kPa) 的 分 组 区 间 为 [12,13) , [13,14) , [14,15) , [15,16),[16,17],将其按从左到右的顺序分别编号为 第一组,第二组,…,第五组,如图是根据试验数据 制成的频率分布直方图.已知第一组与第二组共有20人,
解析 本题属于分层抽样,设该学校的教师人数为x,
所以3126000=160-x 150,所以 x=200.
(1)随机抽样各种方法中,每个个体被抽到的概率
思 都是相等的;(2)系统抽样又称“等距”抽样,被 维 抽到的各个号码间隔相同;分层抽样满足:各层
升
华 抽取的比例都等于样本容量在总体容量中的比例.
B.16
C.17 D.18
解析 由系统抽样方法,知按编号依次每30个编号作 为一组,共分49组, 高二学生的编号为496到988,在第17组到第33组内, 第17组抽取的编号为16×30+23=503,为高二学生, 第33组抽取的编号为32×30+23=983,为高二学生, 故共抽取高二学生人数为33-16=17,故选C. 答案 C
思 值、众数和中位数、方差等.
维 升
(2)由样本数据估计总体时,样本方差越小,数
华 据越稳定,波动越小.
变式训练2
(1)某商场在庆元宵促销活动中,对
元宵节9时至14时的销售额进行统
计,其频率分布直方图如图所示,
已知9时至10时的销售额为2.5万
元,则11时至12时的销售额为____
万元.
10
解析 由频率分布直方图可知:0.10=2.5,
(2)PM2.5是指大气中直径小于或等于 2.5微米的颗粒物,也称为可入肺颗
粒物,如图是根据某地某日早7点至
晚8点甲、乙两个PM2.5监测点统计的 数据(单位:毫克/每立方米)列出的茎
叶图,则甲、乙两地浓度的方差较小的是( )
A.甲
B.乙
C.甲乙相等
D.无法确定
思维启迪
直接根据公式计算方差.
解析 x甲=(0.042+0.053+0.059+0.061+0.062+
解析 A中,a=6,b=14,c=10,d=22,a+b =20,c+d=32,a+c=16,b+d=36,n=52,
K2=52×20×6×322×2-161×4×36102=1
13 440.
B中,a=4,b=16,c=12,d=20,a+b=20,c +d=32,a+c=16,b+d=36,n=52,
2.常用的统计图表 (1)频率分布直方图
频率 ①小长方形的面积=组距×组距=频率;
②各小长方形的面积之和等于1;
③小长方形的高=频组率距,所有小长方形的高的和为组1距.
(2)茎叶图 在样本数据较少时,用茎叶图表示数据的效果较好. 3.用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数
读
处命题,也会出现解答题,都属于中、低档题.
主干知识梳理
1.随机抽样 (1)简单随机抽样特点是从总体中逐个抽取.适用范围:总 体中的个体较少. (2)系统抽样特点是将总体均分成几部分,按事先确定的 规则在各部分中抽取.适用范围:总体中的个体数较多. (3)分层抽样特点是将总体分成几层,分层进行抽取.适用 范围:总体由差异明显的几部分组成.
0.95x+a^,则a^等于( )
A.1.30 B.1.45 C.1.65 D.1.80
解析 依题意得, x=16×(0+1+4+5+6+8)=4, y =16(1.3+1.8+5.6+6.1+7.4+9.3)=5.25; 又直线y^=0.95x+a^必过样本点中心( x, y),
所以抽取编号落入区间[481,720]的人数为
720-480=240 =12. 20 20
答案 B
(2)某学校共有师生3 200人,现用分层抽样的方法,从所 有师生中抽取一个容量为160的样本,已知从学生中抽取 的人数为150,那么该学校的教师人数是________.
200
思维启迪 分层抽样最重要的是各层的比例.
视 力 好 差 总计 性别 男 4 16 20 女 12 20 32 总计 16 36 52
表3
智 商 性别 男 女 总计
偏高
8 8 16
正常 总计
12 20 24 32 36 52
表4
阅
读量 丰富 不丰富 总计
性别 男 女
思维启迪
14
6
20
根据列
联表,计
2
30
32
算K2的值
A.成总绩 计 B.视力16 C.智3商6 D.5阅2读量