高考数学复习考点知识讲解课件51 成对数据的统计分析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(新教材) 高三总复习•数学
— 返回 —
[解析] 由给出的四组数据的散点图可以看出,r1,r3大于0,r2,r4小于0,题图1和 题图2的点相对更加集中,所以r1接近于1,r2接近于-1,由此可得r2<r4<0<r3<r1.故选A.
— 15 —
(新教材) 高三总复习•数学
— 返回 —
3.(2022·江西南昌一模)根据分类变量x与y的观察数据,计算得到χ2=2.974,依据下 表给出的χ2独立性检验中的小概率值和相应的临界值,作出下列判断,正确的是( D )
样本号 i 1 2 3 4 5 6 7 8 9 10 总和 根部横截
0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6 面积 xi 材积量 yi 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9
n
xi--x yi--y
n xiyi-n-x -y
其中b^=i=1
n
xi--x 2
i=1
=
,
n xi2-n-x 2
i=1
i=1
a^=-y -b^-x .
— 7—
(新教材) 高三总复习•数学
— 返回 —
(2)利用决定系数R2刻画回归效果
n
yi-^yi2
i=1
R2=1-
,R2越 大 ,即拟合效果越好,R2越 小 ,模型拟合效果越差.
— 9—
(新教材) 高三总复习•数学
— 返回 —
(2)临界值
χ2=
nad-bc2 a+bc+da+cb+d
.忽略χ2的实际分布与该近似分布的误差后,对于任何小
概率值α,可以找到相应的正实数xα,使得P(χ2≥xα)=α成立.我们称xα为α的临界值,这 个临界值就可作为判断χ2大小的标准.
(3)独立性检验
— 4—
(新教材) 高三总复习•数学
2.样本相关系数 (1)相关系数r的计算 变量x和变量y的样本相关系数r的计算公式如下:
n
xi--x yi--y
i=1
r=
.
n
xi--x 2
n
yi--y 2
i=1
i=1
— 返回 —
— 5—
(新教材) 高三总复习•数学
— 返回 —
(2)相关系数r的性质 ①当r>0时,称成对样本数据 正 相关;当r<0时,成对样本数据 负 相关;当r=0
97+a 5
,所以这组数据的样本中心点为
750,97+ 5 a
,代入回归直线方
程得,97+ 5 a=0.035×750-3.25,解得a=18.
— 20 —
— 返回 —
核心考点突破
02
(新教材) 高三总复习•数学
— 返回 —
对点训练
考点一 成对数据的相关性——自主练透
1.(2022·重庆诊断)某商家今年上半年各月的人均销售额(单位:千元)与利润率统计 表如下:
由此散点图,在10℃至40℃之间,下面四个经验回归方程类型中最适宜作为发芽率y 和温度x的经验回归方程类型的是( D )
A.y=a+bx B.y=a+bx2 C.y=a+bex D.y=a+blnx
— 17 —
(新教材) 高三总复习•数学
— 返回 —
[解析] 根据题中散点图可知,散点大致分布在某一条“对数型”函数曲线的周 围,而A选项是“直线型”的拟合函数,B选项是“抛物线型”的拟合函数,C选项是 “指数型”的拟合函数,只有D选项的拟合函数更符合.故选D.
时,成对样本数据间没有线性相关关系. ②样本相关系数r的取值范围为 [-1,1] . 当|r|越接近1时,成对样本数据的线性相关程度越 强 . 当|r|越接近0时,成对样本数据的线性相关程度越 弱 .
— 6—
(新教材) 高三总复习•数学
— 返回 —
3.一元线性回归模型 (1)经验回归方程与最小二乘法 我们将 ^y = b^ x+ a^ 称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式, 其图形称为经验回归直线.这种求经验回归方程的方法叫做最小二乘法,求得的 b^ , a^ 叫 做b,a的最小二乘估计,
— 2—
— 返回 —
基础知识夯实
01
(新教材) 高三总复习•数学
— 返回 —
知识梳理 1.变量的相关关系 (1)相关关系 两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这 种关系称为相关关系. (2)相关关系的分类:正相关和负相关. (3)线性相关 一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在 一条直线 附 近,我们就称这两个变量线性相关. 一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非 线性相关或曲线相关.
高考数学复习考点知识讲解课件
第三节 成对数据的统计分析
基础知识夯实 核心考点突破
(新教材) 高三总复习•数学
— 返回 —
考试要求:1.结合实例,了解样本相关系数的统计含义,了解样本相关系数与标准 化数据向量夹角的关系;2.结合实例,会通过相关系数比较多组成对数据的相关性;3.结 合具体实例,了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘 原理,掌握一元线性回归模型参数的最小二乘估计方法;4.针对实际问题,会用一元线 性回归模型进行预测;5.掌握分类变量的含义,通过实例,理解2×2列联表的统计意 义,了解2×2列联表独立性检验及其应用.
10
10
10
并计算得x2i =0.038,y2i =1.6158,xiyi=0.2474.
i=1
i=1
i=1
— 24 —
(新教材) 高三总复习•数学
— 返回 —
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到 0.01).
[解析] 在两个变量 y 与 x 的回归模型中,它们的决定系数 R2 越接近 1,模型拟合效 果越好,在四个选项中 A 的决定系数最大,所以拟合效果最好的是模型 1.
— 23 —
(新教材) 高三总复习•数学
— 返回 —
3.(2022·全国乙卷节选)某地经过多年的环境治理,已将荒山改造成了绿水青山.为 估计一林区某种树木的总材积量,随机选取了 10 棵这种树木,测量每棵树的根部横截面 积(单位:m2)和材积量(单位:m3),得到如下数据:
月份
1
2
34
5
6
人均销售额
6
5
83
4
7
利润率(%) 12.6 10.4 18.5 3.0 8.1 16.3
根据表中数据,下列说法正确的是( A )
A.利润率与人均销售额成正相关关系
B.利润率与人均销售额成负相关关系
C.利润率与人均销售额成正比例函数关系
D.利润率与人均销售额成反比例函数关系
[解析] 由统计表可得利润率与人均销售额不是正比例关系,也不是反比例关系,排
— 18 —
(新教材) 高三总复习•数学
— 返回 —
5.(教材P96T3改编)某校一个课外兴趣小组统计了一些地区鸟的种类数与该地区海拔
高度的数据得到了如下的表格,并由此计算得到的经验回归方程为^y=0.035x-3.25,
后来小组成员不慎将下表的统计数据a丢失.则表中丢失的统计数据a=_____1_8____.
地区
A
B
CDE
海拔/米(x)
1256 1003 751 496 244
鸟的种类/种(y)
35
25 22 a 15
— 19 —
(新教材) 高三总复习•数学
— 返回 —
[解析]
由表格数据可知,
-x
=
1 5
(1256+1003+751+496+244)=750,
-y
=
1 5
(35+
25+22+a+15)=
α 0.1 0.05 0.01 0.005 0.001 xα 2.706 3.841 6.635 7.879 10.828 A.有95%的把握认为变量x与y独立 B.有95%的把握认为变量x与y不独立 C.变量x与y独立,这个结论犯错误的概率不超过10% D.变量x与y不独立,这个结论犯错误的概率不超过10%
i=1
=(0.2474-10×0.06×0.39)÷( 0.038-10×0.062× 1.6158-10×0.392)
=
0.0134 0.002× 0.0948
= 1.809.061×3410-4≈113374.7≈0.97,
所以该林区这种树木的根部横截面积与材积量的样本相关系数是 0.97.
— 26 —
— 12 —
(新教材) 高三总复习•数学
— 返回 —
诊断自测 1.判断下列结论是否正确(请在括号中打“√”或“×”) (1)散点图是判断两个变量相关关系的一种重要方法和手段.( √ ) (2)经验回归直线 ^y = b^ x+ a^ 至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个 点.( × ) (3)样本相关系数的绝对值越接近1,成对样本数据的线性相关程度越强.( √ ) (4)若分类变量X,Y关系越密切,则由观测数据计算得到的χ2的观测值越小.( × )
(新教材) 高三总复习•数学
— 返回 —
下表给出了χ2独立性检验中几个常用的小概率值和相应的临界值
α
0.1
0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
— 11 —
(新教材) 高三总复习•数学
— 返回 —
常用结论 1.求解经验回归方程的关键是确定回归系数 a^ , b^ ,应充分利用经验回归直线过样本 点的中心(-x ,-y ). 2.根据经验回归方程计算的^y值,仅是一个预报值,不是真实发生的值. 3.根据χ2的值可以判断两个分类变量有关的可信程度,若χ2越大,则两分类变量有 关的把握越大.
— 13 —
(新教材) 高三总复习•数学
— 返回 —
2.(教材P103T1改编)对四组数据进行统计,获得以下散点图,关于其样本相关系数的 比较,正确的是( A )
A.r2<r4<0<r3<r1 B.r4<r2<0<r1<r3 C.r4<r2<0<r3<r1 D.r2<r4<0<r1<r3
— 14 —
基于小概率值α的检验规则是:
当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超
过α;
当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立. 这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方
独立性检验”,简称独立性检验.
— 10 —
除 C 和 D;其属于正相关关系,A 正确,B 错误.
— 22 —
(新教材) 高三总复习•数学
— 返回 —
2.两个变量 y 与 x 的回归模型中,分别选择了 4 个不同模型,它们的决定系数 R2 如下,其中拟合效果最好的模型是( A )
A.模型 1 的决定系数 R2 为 0.98 B.模型 2 的决定系数 R2 为 0.80 C.模型 3 的决定系数 R2 为 0.50 D.模型 4 的决定系数 R2 为 0.25
(新教材) 高三总复习•数学
附:相关系数
n
∑ xi- x yi- y
r=
i=1
n
∑
xi- x 2∑n
, yi- y 2
1.896≈1.377.
i=1
i=1
10
10
[解] (1)由题意可知xi=0.6,yi=3.9,所以这 10 棵树木的根部横截面积和材积
i=1
i=1
量的平均值分别为-x =110i= 101xi=0.06,-y =110i= 101yi=0.39,所以估计该林区这种树木平均一
n
yi--y 2
i=1
— 8—
(新教材) 高三总复习•数学
— 返回 —
4.列联表与独立性检验 (1)2×2列联表 一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2 列联表为
Hale Waihona Puke xx=x1 x=x2 合计
y y=y1
a c a+c
y=y2 b d
b+d
合计
a+b c+d n=a+b+c+d
棵的根部横截面积与平均一棵的材积量分别为 0.06 和 0.39.
— 25 —
(新教材) 高三总复习•数学
— 返回 —
(2)因为 r=
10
xi--x yi--y
i=1
=
10
xi--x 2
10
yi--y 2
i=1
i=1
10 xiyi-10-x -y
i=1
10 x2i -10-x 2·
i=1
10 y2i -10-y 2
[解析] 因为χ2=2.974>2.706,所以变量x与y不相互独立,这个结论犯错误的概率 不超过10%.
— 16 —
(新教材) 高三总复习•数学
— 返回 —
4.某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系, 在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下 面的散点图: