2024版新教材高考数学全程一轮总复习第九章统计与成对数据的统计分析第二节成对数据的统计分析课件
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
关键能力·题型突破
题型一 成对数据的统计相关性 例 1 (1)对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图 如图①,对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图 如图②.由这两个散点图可以判断( ) A.变量x与y正相关,u与v正相关 B.变量x与y正相关,u与v负相关 C.变量x与y负相关,u与v正相关 D.变量x与y负相关,u与v负相关
Y
Y=0 Y=1
a
b
c
d
a+c b+d
合计
a+b c+d n=a+b+c+d
(2)独立性检验
依据上述2×2列联表构造统计量χ2=
a+b
n ad−bc 2 c+d a+c
b+d
.
利用χ2的取值推断分类变量X和Y_是__否_独__立__的方法称为χ2独立性检验,
读作“卡方独立性检验”,简称独立性检验.
临界值表
α
0.1
0.05
0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
[常用结论] 1.经验回归直线过点(x,y). 2.求b时,常用公式b=∑i=∑in=n1x1xiy2i i--nn-x-x-y2 .
夯实双基 1.思考辨析(正确的打“√”,错误的打“×”) (1)两个随机变量的线性相关程度越强,相关系数的绝对值越接近
(2)说法“高度从 1 000 cm 长到 1 001 cm 所需时间超过一年”成立. 设其幼苗从观察之日起,第 m 天的高度为 1 000 cm, 有 1 000=2.1 m -0.4,解得 m≈226 939, 第 n 天的高度为 1 001 cm, 有 1 001=2.1 n -0.4,解得 n≈227 393, n-m=227 393-226 939=454 天, 所以说法“高度从 1 000 cm 长到 1 001 cm 所需时间超过一年”成立.
答案:A
(2)(多选)有一散点图如图所示,在5组(x,y)数据中去掉D(3,10)后, 下列说法正确的是( )
A.经验回归方程不变 B.样本相关系数r变大 C.各组数据对应的点到经验回归直线的 距离的平方和变小 D.变量x与变量y的相关程度变强
答案:BCD
题型二 回归模型 角度一 一元线性回归模型 例 2 [2023·广东普宁模拟]研究显示,越来越多的“996”上班族下班后 通过慢跑强身健体,慢跑属于一种有氧运动,可以消耗人体大量热量,
次数x 慢胞时间(单位:分钟)
1234567 15 18 27 23 20 29 36
题后师说
求经验回归方程的步骤
巩固训练2 [2023·福建厦门外国语学校期末]某医院用光电比色计检测尿汞时, 得尿汞含量(毫克/升)与消光系数的数据如下表:
尿汞含量x 2 4 6 8 10 消光系数y 64 138 205 285 360
A.yො=x+1 B.yො=x+2 C.yො=2x+1 D.yො=x-1
答案:A
解析:易知变量 y 与 x 具有线性相关关系,且b^ =1,-x =2.5,-y =3.5,所 以a^ =3.5-1×2.5=1,故可得出经验回归方程为^y =x+1.故选 A.
4.(易错)“厉行节约,反对浪费”之风悄然吹开,某市通过随机询 问100名性别不同的居民是否能做到“光盘”行动,得到列联表:
坚持慢跑可以促进新陈代谢,增加肺活量以及增强心脏功能,提升人 体免疫力,因此深受青年人喜爱.如图统计了小明这100天每天慢跑 的时间情况(单位:分钟).
(1)求m的值. (2)如表是小明的同事小强本月前7次慢跑的时间情况;由散点图可 知,小强的慢跑次数x和慢跑时间y(单位:分钟)之间线性相关, ①求y关于x的经验回归方程yො =b x+aො ,其中b ,aො 使用分数形式表示; ②根据①中的运算结果预测小强第9次的慢跑时间是否会超过小明这 100天慢跑的平均时间.
否成立,并给出理由.
解析:(1)由散点图可知,这些数据集中在图中曲线的附近, 而曲线的形状与函数 y= x 的图象很相似, 因此可以用类似的表达式y^ =b x +a 来描述 y 与 x 的关系, 即三个函数中y^ =b x +a 的图象是拟合 y 与 x 的关系“最好”的曲线. 令 u= x ,则y^ =bu+a,根据已知数据,
得-u
=4,-y
=8,
7
u
iyi=283,
7
u
2 i
=140,
i=1
i=1
所以b^ =
=218430--77××4×168 =5298 ≈2.1,
又回归直线y^ =bu+a 经过点(4,8),所以 a=8-2.1×4=-0.4,
所以 y 关于 u 的回归直线方程为y^ =2.1u-0.4,即y^ =2.1 x -0.4.
(1)如果y与x之间具有线性相关关系,求y关于x的经验回归方程; (2)估计尿汞含量为9毫克/升时的消光系数(结果保留整数).
角度二 非线性回归模型
例 3 [2023·山东淄博模拟]小叶紫檀是珍稀树种,因其木质好备受玩 家喜爱,其幼苗从观察之日起,第x天的高度为y cm,测得数据如下:
x 1 4 9 16 25 36 49
A.0<r1<r2<1 B.0<r2<r1<1 C.-1<r1<r2<0 D.-1<r2<r1<0
答案:D
题后师说
判断数据的相关关系的三种方法
巩固训练1 (1)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关,下列结 论中正确的是( ) A.x与y负相关,x与z负相关 B.x与y正相关,x与z正相关 C.x与y正相关,x与z负相关 D.x与y负相关,x与z正相关
,其意义是 R2 越大,残差平
方和∑i=n1 (yi-^y i)2 越小,即模型的拟合效果越____好____;R2 越小,残差平
方和越大,即模型的拟合效果越____差____.
3.列联表与独立性检验 (1)2×2列联表 如图,给出成对分类变量数据的交叉分类频数的数据统计表称为 2×2列联表.
X
X=0 X=1 合计
0.( × ) (2)经验回归直线yො =b x+aො 至少经过点(x1,y1),(x2,y2),…,(xn,yn)
中的一个点.( × ) (3)事件X,Y关系越密切,则由观测数据计算得到的χ2越大.( √ ) (4)由独立性检验可知,在犯错误的概率不超过1%的前提下认为物理
成绩优秀与数学成绩优秀有关,某人数学成绩优秀,则他有99%的可 能物理成绩优秀.( × )
(3)线性相关关系与经验回归直线 如果两个变量的取值呈现正相关或负相关,而且散点落在一条
___直__线___附近,我们就称这两个变量之间具有线性相关关系,这条直
线叫做经验回归直线. (4)样本相关系数
①r=
∑ i=n1 (xi--x )(yi--y ) i∑=n1 (xi--x )2∑ i=n1 (yi--y )2
2.(教材改编)以下四个散点图中,变量x与y之间具有负的线性相关 关系的是( )
答案:C 解析:观察散点图可以看出B和C选项中的点都在直线附近,即具有线性相关关 系,而B中y随着x的增大而增大,具有正的线性相关关系,不合题意.C中y随着x 的增大而减小,具有负的线性相关关系.故选C.
3.(教材改编)实验测得四组(x,y)的值为(1,2),(2,3),(3,4), (4,5),则y与x之间的经验回归方程为( )
知识梳理 1.变量的相关关系 (1)相关关系 两个变量有关系,但又没有确切到可由其中一个去精确地决定另一
个的程度,这种关系称为相关关系. (2)正相关、负相关 从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现
___增__加___的趋势,我们就称这两个变量正相关; 如果当一个变量的 值增加时,另一个变量的相应值呈现___减__少___的趋势,则称这两个变 量负相关.
经验回归公式,其图形称为经验回归直线,其中
b^=i∑=n1
来自百度文库
(xi--x )(yi--y ) i∑=n1 (xi--x )2
a^=-y -b^-x
(2)残差:观测值减去__预__测_值___,称为残差.
(3)利用 R2 刻画回归效果
R2
的计算公式为
R2=1-∑i∑i=n=n11
(yi-^yi)2 (yi--y )2
答案:C
5.(易错)在一次考试中,5名学生的数学和物理成绩如下表(已知学 生的数学和物理成绩具有线性相关关系):
学生的编号i 1 2 3 4 5 数学成绩x 80 75 70 65 60 物理成绩y 70 66 68 64 62
现已知其经验回归方程为yො=0.36x+aො,则根据此经验回归方程估计 数学得90分的同学的物理成绩为____7_3___分.(四舍五入取整数)
答案:C
(2)[2023·安徽合肥八中模拟]如图是相关变量x,y的散点图,现对这 两个变量进行线性相关分析,方案一:根据图中所有数据,得到经验 回归方程yො =b 1x+aො 1,相关系数为r1;方案二:剔除点(10,21),根据 剩下数据得到经验回归方程yො=b2x+aො2,相关系数为r2.则( )
分类 做不到“光盘” 能做到“光盘”
男
45
10
女
30
15
α 0.1 0.05 0.01 xα 2.706 3.841 6.635
由此列联表得到的正确结论是( ) A.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到 ‘光盘’与性别有关” B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到 ‘光盘’与性别无关” C.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到 ‘光盘’与性别有关” D.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到 ‘光盘’与性别无关”
;
②当r>0时,表明成对样本数据___正__相_关____;当r<0时,表明成对样 本数据_负__相__关___.
r的绝对值越接近1,表明成对样本数据的线性相关程度___越_强____.r 的绝对值越接近0,表明成对样本数据的线性相关程度___越__弱___.
2.一元线性回归模型
(1)经验回归方程 我们将yො =b x+aො 称为y关于x的经验回归方程,也称经验回归函数或
题后师说
解决非线性回归模型的应用问题的关键是对非线性回归函数模型作 变换,一般思路是换元,化非线性为线性,进而应用线性回归的方法 进行求解.如
①若yො=aො + b x,设t= x,则yො=aො + bt; ②若满足对数式:yො=aො + bln x,设t=ln x,则yො=aො + bt; ③若满足指数式:y=c1ec2x,两边取对数得ln y=ln c1+c2x,设z= ln y,aො=ln c1,b=c2,则zො=aො + bx.
巩固训练3 [2023·广东汕头模拟]汕头某药企为评估一款新药的药效和安全性, 组织一批志愿者进行临床用药实验,结果显示临床疗效评价指标A的 数量y与连续用药天数x具有相关关系.刚开始用药时,指标A的数量y 变化明显,随着天数增加,y的变化趋缓.根据志愿者的临床试验情 况,得到了一组数据(xi,yi),i=1,2,3,4,5,…,10,xi表示连 续用药i天,yi表示相应的临床疗效评价指标A的数值.该药企为了进 一步研究药物的临床效果,建立了y关于x的两个回归模型: 模型①:由最小二乘公式可求得y与x的经验回归方程:yො =2.50x- 2.50; 模型②:由图中样本点的分布,可以认为样本点集中在曲线:y= b ln x+aො 的附近 ,令 t=ln x,则 有 σi1=01 ti =22.00,σi1=01 yi =230, σi1=01 tiyi=569.00,σi1=01 ti2=50.92.
第二节 成对数据的统计分析
必备知识·夯实双基
关键能力·题型突破
【课标标准】
1.了解样本相关系数的统计意义. 2.了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计 方法,会用一元线性回归模型进行预测. 3.理解2×2列联表的统计意义,了解2×2列联表独立性检验及其应 用.
必备知识·夯实双基
y047
9
11 12 13
数据的散点图如图所示:
为近似描述y与x的关系,除了一次函数yො=bx+a,还有yො=b x+a和 yො=bx2+a两个函数可选.
(1)从三个函数中选出“最好”的曲线拟合y与x的关系,并求出其回 归方程(b 保留到小数点后1位);
(2)判断说法“高度从1 000 cm长到1 001 cm所需时间超过一年”是