高考数学一轮总复习:线性回归分析与统计案例

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

答案 B 解析 根据相关关系的概念知 A 正确;当 r>0 时,r 越大, 相关性越强,当 r<0 时,r 越大,相关性越弱,故 B 不正确;对 于一组数据的拟合程度的好坏的评价,一是残差点分布的带状区 域越窄,拟合效果越好,二是 R2 越大,拟合效果越好,所以 R2 为 0.98 的模型比 R2 为 0.80 的模型拟合的效果好,C,D 正确, 故选 B.
3.下列说法错误的是( ) A.自变量取值一定时,因变量的取值带有一定随机性的两 个变量之间的关系叫做相关关系 B.在线性回归分析中,相关系数 r 的值越大,变量间的相 关性越强 C.在残差图中,残差点分布的带状区域的宽度越狭窄,其 模型拟合的精度越高 D.在回归分析中,R2 为 0.98 的模型比 R2 为 0.80 的模型拟 合的效果好
B.有 97.5%以上的把握认为“爱好该项运动与性别无关”
C.在犯错误的概率不超过 5%的前提下,认为“爱好该项运 动与性别有关”
D.在犯错误的概率不超过 5%的前提下,认为“爱好该项运 动与性别无关”
答案 C
题型一 判断变量的相关性 (1)在一次对人体脂肪含量和年龄关系的研究中,研究人 员获得了一组样本数据,并制作成如图所示的人体脂肪含量与年 龄关系的散点图.根据该图,下列结论中正确的是( )
(4)相关系数.
①r=
n
∑ (xi--x )(yi--y )
i=1
n
nwenku.baidu.com

∑ (xi--x )2∑ (yi--y )2
i=1
r=1
②当 r>0 时,表明两个变量_正__相__关__;
当 r<0 时,表明两个变量_负__相__关__.
r 的绝对值越接近于 1,表明两个变量的线性相关性_越_强___.r
【答案】 B
(2)对四组数据进行统计,获得以下关于其相关系数的比较, 正确的是( )
A.r2<r4<0<r3<r1 C.r4<r2<0<r3<r1
B.r4<r2<0<r1<r3 D.r2<r4<0<r1<r3
【解析】 由相关系数的定义及散点图所表达的含义,可知 r2<r4<0<r3<r1,故选 A.
B.0<r2<r1 D.r2=r1
【解析】 对于变量 Y 与 X 而言,Y 随 X 的增大而增大, 故 Y 与 X 成正相关,即 r1>0;对于变量 V 与 U 而言,V 随 U 的 增大而减小,故 V 与 U 成负相关,即 r2<0,所以有 r2<0<r1.
【答案】 C
(2)四名同学根据各自的样本数据研究变量 x,y 之间的相关 关系,并求得回归直线方程,分别得到以下四个结论:
(11.3,2),(11.8,3),(12.5,4),(13,5);与变量 U 与 V 相对应
的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1 表示变量 y 与 x 之间的线性相关系数,r2 表示变量 V 与 U 之间的 线性相关系数,则( )
A.r2<r1<0 C.r2<0<r1
的绝对值越接近于 0 时,表明两个变量之间__几_乎__不__存_在__线_性__相_关___ __关_系___.通常|r|大于_0_.7_5__时,认为两个变量有很强的线性相关性.
独立性检验
(1)分类变量:变量的不同“值”表示个体所属的__不_同__类_别___,
像这样的变量称为分类变量.
(2)列联表:列出两个分类变量的___频_数__表___,称为列联表.假
n
n
∑ (xi--x )(yi--y ) ∑xiyi-n-x -y
b^=i=1 n
=i=1 n
∑ (xi--x )2
i=1
∑xi2-n-x 2
i=1
a^=-y -b^-x
(-x ,-y )称为样本点的中心点.
(3)回归分析:对具有__相__关_关__系___的两个变量进行统计分析的
一种常用方法.
(3)独立性检验. 利用随机变量__K_2 __来确定是否能有一定把握认为“两个分 类变量_有__关_系___”的方法称为两个分类变量的独立性检验.
1.判断下面结论是否正确(打“√”或“×”). (1)“名师出高徒”可以解释为教师的教学水平与学生的水 平成正相关关系. (2)两个随机变量的线性相关性越强,相关系数的绝对值越接 近于 0. (3)某同学研究卖出的热饮杯数 y 与气温 x(℃)之间的关系, 得回归方程y^=-2.352x+147.767,则气温为 2 ℃时,一定可卖 出 143 杯热饮.
表1
停车距离 (10,20] (20,30] (30,40] (40,50] (50,60]
d(米)
频数
26
a
b
8
2
表2
平均每毫升血液 10 30 50 70 90
酒精含量 x(毫克)
平均停车距离 y(米) 30 50 60 70 90
已知表 1 数据的中位数估计值为 26,回答以下问题.
(1)求 a,b 的值,并估计驾驶员无酒状态下停车距离的平均
★状元笔记★ 判定两个变量正、负相关性的方法 (1)画散点图:点的分布从左下角到右上角,两个变量正相关; 点的分布从左上角到右下角,两个变量负相关. (2)相关系数:r>0 时,正相关;r<0 时,负相关. (3)线性回归方程中:b^>0 时,正相关;b^<0 时,负相关.
思考题 1 (1)与变量 X 与 Y 相对应的一组数据为(10,1),
n
A.使得∑[yi-(a+bxi)]最小 i=1
n
B.使得∑[yi-(a+bxi)2]最小 i=1
n
C.使得∑[yi2-(a+bxi)2]最小 i=1
n
D.使得∑[yi-(a+bxi)]2 最小 i=1
答案 D
解析 根据回归方程表示到各点距离之和最小的直线方程,
n
即总体偏差最小,亦即∑[yi-(a+bxi)]2 最小. i=1
A.人体脂肪含量与年龄正相关,且脂肪含量的中位数等于 20%
B.人体脂肪含量与年龄正相关,且脂肪含量的中位数小于 20%
C.人体脂肪含量与年龄负相关,且脂肪含量的中位数等于 20%
D.人体脂肪含量与年龄负相关,且脂肪含量的中位数小于 20%
【解析】 观察图形,可知人体脂肪含量与年龄正相关,且 脂肪含量的中位数小于 20%,故选 B.
请注意 1.以考查线性回归系数为主,同时可考查利用散点图判断 两个变量间的相关关系. 2.以实际生活为背景,重在考查回归方程的求法.
两个变量的线性相关 (1)正相关. 在散点图中,点散布在从__左__下_角__到__右_上__角__的区域.对于两 个变量的这种相关关系,我们将它们称为正相关. (2)负相关. 在散点图中,点散布在从__左__上_角__到__右_下__角__的区域,两个变 量的这种相关关系称为负相关.
设有两个分类变量 X 和 Y,它们的可能取值分别为{x1,x2}和{y1, y2},其样本频数列联表(称为 2×2 列联表)为
2×2 列联表
x1 x2 总计
y1 a c a+c
y2 B D b+d
总计 a+b c+d a+b+c+d
构造一个随机变量 K2=______________________________, 其中 n=__a_+__b_+_c_+__d__为样本容量.
(3)线性相关关系、回归直线. 如果散点图中点的分布从整体上看大致在_一__条__直_线__附_近___,就 称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
回归方程 (1)最小二乘法.求回归直线使得样本数据的点到回归直线的 __距__离_平__方__和_最__小___的方法叫做最小二乘法. (2)回归方程. 方程y^=b^x+a^是两个具有线性相关关系的变量的一组数据 (x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中a^,b^是待定参 数.
【答案】 A
【探究】 线性相关关系与函数关系的区别 (1)函数关系中的两个变量间是一种确定性关系.例如,正方 形面积 S 与边长 x 之间的关系 S=x2 就是函数关系. (2)相关关系是一种非确定性关系,即相关关系是随机变量与 随机变量之间的关系.例如,商品的销售额与广告费是相关关 系.两个变量具有相关关系是回归分析的前提.
4.(2014·湖北,理)根据如下样本数据
x3 4 5 6 7 8
-- y 4.0 2.5 -0.5 0.5
2.0 3.0
得到的回归方程为y^=b^x+a^,则( )
A.a^>0,b^>0
B.^a>0,b^<0
C.^a<0,b^ >0
D.a^<0,b^<0
答案 B 解析 根据题中表内数据画出散点图(图略),由散点图可知b^ <0,a^>0,选 B.
5.(2019·沧州七校联考)通过随机询问 200 名性别不同的大
学 生 是 否 爱 好 踢 毽 子 运 动 , 计 算 得 到 统 计 量 K2 的 观 测 值
k≈4.892,参照附表,得到的正确结论是( )
P(K2≥k) 0.10
0.05 0.025
k
2.706 3.841 5.024
A.有 97.5%以上的把握认为“爱好该项运动与性别有关”
数;
(2)根据最小二乘法,由表 2 的数据计算 y 关于 x 的回归方程
y^=b^x+a^;
(3) 该 测 试 团 队 认 为 : 若 驾 驶 员 酒 后 驾 车 的 平 均 “ 停 车 距
离”y 大于(1)中无酒状态下的停车距离平均数的 3 倍,则认定驾
驶员是“醉驾”.请根据(2)中的回归方程,预测当每毫升血液酒
(4)事件 X,Y 关系越密切,则由观测数据计算得到的 K2 的 观测值越大.
(5)由独立性检验可知,在犯错误的概率不超过 1%的前提下 认为物理成绩优秀与数学成绩有关,某人数学成绩优秀,则他有 99%的可能物理优秀.
答案 (1)√ (2)× (3)× (4)√ (5)×
2.最小二乘法的原理是( )
①y 与 x 负相关且y^=2.347x-6.423;
②y 与 x 负相关且y^=-3.476x+5.648;
③y 与 x 正相关且y^=5.437x+8.493;
④y 与 x 正相关且y^=-4.326x-4.578.
其中一定不正确的结论的序号是( )
A.①②
B.②③
C.③④
D.①④
【解析】 正相关指的是 y 随 x 的增大而增大.负相关指的 是 y 随 x 的增大而减小,故不正确的为①④,故选 D.
【答案】 D
题型二 线性回归分析 (2019·福建泉州一模)某测试团队为了研究“饮酒”对 “驾车安全”的影响,随机选取 100 名驾驶员先后在无酒状态、 酒后状态下进行“停车距离”测试,测试的方案:电脑模拟驾驶, 以某速度匀速行驶,记录下驾驶员的“停车距离”(驾驶员从看到 意外情况到车子停下所需要的距离),无酒状态与酒后状态下的试 验数据分别列于下表.
(3)由(1)知当 y>81 时,认定驾驶员是“醉驾”. 令y^>81,得 0.7x+25>81,解得 x>80, 则当每毫升血液酒精含量大于 80 毫克时认定为“醉驾”. 【答案】 (1)a=40 b=24 27 (2)y^=0.7x+25 (3)80
思考题 2 (2014·课标全国Ⅱ,理)某地区 2007 年至 2013
高考数学一轮总复习
第十章 算法初步及概率与统计
第7课时 线性回归分析与统计案例
…复习任务… 1.会作两个有关联变量的数据的散点图,会利用散点图认 识变量间的相关关系. 2.了解最小二乘法的思想,能根据给出的线性回归方程系 数公式建立线性回归方程. 3.了解独立性检验(只要求 2×2 列联表)的基本思想、方法 以及其简单应用. 4.了解回归分析的基本思想、方法及其简单应用.
精含量大于多少毫克时为“醉驾”?
n
∑xiyi-n-x -y
(附:回归方程y^=b^x+a^中,b^=i=1n
,a^=-y -b^-x )
∑xi2-n-x 2
i=1
【解析】 (1)依题意,得160a=50-26,解得 a=40. 又 a+b+36=100,解得 b=24, 故停车距离的平均数为 15×12060+25×14000+35×12040+45×1800+55×1020=27. (2)依题意,可知-x =50,-y =60, b^=10×30+30×1052+0+30520+×56002++7700× 2+7900+2-905××9500-2 5×50×60 =0.7,a^=60-0.7×50=25, 所以回归直线方程为y^=0.7x+25.
相关文档
最新文档