(新课标)高三数学一轮复习 第9篇 变量间的相关关系与统计案例学案 理

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第六十三课时 变量间的相关关系与统计案例
课前预习案
1.会作两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系.
2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆).
3.了解回归的基本思想、方法及其简单应用.
4.了解独立性检验的思想、方法及其初步应用
.
1.相关关系的判断
(1)散点图直观反映了两变量的成对观测值之间存在的某种关系,利用散点图可以初步判断两个变量之间是否线性相关.如果散点图中点的分布从整体上看大致在一条直线的附近,我们说变量x 和y 具有 相关关系.
(2)相关系数r =
∑i =1n
(x i -x )(y i -y
)
∑i =1
n
(x i -x
)
2
∑i =1
n
(y i -y
)
2
, 当r>0时,两变量 相关,当r<0时,两变量 相关,当|r|≤1且|r|越接近于1,相关程度 ,当|r|≤1且|r|越接近于0,相关程度 . 2.最小二乘法求回归直线方程 (1)设线性回归方程为y ^=b ^x +a ^,
⎩⎪⎨⎪⎧
b ^=∑i =1n (x i
-x )(y i
-y )∑i =1n (x i -x )2
=∑i =1n
x i y i
-n x y
∑i =1
n
x 2
i
-n x
2

a ^=y -
b ^ x .
(2)回归直线一定经过样本的中心点 ,据此性质可以解决有关的计算问题. 3.独立性检验
(1)独立性检验的有关概念 ①分类变量
可用变量的不同“值”表示个体所属的 的变量称为分类变量.
②2×2列联表
假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:
(2)独立性检验
利用随机变量K2=n(ad-bc)2
(a+b)(c+d)(a+c)(b+d)
(其中n=a+b+c+d为样本容量)来判断“两个变量有关系”的方法称为独立性检验.
步骤如下:
①计算随机变量K2的观测值k,查下表确定临界值k0:
00
错误的概率不超过P(K2≥k0)的前提下不能推断“X与Y有关系”.
1.下列两个变量之间的关系是相关关系的是( ).
A.正方体的棱长与体积
B.单位面积的产量为常数时,土地面积与总产量
C.日照时间与水稻的亩产量
D.电压一定时,电流与电阻
2.对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图(1);对变量u,v有观测数据(u i,v i)(i =1,2,…,10),得散点图(2).由这两个散点图可以判断( ).
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
3.(2012·湖南)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组
样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^
=0.85x -85.71,则下列结论中不正确的是( ).
A .y 与x 具有正的线性相关关系
B .回归直线过样本点的中心(x ,y )
C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kg
D .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg
4.为了评价某个电视栏目的改革效果,在改革前后分别从居民点抽取了100位居民进行调查,经过计算K 2
≈0.99,根据这一数据分析,下列说法正确的是( ). A .有99%的人认为该栏目优秀
B .有99%的人认为该栏目是否优秀与改革有关系
C .有99%的把握认为电视栏目是否优秀与改革有关系
D .没有理由认为电视栏目是否优秀与改革有关系
5.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的线性回归方程:y ^
=0.254x +0.321.由线性回归方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
课堂探究案
考点1 线性相关关系的判断
【典例1】下表是某小卖部6天卖出的热茶的杯数与当天气温的对比表.
(1)(2)你能依据散点图指出气温与热茶杯数的关系吗?
(3)如果气温与卖出热茶杯数近似成线性相关关系的话,请画出一条直线来近似地表示这种线性相关关系.
【变式1】 5个学生的数学和物理成绩如下表:
考点2 线性回归方程及其应用
【典例2】(2012·福建)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
(1)求回归直线方程y ^=b x +a ,其中b =-20,a =y -b x ;
(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)
【变式2】 (2013·南昌模拟)以下是某地搜集到的新房屋的销售价格y 和房屋的面积x 的数据.
(1)(2)据(1)的结果估计当房屋面积为150 m 2
时的销售价格.
考点3 独立性检验的基本思想及应用
【典例3】在调查男女乘客是否晕机的事件中,已知男乘客晕机的为28人,不晕机的也是28人,而女乘客晕机的为28人,不晕机的为56人. (1)根据以上数据建立一个2×2的列联表;
(2)能否在犯错误的概率不超过0.05的前提下认为晕机与性别有关系?
(可能用到的公式:K 2
=n (ad -bc )2
(a +b )(c +d )(a +c )(b +d )
,可能用到的数据:P (K 2≥3.841)=0.05,P (K 2≥5.024)
=0.025)
【变式3】某学生对其亲属30人的饮食习惯进行了一次调查,并用下图所示的茎叶图表示30人的饮食指数.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主)
(1)根据以上数据完成下列2×2列联表:
(2)能否有99%
1.(2012·新课标全国)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =1
2x +1上,则这组样本数据的样本相
关系数为( ). A .-1
B .0
C.1
2
D .1
2.(2013·长春调研)已知x ,y 取值如下表:
从所得的散点图分析可知:y 与x 线性相关,且y =0.95x +a ,则a =( ). A .1.30
B .1.45
C .1.65
D .1.80
3.(2011·陕西)设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 个样本点,直线l 是由这些样本点
通过最小二乘法得到的线性回归直线(如图),以下结论正确的是
( ).
A .直线l 过点(x ,y )
B .x 和y 的相关系数为直线l 的斜率
C .x 和y 的相关系数在0到1之间
D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同 4.(2011·山东)某产品的广告费用x 与销售额y 的统计数据如下表:
根据上表可得回归方程y =b x +a 中的b 为9.4,据此模型预报广告费用为6万元时销售额为 ( ). A .63.6万元
B .65.5万元
C .67.7万元
D .72.0万元
课后拓展案
组全员必做题
1.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:
则y 对x A .y =x -1
B .y =x +1
C .y =88+1
2x D .y =176
2.(2013·福州模拟)下列说法:
①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变; ②设有一个回归方程y ^
=3-5x ,变量x 增加一个单位时,y 平均增加5个单位; ③线性回归方程y ^=b ^x +a ^
必过(x ,y );
④在一个2×2列联表中,由计算得K 2
的观测值k =13.079,则在犯错误的概率不超过0.001的前提下认为这两个变量间有关系.
其中错误的个数是 ( ). A .0 B .1 C .2 D .3
3.已知施化肥量x 与水稻产量y 的试验数据如下表,则变量x 与变量y 是________相关(填“正”或“负”).
4.(2013·唐山统一考试)考古学家通过始祖鸟化石标本发现:其股骨长度x (cm)与肱骨长度y (cm)的线性回归方程为y ^
=1.197x -3.660,由此估计,当股骨长度为50 cm 时,肱骨长度的估计值为________ cm. 5.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:
已知P (K 2
≥3.841)≈0.05,P (K 2
根据表中数据,得到K 2
=50×(13×20-10×7)2
23×27×20×30
≈4.844.
则认为选修文科与性别有关系出错的可能性为________.
组提高选做题
1.某班主任对全班50名学生进行了作业量多少的调查.数据如下表:
(1)(2)试通过计算说明在犯错误的概率不超过多少的前提下认为喜欢玩游戏与作业量的多少有关系? 附:
K 2
=n ((a +b )(c +d )(a +c )(b +d )
2.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据.
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^

(3)已知该厂技改前生产100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
参考答案
1.【答案】C
【解析】A ,B ,D 中两个变量间的关系都是确定的,所以是函数关系;C 中的两个变量间是相关关系,对于日照时间一定的水稻,仍可以有不同的亩产量,故选C. 2.【答案】C
【解析】由图(1)可知,各点整体呈递减趋势,x 与y 负相关;由图(2)可知,各点整体呈递增趋势,u 与v 正相关. 3.【答案】D
【解析】根据线性回归方程中各系数的意义求解.由于线性回归方程中x 的系数为0.85,因此y 与x 具有正的线性相关关系,故A 正确.又线性回归方程必过样本中心点(x ,y ),因此B 正确.由线性回归方程中系数的意义知,x 每增加1 cm ,其体重约增加0.85 kg ,故C 正确.当某女生的身高为170 cm 时,其体重估计值是58.79 kg ,而不是具体值,因此D 不正确. 4.【答案】D
【解析】只有K 2
≥6.635才能有99%的把握认为电视栏目是否优秀与改革有关系,而即使K 2
≥6.635也
只是对“电视栏目是否优秀与改革有关系”这个论断成立的可能性大小的结论,与是否有99%的人等无关.故D 正确. 5.【答案】0.254
【解析】由题意,知其回归系数为0.254,故家庭年收入每增加1万元,年饮食支出平均增加0.254万元.
【典例1】【解析】(1)画出的散点图如图.
(2)从图中可以发现气温和热茶杯数具有相关关系,气温和热茶杯数成负相关,图中的各点大致分布在一条直线的附近,因此气温和杯数近似成线性相关关系.
(3)根据不同的标准,可以画出不同的直线来近似表示这种线性相关关系,如让画出的直线上方的点和下方的点数目相等.如图.
【变式1】【解析】把数学成绩作为横坐标,把相应的物理成绩作为纵坐标,在直角坐标系中描点(x i ,
y i )(i =1,2,…,5),作出散点图如图.
从图中可以直观地看出数学成绩和物理成绩具有相关关系,且当数学成绩增大时,物理成绩也在由小变大,即它们正相关.
【典例2】【解析】(1)由于x =16
(8+8.2+8.4+8.6+8.8+9)=8.5,
y =16
(90+84+83+80+75+68)=80,又b ^
=-20,
所以a ^=y -b ^
x =80+20×8.5=250, 从而回归直线方程为y ^
=-20x +250.
(2)设工厂获得的利润为L 元,依题意得
L =x (-20x +250)-4(-20x +250)
=-20x 2
+330x -1 000 =-20()x -8.252
+361.25.
当且仅当x =8.25时,L 取得最大值.
故当单价定为8.25元时,工厂可获得最大利润.
【变式2】【解析】(1)x =1
5
×(115+110+80+135+105)=109,
y =15
×(24.8+21.6+18.4+29.2+22)=23.2.
设所求回归直线方程为y ^=b ^x +a ^
,则
b ^=
∑i =15
(x i -x )(y i -y
)
∑i =1
5
(x i -x
)
2
=3081 570
≈0.196 2, ∴a ^=y -b ^
x =23.2-109×3081 570≈1.816 6.
∴所求回归直线方程为y ^
=0.196 2x +1.816 6.
(2)由第(1)问可知,当x =150 m 2
时,销售价格的估计值为 y ^
=0.196 2×150+1.816 6=31.246 6(万元).
【典例3】【解析】(1)2×2列联表如下:
(2)假设是否晕机与性别无关,则K 2
的观测值k =)2
56×84×56×84=359≈3.889,P (K 2≥3.841)
=0.05.
所以可以在犯错误的概率不超过0.05的前提下认为晕机与性别有关系. 【变式3】【解析】(1)2×2列联表如下:
(2)因为K 2
=30×(8-128)
2
12×18×20×10
=10>6.635,
所以有99%的把握认为其亲属的饮食习惯与年龄有关.
1.【答案】D
【解析】样本点都在直线上时,其数据的估计值与真实值是相等的,故其相关系数为1. 2.【答案】B
【解析】依题意得,x =16×(0+1+4+5+6+8)=4,y =1
6×(1.3+1.8+5.6+6.1+7.4+9.3)=
5.25.又直线y ^
=0.95x +a 必过样本中心点(x ,y ),即点(4,5.25),于是有5.25=0.95×4+a ,由此解得a =1.45,选B. 3.【答案】A
【解析】由样本的中心(x ,y )落在回归直线上可知A 正确;x 和y 的相关系数表示为x 与y 之间的线性相关程度,不表示直线l 的斜率,故B 错;x 和y 的相关系数应在-1到1之间,故C 错;分布在回归直线两侧的样本点的个数并不绝对平均,无论样本点个数是奇数还是偶数,故D 错. 4.【答案】B
【解析】x =4+2+3+54
=3.5(万元),
y =
49+26+39+54
4
=42(万元),
∴a ^=y -b ^
x =42-9.4×3.5=9.1, ∴回归方程为y ^
=9.4x +9.1,
∴当x =6(万元)时,y ^
=9.4×6+9.1=65.5(万元).
组全员必做题
1.【答案】C
【解析】由题意得x =
174+176+176+176+178
5
=176(cm),
y =
175+175+176+177+177
5
=176(cm),由于(x ,y )一定满足线性回归方程,经验证知选C.
2.【答案】B
【解析】只有②错误,应该是y 平均减少5个单位. 3.【答案】正
【解析】因为散点图能直观地反映两个变量是否具有相关关系,所以画出散点图如图所示:
通过观察图象可知变量x 与变量y 是正相关.
4.【答案】56.19
【解析】根据线性回归方程y ^=1.197x -3.660,将x =50代入得y =56.19,则肱骨长度的估计值为56.19
cm.
5.【答案】5%
【解析】∵K 2
≈4.844,这表明小概率事件发生.根据假设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为5%.
组提高选做题
1.解:(1)
(2)将表中的数据代入公式K 2=(a +b )(c +d )(a +c )(b +d )得到K 2的观测值k =50×(18×15-8×9)226×24×27×23
≈5.059>5.024,
查表知P (K 2
≥5.024)=0.025,即说明在犯错误的概率不超过0.025的前提下认为喜欢玩游戏与作业量的多少有关系.
2.【解析】(1)由题设所给数据,可得散点图如图所示.
(2)由对照数据,计算得:∑i =1
4
x 2
i =86, x =3+4+5+64=4.5(吨),y =2.5+3+4+4.54
=3.5(吨). 已知∑i =1
4
x i y i =66.5,
所以,由最小二乘法确定的回归方程的系数为:
b ^=∑i =14
x i y i -4x ·y
∑i =1
4
x 2
i -4x 2=66.5-4×4.5×3.586-4×4.52=0.7, a ^=y -b ^x =3.5-0.7×4.5=0.35.
因此,所求的线性回归方程为y ^=0.7x +0.35.
(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为: 90-(0.7×100+0.35)=19.65(吨标准煤).。

相关文档
最新文档