高考数学总复习 10-3相关关系、回归分析与性检验课件 新人教B版

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

夯实基础 稳固根基 1.变量间的相关关系 自变量取值一定时,因变量的取值带有一定的随机性的 两个变量之间的关系叫做相关关系.
夯实基础 稳固根基 2.两个变量的线性相关 (1)散点图 将样本中 n 个数据点(xi,yi)(i=1,2,…,n)描在平面直角 坐标系中,表示两个变量关系的一组数据的图形叫做散点图.
(1)求回归直线方程^y=bx+a,其中 b=-20,a= y -b x ; (2)预计在今后的销售中,销量与单价仍然服从(1)中的关系, 且该产品的成本是 4 元/件,为使工厂获得最大利润,该产品的 单价应定为多少元?(利润=销售收入-成本) 分析:(1)先求出 x 和 y ,然后再利用 a= y -b x 求出 a,近 而求出回归直线方程; (2)把利润 L 表示成单价 x(元)的函数,然后利用配方法求函 数的最值.
解析:(1)由于 x =16(x1+x2+x3+x4+x5+x6)=8.5, y =16(y1+y2+y3+y4+y5+y6)=80. 所以 a= y -b x =80+20×8.5=250,从而回归直线方程为 ^y=-20x+250. (2)设工厂获得的利润为 L 元,依题意得 L=x(-20x+250)-4(-20x+250) =-20x2+330x-1000
为休闲方式的概率和女性以看电视为休闲方式的概率;
(2)根据以上数据,能否有 99%的把握认为“在

时间段居民的休闲方式与性别有关系”?
参考公式:χ2=a+bcn+add-ab+cc2b+d,其中 n=a+b
+c+d.
参考数据:
P(χ2≥k0) 0.15 0.10 0.05 0.025 0.010
k0
疑难误区 点拨警示 1.线性回归方程中的系数a^、b^公式复杂莫记混用错. 2.使用 χ2 统计量作 2×2 列联表的独立性检验时,要求 表中的 4 个数据 n11、n12、n21、n22 都要大于 5,在选取样本的 容量时,要注意这一点.
思想方法技巧
1.建立回归模型的基本步骤: ①确定研究对象,明确解释变量和预报变量. ②画出散点图,观察它们是否存在相关关系.(如线性相 关关系) ③确定回归方程类型.(如线性回归方程y^ =b^x+a^) ④按一般规则估计回归方程中的参数.(如最小二乘法) ⑤得出结果后分析残差图有否异常,若存在异常,则检查 数据是否有误,模型是否恰当.
4.独立性检验
(1)若变量的不同“值”表示个体所属的不同类别,则这
些变量称为分类变量.
(2)两个分类变量 X 与 Y 的频数表,称为 2×2 列联表.
y1
y2
x1
a
b
x2
c
d
合计 a+b c+d
合计 a+c b+d a+b+c+d
在 2×2 列 联 表 中 , 随 机 变 量 K2 = a+bcn+add-ab+cc2b+d,其中 n=a+b+c+d 为样本容量, 用 K2 的取值范围可以判断“X 与 Y 有关系”的可信度,临界 值如表.(其中频数 a、b、c、d 都不小于 5)
x 3 45 6 y 2.5 3 4 4.5
(1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法求出 y 关于 x 的线性回归方程^y=b^x+a^; (3)已知该厂技改前 100t 甲产品的生产能耗为 90t 标准煤, 试根据(2)求出的线性回归方程,预测生产 100t 甲产品的生产 能耗比技改前降低多少吨标准煤? (参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
约为 P1=6800=34,
女性以看电视为休闲方式的概率为 P2=1200=12.
(2)提出假设 H0:休闲方式与性别无关系. 根据样本提供的 2×2 列联表得,
解析:-x =14(18+13+10-1)=10, -y =14(24+34+38+64)=40, ∴a=-y -(-2)×-x =60, ∴线性回归方程为^y=-2x+60,令 x=-4 得,^y=68.
答案:68
点评:线性回归方程的要求不高,要熟记回归方程^y=b^x +a^中的系数公式
n
3.独立性检验的步骤: ①据实际问题需要的可信度确定临界值 k0. ②利用公式,由观测数据,求出 χ2 的观测值 k. ③作判断,如果 k≥k0,就以(1-P(χ2≥k0))×100%的把握 认为“X 与 Y 有关系”,否则就说样本数据没有提供充分证据 说明“X 与 Y 有关系”.
考点典例讲练
散点图与相关关系的判断
解析:由图(1)可知,各点整体呈递减趋势,x 与 y 负相关, 由图(2)可知,各点整体呈递增趋势,u 与 v 正相关.
答案:C
x 和 y 的散点图如图,则下列说法中所有正确命题的序号为 ________.
①x,y 是负相关关系; ②在该相关关系中,若用 y=c1ec2x 拟合时的相关指数为 R21,用 y=bx+a 拟合时的相关指数为 R22,则 R21>R22; ③x、y 之间不能用回归直线方程作出预报.
n
xi- x yi- y
i=1
r=

n
n
xi- x 2· yi- y 2
i=1
i=1
数.
n
xiyi-n x ·y
i=1
叫做 y 与 x 间的相关系
n
x2i -n
-x
n
2y2i -n
-y
2
i=1
i=1
r 具有以下性质:|r|≤1,并且|r|越接近 1,线性相关程度 越强;|r|越接近 0,线性相关程度越弱.r>0 表明两变量正相 关,r<0 表明两变量负相关.
解析:①显然正确;由散点图知,用 y=c1ec2x 拟合的效 果比用 y=bx+a 拟合的效果要好,∴②正确;x,y 之间经过 变量代换,在建立回归直线方程后,可以用回归直线方程作出 预报.
答案:①②
利用回归直线方程对总体进行估计 [例 2] 下表提供了某厂节能降耗技术改造后生产甲产 品过程中记录的产量 x(t)与对应的生产能耗 y(吨标准煤)的几 组对应数据.
xi--x yi--y
n xiyi-n-x -y
i=1
b^=
n
xi--x 2
i=1


n x2i -n-x 2
i=1
i=1
a^=-y -b^-x .
(理)(2012·福建文,18)某工厂为了对新研发的一种产品进行 合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价 x(元) 8 8.2 8.4 8.6 8.8 9 销量 y(件) 90 84 83 80 75 68
独立性检验
[例 3] (文)(2012·山西太原模拟)为调查某社区居民的业
余生活状况,研究这一社区居民在

时间段的
休闲方式与性别的关系,随机调查了该社区 80 人,得到下面
的数据表:
休闲方式 看电视 看书 合计
性别

10
50 60

10
10 20
合计
20
60 80
(1)根据上表中数据估计该社区居民在这一时间段以看书
2.线性相关强度检验的步骤: ①作统计假设:x 与 Y 不具有线性相关关系. ②根据小概率 0.05 与 n-2 在附表中查出 r 的一个临界值 r0.05. ③根据样本相关系数计算公式算出 r 的值. ④作统计推断.如果|r|>r0.05,表明有 95%的把握认为 x 与 Y 之间具有线性相关关系. 如果|r|≤r0.05,我们没有理由拒绝原来的假设.这时寻找 回归直线方程是毫无意义的.
4
=66.58-6-4×4×4.45.×52 3.5=0.7,
x2i -4 x 2
i=1
a^=-y -b^-x =3.5-0.7×4.5=0.35. 因此,所求的线性回归方程为^y=0.7x+0.35.
(3)由(2)的回归方程及技改前生产 100t 甲产品的生产能 耗,得降低的生产能耗为:
90-(0.7×100+0.30.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
①当 χ2>6.635 时,有 99%的把握认为“X 与 Y 有关系”. ②当 χ2>3.841 时,有 95%的把握认为“X 与 Y 有关系”. ③当 χ2≤3.841 时,没有充分理由认为 X 与 Y 是相关的. (注:列联表中的 n11、n12、n21、n22 也记作 a、b、c、d,χ2 也记作 K2,此时公式为 K2=a+bcn+add-ab+cd2 b+c.)
(文)某单位为了了解用电量 y(度)与气温 x(℃)之间的关系, 随机统计了某 4 天的用电量与当天气温,并制作了对照表:
气温(℃) 18 13 10 -1 用电量(度) 24 34 38 64 由表中数据,得线性回归方程^y=-2x+a.当气温为-4℃时, 预测用电量的度数约为________.
=-20(x-343)2+361.25. 当且仅当 x=8.25 时,L 取得最大值. 故当单价定价为 8.25 元时,工厂可获得最大利润.
点评:这是集统计中的回归分析与函数的实际应用于一体 的一道综合题;知识点交汇较新颖,难度不大.对于函数在实 际问题中的应用,不要忽略自变量的实际意义,并要有检验意 识.
n
n
xiyi-n x ·y xi- x yi- y
i=1
i=1
b^=

n x2i -n-x 2
n
xi--x 2
i=1
i=1
a^= y -b^ x
其中 x =1ni=n1xi, y =1ni=n1yi,( x , y )称为样本点的中心.
(3)利用回归直线可以对总体进行估计 (4)线性相关强度的检验:
2.072 2.706 3.841 5.024 6.635
分析:(1)从列联表中找出样本中以看书为休闲方式的居 民人数,样本中女性总人数及女性中以看电视为休闲方式的人 数,计算相应频率,以频率作为概率的估计值.
(2)将列联表中数据代入公式计算,查表比对后下结论.
解析:(1)由表可知该社区居民以看书为休闲方式的概率
走向高考·数学
人教B版 ·高考一轮总复习
路漫漫其修远兮 吾将上下而求索
第十章 统计与概率
第十章
第三节 相关关系、回归分析与独立性检验
基础梳理导学
3 考点典例讲练
思想方法技巧
4 课堂巩固训练
5 课后强化作业
基础梳理导学
重点难点 引领方向 重点:1.利用散点图判断变量之间是否具有相关关系; 2.求回归直线方程和利用回归直线作出估计; 3.独立性检验. 难点:回归分析与独立性检验的应用.
(2)正相关、负相关 散点图中各点散布的位置是从 左下角 到 右上角 的区 域,即一个变量的值由小变大时,另一个变量的值也由小变 大,这种相关称为正相关. 散点图中点散布的位置是从 左上角到 右下角的区域,即 一个变量的值由小变大时,另一个变量的值由大变小,这种 相关称为负相关.
3.回归分析 (1)回归分析 对具有相关关系的两个变量进行统计分析的方法叫回归 分析.其基本步骤是:①画散点图,②求回归直线方程,③ 用回归直线方程作预报.
[例 1] 对变量 x、y 的观测数据(xi,yi)(i=1,2,…,10), 得散点图(1);对变量 u、v 的观测数据(u1,v1)(i=1,2,…, 10),得散点图(2).由这两个散点图可以判断.( )
A.变量 x 与 y 正相关,u 与 v 正相关 B.变量 x 与 y 正相关,u 与 v 负相关 C.变量 x 与 y 负相关,u 与 v 正相关 D.变量 x 与 y 负相关,u 与 v 负相关
解析:(1)由题设所给数据,可得散点图如下图.
4
(2)由表中数据,计算得:x2i =86,
i=1
-x =3+4+4 5+6=4.5,-y =2.5+3+4 4+4.5=3.5,
4
已知 xiyi=66.5,
i=1
所以,由最小二乘法确定的回归直线方程的系数为:
4 xiyi-4-x ·-y
i=1
b^=
(2)回归直线方程的求法 ①回归直线:观察散点图的特征,如果散点图中点的分 布从整体上看大致在一条直线附近,我们就称这两个变量之 间具有线性相关关系,这条直线叫做回归直线. ②回归直线方程的求法——最小二乘法. 设具有线性相关关系的两个变量 x、y 的一组观察值为(xi, yi)(i=1,2,…,n),则回归直线方程^y=a^+b^x 的系数为:
相关文档
最新文档