2019年高考数学总复习_10-3_相关关系、回归分析与独立性检验课件_新人教B版
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
如果|r|≤r0.05,我们没有理由拒绝原来的假设.这时 寻找回归直线方程是毫无意义的.
3.独立性检验的步骤: ①据实际问题需要的可信度确定临界值 k0. ②利用公式,由观测数据,求出 χ2 的观测值 k. ③作判断,如果 k≥k0,就以(1-P(χ2≥k0))×100% 的把握认为“X 与 Y 有关系”,否则就说样本数据没有 提供充分证据说明“X 与 Y 有关系”.
i= 1
^a=-y -^b x
其中-x =
1 n
n xi,-y
i=1
=n1i=n1yi,(-x ,
-y )称作样本点
的
中心. ^a,^b表示由观察值用最小二乘法求得的 a,b 的估计
值,叫回归系数.
(3)利用回归直线方程对总体进行估计 若回归直线方程为^y=^bx+^a,则在 x=x0 处的估计 值:^y 0=^b x0+^a .
A.变量 x 与 y 正相关,u 与 v 正相关 B.变量 x 与 y 正相关,u 与 v 负相关 C.变量 x 与 y 负相关,u 与 v 正相关 D.变量 x 与 y 负相关,u 与 v 负相关
①当 χ2>6.635 时,有 99%的把握认为“X 与 Y 有关 系”.
②当 χ2>3.841 时,有 95%的把握认为“X 与 Y 有关 系”.
③当 χ2≤3.841 时,没有充分理由认为 X 与 Y 是相关 的.
误区警示 1.线性回归方程中的系数^a、^b公式复杂莫记混用错. 2.使用 χ2 统计量作 2×2 列联表的独立性检验时, 要求表中的 4 个数据 n11、n12、n21、n22 都要大于 5,在 选取样本的容量时,要注意这一点.
1.建立回归模型的基本步骤: ①确定研究对象,明确解释变量和预报变量. ②画出散点图,观察它们是否存在相关关系.(如线 性相关关系) ③确定回归方程类型.(如线性回归方程y^=^bx+^a)
④按一般规则估计回归方程中的参数.(如最小二乘 法)
⑤得出结果后分析残差图有否异常,若存在异常, 则检查数据是否有误,模型是否恰当.
表.
y1
y2
合计
x1
n11
n12
n1+
x2
n21
n22
n2+
合计
n+1
n+2
n
在 2×2 列联表中,随机变量 χ2=nn11n22-n12n212, n1+·n2+·n+1·n+2
其中 n 为样本容量,χ2 的取值范围可以判断“X 与 Y 有 关系“的可信度如表.(其中频数 n11、n12、n21、n22 都不 小于 5)
i=1
i=1
线性相关. r 具有以下性质:|r|≤1,并且|r|越接近 1,线性相关
程度越强;|r|越接近 0,线性相关程度越弱,r>0 表示正 相关,r<0 表示负相关.
4.独立性检验 (1)若变量的不同“值”表示个体所属的不同类别,则 这些变量称为分类变量.
(2)两个分类变量 X 与 Y 的频数表,称作 2×2 列联
解析:(1)散点图如下:
(2)从上图中可以发现数据点大致分布在一条直线的 附近,因此施化肥量和水稻产量近似成线性相关关系, 当施化肥量由小到大变化时,水稻产量由小变大,但水 稻产量只是在一定范围内随着化肥施用量的增加而增 长.
(文)对变量 x,y 的观测数据(xi,yi)(i=1,2,…,10), 得散点图(1);对变量 u,v 的观测数据(ui,vi)(i=1,2,…, 10),得散点图(2).由这两个散点图可以判断.( )
2019年高考数学总复习_10-3_相关关系、回归分析与独 立性检验课件_新人教B版
2.两个变量的线性相关 (1)散点图 将样本中 n 个数据点(xi,yi)(i=1,2,…,n)描在平面 直角坐标系中,表示具有相关关系的两个变量的一组数 据的图形叫做散点图.利用散点图可以判断变量之间有 无相关关系.
(4)线性相关强度的检验: 对于变量 x 与 y 随机取到的 n 对数据(xi,yi),用 y
与 x 间的相关系数 r=
n
xi--x yi--y
i=1
n
xi--x 2·n
yi--y 2
i=1
i=1
n
xiyi-n
-- x ·y
i=1
=
来检验 x 与 y 是否
n
n
x2i -n x 2y2i -n y 2
相关关系的判断
[例 1] 下面是水稻产量与施化肥量的一组观测数 据:
施化 15 20 25 30 35 40 45
肥量
水稻 320 330 360 410 460 470 480
产量
(1)将上述数据制成散点图; (2)你能从散点图中发现施化肥量与水稻产量近似成 什么关系吗?水稻产量会一直随施化肥量的增加而增长 吗? 分析:描点可画出散点图,观察散点图中的点是否 大致分布在一条直线附近,即可判断是否线性相关.
2.线性相关强度检验的步骤: ①作统计假设:x 与 Y 不具有线性相关关系. ②根据小概率 0.05 与 n-2 在附表中查出 r 的一个临 界值 r0.05. ③根据样本相关系数计算公式算出 r 的值.
④作统计推断.如果|r|>r0.05,表明有 95%的把握认 为 x 与 Y 之间具有线性相关关系.
(2)回归直线方程的求法——最小二乘法. 设具有线性相关关系的两个变量 x、y 的一组观察值 为(xi,yi)(i=1,2,…,n),则回归直线方程^y=^a+^bx 的 系数为:
n
n
--
xiyi-n x ·y xi- x yi- y
^ i=1
ii=1
n
-
xi- x 2
(2)正相关、负相关 如果散点图中各点散布的位置是从左下角到右上角 的区域,即一个变量的值由小变大时,另一个变量的值 也由小变大,这种相关称为正相关. 反之,如果两个变量的散点图中点散布的位置是从 左上角到右下角的区域,即一个变量的值由小变大时, 另一个变量的值由大变小,这种相关称为负相关.
3.回归分析 对具有相关关系的两个变量进行统计分析的方法叫 回归分析.其基本步骤是:①画散点图,②求回归直线方 程,③用回归直线方程作预报. (1)回归直线:观察散点图的特征,如果散点图中点的 分布从整体上看大致在一条直线附近,我们就称这两个变 量之间具有线性相关关系,这条直线叫做回归直线.
3.独立性检验的步骤: ①据实际问题需要的可信度确定临界值 k0. ②利用公式,由观测数据,求出 χ2 的观测值 k. ③作判断,如果 k≥k0,就以(1-P(χ2≥k0))×100% 的把握认为“X 与 Y 有关系”,否则就说样本数据没有 提供充分证据说明“X 与 Y 有关系”.
i= 1
^a=-y -^b x
其中-x =
1 n
n xi,-y
i=1
=n1i=n1yi,(-x ,
-y )称作样本点
的
中心. ^a,^b表示由观察值用最小二乘法求得的 a,b 的估计
值,叫回归系数.
(3)利用回归直线方程对总体进行估计 若回归直线方程为^y=^bx+^a,则在 x=x0 处的估计 值:^y 0=^b x0+^a .
A.变量 x 与 y 正相关,u 与 v 正相关 B.变量 x 与 y 正相关,u 与 v 负相关 C.变量 x 与 y 负相关,u 与 v 正相关 D.变量 x 与 y 负相关,u 与 v 负相关
①当 χ2>6.635 时,有 99%的把握认为“X 与 Y 有关 系”.
②当 χ2>3.841 时,有 95%的把握认为“X 与 Y 有关 系”.
③当 χ2≤3.841 时,没有充分理由认为 X 与 Y 是相关 的.
误区警示 1.线性回归方程中的系数^a、^b公式复杂莫记混用错. 2.使用 χ2 统计量作 2×2 列联表的独立性检验时, 要求表中的 4 个数据 n11、n12、n21、n22 都要大于 5,在 选取样本的容量时,要注意这一点.
1.建立回归模型的基本步骤: ①确定研究对象,明确解释变量和预报变量. ②画出散点图,观察它们是否存在相关关系.(如线 性相关关系) ③确定回归方程类型.(如线性回归方程y^=^bx+^a)
④按一般规则估计回归方程中的参数.(如最小二乘 法)
⑤得出结果后分析残差图有否异常,若存在异常, 则检查数据是否有误,模型是否恰当.
表.
y1
y2
合计
x1
n11
n12
n1+
x2
n21
n22
n2+
合计
n+1
n+2
n
在 2×2 列联表中,随机变量 χ2=nn11n22-n12n212, n1+·n2+·n+1·n+2
其中 n 为样本容量,χ2 的取值范围可以判断“X 与 Y 有 关系“的可信度如表.(其中频数 n11、n12、n21、n22 都不 小于 5)
i=1
i=1
线性相关. r 具有以下性质:|r|≤1,并且|r|越接近 1,线性相关
程度越强;|r|越接近 0,线性相关程度越弱,r>0 表示正 相关,r<0 表示负相关.
4.独立性检验 (1)若变量的不同“值”表示个体所属的不同类别,则 这些变量称为分类变量.
(2)两个分类变量 X 与 Y 的频数表,称作 2×2 列联
解析:(1)散点图如下:
(2)从上图中可以发现数据点大致分布在一条直线的 附近,因此施化肥量和水稻产量近似成线性相关关系, 当施化肥量由小到大变化时,水稻产量由小变大,但水 稻产量只是在一定范围内随着化肥施用量的增加而增 长.
(文)对变量 x,y 的观测数据(xi,yi)(i=1,2,…,10), 得散点图(1);对变量 u,v 的观测数据(ui,vi)(i=1,2,…, 10),得散点图(2).由这两个散点图可以判断.( )
2019年高考数学总复习_10-3_相关关系、回归分析与独 立性检验课件_新人教B版
2.两个变量的线性相关 (1)散点图 将样本中 n 个数据点(xi,yi)(i=1,2,…,n)描在平面 直角坐标系中,表示具有相关关系的两个变量的一组数 据的图形叫做散点图.利用散点图可以判断变量之间有 无相关关系.
(4)线性相关强度的检验: 对于变量 x 与 y 随机取到的 n 对数据(xi,yi),用 y
与 x 间的相关系数 r=
n
xi--x yi--y
i=1
n
xi--x 2·n
yi--y 2
i=1
i=1
n
xiyi-n
-- x ·y
i=1
=
来检验 x 与 y 是否
n
n
x2i -n x 2y2i -n y 2
相关关系的判断
[例 1] 下面是水稻产量与施化肥量的一组观测数 据:
施化 15 20 25 30 35 40 45
肥量
水稻 320 330 360 410 460 470 480
产量
(1)将上述数据制成散点图; (2)你能从散点图中发现施化肥量与水稻产量近似成 什么关系吗?水稻产量会一直随施化肥量的增加而增长 吗? 分析:描点可画出散点图,观察散点图中的点是否 大致分布在一条直线附近,即可判断是否线性相关.
2.线性相关强度检验的步骤: ①作统计假设:x 与 Y 不具有线性相关关系. ②根据小概率 0.05 与 n-2 在附表中查出 r 的一个临 界值 r0.05. ③根据样本相关系数计算公式算出 r 的值.
④作统计推断.如果|r|>r0.05,表明有 95%的把握认 为 x 与 Y 之间具有线性相关关系.
(2)回归直线方程的求法——最小二乘法. 设具有线性相关关系的两个变量 x、y 的一组观察值 为(xi,yi)(i=1,2,…,n),则回归直线方程^y=^a+^bx 的 系数为:
n
n
--
xiyi-n x ·y xi- x yi- y
^ i=1
ii=1
n
-
xi- x 2
(2)正相关、负相关 如果散点图中各点散布的位置是从左下角到右上角 的区域,即一个变量的值由小变大时,另一个变量的值 也由小变大,这种相关称为正相关. 反之,如果两个变量的散点图中点散布的位置是从 左上角到右下角的区域,即一个变量的值由小变大时, 另一个变量的值由大变小,这种相关称为负相关.
3.回归分析 对具有相关关系的两个变量进行统计分析的方法叫 回归分析.其基本步骤是:①画散点图,②求回归直线方 程,③用回归直线方程作预报. (1)回归直线:观察散点图的特征,如果散点图中点的 分布从整体上看大致在一条直线附近,我们就称这两个变 量之间具有线性相关关系,这条直线叫做回归直线.