变量间的相关关系及统计案例复习ppt课件(自制) 通用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

课堂互动讲练
【思路点拨】 (1)先根据已知计算 相关系数r,判断是否具有相关关系.
(2)再利用公式求出回归方程进行回 归分析.
课堂互动讲练
【解】 (1) x =66.8, y =67.01,
10
x 2=4462.24, y 2≈4490.34, xi2=44794,
i=1
10
10
yi2=44941.93, xiyi=44842.4,
课堂互动讲练
施化肥量 x
15
20
25
30
35
40
45
棉花产量 y
330
345
365
405
445
450
455
(1)画出散点图; (2)判断是否具有相关关系.
课堂互动讲练
【思路点拨】 用施化肥量x作为 横轴,产量y为纵轴可作出散点图,由 散点图即可分析是否具有线性相关关 系.
课堂互动讲练
【解】 (1)散点图如图所示,
基础知识梳理
(2)回归方程 方程y^=bx+a 是两个具有线性相关关
系的变量的一组数据(x1,y1), (x2,y2),…,(xn,yn)的回归方程, 其中a,b是待定参数.
基础知识梳理
y -b x
基础知识梳理
相关关系与函数关系有什么 异同点?
【思考·提示】 相同点: 两者均是指两个变量的关系.
答案:11.69
课堂互动讲练
考点一 相关关系的判断
判断两变量之间有无相关关 系,一种常用的简便可行的方法是 绘散点图.散点图是由数据点分布 构成的,是分析研究两个变量相关 关系的重要手段,从散点图中,如 果发现点的分布从整体上看大致在 一条直线附近,那么这两个变量是 线性相关的.
课堂互动讲练
例1 某棉业公司的科研人员在7块并 排、形状大小相同的试验田上对某棉 花新品种进行施化肥量x对产量y影响 的试验,得到如下表所示的一组数据 (单位:kg).
答案:D
三基能力强化
3.(教材习题改编)对于事件A和事件B, 通过计算得到K2的观测值k≈4.514,下列说法正 确的是( )
A.有99%的把握说事件A和事件B有关 B.有95%的把握说事件A和事件B有关 C.有99%的把握说事件A和事件B无关 D.有95%的把握说事件A和事件B无关 答案:B
三基能力强化
课堂互动讲练
故所求的回归方程为: y^=0.4646x+35.97. (3)当 x=73 时, y^=0.4646×73+35.97≈69.9.
所以当父亲身高为73英寸时,估 计儿子身高约为69.9英寸.
课堂互动讲练
【名师点评】 求回归直线方 程,一般先要考查y与x是否具有线性 相关关系,若具有这样的关系,则可 利用公式求解,否则求得的函数关系 无实际意义.
由k≈27.1>10.828,所以我们有 99.9%的把握认为患色盲与性别有关 系,这个结论只对所调查的480名男人 和520名女人有效. 12分
基础知识梳理
n
(xi- x )(yi- y )
i=1
b^ =
,a^= y -b^ x .
n
(xi- x )2
i=1
wenku.baidu.com
其中( x , y )称为样本点的中心.
基础知识梳理
(3)相关系数 当 r>0 时,表明两个变量 正相关 ; 当 r<0 时,表明两个变量 负相关 . r 的绝对值越接近于 1,表明两个变量的 线性相关性 越强 .r 的绝对值越接近于 0 时,表明两个变量之间几乎不存在线性 相关关系.通常|r|大于 0.75 时,认为两 个变量有很强的线性相关性.
课堂互动讲练
(2)设回归方程为y^ =b^ x+a^ .
10
xiyi-10 x y
i=1
由b^ =
10
xi2-10 x 2
i=1
=444844729.44--4444672622..468=7197.17.26≈0.4646. a^ = y - b^ x = 67.01 - 0.4646×66.8≈35.97.
课堂互动讲练
(2)由散点图知,各组数据对应点 大致都在一条直线附近,所以施化肥 量x与产量y具有线性相关关系.
课堂互动讲练
【名师点评】 两变量具有相关关 系但不一定是线性相关,所以当画出的 点明显在一条曲线附近时,两变量也具 有相关关系,但不是线性相关的.
课堂互动讲练
考点二 求回归直线方程
利用最小二乘法求回归直线方 程的一般步骤是:(1)作出散点图, 判断是否线性相关;(2)如果是,则 用公式求a、b,写出回归方程;(3) 根据方程进行估计.
A.角度和它的余弦值 B.正方形的边长和它的面积 C.正n边形的边数和顶点角度之和 D.人的年龄和身高 答案:D
三基能力强化
2.有关线性回归的说法,不正 确的是( )
A.相关关系的两个变量是非确 定关系
B.散点图能直观地反映数据的 相关程度
C.回归直线最能代表线性相关 的两个变量之间的关系
D.散点图中的点越集中,两个 变量的相关性越强
4.下列关系:①人的年龄与其拥有 的财富之间的关系;②曲线上的点与该 点的坐标之间的关系;③苹果的产量与 气候之间的关系;④森林中的同一树 木,其截面直径与高度之间的关系;⑤ 学生的身高与其学号之间的关系,其中 有相关关系的是________.
答案:①③④
三基能力强化
5 . 已 知 回 归 方 程 为 y^ = 0.50x - 0.81 , 则 x= 25 时 , y 的 估 计 值 为 ________.
课堂互动讲练
例2 下表提供了某厂节能降耗技术改
造后生产甲产品过程中记录的产量 x(吨)与相应的生产能耗y(吨标准煤)的 几组对照数据.
x 3 45 6 y 2.5 3 4 4.5
课堂互动讲练
(1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘 法求出 y 关于 x 的线性回归方程y^=bx+a. (参考数值:3×2.5+4×3+5×4+6×4.5 =66.5)
课堂互动讲练
例3 测得某国10对父子身高(单位:英
寸)如下: (1)对变量y与x进行相关性检验; (2)如果y与x之间具有线性相关关
系,求回归方程; (3)如果父亲的身高为73英寸,估
计儿子的身高.
课堂互动讲练
父亲 身高 60 62 64 65 66 67 68 70 72 74 (x) 儿子 身高 63.6 65.2 66 65.5 66.9 67.1 67.4 68.3 70.1 70 (y)
第3课时变量间的相关关系及 统计案例
基础知识梳理
1.两个变量的线性相关 (1)正相关 在散点图中,点散布在从左上角 到右下角的区域.对于两个变量的这 种相关关系,我们将它称为正相关. (2)负相关 在散点图中,点散布在从左下角 到右上角 的区域,两个变量的这种相 关关系称为负相关.
基础知识梳理
(3)线性相关关系、回归直线 如果散点图中点的分布从整体上 看大致在 一条直线附近 ,就称这两个 变量之间具有线性相关关系,这条直 线叫做回归直线. 2.回归方程 (1)最小二乘法 求回归直线使得样本数据的点到 回归直线的 距离的平方和最小的方法 叫做最小二乘法.
其差值为|43880-5620|≈0.068,差值较大.
因而,我们可以认为“患色盲与性别 是有关的”. 8分
根据列联表所给的数据可以有 a=38,b=442,c=6,d=514,a+ b=480,c+d=520, a+c=44,b+d=956,n=1000,
课堂互动讲练
由 K2=(a+b)(cn+(add-)(ab+c)c2)(b+d) 得到观测值 k=100408×0×(385×205×144-4×6×954642)2 ≈27.1. 10 分
不同点:①函数关系是一种 确定的关系,相关关系是一种非 确定的关系.②函数关系是一种 因果关系,而相关关系不一定是 因果关系,也可能是伴随关系.
思 考 ?
基础知识梳理
3.回归分析 (1)定义:对具有相关关系 的两个 变量进行统计分析的一种常用方法. (2)样本点的中心 在具有线性相关关系的数据(x1, y1),(x2,y2),…,(xn,yn)中,回归 方程的截距和斜率的最小二乘估计公 式分别为:
课堂互动讲练
【思路点拨】
课堂互动讲练
【解】 (1)由题设所给数据,可 得散点图如图所示:
课堂互动讲练
4
(2)对照数据,计算得 xi2=86,
i=1
x =3+4+4 5+6=4.5, y =2.5+3+4 4+4.5=3.5,
4
已知 xiyi= 66.5,
i=1
所以,由最小二乘法确定的回归方程的 系数为:
i=1
i=1
课堂互动讲练
10
xiyi-10 x y
i=1
r=
10
10
( xi2-10 x 2)( yi2-10 y 2)
i=1
i=1

44842.4-10×4476.268 (44794-44622.4)(44941.93-44903.4)
= 667191.7.52764≈0.9804.
所以y与x之间具有很强的线性相关 关系.
课堂互动讲练
考点四 独立性检验
利用图形来判断两个变量之间是 否有关系,可以画出三维柱形图、二 维条形图,仅从图形上只可以粗略地 估计两个分类变量的关系,可以结合 所求的数值来进行比较,作图时应注 意单位统一、图形准确,但不能给我 们两个分类变量有关或无关的精确的 可信程度,只有利用独立性检验的有 关计算,才能作出精确的判断.
课课堂互动讲 练堂互动讲练
例4 (解题示范)(本题满分12分) 在调查的480名男人中有38名患
有色盲,520名女人中有6名患有色 盲,分别利用图形和独立性检验的方 法来判断色盲与性别是否有关?你所 得到的结论在什么范围内有效?
课堂互动讲练
【思路点拨】 本题应首先作出 调查数据的列联表,再根据列联表画 出二维条形图,并进行分析,最后利 用独立性检验作出判断.
y1 a c a+c
y2 b d b+d
总计 a+b c+d a+b+c+d
基础知识梳理
n(ad-bc)2 K2=(a+b)(c+d)(a+c)(b+d) ,用 它的大小可以决定是否拒绝原来的统计 假设H0,如果K2值较大,就拒绝H0,即 拒绝事件A与B无关 .
三基能力强化
1.下列两个变量之间的关系哪个不 是函数关系( )
课堂互动讲练
(3)由经验确定回归方程的类型(如我们 观察到数据呈线性关系,则选用线性回归方 程y^ =b^ x+a^ ).
(4)按一定规则估计回归方程中的参数 (如最小二乘法).
(5)得出结果后分析残差是否有异常(个 别数据对应残差过大,或残差呈现不随机的 规律性等).若存在异常,则检查数据是否有 误,或模型是否适合等.
基础知识梳理
4.独立性检验 (1)分类变量的定义 如果某种变量的不同“值”表示个 体所属的不同类别,像这样的变量称 为分类变量 . (2)2×2列联表 一般地,假设有两个分类变量X 和Y,它们的值域分别为{x1,x2}和 {y1,y2},其样本频数列联表(称为 2×2列联表)为
基础知识梳理
x1 x2 总计
课堂互动讲练
【解】 根据题目所给的数据作 出如下的列联表:
男 女 合计
色盲 38 6 44
不色盲 442 514 956
合计 480 520 1000
课堂互动讲练
根据列联表作出相应的二维条形 图: 6分
课堂互动讲练
从二维条形图来看,在男人中患色盲的比例 为43880,要比女人中患色盲的比例5620大.
课堂互动讲练
4
xiyi-4 x y
i=1
b=
4
=66.58-6-4×4×4.45.×52 3.5=0.7,
xi2-4 x 2
i=1
a= y -b x =3.5-0.7×4.5=0.35. 因此,所求的线性回归方程为y^=0.7x+0.35.
课堂互动讲练
【名师点评】 因本题中y对x的关系呈
线性关系,故可用一元线性相关的方法解
课堂互动讲练
解:由(2)的回归方程及技改前生 产100吨甲产品的生产能耗,得降低的 生产能耗为90-(0.7×100+0.35)= 19.65(吨标准煤).
课堂互动讲练
考点三 线性回归分析
建立回归模型的步骤 (1)确定研究对象,明确哪个变量 是解释变量,哪个变量是预报变量. (2)画出确定好的解释变量和预报 变量的散点图,观察它们之间的关系 (如是否存在线性关系等).
n
xiyi-n x y
i=1
决问题.(1)利用公式 b=
,a= y -
n
xi2-n x 2
i=1
b x 来计算回归系数,有时为了方便,常制表对应 出 xiyi,xi2,以便求和应用公式.
课堂互动讲练
互动探究
在本例条件下,若该厂技改前 100吨甲产品的生产能耗为90吨标准 煤.试根据(2)求出的线性回归方 程,预测生产100吨甲产品的生产能 耗比技改前降低多少吨标准煤?
相关文档
最新文档