研究随机变量之间关系的目的基本步骤直线回归方程与参数

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
代指标有“向中心回归”的作用
• Galton的学生Pearson观测了1078对夫妇和 他们的子女,结果是:
组别
双亲X(吋) 子女y(吋) d
Total(N=1078)
68
69
高个组 矮个组
72
71
+2
64
67
-2
• 根据此现象,Galton引进回归 普遍性?
(regression)这个词来描述x和y的关系。
• 在两个变量之间的相关关系中,有正相关, 有负相关,有线性相关,有非线性相关;
• 与之相对应的回归分析,也有线性和非线 性因变量(y)随自变量(x)有促进增加作用, 有抑制减少作用,有阶段性的作用方向发 生变化现象。
二、研究随机变量之间关系的目的
1.确定几个变量之间是否存在相关关系(数学表达式, 线性关系还是非线性关系;
第五讲 直线回归和相关分析
为什么要学习……?
1. 是常用的数理统计方法; 2. 可以处理科学实验和生产实践中变量之间
的关系; 3. 可以解决预测问题。在科学上……,在生
产实践中,达到控制,使生产工艺优化
一、回归分析和相关分析的概念 二、研究随机变量之间关系的目的 三、基本步骤 四、直线回归方程与参数估计 五、直线回归的假设测验 六、直线相关分析 七、对统计学回归概念提出的考究及我国古
如果两个变量是平行的,没有因果关 系的自变量和依变量之分,且皆有随机误 差。这类统计分析称相关分析。所建立的 模型称相关模型。
• 回归模型有预测作用,没有达到显著水平时, 不能建立模型;
• 相关分析是研究X和Y间有无相关,以及相关程 度、相关性质(方向),当达到显著水平时, 可以进一步建立相关模型,做定量关系描述。
三、基本步骤
• 对具有统计关系的两个变量的资料进行初步考察 的简便而有效的方法是:
• 将这两个变量的n对观察值 x1,y1 x2,y2 …… xn,yn
分别以坐标点的形式标记于同一直角坐标平面上,
获得散点图(scatter diagram)。
• 根据散点图可初步判定双变量X和Y间的关系, 包括:
生物界中,大量存在的情况是:一种 变量受另一种变量的影响。两者之间既有 关系,但又不存在完全确定的函数关系。
• 如果两个变量有因果关系,原因变量称自变量 (independent variable) ,一般用X表示; •结果变量称依(因)变量(dependent variable),以Y表示。 •X是已知的或是可控制的,没有误差或误差很小, 而Y则不仅随X的变化而变化,还要受到随机误 差的影响。 •这类统计分析称回归分析。所建立的模型称回 归模型。
• 在统计学上,回归虽然不是普遍现象,但在自然 界,“向中心回归”的作用现象普遍存在;人类 在文化、哲学、伦理上也是普遍应用这种“向中 心回归”的思想。
• 只是“中心”的对象不同
爱出
爱返
对象?
自己
福往
福还
• 付出是我们获得的唯一途径!
• “世上没有无缘无故的恨,也没有无缘无故的爱”
• 1889年出版的《自然遗传》( Natural inheritance)一书中首次提出并阐明了 “相关”的概念及计算两个变数相关程度 的“相关系数”Correlation)的概念。
计数。通常以ρ表示总体相关系数,以r表示 样本相关系数。
三种不同的总体相关散点图
所以,回归分析也可以用相关系数检验其显著性,r 的取值区间为[-1, 1]。R的“+”“-”与b值有关
2. 决定(确定)系数
ຫໍສະໝຸດ Baidu
• 决定系数和相关系数的区别在于: • 首先,除| r | = 1和0的情况外,r2总是小于 | r |, • 其次,r可正可负,其取值区间为[-1,1];而r2则
正或负值
得值待入方程求a:
正或负值
2)在散点图上画拟合直线
一般都是x为横坐标,y为纵坐标;x、y按4:5 or 5:6,标明坐标的名称和单位,取2个x值代入:
就得到2个点,即可连接为一条直线
〔例1〕某地一年级12名女大学生的体重与肺活量的关系数 据列于表10.1,试求肺活量(L)对体重(kg)的直线回 归方程。
减少(b<0时)的单位数,叫回归系数。
2. 参数估计
• 从一元线性回归分析方法中可以了解到全 部回归分析的基本思想。
• 1)回归方程的建立 • 用最小平方法原理:
对 有
求: xmean=∑xi/n =1/n ·∑xi • ymean=∑yi/n =1/n ·∑yi • 对于参数a、b,先求出b,再算得a • 用x、y的观测值求平方和 SSx、 SSy 、SSx.y(sp) 总是正值
2.确定变量间相关关系的性质(正相关还是负相关); 3.确定变量间相关关系的密切程度(显著性检验); 4.利用这种关系去预测或控制另一个变量的取值,并
且要知道这种预测或控制可达到的精确度; 5.进行因素分析,在共同影响一个变量的许多因素
之间,找出哪些是重要因素,哪些是次要因素,这 些因素之间又有什么关系。
代 “阴阳”回归思想的剖析——从“华表”
和 “龙的传人”说起
一、回归分析和相关分析的概念
• 在统计史上, “回归”一词是英国生物学
? 家和统计学家高尔顿(Francis Galton,
1822—1911)提出的。
• 研究人身高的遗传性 • 把每对夫妇的平均身高作为x • 把一个成年儿子的身高作为y • 比较的结果是:未发现两极分化,而是子
3)直线回归的标准误估计
[例2] 试计算由表10.1资料获得的回归方程的 估计标准误。
??
五、直线回归的假设测验
[例3] 试检验表10.1资料回归关系的显著性。
[例4] 试用F检验法检验表10.1资料回归关系 的显著性。
六、直线相关分析
1.相关系数 • 用来表示X和Y相关密切程度及其性质的统
• ①X和Y相关的性质(正或负)和密切程度;
• ②X和Y的关系是直线型的还是非直线型的;
• ③是否有一些特殊的点表示着其他因素的干 扰等。
四、直线回归方程与参数估计
1. 一元直线回归方程参数的含义:
• 上式读作“y依x的直线回归方程”。式中: • x是自变量; • 是和x的量相对应的依变量y的点估计值; • a是x=0时的值,即回归直线在y轴上的截距; • b是x每增加一个单位数时, 平均地将要增加(b>0时)或
相关文档
最新文档