作出统计推论查t界值表
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十九章
直线相关和回归分析
双变量计量资料:每个个体有两个变量值
总体:无限或有限对变量值
样本:从总体随机抽取的n对变量值
(X1,Y1), (X2,Y2), …, (Xn,Yn)
目的:研究X和Y的数量关系
方法:回归与相关
简单、基本——直线回归、直线相关
目前,“回归”已成为表示变量之间某种数 量依存关系的统计学术语,并且衍生出“回归 方程”“回归系数”等统计学概念。如研究糖 尿病人血糖与其胰岛素水平的关系,研究儿童 年龄与体重的关系等。
r0 t sr
r 1 r n2
2
n2
1、建立假设:H0:=0 H1:≠0
=0.05
2、计算检验统计量 r 0.91097 t 8.2637 1 r2 1 0.91097 2 n2 16 2 16 2 14
P 0.01
3、确定P值,作出统计推论
2、求回归系数与常数项
x x 3.53 y y 147.50 n lxx x x / n 2.635
2 2
n
l yy y y / n 2910
2 2
lxy xy ( x. y ) / n 79.77
第一节
直线相关
一、线性相关的基本概念 直线相关(linear correlation):是研究两个 变量之间是否存在相关关系的一种统计方法。 适用条件:线性、双变量正态分布资料。 相关分析是用于分析两变量间的互依关系。
例19-1 为研究中年女性体重指数和 收缩压之间的关系,随机测量了16 名40 岁以上的女性的体重指数和收 缩压,见表19-1,试绘制散点图。
简单线性回归模型
样本线性回归方程
ˆ = a + bX Y
ˆ 为给定X 时Y 的估计值。 Y
a 为回归直线在 Y 轴上的截距
即x 取0时,y 的平均估计值
a >0,表示直线与纵轴的交点在原点的上方 a < 0,则交点在原点的下方 a = 0,则回归直线通过原点
b为回归系数,即直线的斜率
第二节
直线回归
一、线性回归的概念
目的:
在因变量Y和自变量X之间建立一个数 学模型,根据这个模型可以根据自变量的变 动预测因变量的变动。
区别于函数关系和统计关系
函数关系: 两变量的数量表现在一定条件下是完全确 定的。 如: 圆的面积和半径的关系 S r 2 统计关系(相关关系):两变量的数量表 现尽管存在着密切关系,但却不是完全确 定的。 如:成本和利润的关系
第二种方法:查表法
1、建立假设:H0:=0 H1:≠0 =0.05 2、计算检验统计量 n=16,r=0.91097,自由度=16-2=14。 3、查r界值表,得统计结论 查r界值表(附表19-1),得r0.01(14)=0.623,因为r> r0.01(14),故P<0.01,按=0.05水准拒绝H0,接受H1,可 以认为体重指数与收缩压之间存在正相关关系。
r
x x y y x x y y
2
2
l xy l xx .l yy
(19-1)
X X X N 2 Y 2 2 Y Y Y N X Y X X Y Y XY N
b>0,直线从Hale Waihona Puke Baidu下方走向右上方,Y 随 X 增大 而增大 b<0,直线从左上方走向右下方,Y 随 X 增大 而减小 b=0,表示直线与 X 轴平行,X 与Y 无直线关 系
ˆ Y b 的统计学意义是:X 每增加(减)一个单位, 平均改变b个单位
建立 线性回归模型的步骤
1、确定研究的问题 2、设样本回归模型(如: Y a )bx 3、搜集样本资料(数据资料) 4、估计未知参数(计算统计量) 5、得到样本回归方程 6、用模型预测因变量
2 xx
回归系 数
(19-7)
n
n
(19-8)
截距 (intercept
二、直线回归方程的求法
例19-1 为研究中年女性体重指数和 收缩压之间的关系,随机测量了16 名40 岁以上的女性的体重指数和收 缩压,见表19-1,试进行回归分析。
1、做散点图
考察线性、 异常值
图19-1
16名中年女性体重指数与收缩压散点图
图19-1
16名中年女性体重指数与收缩压散点图
图19-2
相关示意图
二、直线线性相关系数
相关系数又称积差相关系数(coefficientof product-moment correlation),它说明两 变量之间线性关系的密切程度与方向的统计指 标。样本用r表示,总体用ρ 。 -1≤r≤1
2 2 2 X
n
L XX X X X L XX Y Y
2
Y 2
2 Y
n
(19-2)
n
r
lxy lxx .l yy
79.77 0.91097 2.635 2910
三、线性相关系数的假设检验 第一种方法:t检验法
2 2 2
X
相关系数对样本相关关系的计量
| r |值 1 0.8 ~ 1 0.5 ~ 0.8 0.3 ~ 0.5 0 ~ 0.3 0 相关程度 绝对相关 高度相关 中度相关 低度相关 无相关 绝对无相关
计算例19-1的相关系数
L XY X
X Y X Y Y XY
建立 样本线性回归模型的方法 --最小二乘法
实际观察值与样本回归线上
Y
n
i 1
yi yi
n 2 i 1 i
2
的点的距离的平方和最小
e2
e3
e 最小
e1
e4
X
y a bX
xy 2 2
(19-6)
x x y y l n XY X Y b x x l n X X Y X a Y bX b
直线相关和回归分析
双变量计量资料:每个个体有两个变量值
总体:无限或有限对变量值
样本:从总体随机抽取的n对变量值
(X1,Y1), (X2,Y2), …, (Xn,Yn)
目的:研究X和Y的数量关系
方法:回归与相关
简单、基本——直线回归、直线相关
目前,“回归”已成为表示变量之间某种数 量依存关系的统计学术语,并且衍生出“回归 方程”“回归系数”等统计学概念。如研究糖 尿病人血糖与其胰岛素水平的关系,研究儿童 年龄与体重的关系等。
r0 t sr
r 1 r n2
2
n2
1、建立假设:H0:=0 H1:≠0
=0.05
2、计算检验统计量 r 0.91097 t 8.2637 1 r2 1 0.91097 2 n2 16 2 16 2 14
P 0.01
3、确定P值,作出统计推论
2、求回归系数与常数项
x x 3.53 y y 147.50 n lxx x x / n 2.635
2 2
n
l yy y y / n 2910
2 2
lxy xy ( x. y ) / n 79.77
第一节
直线相关
一、线性相关的基本概念 直线相关(linear correlation):是研究两个 变量之间是否存在相关关系的一种统计方法。 适用条件:线性、双变量正态分布资料。 相关分析是用于分析两变量间的互依关系。
例19-1 为研究中年女性体重指数和 收缩压之间的关系,随机测量了16 名40 岁以上的女性的体重指数和收 缩压,见表19-1,试绘制散点图。
简单线性回归模型
样本线性回归方程
ˆ = a + bX Y
ˆ 为给定X 时Y 的估计值。 Y
a 为回归直线在 Y 轴上的截距
即x 取0时,y 的平均估计值
a >0,表示直线与纵轴的交点在原点的上方 a < 0,则交点在原点的下方 a = 0,则回归直线通过原点
b为回归系数,即直线的斜率
第二节
直线回归
一、线性回归的概念
目的:
在因变量Y和自变量X之间建立一个数 学模型,根据这个模型可以根据自变量的变 动预测因变量的变动。
区别于函数关系和统计关系
函数关系: 两变量的数量表现在一定条件下是完全确 定的。 如: 圆的面积和半径的关系 S r 2 统计关系(相关关系):两变量的数量表 现尽管存在着密切关系,但却不是完全确 定的。 如:成本和利润的关系
第二种方法:查表法
1、建立假设:H0:=0 H1:≠0 =0.05 2、计算检验统计量 n=16,r=0.91097,自由度=16-2=14。 3、查r界值表,得统计结论 查r界值表(附表19-1),得r0.01(14)=0.623,因为r> r0.01(14),故P<0.01,按=0.05水准拒绝H0,接受H1,可 以认为体重指数与收缩压之间存在正相关关系。
r
x x y y x x y y
2
2
l xy l xx .l yy
(19-1)
X X X N 2 Y 2 2 Y Y Y N X Y X X Y Y XY N
b>0,直线从Hale Waihona Puke Baidu下方走向右上方,Y 随 X 增大 而增大 b<0,直线从左上方走向右下方,Y 随 X 增大 而减小 b=0,表示直线与 X 轴平行,X 与Y 无直线关 系
ˆ Y b 的统计学意义是:X 每增加(减)一个单位, 平均改变b个单位
建立 线性回归模型的步骤
1、确定研究的问题 2、设样本回归模型(如: Y a )bx 3、搜集样本资料(数据资料) 4、估计未知参数(计算统计量) 5、得到样本回归方程 6、用模型预测因变量
2 xx
回归系 数
(19-7)
n
n
(19-8)
截距 (intercept
二、直线回归方程的求法
例19-1 为研究中年女性体重指数和 收缩压之间的关系,随机测量了16 名40 岁以上的女性的体重指数和收 缩压,见表19-1,试进行回归分析。
1、做散点图
考察线性、 异常值
图19-1
16名中年女性体重指数与收缩压散点图
图19-1
16名中年女性体重指数与收缩压散点图
图19-2
相关示意图
二、直线线性相关系数
相关系数又称积差相关系数(coefficientof product-moment correlation),它说明两 变量之间线性关系的密切程度与方向的统计指 标。样本用r表示,总体用ρ 。 -1≤r≤1
2 2 2 X
n
L XX X X X L XX Y Y
2
Y 2
2 Y
n
(19-2)
n
r
lxy lxx .l yy
79.77 0.91097 2.635 2910
三、线性相关系数的假设检验 第一种方法:t检验法
2 2 2
X
相关系数对样本相关关系的计量
| r |值 1 0.8 ~ 1 0.5 ~ 0.8 0.3 ~ 0.5 0 ~ 0.3 0 相关程度 绝对相关 高度相关 中度相关 低度相关 无相关 绝对无相关
计算例19-1的相关系数
L XY X
X Y X Y Y XY
建立 样本线性回归模型的方法 --最小二乘法
实际观察值与样本回归线上
Y
n
i 1
yi yi
n 2 i 1 i
2
的点的距离的平方和最小
e2
e3
e 最小
e1
e4
X
y a bX
xy 2 2
(19-6)
x x y y l n XY X Y b x x l n X X Y X a Y bX b