回归方程和独立性检验知识点

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

回归分析和独立性检验

一、回归分析

1、回归直线方程 a x b y

ˆˆˆ+= (x 叫做解释变量,y 叫做预报变量) 其中∑∑==---=n

i i

n

i i i

x x

y y x x

b

1

2

1

)()

)((ˆ=

∑∑==--n

i i

n

i i

i x n x

y

x n y

x 1

2

21

(由最小二乘法得出,考试时给出此公式中的一个)

x b y a

ˆˆ-= ( 此式说明:回归直线过样本的中心点)(y x , ,也就是平均值点。 ) 2、几条结论:

(1)回归直线过样本的中心点)(y x ,。

(2)b>0时,y 与x 正相关,散点图呈上升趋势;b<0时,y 与x 负相关,散点图呈下降趋势。 (3)斜率b 的含义(举例):

如果回归方程为y=2.5x+2, 说明x 增加1个单位时,y 平均增加2.5个单位; 如果回归方程为y=-2.5x+2,说明x 增加1个单位时,y 平均减少2.5个单位。 (4)相关系数r 表示变量的相关程度。 范围:1≤r ,即 11≤≤-r

r 越大.,相关性越强.

。0>r 时,y 与x 正相关;0

R 表示模型的拟合效果。 范围:]10[2

∈R 2R 越大.,拟合效果越好.

,(这时:残差平方和越小,残差点在带状区域内的分布比较均匀, 带状区域宽度越窄,拟合精度越高)。

2R 表示解释变量x 对于预报变量y 变化的贡献率。

例如:64.02

≈R ,表明“x 解释了64%的y 变化”,或者说“y 的差异有64%是由x 引起的”。 (6)线性回归模型 e a bx y ++=, 其中e 叫做随机误差。(y 是由x 和e 共同确定的。)

二、独立性检验

1、原理:假设性检验(类似反证法原理)。

一般情况下:假设分类变量X 和Y 之间没有关系,通过计算2

K 值,然后查表对照相应的概率P , 发现这种假设正确的概率P 很小,从而推翻假设,最后得出X 和Y 之间有关系的可能性为(1-P), 也就是“X 和Y 有关系”。(表中的k 就是2

K 的

观测值,即

2K k =)

)

)()()(()(2

2

d b c a d c b a bc ad n K ++++-=

2、2⨯2列联表: (考试给出)

部分对照表(考试时会给出用到的一部分数据):

3、范围:),0(2

+∞∈K ; 性质:2K 越大.,说明变量间越有关系...

三、典型例题

估计..

生产7吨产品时,消耗的煤约为5.25吨。 例2、为了考察某药物预防疾病的效果,现对105人进行

试验调查,得到2⨯2列联表。试判断:服用药物和患病之间是否有关系?

解:105=n ,10=a ,45=b ,20=c ,30=d

75

305055)20453010(1052

2

⨯⨯⨯⨯-⨯⨯=K

≈6.109>5.024 (提示:运算时尽量先约分化简,再计算)

所以,有1-0.025=97.5%的把握认为服用药物和患病之间有关系。

相关文档
最新文档