回归方程和独立性检验知识点
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
回归分析和独立性检验
一、回归分析
1、回归直线方程 a x b y
ˆˆˆ+= (x 叫做解释变量,y 叫做预报变量) 其中∑∑==---=n
i i
n
i i i
x x
y y x x
b
1
2
1
)()
)((ˆ=
∑∑==--n
i i
n
i i
i x n x
y
x n y
x 1
2
21
(由最小二乘法得出,考试时给出此公式中的一个)
x b y a
ˆˆ-= ( 此式说明:回归直线过样本的中心点)(y x , ,也就是平均值点。 ) 2、几条结论:
(1)回归直线过样本的中心点)(y x ,。
(2)b>0时,y 与x 正相关,散点图呈上升趋势;b<0时,y 与x 负相关,散点图呈下降趋势。 (3)斜率b 的含义(举例):
如果回归方程为y=2.5x+2, 说明x 增加1个单位时,y 平均增加2.5个单位; 如果回归方程为y=-2.5x+2,说明x 增加1个单位时,y 平均减少2.5个单位。 (4)相关系数r 表示变量的相关程度。 范围:1≤r ,即 11≤≤-r
r 越大.,相关性越强.
。0>r 时,y 与x 正相关;0 R 表示模型的拟合效果。 范围:]10[2 , ∈R 2R 越大.,拟合效果越好. ,(这时:残差平方和越小,残差点在带状区域内的分布比较均匀, 带状区域宽度越窄,拟合精度越高)。 2R 表示解释变量x 对于预报变量y 变化的贡献率。 例如:64.02 ≈R ,表明“x 解释了64%的y 变化”,或者说“y 的差异有64%是由x 引起的”。 (6)线性回归模型 e a bx y ++=, 其中e 叫做随机误差。(y 是由x 和e 共同确定的。) 二、独立性检验 1、原理:假设性检验(类似反证法原理)。 一般情况下:假设分类变量X 和Y 之间没有关系,通过计算2 K 值,然后查表对照相应的概率P , 发现这种假设正确的概率P 很小,从而推翻假设,最后得出X 和Y 之间有关系的可能性为(1-P), 也就是“X 和Y 有关系”。(表中的k 就是2 K 的 观测值,即 2K k =) ) )()()(()(2 2 d b c a d c b a bc ad n K ++++-= 2、2⨯2列联表: (考试给出) 部分对照表(考试时会给出用到的一部分数据): 3、范围:),0(2 +∞∈K ; 性质:2K 越大.,说明变量间越有关系... 。 三、典型例题 估计.. 生产7吨产品时,消耗的煤约为5.25吨。 例2、为了考察某药物预防疾病的效果,现对105人进行 试验调查,得到2⨯2列联表。试判断:服用药物和患病之间是否有关系? 解:105=n ,10=a ,45=b ,20=c ,30=d 75 305055)20453010(1052 2 ⨯⨯⨯⨯-⨯⨯=K ≈6.109>5.024 (提示:运算时尽量先约分化简,再计算) 所以,有1-0.025=97.5%的把握认为服用药物和患病之间有关系。