案例统计公式(绝对精华)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计案例
一、回归分析
1. 线性回归方程ˆˆˆy
bx a =+的求法 (1)求变量x 的平均值,即1231
()n x x x x x n
=+++⋅⋅⋅+ (2)求变量y 的平均值,即1231
()n y y y y y n
=
+++⋅⋅⋅+ (3)求变量x 的系数ˆb
,即1
2
1
()()
ˆ()
n
i
i
i n
i
i x x y y b x x ==--=-∑∑(题目给出,不用记忆)
1
2
1()()
ˆ()
n
i
i
i n
i
i x x y y b
x x ==--=-∑∑
1
1
1
1
2
2
1
1
1
2n
n
n n i i
i
i
i i i i n
n n
i
i i i i x y x y xy x y x
xx x
=======--+=
-+∑∑∑∑∑∑∑1
22
21
2n i i
i n
i
i x y nx y nx y nx y x
nx nx
==--+=
-+∑∑12
21
n
i i
i n
i
i x y nx y
x
nx
==-=
-∑∑(理解记忆)
(其中1
1
n n i i i x x nx ====∑∑,1
1
n n
i i i y y ny ====∑∑,()
,x y 称为样本点中心)
(4)求常数ˆa
,即ˆˆa y bx =- (5)写出回归方程ˆˆˆy bx a =+(ˆa ,ˆb 的意义:以ˆa 为基数,x 每增加1个单位,y 相应地平均增加ˆb
个单位) 注意:若ˆ0b >则正相关,若ˆ0b <则负相关. 2. 相关系数
假设两个随机变量的取值分别是()11,x y ,()22,x y ,……,(),n n x y ,则变量间线性相关系数的计算公式如下:
()()
n
n
i
i
i i
x x y y x y nx y
r ---=
=
∑∑
相关系数r 的性质:
(1)当0r >时,表明两个变量正相关;当0r <时,表明两个变量负相关;当0r =时,表明
两个变量不相关. (2)[]1,1r ∈-.
(3)r 的值越接近1,x ,y 的线性相关程度越强;r 的值越接近0,x ,y 的线性相关程度越弱.
(4)当0.75r >时,x ,y 线性相关关系很强;当0.75r ≤时,x ,y 线性相关关系很弱.
二、独立性检验
1.二维列联表
一般地,假设有两个分类变量X 和Y ,它们的取值分别为{}12,x x 和{}12,y y ,其样本频数列联表(称为22⨯列联表)为:
注意:数据a 具有两个属性1x ,1y ;数据b 具有两个属性1x ,2y ;数据c 具有两个属性2x ,2y 数据d 具有两个属性2x ,2y .其中n a b c d =+++为样本容量. 2.解题步骤
(1)假设检验问题 (一般假设两个变量没有关系); (2)列出上述表格;
(3)计算检验指标(随机变量):2
2
()()()()()
n ad bc K a b c d a c b d -=++++;
(4)查表得出结论.
例如:若计算得29K =,而97.879
>,则推断“两个分类变量有关系”犯错误的概率不超过0.005,即说明这两个分类变量有关系的概率为99.5%(或说有99.5%的把握认为这两个分类变量有关系)