案例统计公式(绝对精华)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

统计案例

一、回归分析

1. 线性回归方程ˆˆˆy

bx a =+的求法 (1)求变量x 的平均值,即1231

()n x x x x x n

=+++⋅⋅⋅+ (2)求变量y 的平均值,即1231

()n y y y y y n

=

+++⋅⋅⋅+ (3)求变量x 的系数ˆb

,即1

2

1

()()

ˆ()

n

i

i

i n

i

i x x y y b x x ==--=-∑∑(题目给出,不用记忆)

1

2

1()()

ˆ()

n

i

i

i n

i

i x x y y b

x x ==--=-∑∑

1

1

1

1

2

2

1

1

1

2n

n

n n i i

i

i

i i i i n

n n

i

i i i i x y x y xy x y x

xx x

=======--+=

-+∑∑∑∑∑∑∑1

22

21

2n i i

i n

i

i x y nx y nx y nx y x

nx nx

==--+=

-+∑∑12

21

n

i i

i n

i

i x y nx y

x

nx

==-=

-∑∑(理解记忆)

(其中1

1

n n i i i x x nx ====∑∑,1

1

n n

i i i y y ny ====∑∑,()

,x y 称为样本点中心)

(4)求常数ˆa

,即ˆˆa y bx =- (5)写出回归方程ˆˆˆy bx a =+(ˆa ,ˆb 的意义:以ˆa 为基数,x 每增加1个单位,y 相应地平均增加ˆb

个单位) 注意:若ˆ0b >则正相关,若ˆ0b <则负相关. 2. 相关系数

假设两个随机变量的取值分别是()11,x y ,()22,x y ,……,(),n n x y ,则变量间线性相关系数的计算公式如下:

()()

n

n

i

i

i i

x x y y x y nx y

r ---=

=

∑∑

相关系数r 的性质:

(1)当0r >时,表明两个变量正相关;当0r <时,表明两个变量负相关;当0r =时,表明

两个变量不相关. (2)[]1,1r ∈-.

(3)r 的值越接近1,x ,y 的线性相关程度越强;r 的值越接近0,x ,y 的线性相关程度越弱.

(4)当0.75r >时,x ,y 线性相关关系很强;当0.75r ≤时,x ,y 线性相关关系很弱.

二、独立性检验

1.二维列联表

一般地,假设有两个分类变量X 和Y ,它们的取值分别为{}12,x x 和{}12,y y ,其样本频数列联表(称为22⨯列联表)为:

注意:数据a 具有两个属性1x ,1y ;数据b 具有两个属性1x ,2y ;数据c 具有两个属性2x ,2y 数据d 具有两个属性2x ,2y .其中n a b c d =+++为样本容量. 2.解题步骤

(1)假设检验问题 (一般假设两个变量没有关系); (2)列出上述表格;

(3)计算检验指标(随机变量):2

2

()()()()()

n ad bc K a b c d a c b d -=++++;

(4)查表得出结论.

例如:若计算得29K =,而97.879

>,则推断“两个分类变量有关系”犯错误的概率不超过0.005,即说明这两个分类变量有关系的概率为99.5%(或说有99.5%的把握认为这两个分类变量有关系)

相关文档
最新文档