卡方分布及其它分布

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

另外,写论文的过程中也使我们对论文的格式有了一个了解,更规范更具 体,为以后的学业报告做了一次很好的准备。论文属于科学性的文章,它有严格 的书写格式规范,因此一篇好的论文一定 要有正确的格式,论文格式错误就不 能得到好成绩,因此我们写论文时要端正态度,注意书写格式。
多元课程的设计更加是丰富了我们的业余生活,让大家聚在一起讨论题目, 其乐融融。这样的课程设计也能使我们找到志同道合的朋友,发现生活中的点滴 数学趣事,从实际出发思考题目,同时我们对计算机的知识也有了一定的加深, matlab 的使用等等。
n
g (x) n 1 (1 x 2 )(n5) / 2 (1 x 2 n 3 x 2 )
n
n
Hale Waihona Puke Baidu
nn
故 g(x) 0 的 解 为
x n /(n 2) ,即分布密度在 x n /(n 2) 处有拐点。
性质 2 lim t(x; n)
1
1 x2
e2
n
2
性质 3 设 X ~ tn ,若 r n ,则 E( X r ) 存在;若 r n ,则 E( X r ) 不存在。此点由微积分
二、 卡方分布的性质::
(1) (可加性)
设Yi
~
2 ni ,i
,i
1,,
k , 且相互独立,则
Y1
Yk
~
2 n,
,
这里 n ni , i .
(2)
E(
2 n ,
)
n
,
Var(
2 n ,
)
2n
4.
证明 (1)根据定义易得。
(2)设 Y
~
2 n,
,则依定义,Y可表示为
Y
X
2 1
X
2 n1
X
f1 (x2 x) f2 (x2 ) x2 dx2.
2

n
2( )
f
(x) 2 •
z n
( n )
2
1 2
e x e dx ,
x2 x22 2
n
nx22 2
0
2
2
令u x2 n x2 ,则上式变为 2
n
f
(x)
z n
( n )
n2
n1
0
2u neu2 du
(n x2 ) 2
2
n
P x2 z
1
2
n 2
1
n
x
n1
2 z
d
0
2
1
2
n 2
1
n
z n 1
2 2 d
0
2
即, 2 的密度函数为
f
z2
x
2
n 2
1
n 2
z
n 1 z
2 e2
,当z
0
0,其他
称这个密度函数所定的分布为自由度为
n

2
分布,记作
2 (n)
。它的图像
如下:
图(一) 2 分布密度函数图
r1
0, r2
6 ,n n4
5,6,
性质 4 tn 分布由于只有 n 1阶矩存在,故没有矩母函数存在。
性质 5
如 X 1 和 X 2 独立同分布于 2 n ,则随机变量Y
dy (n y 2 )2 /(2ny) • dt
1
3
t 2 (1 t) 2 dt ,因此
2
x
A2
0
x2
1
(1 y 2 )(n1) / 2 dy nx2
B(1 , 1 n) n
0
22
1
n1
(1 t) 2 •
B(1 , 1 n)
22
1
11
2 I x2 /(nx2 ) ( 2 , 2 n)
, z
n
n
P{ x}• P{z ny2}
P{ x}• P{ z y} n
F (x) • F
z ( y),当y 0时. n
F
,
z (x) 0 F (x) • 0 F (x) • F
(x),当y 0时.
z
n
n
故得证与 z n是相互独立的 . (其实,由商的密度函数为
f
1
(x)
t 分布的有关知识
t 分布的概述及其历史
在概率论和统计学中,学生 t-分布(Student's t-distribution)应用在当对呈 正 态 分 布 的 母 群 体 的 均 值 进 行 估 计 。它 是 对 两 个 样 本 均 值 差 异 进 行 显 著 性 测 试 的 学 生 t 测定的基础。t 检定改进了 Z 检定,不论样本数量大或小皆可应用。在样本数量大 (超过 120 等)时,可以应用 Z 检定,但 Z 检定用在小的样本会产生很大的误差,因 此样本很小的情况下得改用学生 t 检定。在数据有三组以上时,因为误差无法压低, 此时可以用变异数分析代替学生 t 检定。 当母群体的标准差是未知的但却又需要估计时,我们可以运用学生 t-分布。 学生 t-分布可简称为 t 分布。其推导由威廉·戈塞于 1908 年首先发表,当时他还在都柏林的 健力士酿酒厂工作。因为不能以他本人的名义发表,所以论文使用了学生(Student)这一 笔名。之后 t 检验以及相关理论经由罗纳德·费雪的工作发扬光大,而正是他将此分布称为 学生分布 由于在实际工作中,往往 σ 是未知的,常用 s 作为 σ 的估计值,为了与 u 变换区别,称为 t 变换 t= x u ,统计量 t 值的分布称为 t 分布。
s x
t 分布的分布函数及证明
用 T (x; n) 表示 tn 分布的分布函数,则
1
11
T (x; n)
2 I n /(nx2 ) ( 2 , 2 n)
1 2
1
I
x2
/(n x 2
)
(1 2
,
1 2
n)
x0
证明 根据分布函数的定义有
x0
x
x
T (x; n) t( y; n)dy
1
• (1 y 2 ) (n1) / 2 dy
与这变换相应的函数行列式为:
r r
x1,, xn r,1,,n1
r r
n -1
r
r r
其中括号和 都表示 1,, n1 的函数。因此。当 z>0 时,
P 2 z
1 2
n 2
0
z
r
n-1
r2 -
z
dr
C
C 是常数。
为了定出 C,在上述等式的两端令 r , 得到
2x
20
然后利用刚刚的讨论可知
11
11 1
11
T (x; n)
2
2
I x2 /(nx2 ) ( 2 ,
n) 2
2
I n /(nx2 ) ( 2 ,
n) 2
综上所述便得我们所要的结论。
t 分布的密度函数及证明
设 , z 为相互独立随机变量, 服从正态 N (0,1), z 服从自由度为 n 的 2 —分布,则
n 2
(
n
1)
2
( n )
n1
(n x2 ) 2
2
n 1
(
2
)
(1
x2
n1
) 2.
n ( n) n
2
证明过程用到公式
( )
0
x1ex dx
2
0
y 21e y2 dy
( 0).
t 分布的 w 特征函为:
(t)
( n 1)
2
(1 x^2)^ ( n 1)wal(x,t)dx
n ( )
n
中判别积分收敛的法则很容易看出。
若 r n ,且 r 为奇数,由于函数 x r (1 x 2 / n)(n1) / 2 是 x 的奇函数,因此,r 0 ;

rn

r
为偶数,可以算得
r
r
nr
/2
(n
1•3• 2)(n
5(r 1) 4)(n
r)
特别
E(X ) 0,Var(X ) n , n 3,4, n2
t=
z n 的密度函数为
n 1
ft (x)
f
/
(x)
z/n
(
2
)
• (1
x2
n1
)2
n (n)
n
2
称 ft (x) 是自由度为 n 的 t —分布(或 Student 分布)的密度函数,
证:首先,易知与 z n 相互独立,事实上,
F (x, y) P{ x, z y} P{ x, z ny2}
n
2
2
t 分布有如下特征:
1、t 分布是对称分布,且其均值为 0
2.t 分布是一簇曲线,其形态变化与 n(确切地说与自由度 ν)大小有关。自由 度 ν 越小,t 分布曲线越低平;自由度 ν 越大,t 分布曲线越接近标准正态分布 (u 分布)曲线,如图 1。
3、t 分布是一个分布族,对于不同的样本容量都对应不同的分布,且其均值都为 0。
1
1 2
n 2
r
n
1
r2 z
dr
C
0
从而,
C
n
2 2
r
n1
2 z
dr
0
在分母内的积分中令 1 r2 ,即,用 r
1
2 2 作代换,那么,这个积分等
2

n-1 n1
2
2
2
2

1
1
2 d
n 1
22
n 1
2
n d
2
n 2
1
n
0
2
0
2
因此, C
2
n 2
2
n 2
1
n
2
从而,当 z>0 时,
f
x2
x
2
n 2
1
n 2
x
n 1
2e
x 2
,当x
0
0,其他
设随机变量 X1,.... Xn相互独立且都服从 N(0,1)。现在来推导随机变 数
^2 1 ^2 ..... n ^2的分布。
1,
n
的密度函数为 1 2n^
n
^
1 2
x
1
^
2
x
n
^
2
2
当z 0时,P 2 z P 12 X n 2 z 0
2 n
,
其中 X i ~ N (0,1), i 1,, n 1, X n ~ N ( ,1), 且相互独立,于是
n
E(Y )
E
(
X
2 i
),
(1)
i 1
n
Var(Y )
V
ar(
X
2 i
).
(2)
i 1
因为
E(
X
2 i
)
Var(X i )
E(Xi )2
1, 1 ,
i
1,, n i n.
四、卡方分布的累积分布函数为:
Fk x
f x2 x dx
1
n
x
1
x 2 e 2 dx
0
2
n 2
n
2
Fk
x
k 2 k
,
x 2 2

其中 γ(k,z)为不完全 Gamma 函数。其图像如下:
图(二) 2 分布的分布函数图
五、 卡方分布的特征函数及其推导:
特征函数: ψ(t)
=
f(x)dx
4、与标准正态分布相比,t 分布的中心部分较低,2 个尾部较高。
5、变量 t 的取值范围在 到 之间
图 1 自由度为 1、5、∞的 t 分布
t 分布有如下性质:
性质 1
令 g(x) (1
2
x ) (n1) / 2
n
则 g (x) n 1 (1 x 2 )(n3) / 2 • x
n
当z o时,P 2 z P 12 X n 2 z Dz
1-
1 2
x1
^
2
xn
^
2
e d n
x
2n2
其中 Dx 为 n 维 x 空间内由不等式 x12 xn2 z 所定的区域。
即,Dz 为 n 维 x 空间内以坐标原点为球心、 z 为半径的球面所围成的区域
(边界不在内) 可以利用极坐标来计算这积分。令 x1 r sin1 sin 2 sin n1 x2r cos1sin2 sinn1 xn1 r cos n 2 sin n1 xn r cos n1




一、 卡方分布的定义:
若 n 个相互独立的随机变量 ξ1,ξ2,…,ξn ,均服从标准正态分 布(也称独立同分布于标准正态分布),则这 n 个服从标准正态分布的随 机变量的平方和∑ξi∧2 构成一新的随机变量,其分布规律称为 χ2(n)分 布(chi-square distribution),其中参数 n 称为自由度。
=
dx
=
六、 论证过程中的心得体会:
首先通过对卡方的研究和证明,提高了我们对数学的兴趣。其次,通过这 次的推导和搜索资料进行分析,大大提高了我们的独立思考的能力,我们当中很 多同学之前都很害怕类似的证明题,这一次的合力解决难题使我们信心倍增。 当然同时,这个合作锻炼了我们团队合作的能力,分工合作解决问题,有的人负 责收集资料,有点人负责推导公式,有的人负责输入文章,整理公式,等等。这 让大家明白了团结的力量。做出合理的时间安排, 做任何事情,合理的时间安 排非常重要,多元课程设计也是一样,事先要做好一个规 划,课程设计一共分 5 个板块(定义,性质,特征函数,密度函数,分布函数,心得体会)。你每 天 要做完哪几个板块事先要确定好,这样做才会使自己游刃有余,保证在 2 周时间 内内完成论文,以避免由于时间上的不妥,以致于最后无法完成论文。
1,
代入(1),第一条结论可得证。直接计算可得
E
X
4 i
3,
i 1,, n 1,
E
X
4 n
2
6
3.
于是
Var(
X
2 i
)
EX
4 i
(EX
2 i
)
2
3 1
2,
i 1,, n 1,
Var
(
X
2 n
)
EX
4 n
(
EX
2 n
)
2
2
4.
代入(2)便证明了第二条结论。
三、 卡方分布的概率密度函数:
故T (x; n)
A1
A2
1 2
1 2
11 I X 2 /(nx2 ) ( 2 , 2 n)
1
3
t 2 (1 t) 2 dt
2
1 2
1
I x2
1 ( 2 /(n x2 )
,
1 2
n)
而当 x 0时,我们有
T(x;n)
1
t( y; n)dy
1
0
t( y; n)dy
1
x
t( y; n)dy
x
B(1 , 1 n)
n
22
当 x 0时,上式为
0
T (x; n)
1
(1 y 2 ) (n1) / 2 dy x
B(1 , 1 n) n
0
22
1
(1
B(1 , 1 n)
y2 n
)
( n 1)
/
2
dy
A1
A2
22
由于 t( y; n)dy 1,故立即可得 A1 1/ 2 ,为了计算 A2 ,我们做变换 t y 2 /(n y 2 ) 则
相关文档
最新文档