t分布及其应用的探讨

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

322
申小征,吴仍康
由度为 ∞ 时的值来确定取样数比较可靠: n = 出。
(x − µ)
s 2t(2α ,∞ )
,其中 s 2 可以在正式调查前的预备调查中的实际算
例 2.2 在上例所述的池塘中, 假设已知鲢鱼样本标准差为 s = 0.17 市斤, 如果我们要求样本均值与总 体均值的允许偏差为总体均值的允许偏差为 0.07 市斤,试求 90%置信概率的鲢鱼样本应取样数。 0.17 2 × 1.642 解: = n = 15.9 ≈ 16 0.07 2 即取样数为 16 即可。 2) 单样本区间估计在产品寿命中的应用 例 2.3 [2] 假定某种轮胎的寿命服从正态分布.为了估计这种轮胎的平均使用寿命,我们随机地抽取 12 只轮胎进行试用,测得它们的使用寿命(单位:万千米)如表 1。 试求平均寿命的 0.95 置信区间。 解: 这里正态总体的标准差未知, 故可使用 t 分布求均值的置信区间. 其中 x = 4.7092 , 取 s 2 = 0.0615 .
∑ ( xi − x )
i =1
2
n −1
,n 为样本容
利用 t 分布,对于任意可能的偏差 ε > 0 ,我们计算概率 P ( x − µ < ε ) , 设
X −µ ε ε ε < P X −µ <ε = P P ( t < t1−α ) = 1 − α 其中 t1−α = ,即 ε = = t1−α ,则对于置信度 S n S n S n n
S = 0.34 市斤.试求该样本总体均值 µ 以 90%的置信区间。
解:自由度 k = n − 1 = 22 − 1 = 21 和 α = 0.1 查 t 分布表可得到 t1−α = 1.721 ,由此可得偏差为
s 0.34 t1−α = × 1.721 = 0.12 n 22
ε=
所以置信区间为
1.34 − 0.12 < µ < 1.34 + 0.12
于是 P ( 0 < t < = y)
(wenku.baidu.com
)
1 + n 1 2 n +1 Γ − 1 1 2 2 2 n 2 2 2 −1 = pt ( y ) yp = y y F y 1 + y n 1 n Γ Γ 2 2 n +1 n +1 − Γ y2 2 2 = , − ∞ < y < ∞. 1 + n n nπΓ 2
(
)
1 − α ,可以查 t 分布表(自由度为 n − 1 ),求出 t1−α ,进而按上式求出偏差 ε ,便可得到 µ 的置信区间

s s s x − µ < ε = t1−α ,或 − t1−α < µ − x < t1−α , n n n
即x−
s s t1−α < µ < x + t1−α 。 n n
1
( )
( )
这就是自由度为 n 的 t 分布的密度函数。 t 分布是一簇曲线,其形态大小变化与自由度的大小相关。如果自由度 v 越小,t 分布的曲线就越低
320
申小征,吴仍康
平;如果 v 自由度越大,t 分布的曲线越与标准正态分布曲线接近,t 分布图像,如图 1。
2.2. t 分布的性质[1]
x 与 s 2 分别是该样本均值与样本方差, 性质 1: 设 x1 , x2 , , xn 是来自正态分布 N µ , σ 2 的一个样本,


t分布是统计学中的一类重要分布,它在区间估计和假设检验中有很重要的应用,具体包括单样本的区间
文章引用: 申小征, 吴仍康. t 分布及其应用的探讨[J]. 统计学与应用, 2015, 4(4): 319-334. http://dx.doi.org/10.12677/sa.2015.44036
申小征,吴仍康
2 性质 2:设 x1 , x2 , , x m 是来自 N µ1 , σ 12 的样本, y1 , y2 , , y n 是来自 N µ2 , σ 2 的样本,且此两样本
(
)
(
)
相互独立,记
1 m 1 n 2 2 ( xi − x ) , s 2 ∑ ∑ ( yi − y ) , y= m −1 i 1= n −1 i 1 =
Keywords
t-Distribution, Interval Estimation, t-Text, SPSS Software
t分布及其应用的探讨
申小征,吴仍康
云南财经大学统计与数学学院,云南 昆明 收稿日期:2015年12月9日;录用日期:2015年12月27日;发布日期:2015年12月30日
X1 的分布为自 X2 n
P ( 0 < t < y ) = P ( 0 < −t < y ) = P ( − y < t < 0 ) ,
1 P t 2 < y2 . 2 X 12 ~ F (1, n ) ,将上式两边关于 y 求导可得 t 分布的密度函数为 由 F 变量构造可知, t 2 = X2 n
2. t 分布
2.1. t 分布的定义[1]
假设随机变量 X 1 ~ N ( 0,1) , X 2 ~ χ 2 ( n ) , 且变量 X 1 与变量 X 2 相互独立,则称 t = 由度为 n 的 t 分布,记作 t ~ t ( n ) 。 下面导出 t 分布的密度函数。由标准正态密度函数的对称性可知, X 1 与 − X 1 相同分布相同,从而 t 与−t 有相同分布。这说明:对任意实数 y 有
即 1.22 < µ < 1.46 。 也就是说, 我们有 90%的把握推断该鱼塘鳙鱼平均体重为 1.22~1.46 市斤. 有时候我们需要知道样本 量,故可通过单样本区间估计得出样本量。样本量的确定,从 2.1.1 的推导我们可以知道,对于置信区间
2 s 2tα s s tα = α 。由 x − µ < 通常我们取 tα 等于自 tα 可以得到 n < α ,偏差 x − µ 满足 P x − µ < 2 n n (x − µ)
2
也常记为 x ± t1−α
( n − 1) s
= s2 n ,此处
1 n 2 ( xi − x ) 是 σ 2 的无偏估计。 ∑ n − 1 i =1
3.1.2. 单样本区间估计的应用 1) 在渔业中的应用 例 2.1 某水产研究所池塘养殖室,1979 年在某渔场一块面积 15 亩的池塘,他们将利用城市的污水 进行养殖鲢、鳙鱼来进行试验,年初时鲢、鳙鱼种在池塘中各放入 12,000 条(其中鱼的个体长约 8 寸), 经数据统计知年终取样捕捞鳙鱼 22 条,经计算可以得到样本均值为 x = 1.34 市斤,该样本的标准差为
Statistical and Application 统计学与应用, 2015, 4(4), 319-334 Published Online December 2015 in Hans. http://www.hanspub.org/journal/sa http://dx.doi.org/10.12677/sa.2015.44036
Discussion on t-Distribution and Its Application
Xiaozheng Shen, Rengkang Wu
School of Statistics and Mathematics, Yunnan University of Finance and Economics, Kunming Yunnan Received: Dec. 9 , 2015; accepted: Dec. 27 , 2015; published: Dec. 30 , 2015 Copyright © 2015 by authors and Hans Publishers Inc. This work is licensed under the Creative Commons Attribution International License (CC BY). http://creativecommons.org/licenses/by/4.0/
则有
(
)
= t
证明:由于 x ~ N µ , σ 2 n 所以可以推出
n (x − µ) ~ t ( n − 1) s
x −µ
(1.1)
(
)
σ
~ N ( 0,1) 。将(1.1)式左端改写成为
n (x − µ) = s
2
x −µ σ n
( n − 1) s 2 σ 2
n −1
因为分母的根号里是自由度为 n − 1 的 χ 变量除以它的自由度, 分子是标准正态变量, 并且分子与分 母相互独立,我们由 t 分布定义可知 t ~ t ( n − 1) ,证毕。
th th th
Abstract
The t-distribution is an important distribution in statistics, it has very important application in the interval estimation and hypothesis test, including t-test in the interval estimation of single samples, two samples of independent interval estimation, one sample of the mean test, two sample mean difference. The paper introduces the nature of t-distribution and its application in real life, such as product life, fishery, agriculture, and also achieves a single sample and two sample t-test in the test of hypothesis with the help of the statistical software SPSS.
2 sx =
其中
= x
则有
F =
2 2 设σ = σ = σ 2 ,并记 1 2
1 m 1 n = xi , y ∑ ∑ yi , m i 1= ni1 =
2 sx σ 12 ~ F ( m − 1, n − 1) 2 s2 y σ2
2 sw =
( m − 1) s
+ ( n − 1) s = m+n−2
2 x
m n 2 2 i y i 1= i 1 =
∑(x
− x ) + ∑ ( yi − y ) m+n−2
2
Figure 1. Degree of freedom was 1, 5, ∞ for the t distribution 图 1. 自由度为 1、5、∞的 t 分布
321
申小征,吴仍康
则有
( x − y ) − ( µ1 − µ2 ) ~ t
sw 1 1 + m n
( m + n − 2)
3. t 分布在区间估计中应用
3.1. 单样本的区间估计[1]
3.1.1. 均值的区间估计
n
= 方差未知时, t 统计量 t
量.
n (x − µ) ~ t ( n − 1) ,其中 s 为样本标准差 s = s
估计、独立两样本的区间估计、单样本的均值检验、两样本均值差的t检验。文中详细介绍了t分布定义 性质及其在产品寿命、渔业、农业等实际生活中的应用,并借助统计软件SPSS实现单样本t检验和两样本 t检验。
关键词
t分布,区间估计,t检验,SPSS软件
1. 引言
t 分布是统计学中的一类重要分布,英国统计学家哥塞特(Gosset)发现了它与标准正态分布的微小 差别,在置信区间估计和显著性检验问题的计算中起到了重要作用。从各种有关统计资料中可以发现很 多有关 t 分布的应用,例如在渔业中、农业、工业等中的应用,为此可用 t 分布进行区间估计和假设检验 来解决一些实际生活问题。 t 检验是假设检验方法最常用方法之一,常用于正态总体均值的假设检验。单边检验和双边检验的拒 绝域在许多统计学和概率论的教材中都给出了明确的定义。当样本数据比较多的时候,t 检验方法虽然简 单,但其计算量仍然比较大,因此我们可以使用 SPSS 软件来实现 t 检验。本文用 SPSS13.0 分别讨论了 单样本与独立两样本两种情形的 t 检验。
相关文档
最新文档