3第四章 抽样分布
第4章抽样分布与参数估计习题
第四章抽样分布与参数估计思考与练习一、单项选择题1.抽样平均误差与极限误差间的关系是( d )。
a. 抽样平均误差大于极限误差b. 抽样平均误差等于极限误差c. 抽样平均误差小于极限误差d. 抽样平均误差可能大于、等于或小于极限误差2.在其它条件不变的情况下,如果允许误差缩小为原来的二分之一,则样本容量( a )。
a. 扩大为原来的4倍b. 扩大为原来的2倍c. 缩小为原来的二分之一d. 缩小为原来的四分之一3.类型抽样影响抽样平均误差的方差是( b )。
a. 组间方差b. 组内方差c. 总方差d. 允许误差4.当样本单位数充分大时,样本估计量充分地靠近总体指标的可能性趋于1,称为抽样估计的( b )。
a.无偏性b.一致性c.有效性d.充分性二、多项选择题1.影响抽样平均误差的因素有( a b c d )。
a.总体标志变异程度b.样本容量c.抽样方式d.抽样的组织形式e.样本指标值的大小2.抽样估计的抽样平均误差(a c e)。
a.是不可避免要产生的b.是可以通过改进调查方法消除的c.是可以事先计算的d.只有调查结束之后才能计算e.其大小是可以控制的3.确定样本容量时,可用以下方法取得近似的总体方差估计值(a b c )。
a.参考以往调查的经验资料b.以试点调查的样本方差来估计c.在做成数估计时,用成数方差最大值0.25来代替d.假定总体不存在标志变异,方差为零三、计算题1.某市居民家庭人均年收入是服从μ=4 000元,σ=1 200元的正态分布,求该市居民家庭人均年收入:(1)在5 000~7 000元之间的概率;(2)超过8 000元的概率。
解:(1)1200,4000==σμ。
{}()()0.197055935.020325.09876.00062.08333.02}8333.0{1}5.2{2}5.2{1}8333.0{}5.2{}5.28333.0{}70005000{}70005000{=+-+=⎪⎪⎭⎫ ⎝⎛<+<--⎪⎪⎭⎫ ⎝⎛<+<-=<-<=<<=-<=-<-=<<z prob z prob z prob z prob z prob z prob z prob z x prob x prob σμσμσμ (2) {}{}{}00035.0333.32333.311333.31}333.3{}8000{}8000{=⎥⎥⎦⎤⎢⎢⎣⎡<+<--=<-=>=->=-=>z prob z prob z prob z prob z x prob x prob σμσμ2.某小组5个工人的周工资分别为140、160、180、200、220元,现在用重复抽样的方法从中抽出2个工人的工资构成样本。
第四章抽样分布
10 42 7 60 7 6 e 7 P X 6 0.149 6!
4.2 随机变量的概率分布
4.2.3 连续型概率分布
连续型随机变量的概率分布
1. 连续型随机变量可以取某一区间或整个实 数轴上的任意一个值 2. 它取任何一个特定的值的概率都等于0 3. 不能列出每一个值及其相应的概率 4. 通常研究它取某一区间值的概率 5. 用概率密度函数的形式和分布函数的形式 来描述
二项分布
(Binomial distribution)
1. 重复进行 n 次试验,出现“成功”的次数 的概率分布称为二项分布,记为X~B(n, p) 2. 设X为 n 次重复试验中出现成功的次数,X 取 x 的概率为 x x n x
P X x Cn p q
n!
( x 0,1,2,, n)
(4) P(X2)=0.35+0.30=0.65
二项试验
(Bernoulli试验) 1. 二项分布建立在Bernoulli试验基础上
2. 贝努里试验满足下列条件
一次试验只有两个可能结果,即“成功”和“ 失败”
“成功”是指我们感兴趣的某种特征
一次试验“成功”的概率为p ,失败的概率为q =1- p,且概率p对每次试验都是相同的 试验是相互独立的,并可以重复进行n次 在n次试验中,“成功”的次数对应一个离散型 随机变量X
x 式中: Cn
x! ( n x )!
二项分布
(例题分析)
【例】已知一批产品的次品率为4%,从中任意有放回地抽
取5个。求5个产品中
(1) 没有次品的概率是多少? (2) 恰好有1个次品的概率是多少?
第四章 (概率论基础与抽样分布)
4 - 25
第四章 概率论与抽样分布
第二节 概率分布
分布函数与密度函数的图示
1. 密度函数曲线下的面积等于1 2. 分布函数是曲线下小于 x0 的面积
f(x)
4 - 26
F ( x0 )
x0
x
第四章 概率论与抽样分布
第二节 概率分布
连续型随机变量的期望和方差
1. 连续型随机变量的数学期望为
E(X ) xf (x)dx
4 - 41
第四章 概率论与抽样分布
第二节 概率分布
4 - 42
第四章 概率论与抽样分布
第二节 概率分布
【例】已知x~N(12.86,1.332),若 P(x<l1)=0.03,P(x≥l2)=0.03,求l1,l2
概率的性质
1. 非负性 对任意事件A,有 0 P 1
2. 规范性 必然事件的概率为1;不可能事件的概率为0。即
P ( ) = 1; P ( ) = 0
3. 可加性 若A与B互斥,则P ( A∪B ) = P ( A ) + P ( B ) 推广到多个两两互斥事件A1,A2,…,An,有 P ( A1∪A2 ∪… ∪An) = P ( A1 ) + P (A2 ) + …+ P (An )
标准正态分布
=1
0.1664
2.9 5 7.1 X
.0832 .0832
-.21 0 .21 Z
4 - 37
第四章 概率论与抽样分布
第二节 概率分布
【例】已知x~N(30.26,5.12), 求P(|x-30.26|<5.1); P(20.06≤x<40.46)
P(| X 30.26 | 5.1) P 5.1 X 30.26 5.1
第四章 抽样分布
二、总体标准差未知的情况
当总体标准差未知时,可用样本标准差代替
两个总体相互独立,且均服从正态分布,同时
1 2
则
tf
( x1 x 2 ) ( 1 2 ) fs f s f1 f 2
2 1 1 2 2 2
1 1 n n2 1
概率等于该区间所夹曲线下面积
P(t t ) P(t t )
P( t t / 2 )
ta/2
t1-a/2
附:t分布表
t分布表的使用
对于双侧置信概率的t分布表
概率P可由t分布表查出 反过来,亦可查出给定概率下的t的取值
二、样本方差的分布
设x1,x2,…,xn是来自正态总体
1 F ( f1 , f 2 )
2 f2
F分布的另一个重要的性质
F1 ( f 2 , f1 )
F分布的概率密度曲线
F分布概率示意图
F分布表的使用
不同f取值的χ2分布概率密度曲线
附:χ2分布表
χ2分布表的使用
4.3 从两个正态总体中抽取的 样本统计量的分布
假定有两个正态总体
从第一个总体 N(μ1,σ12) 中随机抽取 含量为n1的样本,并独立地从第二个总体
N(μ2,σ22) 中抽取含量为n2的样本。
x1 , s1
和标准差
和
x 2 , s2 为两个样本的均值
p(t ) f 1 ( ) f 1 2 t 2 (1 ) 2 f f ( )( f / 2)
t
随f的增加,t分布趋近于标准正态分布
自由度较大(f>30)的t分布可以近似地按N(0, 1)分布处理
第四章 抽样分布
从两个正态总体中抽取的样本统计量的分布 二、标准差σ i未知但相等时两个平均数的和与差的 分布
t2 n 2
( y1 y2 ) ( 1 2 ) s s n
2 1 2 2
从两个正态总体中抽取的样本统计量的分布 三、两个样本方差比的分布——F分布
Fdf1 ,df2
t0.05(0.01)=? -t0.05(0.01)=? t0.05/2(0.01/2)=?
二、样本方差的分布
2 df
dfs 2
2
(n 1) s 2
2
2
2
2 K ( ) 2 e f df ( ) 2 0 , 0
df 1 2
,
2
0 K
y , y n
即 y 服从正态分布 N(μ,σ 2/n)。
标准差未知时平均数的分布——t分布
y t 具n-1自由度 s n 样本标准误
t分布的特征数:
t 0
(df>1) (df>2)
1:t 0
(df>3)
df t df 2
2:t
6 (df>4) df 4Biblioteka t分布曲线下总的面积等于1。
f=∞
f=5 f=1
图3-6 t分布曲线
t分布的累积分布函数为:
Ft ( df ) P(t t1 )
t1
f (t )dt
P(t ta ) P(t ta ) a
P( t t a ) a
2
- t (n)
t (n)
u
( y1 y2 ) ( 1 2 )
第四章 抽样与抽样分布习题及答案
5.参数是总体的某种特征值,而统计量是一个不含未知参数的样本函数。
答案:对
6.在计算样本容量时,成数方差P(1-P)在完全缺乏资料的情况下,可用成数方差P(1-P)的极大值0.5 0.5来代替。
答案:对
A.前者高说明后者小
B.前者高说明后者大
C.前者变化而后者不变
D.两者没有关系
答案:a
6.在简单随机重复抽样下,欲使抽样平均误差缩小为原来的三分之一,则样本容量应( )。
A.增加8倍
B.增加9倍
C.增加倍
D.增加2.25倍
答案:b
7.当总体单位数较大时,若抽样比为51%,则对于简单随机抽样,不重复抽样的平均误差约为重复抽样的( )。
3.抽样极限误差是( )。
A.调查性误差
B.一定可靠程度下的抽样误差可能范围
C.最小抽样误差
D.等于抽样平均误差
答案:b
4.在其它条件相同的情况下,重复抽样的抽样平均误差和不重复抽样的相比( )。
A.前者一定大于后者
B.前者一定小于后者
C.两者相等
D.前者可能大于、也可能小于后者
答案:a
5.抽样推断的精确度和极限误差的关系是( )。
抽样与抽样分布习题及答案
单选题
1.抽样调查抽选样本时,遵循的原则是( )。
A.随机原则
B.同质性原则
C.系统原则
D.主观性原则
答案:a
2.抽样误差是指( )。
A.在调查过程中由于观察、测量等差错所引起的误差
B.在调查中违反随机原则出现的系统误差
C.随机抽样而产生的代表性误差
D.人为原因所造成的误差
答案:c
A.51%
B.49%
第四章 抽样
(1)概率抽样:简单随机抽样、系统抽样、 分层抽样、整群抽样、多段抽样、PPS抽样、 户内抽样 (2)非概率抽样:偶遇抽样、判断抽样、 定额抽样、雪球抽样
二、概率抽样的原理与程序
(一)概率抽样的基本原理 1、总体的同质性与异质性 同质性:如果某个总体中的每一个成员在所有方 面都相同,那么,我们就说这个总体具有完全的 同质性。 否则,就存在不同程度的异质性。 同质性总体不需要抽样。 社会各种总体的异质性决定了严格的概率抽样的 必要性。
(二)系统抽样
3、系统抽样优缺点: <1>优点: ①易于实施,工作量少。 ②样本在总体中分布更为均匀,抽样误差 小于或至多等于简单随机抽样。
(二)系统抽样
<2>系统抽样缺点: ①系统抽样是以总体的随机排列为前提, 如果总体的排列出现有规律分布时,会使 系统抽样产生极大误差。 ②当总体内个体类别之间的数目悬殊过大 时,样本的代表性可能较差。 <3>适用范围:系统抽样最适用于同质性较 高的总体。
人们通常采用下列几组数字
有90%的样本统计值落在u〒1.65SE(样本 平均数的标准差)之间; 有95%的样本统计值落在u〒1.96SE之间; 有98%的样本统计值落在u〒2.33SE之间; 有99%的样本统计值落在u〒2.58SE之间。 其中,百分数表示置信水平,u〒1.65SE等 表示置信区间。
随机数表抽样举例
3、简单随机抽样方法
①当总体元素较少时:常用的办法类似于 抽签,即把总体中每一个单位都编号,将 这些号码写在一张张小纸条上,然后放入 一容器如纸盒、口袋中,搅拌均匀后,从 中任意抽取,直到抽够预定的样本数目。 这样,由抽中的号码所代表的元素组成就 是一个简单随机样本。
抽样及抽样分布
分层抽样 概念:分层抽样又称类型抽样。首先将总体单
位按某一个标志分层;然后在各层按随机抽样的方 法分别抽出各层的样本。
特点:分层抽样在层内是抽样调查,层间是全面调
查,所以分层时应该尽量让每层内的变异程度小,
而层间的变异程度大。分层抽样的抽样误差较简单 随机抽样小,样本具有很好的代表性。
抽样平均误差的计算公式:
z
(
X 1
X
)
2
( 1
2
)
s2 1
s2 2
n1 n2
渐近服从标准正态分布。
如果: X1 和 X2 是两个非正态总体,当和样本容
量足够大,
z
(
X1
X
2
)
(1
2
)
s2 1
s2 2
n1 n2
渐近服从标准正态分布。
NEXT
二、样本成数及成数差的抽样 分布
成数的概念 样本成数的分布 两个总体样本成数差的分布
,则样本的成数为p n1
n
。
例如,某工厂生产某种电子元件,某批产品
共10000件,其中不合格品100件原则抽100件,其中
有3件不合格品,则样本的成数为p 3% 。
NEXT
样本成数的分布
用途:推断或估计总体的成数。例如某项改革 方案工人的支持率,产品的正品率等。
假设A、B、C、D、E5位同学的统计学成绩分别为: 80、 86、90、92、96。可计算得总体均值为88.8,总体方 差为29.76。现在随机从中抽容量为2的样本。
重复抽样的所有可能的样本:
样本(AA)(AB)(AC)(AD)(AE)
均值 80 83 85
86 88
样本 (BA)(BB) (BC) (BD)(BE)
概率论抽样分布
概率论抽样分布说明在概率论中,抽样分布是指从总体中选取样本并计算样本统计量的分布。
通过研究抽样分布,可以推断总体的性质和参数。
在这篇文档中,我们将介绍概率论抽样分布的基本概念、特性以及常用的分布类型。
抽样分布的定义抽样分布是由于从总体中抽取样本导致的统计量的分布。
在统计学中,统计量是从样本数据中计算得出的数值,如样本均值、样本方差等。
通过从总体中不断抽取样本并计算统计量的值,可以得到抽样分布。
抽样分布的特性抽样分布具有以下特性:1.中心极限定理:当样本容量足够大时,抽样平均值的抽样分布近似呈正态分布。
2.抽样分布的均值等于总体均值:样本均值的期望值等于总体均值。
3.抽样分布的方差等于总体方差除以样本容量:样本均值的方差等于总体方差除以样本容量。
常见的抽样分布类型在概率论中,常用的抽样分布类型包括:1.正态分布:也称为高斯分布,是最常用的抽样分布。
当样本容量足够大时,均值的抽样分布近似呈正态分布。
2.t分布:用于小样本(样本容量较小)情况下对总体均值的推断。
相对于正态分布,t分布有更宽的尾部。
3.卡方分布:用于推断总体方差时的抽样分布。
卡方分布的形态由自由度决定。
4.F分布:用于比较两个总体方差是否相等的抽样分布。
F分布的形态由两个样本的自由度决定。
抽样分布的应用抽样分布广泛应用于统计学和概率论中的推断与检验问题。
通过从总体中抽取样本并计算统计量的分布,可以进行以下应用:1.参数估计:通过抽样分布,我们可以估计总体参数的取值,如总体均值、总体方差等。
2.假设检验:通过比较样本统计量与抽样分布的临界值,我们可以判断总体参数是否满足某个假设。
3.置信区间估计:通过计算抽样分布的分位数,我们可以得到总体参数的置信区间,从而评估参数的精确性。
总结抽样分布是概率论中的重要概念,用于推断总体的性质和参数。
具备了中心极限定理、均值和方差的性质等特点,常见的抽样分布类型包括正态分布、t分布、卡方分布和F分布。
通过抽样分布,我们可以进行参数估计、假设检验和置信区间估计等应用。
4.3抽样分布
(3) X与S2相互独立
(4) X ~ t(n 1)
Sn
已知, 2未知
(5) n ( Xi )2 ~ 2 (n)
i1
已知
LOGO
例1 设总体X 服从正态分布N (12, 2 ), 抽取容量为
25的样本,求样本均值X大于12.5的概率.如果(1)已
知 12;(2)未知,但已知样本方差S2 3.6.
n1 n2
服
从
F(n1,
n
)
2
分
布
.
LOGO
4.3.2 正态总体的抽样分布
由于要求具体抽样分布是困难的,有时甚至是不可 能的。正态总体的抽样分布有详尽的研究,本节主要 学习正态总体的抽样分布。
掌握正态分布、 2分布、t分布、F分布的一些结论
对于正态总体抽样分布的学习非常有用. 主要学习单个正态总体的抽样分布以及多个正态总
i1
于是P
10
i1
Xi 2
4
P
1 0.52
10 i1
Xi2
16
查表求02.10(10) 16.由此可得
P
10 i1
Xi
2
4
0.10.
(2) 由题设及定理4.3.2, 9S 2
0.52
10
P i1
(Xi
X )2
1
2.85
P
0.52
10 i1
查表得02.25(9) 11.4,由此可求得
n
n
该定理的证明由正态分布的性质3.1.10可得。
注意:当样本来自非正态总体时,若总体均值为,方差 为 样 本量2(充有分限大且时不,X为近零似)服,从由N中(心, 极)2.限定理可以证明当
四章样本及抽样分布
E(X )
1 n
n i 1
E( X i )
D(X )
1 n2
n
2
D(Xi )
i 1
n
X ~ N(, 2 )
n
X ~ N (0, 1) / n
iid
2.若X1,,X n ~ N (, 2 ), 则 (1) X与S 2相互独立; (2) 2
(n 1)S 2
2
~
2 (n 1);
(3)T X ~ t(n 1).
第四 章 样本及抽样分布
引言 run 随机样本 抽样分布
4.1 随机样本 一、总体与样本
1. 总体:研究对象旳全体。 一般指研究对象旳某项数量指标。 构成总体旳元素称为个体。
从本质上讲,总体就是所研究旳随机变量或 随机变量旳分布。
2. 样本:来自总体旳部分个体X1, … ,Xn 假如满足: (1)同分布性: Xi, i=1,…,n与总体同分布. (2)独立性: X1,… ,Xn 相互独立; 则称为容量为n 旳简朴随
P{ 1
1
P{ 1 F
F (n2 , n1)}
} 1
F F1 (n1, n2 )
P{ 1
1 }
得证!
F F1 (n1, n2 )
4.3 正态总体旳抽样分布定理
iid
1.若X1 ,,Xn ~ N(, 2 ), 则U
X / n
~
N(0, 1)
证明:
X
1 n
n i 1
Xi
是n 个独立旳正态随 机变量旳线性组合,故 服从正态分布
i 1
称为自由度为n的 2 分布.
2.2—分布旳密度函数f(y)曲线
f
(y)
抽样分布
x
/ n
x s/ n
N (0,1)
t=
N ( , )
2
t分布
总体方差未知或样本容量n小于30时,标准离差的分布呈t分布。
四、 t 分布
对于不同的自由度,t分布有不同的曲线。
四、 t 分布
( 1 ) t分布曲线左右对称,围绕平均数μt =0 向两侧递降。 (2)t分布受自由度df=n-1制约,每个df都有一条t分布曲线。 (3)df小,t值离散程度大。 (4)和正态分布相比,t分布的顶端偏低,尾部偏高,自由度
2 s1 F 2 s2
此F值具有s12的自由度df1=n1-1和s22的自由度 df2=n2-1。
六、 F 分布
df1 df1 df2 1 ( ) df1 df 2 2 F 2 2 2 f (F ) df1 df2 df1 df 2 df1 df2 ( ) ( ) (df1 F df2 ) 2 2 2
F分布是随自由度df1和df2进行变化的一组曲线。
F分布的概率累积函数
f (F )
F
0
f ( F )dF
六、F 分布
1
F分布的平均数μF=1 ,F的取值区间为[0,+∝ )
F分布曲线的形状仅决定于df1和df2。在df1=1或2时, 2 F分布曲线呈严重倾斜的反向J型,当df1≧ 3时,转
为左偏曲线。
第四章:统计数的分布——抽样分布
从总体中抽取的样本提供的信息仅是总体的一部分,它不能 提供完全准确的信息,必然存在着一定的误差。 对于样本容量相同的多次随机抽样样本,其统计量是变异的, 且其取值有一定的概率,即样本统计量也是一个随机变量,此 分布规律称为抽样分布(sampling distribution)。
第四章 概率基础和抽样分布
3 2.0 2.5 3.0 3.5
4 2.5 3.0 3.5 4.0
P(x) 0.3
0.2
0.1
0 1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
样本均值的抽样分布
(一)样本均值的抽样分布 【例题1 】分析
样本均值 频数
1.0
1
1.5
2
2.0
3
2.5
4
3.0
3
3.5
2
4.0
1
E( x)
都是可以事先确定和罗列出来的; 4. 每次试验的结果事前不能预知。
随机事件:在随机试验E中,所有可 能发生的结果都叫随机事件。
随机事件的类型: 1.基本事件(简单事件ei ,ωi) 2.复合事件(复杂事件) 3.不可能事件(Ø ) 4.必然事件(Ω)
二.事件的概率
❖ (一)古典概型
事件组Ai (i 1,2,, n)
大号小号校服需各裁制 套数 :
104 0.1587 1587
【例1】: 已知
X ~ N (4,22 )
求
P( X 2)
P( X 2)
解:
令
Z X 4
则Z ~ N (0,1)
2
P( X 2) P( X 2) P( X 2)
P( Z 1) P( Z 3) 1 1 F (1) 1 1 F (3)
所有可能的n = 2 的样本(共12个)
第一个
第二个观察值
观察值
1
2
3
4
1
─
1,2
1,3
1,4
2
2,1
─
2,3
2,4
3
3,1
3,2
─
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
χ2分布是不对称的
表中表头的概率α 是χ 2大于表内所列χ 2值的概率。 P(χ
df = 2
2 2 2
≧ 5.99)=0.05 ≧ 9.21)=0.01 ≧ 0.10)=0.95
P(χ P (χ
六、 F 分布 样本方差比的分布
设从一正态总体N(μ, σ2) 中随机抽取样本容量为 n1、n2的两个独立样本,其样本方差为s12、 s22, 则定义其比值:
第四章:统计数的分布——抽样分布
从总体中抽取的样本提供的信息仅是总体的一部分,它不能 提供完全准确的信息,必然存在着一定的误差。 对于样本容量相同的多次随机抽样样本,其统计量是变异的, 且其取值有一定的概率,即样本统计量也是一个随机变量,此 分布规律称为抽样分布(sampling distribution)。
2 s1 F 2 s2
此F值具有s12的自由度df1=n1-1和s22的自由度 df2=n2-1。
六、 F 分布
df1 df1 df2 1 ( ) df1 df 2 2 F 2 2 2 f (F ) df1 df2 df1 df 2 df1 df2 ( ) ( ) (df1 F df2 ) 2 2 2
其样本平均数x是一具有平均数 μ,方差σ2/n的
正态分布,记作N(μ,σ2/n)。
x N ( , )
2
x N ( ,
2
n
)
中心极限定理 (central limit theorem)
(4)如果被抽总体不是正态分布总体,但具有平均数 μ和方差σ2 ,当随样本容量n的不断增大,样本平均数 x 的分布也越来越接近正态分布,且具有平均数μ,方 差 σ 2 /n 。
F分布是随自由度df1和df2进行变化的一组曲线。
F分布的概率累积函数
f (F )
F
0
f ( F )dF
六、F 分布
1
F分布的平均数μF=1 ,F的取值区间为[0,+∝ )
F分布曲线的形状仅决定于df1和df2。在df1=1或2时, 2 F分布曲线呈严重倾斜的反向J型,当df1≧ 3时,转
为左偏曲线。
您能回答以下问题吗?
抽样分布有哪些主要类型,特点是什么? u、t、F的计算公式?
x
/ n
x s/ n
N (0,1)
t=
N ( , )
2
t分布
总体方差未知或样本容量n小于30时,标准离差的分布呈t分布。
四、 t 分布
对于不同的自由度,t分布有不同的曲线。
四、 t 分布
( 1 ) t分布曲线左右对称,围绕平均数μt =0 向两侧递降。 (2)t分布受自由度df=n-1制约,每个df都有一条t分布曲线。 (3)df小,t值离散程度大。 (4)和正态分布相比,t分布的顶端偏低,尾部偏高,自由度
df>30时,其曲线接近正态分布曲线,df→∝时则和正态分布曲 线重合。 S S
x
x x
四、t 分布
t分布曲线与横轴所围成的面积为1。 同标准正态分布曲线一样,统计应用中最为关心的是t分 布曲线下的面积(即概率P)与横轴t值间的关系。 为使用方便,统计学家编制了不同自由度df下的t界值表。
P(t 2.228) P(t 2.228) 0.05
连续型变量 正态分布
离散型变量
偏态分布
不论总体为何种分布,只要是大样本,
就可运用中心极限定理,认为样本平均数的
分布是正态分布,在计算样本平均数出现的
概率时,样本平均数可按下式进行标准化。
u
x x
x
x
/
n
三、样本平均数差数分布
样本平均数差数的分布
从两个相互独立的正态总体中抽取样本,得到 样本平均数差数的分布也是正态分布。样本平均 数差数的平均数等于总体平均数的差数,样本平 均数差数的方差等于两样本平均数方差除以各自 样本容量之和。
如,从N(5 ,25 )的总体中抽取 n1 =35 的样 本,从 N(10,5)的总体中抽取n2 =40的样本, 则两样本平均数差数的平均数为-5。方差为25/ 35+5/40=47/56
四、 t 分布
x N (, )
2
标准差已知的样本平均数分布
u=
在实际研究中,经常遇到σ 未知,且样本容量n不大的情 况,这时若用 s 来代替σ 。 其并不服从正态分布,而是 服从具n-1自由度的t分布。
2 2 2 3 2 n n
u u u ... u ui2
i 1
u (
2 i 1 2 i 1
k
k
x
2
)
1
2
2 ( x )
1
ቤተ መጻሕፍቲ ባይዱ2
2 ( x x ) df
s2
2
df = n-1
五、 χ2分布
概率密度函数
f ( 2 ) ( 2 ) 2
P(t 1.812) 0.05 P(t 1.812) 0.05
在相同的自由度df时,t值越大,概率P越小。 在相同的P值下,随df的增加,临界t值减小。 在相同t值时,双尾概率P为单尾概率P的两倍。 df增大,t分布接近正态分布,即t值接近u值。
四、t 分布
-2.776
+2.776
且呈反J型的偏斜分布。
2分布的偏斜度随自由度降 χ 2 低而增大,当自由度df=1时,
曲线以纵轴为渐近线。
3 随自由度df的增大, χ2分布曲线渐趋左右对称,当
df>30时,卡方分布已接近正态分布。
五、 χ2分布
对于给定的α(0<α<1),
称满足条件 P{χ2 >χα2(n)}=α的点 χα2(n)为
t落于[- t0.05, + t0.05 ] 内的概率为0.95
t落于[- t0.01, + t0.01 ] 内的概率为0.99
置信度为5%和1%的t临界值。 t0.05(4)=2.776
t0.01(4)=4.604
x N ( , )
2
五、 χ2分布 样本方差的分布
u
2
x
2 1
N (0,1)
二、样本平均数的分布 (1)样本平均数分布的平均数=总体平均数。
x
(2)样本平均数分布的方差=总体方差除以样本容量。
2 x
2
n
样本平均数的标准误差(标准误) (standard error of mean)
x
n
二、样本平均数的分布
(3)如果从正态分布总体N(μ,σ2)进行抽样,
六、F 分布
对于给定的α(0<α<1), 称满足条件 P{F>Fα(n1,n2)}=α的点
Fα(n1,n2)为F分布的上α分位点(或临界值点)。
P(F ≧ 3.48)
=0.05
2
P(F ≧5.99) =0.01
概率和概率分布 概率的基础知识
概率的概念 概率的计算
大数定律
概率的分布
离散型变量 二项分布 连续型变量 正态分布
总体
样本1 x1
样本2 x2
样本3 x3
样本n xn
一、抽样试验与无偏估计
如果所有可能样本的某一统计数的平均数等于总体的 相应参数,则称该统计数为总体相应参数的无偏估计值。 样本平均数 x 是总体平均数μ的无偏估计值。 样本方差 s2 是总体方差σ2的无偏估计值。
样本标准差 s 不是总体标准差σ的无偏估计值。
df 2 df 1 2 1 2 2
df ( ) 2
e
概率累积函数
F ( 2 )
2
0
f ( 2 )d ( 2 )
五、 χ2分布
χ2分布是连续型变量的分布,每个不同的自由度都有一 个相应的卡方分布曲线,所以其分布是一组曲线。
特征
五、 χ2分布
2 1 χ 分布于区间[0,+∝ ),并
x n x
常见的理论分布
P( x) C p q
x n
f ( x)
泊松分布
e x P( x) x!
1 2
e
( x )
2
2
2
抽样与无偏估计
统计数的分布
x N ( , 2 )
x1 x2 N ( 1 2 ,
12
n1
2 2
n2
)
t
2
F