样本方差的抽样分布

合集下载

抽样分布和七种理论分布

抽样分布和七种理论分布

抽样分布与理论分布一、抽样分布总体分布:总体中所有个体关于某个变量的取值所形成的分布。

样本分布:样本中所有个体关于某个变量大的取值所形成的分布。

抽样分布:样品统计量的概率分布,由样本统计量的所有可能取值和相应的概率组成。

即从容量为N 的总体中抽取容量为n 的样本最多可抽取m 个样本,m 个样本统计值形成的频率分布,即为抽样分布。

样本平均数的抽样分布:设变量X 是一个研究总体,具有平均数μ和方差σ2。

那么可以从中抽取样本而得到样本平均数x ,样本平均数是一个随机变量,其概率分布叫做样本平均数的抽样分布。

由样本平均数x 所构成的总体称为样本平均数的抽样总体。

它具有参数μx 和σ2x ,其中μx 为样本平均数抽样总体的平均数,σ2x 为样本平均数抽样总体的方差,σx 为样本平均数的标准差,简称标准误。

统计学上可以证明x 总体的两个参数 μx 和σ2x 与X 总体的两个参数μ和σ2有如下关系:μx = μ σ2x = σ2 /n由中心极限定理可以证明,无论总体是什么分布,如果总体的平均值μ和σ2都存在,当样本足够大时(n>30),样本平均值x 分布总是趋近于N (μ,n2)分布。

但在实际工作中,总体标准差σ往往是未知的,此时可用样本标准差S 估计σ。

于是,以nS估计σx ,记为X S ,称为样本标准误或均数标准误。

样本平均数差数的抽样分布:二、正态分布2.1 正态分布的定义:若连续型随机变量X 的概率密度函数是⎪⎭⎫ ⎝⎛--=σμπσx ex f 22121)( (-∞<x <+∞)则称随机变量X 服从平均数为μ、方差为σ2的正态分布,记作X~N (μ,σ2)。

相应的随机变量X 概率分布函数为 F (x )=⎰∞-x dx x f )(它反映了随机变量X 取值落在区间(-∞,x )的概率。

2.2 标准正态分布当正态分布的参数μ=0,σ2=1时,称随机变量X 服从标准正态分布,记作X~N (0,1)。

统计学 第三章抽样与抽样分布

统计学 第三章抽样与抽样分布

=10
= 50 X
总体分布
n= 4
x 5
n =16
x 2.5
x 50
X
抽样分布
从非正态总体中抽样
结论:
从非正态中体中抽样,所形成 的抽样分布最终也是趋近于正态分 布的。只是样本容量需要更大些。
总结:中心极限定理
设从均值为,方差为 2的一个任意总体中抽 取容量为n的样本,当n充分大时(超过30),样本 均值的抽样分布近似服从均值为μ、方差为σ2/n的
总体
样本
参数
统计量
总体与样本的指标表示法
总体参数
样本统计量
(Parameter) (Sample Statistic)
容量 平均数 比例 方差 标准差
N
n
X
x
p
2
s2
s
小练习
某药品制造商感兴趣的是用该公司开发的某 种新药能控制高血压人群血压的比例。进行了一 项包含5000个高血压病人个体的研究。他发现用 这种药后80%的个体,他们的高血压能够被控制。 假定这5000个个体在高血压人群中具有代表性的 话,回答下列问题: 1、总体是什么? 2、样本是什么? 3、识别所关心的参数 4、识别此统计量并给出它的值 5、我们知道这个参数的值么?
正态分布
一个任意分 布的总体
x
n
当样本容量足够 大时(n 30) , 样本均值的抽样 分布逐渐趋于正 态分布
x
X
总体分布
正态分布
非正态分布
大样本 小样本 大样本 小样本
正态分布
正态分布
非正态分布
三 中心极限定理的应用
中心极限定理(Central Limit theorem) 不论总体服从何种分布,从中抽取

《概率与数理统计》第06章 - 样本及抽样分布

《概率与数理统计》第06章 - 样本及抽样分布

(3)g( x1, x2 ,L xn )是统计量g(X1, X2 ,L Xn )的观察值
几个常见统计量
样本平均值
X
1 n
n i 1
Xi
它反映了 总体均值 的信息
样本方差
S 2
1 n1
n i 1
(Xi
X )2
它反映了总体 方差的信息
n
1
1
n
X
2 i
i 1
nX
2
样本标准差
S
1 n
n
1
(
i 1
X
i
是来自总体的一个样本,则
(1) E( X ) E( X ) ,
(2) D( X ) D( X ) 2 n ,
n
(3) E(S 2 ) D( X ) 2
矩估计法的 理论根据
若总体X的k阶矩E( X k ) k存在,则
(4) Ak
1 n
n i 1
Xik
p k
k 1, 2,L .
(3)证明:E(S2 )
定义 设X1 , X2 ,L , Xn是来自总体X的一个样本, g( X1 , X 2 ,L , X n )是X1 , X 2 ,L , X n的函数,若g 中不含未知参数,则g( X1 , X 2 ,L , X n )称是一 个统计量.
请注意 :
(1)X1, X2 ,L
X
是样本,也是随机变量
n
(2)统计量是随机变量的函数,故也是随机变量
1
e
(
xi 2
2
)2
2
n
( xi )2
1
e i1 2 2
n
2
第二节
抽样分布

抽样 分布定理

抽样 分布定理
1 2
这两个样本的样本方差,则有
2 S12 1 1、 2 2 ~ F ( n1 1, n2 1) S2 2 X Y ( 1 2 ) 2、 ~ t ( n1 n2 2) 2 2 ( n1 1) S1 ( n2 1) S2 1 1 n1 n2 2 n1 n2
则服从自由度为 n-1 的 t 分布的随机变量是
( A)t X S1 / n 1
( B)t X S2 / n 1

( D)t X S4 / n
(C )t
X S3 / n
定理 6.2 (两总体样本均值差、样本方差比的分布) 且X与Y独立, 设X ~ N ( 1, 2 ),Y ~ N ( 2 , 2 ), X1,X2,…, X n是来自X的样本,Y1,Y2,…,Yn 是取自Y的样本, 1 2 X和Y 分别是这两个样本的 样本均值, 2和S 2 分别是 S
几个重要的抽样分布定理
设总体X的均值为,方差为 2,X 1 , X 2 ,, X n 是 来自总体的一个样本,则样本均值X和样本方差S 2有
E( X ) , D( X ) 2 n ,
E( S 2 ) 2
样本均值的分布 设 X1, X2, …, Xn 是来自正态总体 的样本,
2 2
1 故C . 3
小结
在这一节中我们学习了抽样分布定理. 要 求大家熟练地掌握它们 .
常用的统计量 样本平均值
1 n X Xi n i 1
样本方差
样本标准差 样本k阶原点矩 样本k阶中心矩
1 n S2 ( X i X )2 n 1 i 1
1 n 2 S ( Xi X ) n 1 i 1
2 1 2 2 2 1 2 2

概率论 第六章 样本及抽样分布

概率论 第六章 样本及抽样分布
函数Fn(x)为 Fn(x)=S(x)/n , -∞<x< +∞。
一般,设 x1,x2, …,xn 是总体F的一个容 量为n的样本值,先将x1,x2, …,xn 按自小到 大的次序排列,并重新编号,设为
x(1) ≤x(2) ≤…≤x(n) 则经验分布函数Fn(x)的观察值为
0,
若x x(1) ,
性质:
(1) limf (t)
1
e ; t2 2
n
2
(2)当n 45时 取t (n) Z .
(三)设X~2(n1), Y~ 2(n2), 且X 与Y相互独立,则随机变量
F X/ n1 Y / n2
则称F服从第一自由度为n1,第二自由 度为n2的F分布,记作
F~F(n1 ,n2)
F分布的分布密度为
2 2
E( X 2 ) D( X ) (E( X ))2
2 2
n
E(S 2 )
E[ 1 n 1
n i 1
(Xi
X
)2 ]
E[
1
n
(
n 1 i1
X
2 i
2
n X )]
1
n
E(
n 1 i1
X
2 i
nX
2
)
1 [E( n 1
n i 1
X
2 i
)
E(n X
2
)]
1[ n 1
n i 1
考察某厂生产的电容器
的使用寿命。在这个试验 中什么是总体,什么是个 体。
解 个体是每一个电容器 的使用寿命;总体X是各个 电容器的使用寿命的集合。
2. 样本
为推断总体分布及各种特征,按一定规 则从总体中抽取若干个体进行观察试验,以 获得有关总体的信息,这一抽取过程称为 “抽样”,所抽取的部分个体称为样本. 样 本中所包含的个体数称为样本容量.

《统计学》第9章 抽样与抽样分布

《统计学》第9章 抽样与抽样分布

二、抽样中的基本概念
⚫ 样本比例(成数)
p = n1 ,q = n0 = 1− p
n
n
⚫ 样本是非标志的标准差
(n = n0 + n1)
sp =
n p (1− p) =
n −1
n pq n −1
⚫ 样本是非标志的方差
s
2 p
=
n n −1
p(1 −
p)
=
n n −1
pq
第一节 抽样和抽样方法
三、抽样方法
三、抽样方法
⚫ 多阶段抽样
⚫ 在实践中总体所包括的单位数很多,分布很广,通过一次 抽样就选出有代表性的样本是很困难的。此时可将整个抽 样过程分为几个阶段,然后逐阶段进行抽样,最终得到所 需要的有代表性的样本。
第一节 抽样和抽样方法
三、抽样方法
⚫ 多阶段抽样
⚫ 阶段数不宜过多,一般采用两个、三个阶段,至多四个阶 段为宜,否则,手续繁琐,效果也不一定好。
第一节 抽样和抽样方法
二、抽样中的基本概念
⚫ 总体参数
⚫ 总体参数是根据总体各单位的标志值或特征计算的、反 映总体某一属性的综合指标。
⚫ 总体参数是唯一的、确定的常数,但一般情况下又是未 知的。
⚫ 常用的总体参数有 ⚫ 总体均值 ⚫ 总体标准差、总体方差 ⚫ 总体比例(成数)
第一节 抽样和抽样方法
⚫ 样本标准差
s =
1 n −1
n i =1
(xi

x )2,或s
=
1
m
m
(xi − x )2 fi
fi −1 i=1
i =1
⚫ 样本方差
( ) ( ) s2 = 1 n n −1 i=1

2021统计学原理-《统计学》第五章统计量及其抽样分布试题(精选试题)

2021统计学原理-《统计学》第五章统计量及其抽样分布试题(精选试题)

统计学原理-《统计学》第五章统计量及其抽样分布试题1、智商的得分服从均值为100,标准差为16的正态分布。

从总体中抽取一个容量为n的样本,样本均值的标准差为2,样本容量为____________。

2、样本均值与总体均值之间的差被称作____________。

3、从均值为50,标准差为5的无限总体中抽取容量为30的样本,则抽样分布的超过51的概率为____________。

4、某校大学生中,外国留学生占10%。

随机从该校学生中抽取100名学生,则样本中外国留学生比例的标准差为____________。

5、假设总体服从均匀分布,从此总体中抽取容量为36的样本,则样本均值的抽样分布( )。

A.服从非正态分布B.近似正态分布C.服从均匀分布D.服从x²分布6、从服从正态分布的无限总体中分别抽取容量为4,16,36的样本,当样本容量增大时,样本均值的标准差( )。

A.保持不变B.增加C.减小D.无法确定7、总体均值为50,标准差为8,从此总体中随机抽取容量为64的样本,则样本均值的抽样分布的均值和标准误差分别为( )。

A.50,8B.50,1C.50,4D.8,88、某厂家生产的灯泡寿命的均值为60小时,标准差为4小时。

如果从中随机抽取30只灯泡进行检测,则样本均值( )。

A.抽样分布的标准差为4小时B.抽样分布近似等同于总体分布C.抽样分布的中位数为60小时D.抽样分布近似等同于正态分布,均值为60小时9、假设某学校学生的年龄分布是右偏的,均值为23岁,标准差为3岁。

如果随机抽取100名学生,下列关于样本均值抽样分布描述不正确的是( )。

A.抽样分布的标准差等于3B.抽样分布近似服从正态分布C.抽样分布的均值近似为23D.抽样分布为非正态分布10、从均值为200,标准差为50的总体中抽取容量为100的简单随机样本,样本均值的数学期望是( )。

A.150B.200C.100D.25011、从均值为200,标准差为50的总体中抽取容量为100的简单随机样本,样本均值的标准差是( )。

统计学课后答案解析第七八章

统计学课后答案解析第七八章

6.1 调节一个装瓶机使其对每个瓶子的灌装量均值为μ盎司,通过观察这台装瓶机对每个瓶子的灌装量服从标准差 1.0σ=盎司的正态分布。

随机抽取由这台机器灌装的9个瓶子形成一个样本,并测定每个瓶子的灌装量。

试确定样本均值偏离总体均值不超过0.3盎司的概率。

解:总体方差知道的情况下,均值的抽样分布服从()2,N n σμ的正态分布,由正态分布,标准化得到标准正态分布:x ~()0,1N ,因此,样本均值不超过总体均值的概率P为:()0.3P x μ-≤=P ⎫≤=x P ⎛⎫≤≤=()0.90.9P z -≤≤=2()0.9φ-1,查标准正态分布表得()0.9φ=0.8159 因此,()0.3P x μ-≤=0.63186.2在练习题6.1中,我们希望样本均值与总体均值μ的偏差在0.3盎司之内的概率达到0.95,应当抽取多大的样本?解:()0.3P x μ-≤=P ⎫≤=x P ⎛⎫≤≤=210.95Φ-≥0.975⇒Φ≥1.96⇒≥42.6828843n n ⇒≥⇒≥6.3 1Z ,2Z ,……,6Z 表示从标准正态总体中随机抽取的容量,n=6的一个样本,试确定常数b ,使得 6210.95i i P Z b =⎛⎫≤= ⎪⎝⎭∑ 解:由于卡方分布是由标准正态分布的平方和构成的: 设Z 1,Z 2,……,Z n 是来自总体N (0,1)的样本,则统计量222212χ=+++n Z Z Z服从自由度为n 的χ2分布,记为χ2~ χ2(n ) 因此,令6221ii Z χ==∑,则()622216ii Zχχ==∑,那么由概率6210.95i i P Z b =⎛⎫≤= ⎪⎝⎭∑,可知:b=()210.956χ-,查概率表得:b=12.596.4 在习题6.1中,假定装瓶机对瓶子的灌装量服从方差21σ=的标准正态分布。

假定我们计划随机抽取10个瓶子组成样本,观测每个瓶子的灌装量,得到10个观测值,用这10个观测值我们可以求出样本方差22211(())1n i i S S Y Y n ==--∑,确定一个合适的范围使得有较大的概率保证S 2落入其中是有用的,试求b 1,b 2,使得 212()0.90p b S b ≤≤=解:更加样本方差的抽样分布知识可知,样本统计量:222(1)~(1)n s n χσ--此处,n=10,21σ=,所以统计量22222(1)(101)9~(1)1n s s s n χσ--==-根据卡方分布的可知:()()2212129990.90P b S b P b S b ≤≤=≤≤=又因为:()()()2221221911P n S n ααχχα--≤≤-=-因此:()()()()22221212299919110.90P b S b P n S n ααχχα-≤≤=-≤≤-=-= ()()()()222212122999191P b S b P n S n ααχχ-⇒≤≤=-≤≤- ()()()2220.950.059990.90P S χχ=≤≤=则: ()()2210.9520.0599,99b b χχ⇒==()()220.950.051299,99b b χχ⇒==查概率表:()20.959χ=3.325,()20.059χ=19.919,则()20.95199b χ==0.369,()20.05299b χ==1.887.1 从一个标准差为5的总体中采用重复抽样方法抽出一个样本容量为40的样本,样本均值为25。

概率论第六章样本及抽样分布

概率论第六章样本及抽样分布
2 1 2 2
本相互独立,记
1 n1 X Xi n1 i 1 1 n2 Y Yi n2 i 1
则有 ⑴
2 1 2 2 2 1 2 2
1 n1 S12 ( X k X )2 n1 1 k 1 1 n2 2 S2 (Yk Y ) 2 n2 1 k 1
S / ~ F (n1 1, n2 1) S /
⑵ 当 时
2 1 2 2 2
X Y ( 1 2 ) ~ N (0,1) 1 1 n1 n2
(n1 1) S12

2 1

2 (n2 1) S2

2 2
~ 2 (n1 n2 2)
X Y ( 1 2 ) ~ t (n1 n2 2) 1 1 S n1 n2
2
又因为
(n 1)S 2

2
~ (n 1)
2
X n1 X n
故 Y

(n 1) S 2
n n 1 ~ t (n 1) /(n 1)

2
X n1 X n Y S
n ~ t (n 1) n 1
例4
设总体X , Y 相互独立 X ~ N (0,32 ) , Y ~ N (0,32 ) ,
2
X n1 X n n X 1 , X 2 ,, X n , X n1 , 求 Y 的分布 . S n 1 1 n 1 n 2 2 其中 X n X i , S ( Xi X n ) n i 1 n 1 i 1
1 2 解 由已知得 X n1 ~ N ( , ) , X n ~ N ( , ) , n n 1 2 所以 X n1 X n ~ N (0, ) n n 标准化得 X n1 X n ~ N (0,1) n 1

统计学(1)(1)

统计学(1)(1)

1、依据统计数据的收集方法不同,可将其分为【观测数据】数据和【实验数据】数据。

2、收集的属于不同时间上的数据称为【时间序列】数据。

5、在某城市随机抽取13个家庭,调查得到每个家庭的人均月收入数据如下:1080、750、1080、850、960、2000、1250、1080、760、1080、950、1080、660,则其众数为 1080,中位数为1080。

7、设总体X ~),(2σμN ,x为样本均值,S 为样本标准差。

当σ未知,且为小样本时,则n sx μ-服从自由度为n-1的___t__分布。

1、数据分析所用的方法分为 描述统计方法 和 推断统计方法 。

2、数据的基本类型有 分类数据 、 顺序数据 和 数值型数据 。

3、在某城市中随机抽取9个家庭,调查得到每个家庭的人均月收入数据:1080,750,780,1080,850,960,2000,1250,1630(单位:元),则人均月收入的平均数是 1153.3 ,中位数是 1020 。

4、设连续型随机变量X 在有限区间(a,b)内取值,且X 服从均匀分布,其概率密度函数0()1f x b a ⎧⎪=⎨⎪-⎩则X 的期望值为 2a b + ,方差为2()12b a - 。

1、收集数据的基本方法是 自填式 、 面访式 和 电话式 。

2、依据统计数据的收集方法不同,可将其分为 观测数据 和 实验数据 。

3、分类数据、顺序数据和数值型数据都可以用 饼图 、 条形图 等图形来显示。

5、测定数值型数据的离散程度,依据研究目的及资料的不同,可用的指标有 方差 、 离散系数 。

5、原假设0H 为真时却被我们拒绝,称为 弃真错误 。

7、对回归方程线性关系的检验,通常采用的是 F 检验。

2、如果我们要研究某班学生的学习状况,则总体是 ,总体单位是_ _ 。

4、利用估计的回归方程进行区间估计有两种类型,一是 置信区间估计 ,二是 预测区间估计 。

8、在参数估计时,评价估计量的主要有三个指标是无偏性、 、有效性、一致性。

样本方差的抽样分布(优质)

样本方差的抽样分布(优质)
样本方差的抽样分布
样本方差的分布
设总体服从正态分布N ~ (μ,σ2 ), X1,X2,… ,Xn为来自该正态总体的样本,则样本方差 s2 的分布为:
将2(n – 1)称为自由度为(n-1)的卡方分布。
总体
s m
卡方 (2) 分布
选择容量为n 的 简单随机样本 计算样本方差S2
计算卡方值
2 = (n-1)S2/σ2
将F(n1-1 , n2-1 )称为第一自由度为(n1-1),第二 自由度为(n2-1)的F分布
两个样本方差比的抽样分布
不同样本容量的抽样分布
(1,10)
(5,10)
(10,10)
F
两个不同自由度样本方差比的抽样分布(F分布)
空白演示
单击输入您的封面副标题
计算出所有的
2值
Байду номын сангаас
不同容量样本的抽样分布
n=1 n=4 n=10 n=20
2
均值的标准误
所有可能的样本均值的标准差,测度所 有样本均值的离散程度;
小于总体标准差; 计算公式为:
两个样本方差比的抽样分布
两个样本方差比的抽样分布
设X1,X2,… ,Xn1是来自正态总体N~(μ1,σ12 )的 一个样本, Y1,Y2,… ,Yn2是来自正态总体 N~(μ2,σ22 ) 的 一 个 样 本 , 且 Xi(i=1,2,… , n1) , Yi(i=1,2, …,n2)相互独立,则

统计学第3、4章习题

统计学第3、4章习题

13
24. 指出下列假设检验哪一个属于左侧检验(

A. H0:=0,H1:≠0 B. H0:≤0,H1:0 C. H0:<0,H1:≥0 D. H0:≥0,H1:<0
25.一项研究表明,司机驾车时接打手机而发生事故 的比例超过20%,为了证明这一结论,原假设和备 择假设应为( ) A. H0:≤ 0.2,H1: 0.2 B. H0:= 0.2 ,H1: ≠0.2 C. H0:≥ 0.2 ,H1: < 0.2 D. H0:< 0.2,H1: ≥ 0.2 14

16. 抽取一个容量为100的随机样本,其均值为81, 标准差为12,总体均值的95%的置信区间为 ( ) A. 81±1.97 B. 81±2.35 C. 81±3.10 D. 81±3.52
9
17.从某地区随机抽取20个企业,得到20个企业总 经理的年平均收入为25964.7元,标准差为 42807.8元。构造企业总经理年平均收入的95% 的置信区间为( ) A. 25964.7±20034.3 B. 25964.7±21034.3 C. 25964.7±25034.3 D. 25964.7±30034.3 18. 税务管理官员认为,大多数企业都有偷税漏税 行为。在对由800个企业构成的随机样本检查中, 发现有144个企业有偷税漏税行为。根据99%的 置信水平估计偷税漏税企业比例的置信区间为 ( ) A. 0.18±0.015 B. 0.18±0.025 C. 0.18±0.035 D. 0.18±0.045 10

s
n

n
C. t x 0
n
D. z x 0
s n
15
28.随机抽取一个n=50的样本,计算得到 x 60 , s=15,要检验假设H0:=65,H1:≠65,检验 统计量为 ( ) A. -3.33 B. 3.33 C. -2.36 D. 2.36 29. 随机抽取一个n=40的样本,计算得到 x 17, s 2 8, 在a0.02的显著水平下,检验假设H0:≤15,H1: 15,统计量的临界值为( ) A. -2.05 B. 2.05 C. 1.96 D. -1.96

贾俊平统计学第六章 抽样分布

贾俊平统计学第六章 抽样分布
σ =10
n=4 σx = 5 n =16 σ x = 2.5
µ = 50
X
µx = 50
X
总体分布
抽样分布
中心极限定理
(central limit theorem)
中心极限定理: 中心极限定理:设从均值为µ,方差为σ 2的一个任意总 体中抽取容量为n的样本, 充分大时, 体中抽取容量为n的样本,当n充分大时,样本均值的抽 样分布近似服从均值为µ 方差为σ 样分布近似服从均值为µ、方差为σ2/n的正态分布
解:根据中心极限定理,样本容量>30,可视 为样本均值近似服从正态分布。
样本均值的抽样分布与中心极限定理 (例题分析)
因此知,样本均值服从:
0.62 X~N ( µ , σ 2 n ) = N 10, = N (10, 0.01) 36 (1) P X <9. = P X − 10 < 9.9 − 10 9) ( 0.1 0.1
6.1 统计量
1. 统计量的概念 2. 常用的统计量
统计量的概念
定义:
设X1,X2,……,Xn是从总体X中抽取的样本容 量为n的一个样本,如果由此样本构造一个函数 T(X1,X2,……,Xn),不依赖任何未知参数, 则称行数T(X1,X2,……,Xn)是一个统计量。 统计量是样本的函数 统计量不依赖任何未知总体参数 根据具体样本的观测值x1,x2,……,xn带入统 计量函数,计算出来的值是一个具体的统计量 的值。
0.1 0 1.0 1.5 2.0 2.5 3.0 3.5 4.0 X 0.3 0.2 P (X )
样本均值的抽样分布 3.0 3 3.5 2 4.0 1
均值X的取值 均值 的取值 均值X的个数 均值 的个数

极限定理 样本及抽样分布

极限定理 样本及抽样分布

f ( y)
n =1
n=5 n = 15
O
y
χ 2 (n)分布具有以下性质 分布具有以下性质:
2 χ2 χ2 χ2 (1)如果 1 ~ χ 2 (n1 ), χ2 ~ χ 2 (n2 )且 1 与 2 相互独立 2 χ2 则 1 + χ2 ~ χ 2 (n1 + n2 )
(2)如果 ~ χ (n), 则有 (χ ) = n, D(χ ) = 2n. χ E
1 n E(S ) = E( Xi2 ) − nE( X 2 ) ∑ n − 1 i=1
2
1 σ 2 2 2 2 = ∑(σ + µ ) − n(µ + n ) = σ n − 1 i=1
n 2
第二节 抽样分布
χ2 分布 1、 、
是来自总体N(0,1)的样本,称统计量 的样本, 设X1,X2…Xn是来自总体 , 的样本
1 2 2 (∑ Xi + ∑ X − 2∑ Xi X ) = n − 1 i =1 i =1 i =1 n n n 1 2 2 X = ∑ Xi ⇒ ∑X 2 X = 2 X∑Xi ...X 2 = nX 2 = X + X + = nX= ⇒ ∑Xi n i =1 i =1 i =1
n n n
1 2 2 (∑Xi + nX − 2nX 2 ) = n − 1 i =1
定义5.1 设随机变量序列Y 是常数, 定义5.1 设随机变量序列 1 , Y2 …Yn , a是常数, 是常数 对于任意正数ε, 有
n
lim P { Yn − a < ε } = 1, →∞
则称序列 Y1 , Y2 L Yn ... 依概率收敛于 a , 记为 P Yn → a .

统计学复习(抽样分布、参数估计、假设检验)

统计学复习(抽样分布、参数估计、假设检验)

两个样本均值之差的抽样分布 (1)如: ) 抽样
X1 − N(µ1,σ12 ), X2 − N(µ2 ,σ2 ),
2
则 x1 − x2 ) ~ N(µ1 − µ2 , (
σ12 σ22
n1 + n2
)
抽样
σ12 N1 − n1 σ22 N2 − n2 (x1 − x2 ) ~ N[(µ1 − µ2 , ( )+ ( )] n1 N1 −1 n2 N2 −1
对于无限总体, 对于无限总体, 一个估计 如果对任意 量如能完 ε>ˆ 0 满足条件 全地包含 LimP(|θn −θ |≥ ε ) = 0 未知参数 n→∞ 信息, 信息,即 则称 θˆ 是 θ 为充分量 的一致估计。 的一致估计。
点估计
常用的求点估计量的方法
用样本的数字特征 1.数字特征法: 1.数字特征法:当样本容量增大时 ,用样本的数字特征 数字特征法 去估计总体的数字特征。 去估计总体的数字特征。 例如,我们可以用样本平均数(或成数 和样本方差来估 例如,我们可以用样本平均数 或成数)和样本方差来估 或成数 计总体的均值(或比率 和方差。 或比率)和方差 计总体的均值 或比率 和方差。
样本均值的抽样分布(简称均值的分布) 样本均值的抽样分布(简称均值的分布) 抽样
均值µ=∑Xi/N 均值
均值 X = Σxi
n
样本均值是样本的函数, 故样本均值是一个统计量, 样本均值是样本的函数, 故样本均值是一个统计量, 统计量 统计量是一个随机变量 随机变量, 统计量是一个随机变量, 样本均值的概率分布称为 样本均值的抽样分布。 样本均值的抽样分布。
2
n
总体均值 (µ) )
X ± tα
2
( n −1 )

正态总体的常用抽样分布(2)

正态总体的常用抽样分布(2)

(n 1)S 2
2
~
2 (n 1) ,
且 X 与 (n 1)S 2 相互独立,
2 /n
2
3
X / n
~
N (0, 1) ,(n 1)S 2 2
~
2 (n 1) ,

X 2/n

(
n
1)
2
S
2
相互独立,
由 t 分布的定义,
T X 2/n
(n 1)S 2
2 (n 1)
S
2 X

SY2
为各自的样本方差,

F
S
2 X
SY2
2 1
2 2
~
F (n1
1, n2
1) .

(n1
1)
S
2 X
2 1
~
2(n1
1),(n2
1)SY2
2 2
~ 2(n2 1),

S
2 X

SY2
相互独立,
由F分布的定义可得结论.
18
小结
样本均值
X
1 n
n i 1
Xi
样本方差
S2
(4) U ( X Y ) (1 2 ) ~ N (0,1)
2 1
/
n1
2 2
/
n2
(5)
T
F
(X S
S
2 X
SY2
Y)
xy
(1
1
1
) 2~
t ( n1
n2
n1 n2
2


S
2 xy
(n1
1)S n1
1 2

正态总体样本均值与样本方差的分布

正态总体样本均值与样本方差的分布
2
~ 2(n 1);
(3) X 与 S 2 相互独立.
定理6.2 设 X1, X2 ,L , Xn 是来自正态总体 N (, 2 )
的样本, X 与 S2 是样本均值与样本方差, 则
X ~ t(n 1).
S/ n
证明
因为 X ~ N (0,1), / n
(n 1)S 2
S2

1 n1
n i 1
(Xi

X
)2
6.3.1 单个正态总体的情形
定理6.1 设 X1, X2 ,L , Xn 是来自正态总体 N (, 2 )
的样本, X 与 S2 是样本均值与样本方差, 则
(1)
X
~
N

,
2
n



X



n
~ N 0, 1;
(2)
(n 1)S 2


2 2
nm
(2)
S12 / S22

2 1
/

2 2
~ F(n 1, m 1);
(3)


2 1


2 2
2
时,
( X Y ) (1 2 ) ~ t(n m 2),
Sw
1 1 nm
其中
Sw2
(n 1)S12 (m 1)S22 , nm2
在概率统计问题中,正态分布占据着十分重
要的位置,这是因为许多量的概率分布或者是正
态分布,或者接近于正态分布,而且,正态分布
有许多优良性质,便于进行较深入的理论研究。
因此,我们着重来讨论一下正态总体下的抽样分

样本方差的抽样分布

样本方差的抽样分布

样本方差的抽样分布样本方差先求出总体各单位变量值与其算术平均数的离差的平方,然后再对此变量取平均数,就叫做样本方差。

在许多实际情况下,人口的真实差异事先是不知道的,必须以某种方式计算。

当处理非常大的人口时,不可能对人口中的每个物体进行计数,因此必须对人口样本进行计算。

样本方差也可以应用于从该分布的样本的连续分布的方差的估计。

[从一个样本取n个值y1,...,y n,其中n <N,并根据这个样本估计方差。

直接取样本数据的方差给出平均偏差的平均值:这里,表示样本均值由于y i是随机选择的,所以和是随机变量。

他们的预期值可以通过从群体中的大小为n的所有可能样本{yi}的集合进行平均来评估。

对于,有因此给出了基于因子的人口方差的估计值。

被称为偏样本方差。

纠正该偏差之后形成无偏样本方差:估计值可以简单地称为样本方差。

同样的证明也适用于从连续概率分布中抽取的样本。

样本方差分布作为随机变量的函数,样本方差本身就是一个随机变量,研究其分布是很自然的。

在yi是来自正态分布的独立观察的情况下,s2服从卡方分布:所以可求;和如果y i独立同分布,但不一定是正态分布,那么如果大数定律的条件对于平方观测值同样适用,则s2是σ2的一致估计量。

抽样分布抽样分布也称统计量分布、随机变量函数分布,是指样本估计量的分布。

样本估计量是样本的一个函数,在统计学中称作统计量,因此抽样分布也是指统计量的分布。

以样本平均数为例,它是总体平均数的一个估计量,如果按照相同的样本容量,相同的抽样方式,反复地抽取样本,每次可以计算一个平均数,所有可能样本的平均数所形成的分布,就是样本平均数的抽样分布。

抽样分布定理(1)从总体中随机抽取容量为n的一切可能个样本的平均数之平均数,等于总体的平均数,即(E为平均的符号,为样本的平均数,μ为总体的平均数)。

(2)从正态总体中,随机抽取的容量为n的一切可能样本平均数的分布也呈正态分布。

(3)虽然总体不是正态分布,如果样本容量较大,反映总体μ和σ的样本平均数的抽样分布,也接近于正态分布。

2019年统计师考试《专业知识》讲义:样本方差的抽样分布

2019年统计师考试《专业知识》讲义:样本方差的抽样分布

2019年统计师考试《专业知识》讲义:样本方差的抽样分布样本方差的抽样分布样本方差的抽样分布是指在重复选择容量为n的样本时,样本方差的所有可能取值形成的概率分布。

χ2分布具有如下性质和特点:(1)χ2分布的变量值始终为正。

(2)χ2(n)分布的形状取决与其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称,如图7-2所示。

(3)χ2分布的期望为E(χ2)=n,方差为D(χ2)=2n(n为自由度)。

(4)χ2分布具有可加性。

若U和V为两个独立的χ2分布随机变量,U~χ2(n1),V~χ2(n2),则随机变量U+V服从自由度为n1+n2的χ2分布。

统计总体根据一定的目的和要求所确定的研究事物的全体,它是由客观存有的、具有某种共同性质的很多个别事物构成的整体。

总体单位(总体的单位)指构成总体的个体单位,它是总体的基本单位。

两者的联系:(1)总体和总体单位是互为条件地连接在一起的;(2)没有总体单位,总体也就不存有;(3)没有总体,也就无法确定总体单位。

统计总体的特点和分类特点一、大量性二、同质性三、变异性分类1、统计总体按包含单位的数量,分为有限总体和无限总体。

(注意相对性)2、统计总体按单位标志的属性,分为数量总体和属性总体。

统计标志与标志表现单位标志——简称为标志,是指总体中各单位所共同具有的属性和特征。

总体单位是标志的直接承担者,标志是依附于单位的。

标志表现——标志特征在各单位的具体表现。

标志的分类1、标志通常分为品质标志和数量标志。

品质标志——表明单位属性方面的特征。

数量标志——表明单位数量方面的特征。

2、标志按研究标志的标志表现在总体各单位是否发生变化,分为不变标志和可变标志(变异标志)。

季节变动季节变动是指现象随着季节的变动而引起的比较有规则的变动。

理解和掌握这种变动规律,对于组织生产、安排人民生活等都具有重要意义。

研究季节变动,对于准确理解现象整体的发展变化规律性,也具有重要意义。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

样本方差的抽样分布
样本方差
先求出总体各单位变量值与其算术平均数的离差的平方,然后再对此变量取平均数,就叫做样本方差。

在许多实际情况下,人口的真实差异事先是不知道的,必须以某种方式计算。

当处理非常大的人口时,不可能对人口中的每个物体进行计数,因此必须对人口样本进行计算。

样本方差也可以应用于从该分布的样本的连续分布的方差的估计。

[
从一个样本取n个值y1,...,y n,其中n <N,并根据这个样本估计方差。

直接取样本数据的方差给出平均偏差的平均值:
这里,表示样本均值
由于y i是随机选择的,所以和是随机变量。

他们的预期值可以通过从群体中的大小为n的所有可能样本{yi}的集合进行平均来评估。

对于,有
因此给出了基于因子的人口方差的估计值。

被称为偏样本方差。

纠正该偏差之后形成无偏样本方差:
估计值可以简单地称为样本方差。

同样的证明也适用于从连续概率分布中抽取的样本。

样本方差分布
作为随机变量的函数,样本方差本身就是一个随机变量,研究其分布是很自然的。

在yi是来自正态分布的独立观察的情况下,s2服从卡方分布:
所以可求;和
如果y i独立同分布,但不一定是正态分布,那么
如果大数定律的条件对于平方观测值同样适用,则s2是σ2的一致估计量。

抽样分布
抽样分布也称统计量分布、随机变量函数分布,是指样本估计量的分布。

样本估计量是样本的一个函数,在统计学中称作统计量,因此抽样分布也是指统计量的分布。

以样本平均数为例,它是总体平均数的一个估计量,如果按照相同的样本容量,相同的抽样方式,反复地抽取样本,每次可以计算一个平均数,所有可能
样本的平均数所形成的分布,就是样本平均数的抽样分布。

抽样分布定理
(1)从总体中随机抽取容量为n的一切可能个样本的平均数之平均数,等于总体的平均数,即(E为平均的符号,为样本的平均数,μ为总体的平均数)。

(2)从正态总体中,随机抽取的容量为n的一切可能样本平均数的分布也呈正态分布。

(3)虽然总体不是正态分布,如果样本容量较大,反映总体μ和σ的样本平均数的抽样分布,也接近于正态分布。

样本方差的抽样分布
样本方差的抽样分布是指在重复选取容量为n的样本时,样本方差的所有可能取值形成的概率分布。

χ2分布具有如下性质和特点:
(1)χ2分布的变量值始终为正。

(2)χ2(n)分布的形状取决与其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称,如图7-2所示。

(3)χ2分布的期望为E(χ2)=n,方差为D(χ2)=2n(n为自由度)。

(4)χ2分布具有可加性。

若U和V为两个独立的χ2分布随机变量,U~χ2(n1),V~χ2(n2),则随机变量U+V服从自由度为n1+n2的χ2分布。

相关文档
最新文档