样本方差的抽样分布
生物统计学—卡方检验
独立性检验
步骤: 1. 提出无效假设,即认为所观测的各属性之间
没有关联 2. 规定显著性水平 3. 根据无效假设计算出理论数 4. 根据规定的显著水平和自由度计算出卡方值,
再和计算的卡方值进行比较。 如果接受假设,则说明因子之间无相关联,
是相互独立的 如果拒绝假设,则说明因子之间的关联是显
著的,不独立
一、2X2列联表的独立性检验
设A、B是一个随机试验中的两个事件,其中A可能
出现r1、r2个结果,B可能出现c1、c2个结果,两 因子相互作用形成4个数,分别以O11、O12、O21、 O22表示,即
2X2列联表的一般形式
r1 r2 总和
c1 O11 O21 C1=O11+O21
c2 O12 O22 C2=O12+O22
解:(1)假设 H0 : 鲤鱼体色F2性状分离符合3:1 对 H A : 鲤鱼体色F2性状分离不符合3:1
(2)选取显著水平 0.05
(3)检验计算: 计算鲤鱼体色的理论值
体色 F2理论尾数
青灰色 1201.5
红色 400.5
总数 1602
k
cc2 i 1
Oi Ei
0.5 2 301.63
1
2
2
xx
将样本方差代入,则:c
2
(k
1) s 2
2
其c2服从自由度为(k-1)的卡方分布
卡方函数的使用
假设
H 0:
2
2 0
,
适用右尾检验 ,其否定区为: c 2 c2
假设
H
0:
2
2 0
,
适用左尾检验
,其否定区为:
c
2
c2 1
假设
抽样分布习题
抽样分布习题1.抽样分布是指( C )A 一个样本各观测值的分布B 总体中各观测值的分布C 样本统计量的分布D 样本数量的分布2.根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分布,其分布的均值为( A )。
A μ B x C 2σ D n 2σ3.根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分布,其分布的方差为( D )。
A μ B x C 2σ D n 2σ4.从一个均值μ=10,标准差σ=0.6的总体中随机选取容量为n=36的样本。
假定该总体并不是很偏的,则样本均值x 小于9.9的近似概率为( A )。
A 0.1587B 0.1268C 0.2735D 0.63245.假设总体服从均匀分布,从此总体中抽取容量为36的样本,则样本均值的抽样分布( B )A 服从非正态分布B 近似正态分布C 服从均匀分布D 服从2χ分布6.从服从正态分布的无限总体中分别抽取容量为4,16,36的样本,当样本容量增大时,样本均值的标准差( C )A 保持不变 B 增加 C 减小D 无法确定7. 总体均值为50,标准差为8,从此总体中随机抽取容量为64的样本,则样本均值的抽样分布的均值和标准误差分布为( B )。
A 50,8B 50,1C 50,4D 8,88.某大学的一家快餐店记录了过去5年每天的营业额,每天营业额的均值为2500元,标准差为400元。
由于在某些节日的营业额偏高,所以每日营业额的分布是右偏的,假设从这5年中随机抽取100天,并计算这100天的平均营业额,则样本均值的抽样分布是( B )。
A 正态分布,均值为250元,标准差为40元B 正态分布,均值为2500元,标准差为40元C 右偏分布,均值为2500元,标准差为400元D 正态分布,均值为2500元,标准差为400元9. 某班学生的年龄分布是右偏的,均值为22,标准差为4.45,如果采取重复抽样的方法从该班抽取容量为100的样本,则样本均值的抽样分布是( A )A 正态分布,均值为22,标准差为0.445B 分布形状未知,均值为22,标准差为4.45C 正态分布,均值为22,标准差为4.45D 分布形状未知,均值为22,标准差为0.44510.在一个饭店门口等待出租车的时间是左偏的,均值为12分钟,标准差为3分钟,如果从饭店门口随机抽取100名顾客并记录他们等待出租车的时间,则该样本均值的分布服从( A )A 正态分布,均值为12分钟,标准差为0.3分钟B 正态分布,均值为12分钟,标准差为3分钟C 左偏分布,均值为12分钟,标准差为3分钟D 左偏分布,均值为12分钟,标准差为0.3分钟11. 某厂家生产的灯泡寿命的均值为60小时,标准差为4小时,如果从中随机抽取30只灯泡进行检查,则样本均值( D )A 抽样分布的标准差为4小时B 抽样分布近似等于总体分布C 抽样分布的中位数为60小时D 抽样分布近似等同于正态分布,均值为60小时12.假设某学校学生的年龄分布是右偏的,均值为23岁,标准差为3岁。
抽样 分布定理
这两个样本的样本方差,则有
2 S12 1 1、 2 2 ~ F ( n1 1, n2 1) S2 2 X Y ( 1 2 ) 2、 ~ t ( n1 n2 2) 2 2 ( n1 1) S1 ( n2 1) S2 1 1 n1 n2 2 n1 n2
则服从自由度为 n-1 的 t 分布的随机变量是
( A)t X S1 / n 1
( B)t X S2 / n 1
.
( D)t X S4 / n
(C )t
X S3 / n
定理 6.2 (两总体样本均值差、样本方差比的分布) 且X与Y独立, 设X ~ N ( 1, 2 ),Y ~ N ( 2 , 2 ), X1,X2,…, X n是来自X的样本,Y1,Y2,…,Yn 是取自Y的样本, 1 2 X和Y 分别是这两个样本的 样本均值, 2和S 2 分别是 S
几个重要的抽样分布定理
设总体X的均值为,方差为 2,X 1 , X 2 ,, X n 是 来自总体的一个样本,则样本均值X和样本方差S 2有
E( X ) , D( X ) 2 n ,
E( S 2 ) 2
样本均值的分布 设 X1, X2, …, Xn 是来自正态总体 的样本,
2 2
1 故C . 3
小结
在这一节中我们学习了抽样分布定理. 要 求大家熟练地掌握它们 .
常用的统计量 样本平均值
1 n X Xi n i 1
样本方差
样本标准差 样本k阶原点矩 样本k阶中心矩
1 n S2 ( X i X )2 n 1 i 1
1 n 2 S ( Xi X ) n 1 i 1
2 1 2 2 2 1 2 2
概率论 第六章 样本及抽样分布
一般,设 x1,x2, …,xn 是总体F的一个容 量为n的样本值,先将x1,x2, …,xn 按自小到 大的次序排列,并重新编号,设为
x(1) ≤x(2) ≤…≤x(n) 则经验分布函数Fn(x)的观察值为
0,
若x x(1) ,
性质:
(1) limf (t)
1
e ; t2 2
n
2
(2)当n 45时 取t (n) Z .
(三)设X~2(n1), Y~ 2(n2), 且X 与Y相互独立,则随机变量
F X/ n1 Y / n2
则称F服从第一自由度为n1,第二自由 度为n2的F分布,记作
F~F(n1 ,n2)
F分布的分布密度为
2 2
E( X 2 ) D( X ) (E( X ))2
2 2
n
E(S 2 )
E[ 1 n 1
n i 1
(Xi
X
)2 ]
E[
1
n
(
n 1 i1
X
2 i
2
n X )]
1
n
E(
n 1 i1
X
2 i
nX
2
)
1 [E( n 1
n i 1
X
2 i
)
E(n X
2
)]
1[ n 1
n i 1
考察某厂生产的电容器
的使用寿命。在这个试验 中什么是总体,什么是个 体。
解 个体是每一个电容器 的使用寿命;总体X是各个 电容器的使用寿命的集合。
2. 样本
为推断总体分布及各种特征,按一定规 则从总体中抽取若干个体进行观察试验,以 获得有关总体的信息,这一抽取过程称为 “抽样”,所抽取的部分个体称为样本. 样 本中所包含的个体数称为样本容量.
2021统计学原理-《统计学》第五章统计量及其抽样分布试题(精选试题)
统计学原理-《统计学》第五章统计量及其抽样分布试题1、智商的得分服从均值为100,标准差为16的正态分布。
从总体中抽取一个容量为n的样本,样本均值的标准差为2,样本容量为____________。
2、样本均值与总体均值之间的差被称作____________。
3、从均值为50,标准差为5的无限总体中抽取容量为30的样本,则抽样分布的超过51的概率为____________。
4、某校大学生中,外国留学生占10%。
随机从该校学生中抽取100名学生,则样本中外国留学生比例的标准差为____________。
5、假设总体服从均匀分布,从此总体中抽取容量为36的样本,则样本均值的抽样分布( )。
A.服从非正态分布B.近似正态分布C.服从均匀分布D.服从x²分布6、从服从正态分布的无限总体中分别抽取容量为4,16,36的样本,当样本容量增大时,样本均值的标准差( )。
A.保持不变B.增加C.减小D.无法确定7、总体均值为50,标准差为8,从此总体中随机抽取容量为64的样本,则样本均值的抽样分布的均值和标准误差分别为( )。
A.50,8B.50,1C.50,4D.8,88、某厂家生产的灯泡寿命的均值为60小时,标准差为4小时。
如果从中随机抽取30只灯泡进行检测,则样本均值( )。
A.抽样分布的标准差为4小时B.抽样分布近似等同于总体分布C.抽样分布的中位数为60小时D.抽样分布近似等同于正态分布,均值为60小时9、假设某学校学生的年龄分布是右偏的,均值为23岁,标准差为3岁。
如果随机抽取100名学生,下列关于样本均值抽样分布描述不正确的是( )。
A.抽样分布的标准差等于3B.抽样分布近似服从正态分布C.抽样分布的均值近似为23D.抽样分布为非正态分布10、从均值为200,标准差为50的总体中抽取容量为100的简单随机样本,样本均值的数学期望是( )。
A.150B.200C.100D.25011、从均值为200,标准差为50的总体中抽取容量为100的简单随机样本,样本均值的标准差是( )。
8-抽样分布
样本方差的抽样分布
1. 在重复选取容量为n的样本时,由样本方差的所有 可能取值形成的相对频数分布 2. 对于来自正态总体的简单随机样本,则比值
(n 1) s 2
的抽样分布服从自由度为 (n -1) 的2分布,即
2
(n 1) s 2 ~ (n 1) 2
2
2分布(图示)
不同容量样本的抽样分布
统计量
抽样分布
抽样分布 ( sampling distribution) 抽样误差
抽样分布
一、抽样分布的概念 二、样本均值抽样分布的形式 三、样本均值抽样分布的特征
三种不同性质的分布
总体分布
样本分布
抽样分布
总体分布(population distribution)
1. 2. 3.
M为样本数目
比较及结论:1. 样本均值的均值(数学期望) 等于总 体均值。 2. 样本均值的方差等于总体方差的1/n。
总体分布
.3 P(x)
抽样分布
.3 .2 .1 0 1 2 3 4
.2 .1 0 1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
= 2.5
σ2 =1.25
x 2.5 2 x 0.625
2.
3.
称F为服从自由度n1和n2的F分布,记为
U n1 F V n2
F ~ F (n1 , n2 )
例: (X1,X2,…,X5)为取自正态总体X~(0,σ2)的样本,
2 3( X 12 X 2 ) 求统计量 2 2( X 32 X 4 X 52 )
的分布
Xi
解
X i ~ N (0, 2 )
样本方差的抽样分布
样本方差的抽样分布样本方差先求出总体各单位变量值与其算术平均数的离差的平方,然后再对此变量取平均数,就叫做样本方差。
在许多实际情况下,人口的真实差异事先是不知道的,必须以某种方式计算。
当处理非常大的人口时,不可能对人口中的每个物体进行计数,因此必须对人口样本进行计算。
样本方差也可以应用于从该分布的样本的连续分布的方差的估计。
[从一个样本取n个值y1,...,y n,其中n <N,并根据这个样本估计方差。
直接取样本数据的方差给出平均偏差的平均值:这里,表示样本均值由于y i是随机选择的,所以和是随机变量。
他们的预期值可以通过从群体中的大小为n的所有可能样本{yi}的集合进行平均来评估。
对于,有因此给出了基于因子的人口方差的估计值。
被称为偏样本方差。
纠正该偏差之后形成无偏样本方差:估计值可以简单地称为样本方差。
同样的证明也适用于从连续概率分布中抽取的样本。
样本方差分布作为随机变量的函数,样本方差本身就是一个随机变量,研究其分布是很自然的。
在yi是来自正态分布的独立观察的情况下,s2服从卡方分布:所以可求;和如果y i独立同分布,但不一定是正态分布,那么如果大数定律的条件对于平方观测值同样适用,则s2是σ2的一致估计量。
抽样分布抽样分布也称统计量分布、随机变量函数分布,是指样本估计量的分布。
样本估计量是样本的一个函数,在统计学中称作统计量,因此抽样分布也是指统计量的分布。
以样本平均数为例,它是总体平均数的一个估计量,如果按照相同的样本容量,相同的抽样方式,反复地抽取样本,每次可以计算一个平均数,所有可能样本的平均数所形成的分布,就是样本平均数的抽样分布。
抽样分布定理(1)从总体中随机抽取容量为n的一切可能个样本的平均数之平均数,等于总体的平均数,即(E为平均的符号,为样本的平均数,μ为总体的平均数)。
(2)从正态总体中,随机抽取的容量为n的一切可能样本平均数的分布也呈正态分布。
(3)虽然总体不是正态分布,如果样本容量较大,反映总体μ和σ的样本平均数的抽样分布,也接近于正态分布。
概率论第六章样本及抽样分布
本相互独立,记
1 n1 X Xi n1 i 1 1 n2 Y Yi n2 i 1
则有 ⑴
2 1 2 2 2 1 2 2
1 n1 S12 ( X k X )2 n1 1 k 1 1 n2 2 S2 (Yk Y ) 2 n2 1 k 1
S / ~ F (n1 1, n2 1) S /
⑵ 当 时
2 1 2 2 2
X Y ( 1 2 ) ~ N (0,1) 1 1 n1 n2
(n1 1) S12
2 1
2 (n2 1) S2
2 2
~ 2 (n1 n2 2)
X Y ( 1 2 ) ~ t (n1 n2 2) 1 1 S n1 n2
2
又因为
(n 1)S 2
2
~ (n 1)
2
X n1 X n
故 Y
(n 1) S 2
n n 1 ~ t (n 1) /(n 1)
2
X n1 X n Y S
n ~ t (n 1) n 1
例4
设总体X , Y 相互独立 X ~ N (0,32 ) , Y ~ N (0,32 ) ,
2
X n1 X n n X 1 , X 2 ,, X n , X n1 , 求 Y 的分布 . S n 1 1 n 1 n 2 2 其中 X n X i , S ( Xi X n ) n i 1 n 1 i 1
1 2 解 由已知得 X n1 ~ N ( , ) , X n ~ N ( , ) , n n 1 2 所以 X n1 X n ~ N (0, ) n n 标准化得 X n1 X n ~ N (0,1) n 1
统计学(1)(1)
1、依据统计数据的收集方法不同,可将其分为【观测数据】数据和【实验数据】数据。
2、收集的属于不同时间上的数据称为【时间序列】数据。
5、在某城市随机抽取13个家庭,调查得到每个家庭的人均月收入数据如下:1080、750、1080、850、960、2000、1250、1080、760、1080、950、1080、660,则其众数为 1080,中位数为1080。
7、设总体X ~),(2σμN ,x为样本均值,S 为样本标准差。
当σ未知,且为小样本时,则n sx μ-服从自由度为n-1的___t__分布。
1、数据分析所用的方法分为 描述统计方法 和 推断统计方法 。
2、数据的基本类型有 分类数据 、 顺序数据 和 数值型数据 。
3、在某城市中随机抽取9个家庭,调查得到每个家庭的人均月收入数据:1080,750,780,1080,850,960,2000,1250,1630(单位:元),则人均月收入的平均数是 1153.3 ,中位数是 1020 。
4、设连续型随机变量X 在有限区间(a,b)内取值,且X 服从均匀分布,其概率密度函数0()1f x b a ⎧⎪=⎨⎪-⎩则X 的期望值为 2a b + ,方差为2()12b a - 。
1、收集数据的基本方法是 自填式 、 面访式 和 电话式 。
2、依据统计数据的收集方法不同,可将其分为 观测数据 和 实验数据 。
3、分类数据、顺序数据和数值型数据都可以用 饼图 、 条形图 等图形来显示。
5、测定数值型数据的离散程度,依据研究目的及资料的不同,可用的指标有 方差 、 离散系数 。
5、原假设0H 为真时却被我们拒绝,称为 弃真错误 。
7、对回归方程线性关系的检验,通常采用的是 F 检验。
2、如果我们要研究某班学生的学习状况,则总体是 ,总体单位是_ _ 。
4、利用估计的回归方程进行区间估计有两种类型,一是 置信区间估计 ,二是 预测区间估计 。
8、在参数估计时,评价估计量的主要有三个指标是无偏性、 、有效性、一致性。
第五章抽样分布
第四章抽样与抽样分布例1:从某年级1000位学生中抽取4位学生,计算身高(μ=169, =6.4),来估计全年级平均身高,假设抽取了成千上万个样本,得到如下结果:例2:几年前台湾一项调查显示,台湾民众月收入近似成正态分布,均值为13100台币,标准差为8750元,求:1)随机抽取一人,收入超过18430元的概率?2)抽取一个10人样本,平均收入超过18430元的概率?例3:假定某班级男生平均身高169cm,标准差为10.2cm,如果抽取一个n=100的随机样本,那么样本均值在μ±2之内的可能性是多少?例4:一架电梯极限负重1000公斤,一般可容纳13人。
假定电梯的所有乘客平均体重70公斤,标准差12公斤。
那么一个13个人的随机样本总重量超过极限负重的概率是多少?例5:某市育龄妇女生育意愿普查,65%的赞成“只生一个孩子”,35%不赞成或不表态。
设生育态度X:赞成为1,否则为0。
求:1)总体均值、总体方差、总体中赞成的比例;2)随机抽取10位育龄妇女,得到样本值为1、0、0、1、1、1、0、1、1、1,求样本均值、样本中赞成比例。
解:1)计算见下表2)样本均值=7/10=0.7,样本中赞成比例=7/10=0.7例6:学校选人大代表,结果有60%的选民投了我院院长而当选。
假定选举之前有人做了预测,抽取了一个n=30的随机样本进行民意测验,如果样本中只有半数一下的比例支持院长,于是得出院长失败的结果,显然这一预测是一个倒霉的预测。
那么,抽取到以上倒霉样本的概率是多少呢?即错误预测的可能性是多少?如果将样本量增到100,再计算错误概率。
例7:某中学学生男女人数相同,现随机从中抽取15名学生,问男生人数大于10的概率是多少?四、样本方差的抽样分布设随机变量x 1,x 2,x 3…..x i 相互独立且服从同一正态分布,则将这些随机变量标准化,再计算它们的平方和,得到卡方值2χ,其服从于自由度为n-1的卡方分布:2χ=2222312()()().....()i x x x x μμμμσσσσ----++++=2211()kii x μσ=-∑分子分母同乘n-1,进一步整理得2χ=22(1)n s σ-~2χ(n-1)练习题:1、某专业学生的年龄分布是右偏的,均值为22,标准差为4.45,如果采用重复抽样的方法从该专业学生中抽取容量为100的样本,则样本均值的抽样分布为?2、从均值为50,标准差为5的正态总体中抽取容量为25的样本,则样本均值超过51的概率为?3、某企业声明企业人均收入为5500元,标准差为550元。
四章样本及抽样分布
E(X )
1 n
n i 1
E( X i )
D(X )
1 n2
n
2
D(Xi )
i 1
n
X ~ N(, 2 )
n
X ~ N (0, 1) / n
iid
2.若X1,,X n ~ N (, 2 ), 则 (1) X与S 2相互独立; (2) 2
(n 1)S 2
2
~
2 (n 1);
(3)T X ~ t(n 1).
第四 章 样本及抽样分布
引言 run 随机样本 抽样分布
4.1 随机样本 一、总体与样本
1. 总体:研究对象旳全体。 一般指研究对象旳某项数量指标。 构成总体旳元素称为个体。
从本质上讲,总体就是所研究旳随机变量或 随机变量旳分布。
2. 样本:来自总体旳部分个体X1, … ,Xn 假如满足: (1)同分布性: Xi, i=1,…,n与总体同分布. (2)独立性: X1,… ,Xn 相互独立; 则称为容量为n 旳简朴随
P{ 1
1
P{ 1 F
F (n2 , n1)}
} 1
F F1 (n1, n2 )
P{ 1
1 }
得证!
F F1 (n1, n2 )
4.3 正态总体旳抽样分布定理
iid
1.若X1 ,,Xn ~ N(, 2 ), 则U
X / n
~
N(0, 1)
证明:
X
1 n
n i 1
Xi
是n 个独立旳正态随 机变量旳线性组合,故 服从正态分布
i 1
称为自由度为n的 2 分布.
2.2—分布旳密度函数f(y)曲线
f
(y)
样本方差的抽样分布(优质)
样本方差的分布
设总体服从正态分布N ~ (μ,σ2 ), X1,X2,… ,Xn为来自该正态总体的样本,则样本方差 s2 的分布为:
将2(n – 1)称为自由度为(n-1)的卡方分布。
总体
s m
卡方 (2) 分布
选择容量为n 的 简单随机样本 计算样本方差S2
计算卡方值
2 = (n-1)S2/σ2
将F(n1-1 , n2-1 )称为第一自由度为(n1-1),第二 自由度为(n2-1)的F分布
两个样本方差比的抽样分布
不同样本容量的抽样分布
(1,10)
(5,10)
(10,10)
F
两个不同自由度样本方差比的抽样分布(F分布)
空白演示
单击输入您的封面副标题
计算出所有的
2值
Байду номын сангаас
不同容量样本的抽样分布
n=1 n=4 n=10 n=20
2
均值的标准误
所有可能的样本均值的标准差,测度所 有样本均值的离散程度;
小于总体标准差; 计算公式为:
两个样本方差比的抽样分布
两个样本方差比的抽样分布
设X1,X2,… ,Xn1是来自正态总体N~(μ1,σ12 )的 一个样本, Y1,Y2,… ,Yn2是来自正态总体 N~(μ2,σ22 ) 的 一 个 样 本 , 且 Xi(i=1,2,… , n1) , Yi(i=1,2, …,n2)相互独立,则
统计学第3、4章习题
13
24. 指出下列假设检验哪一个属于左侧检验(
)
A. H0:=0,H1:≠0 B. H0:≤0,H1:0 C. H0:<0,H1:≥0 D. H0:≥0,H1:<0
25.一项研究表明,司机驾车时接打手机而发生事故 的比例超过20%,为了证明这一结论,原假设和备 择假设应为( ) A. H0:≤ 0.2,H1: 0.2 B. H0:= 0.2 ,H1: ≠0.2 C. H0:≥ 0.2 ,H1: < 0.2 D. H0:< 0.2,H1: ≥ 0.2 14
)
16. 抽取一个容量为100的随机样本,其均值为81, 标准差为12,总体均值的95%的置信区间为 ( ) A. 81±1.97 B. 81±2.35 C. 81±3.10 D. 81±3.52
9
17.从某地区随机抽取20个企业,得到20个企业总 经理的年平均收入为25964.7元,标准差为 42807.8元。构造企业总经理年平均收入的95% 的置信区间为( ) A. 25964.7±20034.3 B. 25964.7±21034.3 C. 25964.7±25034.3 D. 25964.7±30034.3 18. 税务管理官员认为,大多数企业都有偷税漏税 行为。在对由800个企业构成的随机样本检查中, 发现有144个企业有偷税漏税行为。根据99%的 置信水平估计偷税漏税企业比例的置信区间为 ( ) A. 0.18±0.015 B. 0.18±0.025 C. 0.18±0.035 D. 0.18±0.045 10
s
n
n
C. t x 0
n
D. z x 0
s n
15
28.随机抽取一个n=50的样本,计算得到 x 60 , s=15,要检验假设H0:=65,H1:≠65,检验 统计量为 ( ) A. -3.33 B. 3.33 C. -2.36 D. 2.36 29. 随机抽取一个n=40的样本,计算得到 x 17, s 2 8, 在a0.02的显著水平下,检验假设H0:≤15,H1: 15,统计量的临界值为( ) A. -2.05 B. 2.05 C. 1.96 D. -1.96
贾俊平统计学第六章 抽样分布
n=4 σx = 5 n =16 σ x = 2.5
µ = 50
X
µx = 50
X
总体分布
抽样分布
中心极限定理
(central limit theorem)
中心极限定理: 中心极限定理:设从均值为µ,方差为σ 2的一个任意总 体中抽取容量为n的样本, 充分大时, 体中抽取容量为n的样本,当n充分大时,样本均值的抽 样分布近似服从均值为µ 方差为σ 样分布近似服从均值为µ、方差为σ2/n的正态分布
解:根据中心极限定理,样本容量>30,可视 为样本均值近似服从正态分布。
样本均值的抽样分布与中心极限定理 (例题分析)
因此知,样本均值服从:
0.62 X~N ( µ , σ 2 n ) = N 10, = N (10, 0.01) 36 (1) P X <9. = P X − 10 < 9.9 − 10 9) ( 0.1 0.1
6.1 统计量
1. 统计量的概念 2. 常用的统计量
统计量的概念
定义:
设X1,X2,……,Xn是从总体X中抽取的样本容 量为n的一个样本,如果由此样本构造一个函数 T(X1,X2,……,Xn),不依赖任何未知参数, 则称行数T(X1,X2,……,Xn)是一个统计量。 统计量是样本的函数 统计量不依赖任何未知总体参数 根据具体样本的观测值x1,x2,……,xn带入统 计量函数,计算出来的值是一个具体的统计量 的值。
0.1 0 1.0 1.5 2.0 2.5 3.0 3.5 4.0 X 0.3 0.2 P (X )
样本均值的抽样分布 3.0 3 3.5 2 4.0 1
均值X的取值 均值 的取值 均值X的个数 均值 的个数
统计学复习(抽样分布、参数估计、假设检验)
两个样本均值之差的抽样分布 (1)如: ) 抽样
X1 − N(µ1,σ12 ), X2 − N(µ2 ,σ2 ),
2
则 x1 − x2 ) ~ N(µ1 − µ2 , (
σ12 σ22
n1 + n2
)
抽样
σ12 N1 − n1 σ22 N2 − n2 (x1 − x2 ) ~ N[(µ1 − µ2 , ( )+ ( )] n1 N1 −1 n2 N2 −1
对于无限总体, 对于无限总体, 一个估计 如果对任意 量如能完 ε>ˆ 0 满足条件 全地包含 LimP(|θn −θ |≥ ε ) = 0 未知参数 n→∞ 信息, 信息,即 则称 θˆ 是 θ 为充分量 的一致估计。 的一致估计。
点估计
常用的求点估计量的方法
用样本的数字特征 1.数字特征法: 1.数字特征法:当样本容量增大时 ,用样本的数字特征 数字特征法 去估计总体的数字特征。 去估计总体的数字特征。 例如,我们可以用样本平均数(或成数 和样本方差来估 例如,我们可以用样本平均数 或成数)和样本方差来估 或成数 计总体的均值(或比率 和方差。 或比率)和方差 计总体的均值 或比率 和方差。
样本均值的抽样分布(简称均值的分布) 样本均值的抽样分布(简称均值的分布) 抽样
均值µ=∑Xi/N 均值
均值 X = Σxi
n
样本均值是样本的函数, 故样本均值是一个统计量, 样本均值是样本的函数, 故样本均值是一个统计量, 统计量 统计量是一个随机变量 随机变量, 统计量是一个随机变量, 样本均值的概率分布称为 样本均值的抽样分布。 样本均值的抽样分布。
2
n
总体均值 (µ) )
X ± tα
2
( n −1 )
正态总体的常用抽样分布(2)
(n 1)S 2
2
~
2 (n 1) ,
且 X 与 (n 1)S 2 相互独立,
2 /n
2
3
X / n
~
N (0, 1) ,(n 1)S 2 2
~
2 (n 1) ,
且
X 2/n
与
(
n
1)
2
S
2
相互独立,
由 t 分布的定义,
T X 2/n
(n 1)S 2
2 (n 1)
S
2 X
和
SY2
为各自的样本方差,
则
F
S
2 X
SY2
2 1
2 2
~
F (n1
1, n2
1) .
证
(n1
1)
S
2 X
2 1
~
2(n1
1),(n2
1)SY2
2 2
~ 2(n2 1),
且
S
2 X
与
SY2
相互独立,
由F分布的定义可得结论.
18
小结
样本均值
X
1 n
n i 1
Xi
样本方差
S2
(4) U ( X Y ) (1 2 ) ~ N (0,1)
2 1
/
n1
2 2
/
n2
(5)
T
F
(X S
S
2 X
SY2
Y)
xy
(1
1
1
) 2~
t ( n1
n2
n1 n2
2
其
中
S
2 xy
(n1
1)S n1
1 2
抽样分布
x
/ n
x s/ n
N (0,1)
t=
N ( , )
2
t分布
总体方差未知或样本容量n小于30时,标准离差的分布呈t分布。
四、 t 分布
对于不同的自由度,t分布有不同的曲线。
四、 t 分布
( 1 ) t分布曲线左右对称,围绕平均数μt =0 向两侧递降。 (2)t分布受自由度df=n-1制约,每个df都有一条t分布曲线。 (3)df小,t值离散程度大。 (4)和正态分布相比,t分布的顶端偏低,尾部偏高,自由度
2 s1 F 2 s2
此F值具有s12的自由度df1=n1-1和s22的自由度 df2=n2-1。
六、 F 分布
df1 df1 df2 1 ( ) df1 df 2 2 F 2 2 2 f (F ) df1 df2 df1 df 2 df1 df2 ( ) ( ) (df1 F df2 ) 2 2 2
F分布是随自由度df1和df2进行变化的一组曲线。
F分布的概率累积函数
f (F )
F
0
f ( F )dF
六、F 分布
1
F分布的平均数μF=1 ,F的取值区间为[0,+∝ )
F分布曲线的形状仅决定于df1和df2。在df1=1或2时, 2 F分布曲线呈严重倾斜的反向J型,当df1≧ 3时,转
为左偏曲线。
第四章:统计数的分布——抽样分布
从总体中抽取的样本提供的信息仅是总体的一部分,它不能 提供完全准确的信息,必然存在着一定的误差。 对于样本容量相同的多次随机抽样样本,其统计量是变异的, 且其取值有一定的概率,即样本统计量也是一个随机变量,此 分布规律称为抽样分布(sampling distribution)。
概率论与数理统计 --- 第六章{样本及抽样分布} 第四节:抽样分布
P T 1.059
0.15.
例2:
从正态总体N ( , 0.5 )中抽取样本X 1 , , X 10 .
2
数理统计
10 2 (1)已知 0,求概率P X i 4 ; i 1 10 2 (2)未知,求概率P ( X i X ) 2.85 . i 1
S1 和S2 分别是这两个样本的样本方差, 则有:
2 2
(1)
S1
2 2
S2
~ F ( n1 1, n2 1);
2 2
若两方差 1 2,则
S1 1
2 2
2 2
S2 2
~ F ( n1 1, n2 1);
(2)
X Y ( 1 2 ) ( n1 1) S1 ( n2 1) S2
n取不同值时
( n 1) S
2
2
的分布
定理3 (样本均值的分布) 数理统计 设X1, X2, …, Xn是取自正态总体 N(μ, σ2)的样本, 2 X和S 分别为样本均值和样本方差, 则有:
X S n ~ t ( n 1)
证:由定理1、和t分布的定义可得: 2
X ~ N (0,1), ( n 1) S
2) F分布的分位点:
对于给定的, 1, 称满足条件: 0
P F F ( n1 , n2 )
( y )dy
F ( n1 , n2 )
的点F ( n1 , n2 )为F ( n1 , n2 )分布的上 分位点.
F分布的上分位点的性质:
F1 ( n1 , n2 ) 1 F ( n2 , n1 )
正态总体样本均值与样本方差的分布
~ 2(n 1);
(3) X 与 S 2 相互独立.
定理6.2 设 X1, X2 ,L , Xn 是来自正态总体 N (, 2 )
的样本, X 与 S2 是样本均值与样本方差, 则
X ~ t(n 1).
S/ n
证明
因为 X ~ N (0,1), / n
(n 1)S 2
S2
1 n1
n i 1
(Xi
X
)2
6.3.1 单个正态总体的情形
定理6.1 设 X1, X2 ,L , Xn 是来自正态总体 N (, 2 )
的样本, X 与 S2 是样本均值与样本方差, 则
(1)
X
~
N
,
2
n
或
X
n
~ N 0, 1;
(2)
(n 1)S 2
2 2
nm
(2)
S12 / S22
2 1
/
2 2
~ F(n 1, m 1);
(3)
当
2 1
2 2
2
时,
( X Y ) (1 2 ) ~ t(n m 2),
Sw
1 1 nm
其中
Sw2
(n 1)S12 (m 1)S22 , nm2
在概率统计问题中,正态分布占据着十分重
要的位置,这是因为许多量的概率分布或者是正
态分布,或者接近于正态分布,而且,正态分布
有许多优良性质,便于进行较深入的理论研究。
因此,我们着重来讨论一下正态总体下的抽样分
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
样本方差的抽样分布
样本方差
先求出总体各单位变量值与其算术平均数的离差的平方,然后再对此变量取平均数,就叫做样本方差。
在许多实际情况下,人口的真实差异事先是不知道的,必须以某种方式计算。
当处理非常大的人口时,不可能对人口中的每个物体进行计数,因此必须对人口样本进行计算。
样本方差也可以应用于从该分布的样本的连续分布的方差的估计。
[
从一个样本取n个值y1,...,y n,其中n <N,并根据这个样本估计方差。
直接取样本数据的方差给出平均偏差的平均值:
这里,表示样本均值
由于y i是随机选择的,所以和是随机变量。
他们的预期值可以通过从群体中的大小为n的所有可能样本{yi}的集合进行平均来评估。
对于,有
因此给出了基于因子的人口方差的估计值。
被称为偏样本方差。
纠正该偏差之后形成无偏样本方差:
估计值可以简单地称为样本方差。
同样的证明也适用于从连续概率分布中抽取的样本。
样本方差分布
作为随机变量的函数,样本方差本身就是一个随机变量,研究其分布是很自然的。
在yi是来自正态分布的独立观察的情况下,s2服从卡方分布:
所以可求;和
如果y i独立同分布,但不一定是正态分布,那么
如果大数定律的条件对于平方观测值同样适用,则s2是σ2的一致估计量。
抽样分布
抽样分布也称统计量分布、随机变量函数分布,是指样本估计量的分布。
样本估计量是样本的一个函数,在统计学中称作统计量,因此抽样分布也是指统计量的分布。
以样本平均数为例,它是总体平均数的一个估计量,如果按照相同的样本容量,相同的抽样方式,反复地抽取样本,每次可以计算一个平均数,所有可能
样本的平均数所形成的分布,就是样本平均数的抽样分布。
抽样分布定理
(1)从总体中随机抽取容量为n的一切可能个样本的平均数之平均数,等于总体的平均数,即(E为平均的符号,为样本的平均数,μ为总体的平均数)。
(2)从正态总体中,随机抽取的容量为n的一切可能样本平均数的分布也呈正态分布。
(3)虽然总体不是正态分布,如果样本容量较大,反映总体μ和σ的样本平均数的抽样分布,也接近于正态分布。
样本方差的抽样分布
样本方差的抽样分布是指在重复选取容量为n的样本时,样本方差的所有可能取值形成的概率分布。
χ2分布具有如下性质和特点:
(1)χ2分布的变量值始终为正。
(2)χ2(n)分布的形状取决与其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称,如图7-2所示。
(3)χ2分布的期望为E(χ2)=n,方差为D(χ2)=2n(n为自由度)。
(4)χ2分布具有可加性。
若U和V为两个独立的χ2分布随机变量,U~χ2(n1),V~χ2(n2),则随机变量U+V服从自由度为n1+n2的χ2分布。