第四节 抽样分布
抽样与抽样分布
抽样与抽样分布在统计学中,抽样是一种常用的数据收集方法,通过从总体中选择一部分样本来进行研究和分析。
抽样的目的是通过样本来推断总体的特征和性质。
在进行抽样时,我们需要了解抽样的方法和抽样分布的概念。
一、抽样方法1. 无偏抽样无偏抽样是指所有样本有相同被选中的机会。
这样可以确保样本的代表性,从而减小样本估计值和总体真值之间的误差。
常见的无偏抽样方法包括简单随机抽样、系统抽样和分层抽样等。
2. 有偏抽样有偏抽样是指样本的选择并不具有相等的机会。
这样可能导致样本的代表性不足,从而产生较大的估计误差。
有时,有偏抽样也可以用于特定的研究目的,但需要明确地说明和分析偏差带来的影响。
二、抽样分布1. 抽样分布的概念抽样分布是指统计量在各个可能样本上的取值分布。
统计量可以是样本均值、样本方差等。
抽样分布的性质对于进行统计推断和假设检验非常重要。
2. 样本均值的抽样分布样本均值的抽样分布在中心极限定理的条件下近似服从正态分布。
中心极限定理指出,当样本容量足够大时,无论总体分布如何,样本均值的抽样分布都会接近正态分布。
3. 样本比例的抽样分布样本比例的抽样分布在满足一些条件的情况下也近似服从正态分布。
这些条件包括样本容量足够大、总体比例接近0.5以及样本与总体之间的独立性等。
4. 样本方差的抽样分布样本方差的抽样分布不服从正态分布。
通常情况下,样本方差的抽样分布呈右偏态,即偏度大于0。
为了得到样本方差的抽样分布,可以使用抽样分布的近似分布,如卡方分布。
三、应用案例抽样与抽样分布的方法和理论在实际统计学中有广泛的应用。
以下是一些常见的应用案例:1. 调查研究在进行调查研究时,我们经常需要从总体中选择一部分样本进行问卷调查或面访。
通过利用抽样与抽样分布的方法,我们可以将样本的调查结果推广到总体中,从而得到总体的特征和性质。
2. 假设检验假设检验是统计学中常用的推断方法之一。
通过比较样本统计量与假设的总体参数值,我们可以判断假设的合理性。
统计学习题答案 第4章 抽样与抽样分布
第4章抽样(chōu yànɡ)与抽样分布——练习题(全免(quán miǎn))1. 一个(yīɡè)具有个观察(guānchá)值的随机样本抽自于均值等于20、标准差等于(děngyú)16的总体。
⑴给出的抽样分布(重复抽样)的均值和标准差⑵描述x的抽样分布的形状。
你的回答依赖于样本容量吗?⑶计算标准正态统计量对应于的值。
⑷计算标准正态z统计量对应于的值。
解: 已知 n=64,为大样本,μ=20,σ=16,⑴在重复抽样情况下,x的抽样分布的均值为a. 20, 2b. 近似正态c. -2.25d. 1.502 . 参考练习4.1求概率。
⑴x<16;⑵x>23;⑶x>25;⑷.x落在16和22之间;⑸x<14。
解: a. 0.0228 b. 0.0668 c. 0.0062 d. 0.8185 e. 0.00133. 一个具有个观察值的随机样本选自于、的总体。
试求下列概率的近似值:解: a. 0.8944 b. 0.0228 c. 0.1292 d. 0.96994. 一个具有个观察值的随机样本选自于和的总体。
⑴你预计x的最大值和最小值是什么?⑵你认为x至多偏离多么远?⑶为了回答b你必须要知道 吗?请解释。
解:a. 101, 99 b. 1 c. 不必5.考虑一个包含的值等于0,1,2,…,97,98,99的总体。
假设x的取值的可能性是相同的。
则运用计算机对下面的每一个值产生500个随机样本,并对于每一个样本计算x。
对于每一个样本容量,构造x的500个值的相对频率直方图。
当n值增加时在直方图上会发生什么变化?存在什么相似性?这里和。
解:趋向正态6.美国(měi ɡuó)汽车联合会(AAA)是一个(yīɡè)拥有90个俱乐部的非营利联盟,它对其成员提供旅行、金融(jīnróng)、保险以及与汽车相关的各项服务。
第四章抽样分布
10 42 7 60 7 6 e 7 P X 6 0.149 6!
4.2 随机变量的概率分布
4.2.3 连续型概率分布
连续型随机变量的概率分布
1. 连续型随机变量可以取某一区间或整个实 数轴上的任意一个值 2. 它取任何一个特定的值的概率都等于0 3. 不能列出每一个值及其相应的概率 4. 通常研究它取某一区间值的概率 5. 用概率密度函数的形式和分布函数的形式 来描述
二项分布
(Binomial distribution)
1. 重复进行 n 次试验,出现“成功”的次数 的概率分布称为二项分布,记为X~B(n, p) 2. 设X为 n 次重复试验中出现成功的次数,X 取 x 的概率为 x x n x
P X x Cn p q
n!
( x 0,1,2,, n)
(4) P(X2)=0.35+0.30=0.65
二项试验
(Bernoulli试验) 1. 二项分布建立在Bernoulli试验基础上
2. 贝努里试验满足下列条件
一次试验只有两个可能结果,即“成功”和“ 失败”
“成功”是指我们感兴趣的某种特征
一次试验“成功”的概率为p ,失败的概率为q =1- p,且概率p对每次试验都是相同的 试验是相互独立的,并可以重复进行n次 在n次试验中,“成功”的次数对应一个离散型 随机变量X
x 式中: Cn
x! ( n x )!
二项分布
(例题分析)
【例】已知一批产品的次品率为4%,从中任意有放回地抽
取5个。求5个产品中
(1) 没有次品的概率是多少? (2) 恰好有1个次品的概率是多少?
抽样分布基本概念
抽样分布基本概念引言抽样分布是统计学中一个重要的概念,它描述了在进行统计推断时所使用的样本统计量的分布情况。
在本文中,我们将讨论抽样分布的基本概念,包括样本、样本统计量、抽样分布的性质以及样本均值和样本比例的抽样分布。
样本与样本统计量在统计学中,样本是指从总体中随机选取的一部分观察对象。
样本的大小通常用字母n表示。
通过对样本进行测量和观察得到的某一特定数值称为样本统计量。
样本统计量是对总体参数的估计。
常见的样本统计量有样本均值、样本方差和样本比例。
样本均值是指样本中所有观察值的平均值,用符号X表示。
样本方差是指样本中所有观察值与样本均值之差的平方和的均值。
样本比例是指符合某一特征的观察值占样本总体的比例。
抽样分布的性质抽样分布是指在总体参数未知的情况下,对总体进行抽样并计算样本统计量后得到的分布。
在大样本情况下(样本容量n足够大),根据中心极限定理,样本均值的抽样分布近似呈正态分布。
这意味着无论总体是什么样的分布,当样本容量足够大时,样本均值的抽样分布都可以近似看作是正态分布。
当总体分布为正态分布时,样本均值的抽样分布仍然是正态分布。
但是当总体分布为非正态分布时,样本均值的抽样分布仍然近似为正态分布,但不再是精确的正态分布。
样本均值的抽样分布样本均值的抽样分布被称为抽样分布。
当总体分布为正态分布时,不论样本容量大小,样本均值的抽样分布都是正态分布。
当总体分布为非正态分布时,当样本容量足够大时,样本均值的抽样分布近似为正态分布。
样本均值的抽样分布的均值等于总体均值,标准差等于总体标准差除以样本容量的平方根。
抽样分布的均值等于总体均值是因为样本均值是总体均值的无偏估计,即样本均值的期望值等于总体均值。
抽样分布的标准差等于总体标准差除以样本容量的平方根是因为样本均值的抽样分布的方差等于总体方差除以样本容量。
样本比例的抽样分布样本比例的抽样分布也是一个重要的抽样分布。
样本比例的抽样分布是二项分布的一种特殊情况。
统计学中的抽样分布基本理论
统计学中的抽样分布基本理论统计学是一门广泛应用于各个领域的学科。
在许多领域都需要数据支撑决策,统计学是收集、分析和解释数据的科学。
而抽样分布的基本理论则是统计学中最为基础且至关重要的概念之一。
什么是抽样分布?抽样分布指的是在总体中选取一定数量样本的情况下,样本所呈现的分布情况。
这个分布被称为抽样分布。
抽样分布正是在原本无法得出准确结果时,在对样本进行检测和分析加以处理得出的模拟分布情况。
抽样分布的定义我们假设样本是从一个总体中随机抽取的,这个总体具有一个概率分布,并且每个样本都独立地从该概率分布中抽取。
根据中心极限定理,当样本数量足够大时,样本均值的分布将会近似正态分布,均值为总体均值,标准差为总体标准差除以样本量的平方根。
这个近似于正态分布的抽样分布称为样本均值的抽样分布。
抽样分布中的t分布因为在实际应用中,样本的真实总体均值和总体标准差都是为了推断或预测总体特征,而在抽样时这些特征是不确定的,所以会有一定误差。
这时我们便需要用到其它类型的抽样分布。
t分布就是这样一种抽样分布方式,它在样本量较小时,比正态分布更适用。
它类似于正态分布,但在小样本情况下,会有更宽的尾部和更高的峰值。
t分布具有参数自由度 (df) ,其在自由度越大时,越接近于正态分布。
当自由度大于30时,两者基本一致。
了解抽样分布形式和方法对于进行更高质量的统计分析意义重大。
在统计中,我们总是使用概率论和数理统计中的一些基本思想来尽可能减少污染。
特别是在数据采集的实际工作中,数据样本的选取是统计分析的重要基础之一,样本均值的分布越正常,那么就可以推断出样本中的点集越正常。
抽样分布是推断总体、检验总体分布、总体均值、总体比率、总体标准差等经典统计问题的基础。
(04)第4章+抽样与抽样分布
4-6
统计学
STATISTICS
例题分析
♦ 假定我们刚刚已取了飞机制造所用的铆钉的25个 假定我们刚刚已取了飞机制造所用的铆钉的25个
一组的样本。检测铆钉的抗剪强度,破坏每个铆 钉所需的力是响应变量。对这组样本,可以求得 各种描述性的测量(均值、方差等)。 ♦ 然而,我们的感兴趣的是总体,并不是样本自身。 被测试的铆钉在测试时已被破坏,不能再用在飞 机的制造上,所以我们肯定不能测试所有的铆钉。 我们必须从这组样本或几组这样的样本来决定总 体的某些特性。 ♦ 因此,我们必须设法推断信息,也即基于样本的 观测结果作出总体的推断
(例题分析) 例题分析)
计算出各样本的均值,如下表。 计算出各样本的均值,如下表。并给出样本均 值的抽样分布
4 - 32
样本均值的抽样分布
统计学
STATISTICS
(例题分析) 例题分析)
【例】设一个总体,含有4个元素(个体) ,即总体单位 设一个总体,含有4个元素(个体) 数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4 。总 个个体分别为x 体的均值、 体的均值、方差及分布如下 总体分布
4 - 17
统计学
STATISTICS
分层抽样
分层抽样
统计学
STATISTICS
(stratified sampling) sampling)
♦ 分层抽样:在抽样之前先将总体的单位按 分层抽样:
某种特征或某种规则划分为若干层(类), 然后从不同的层中独立、随机地抽取一定 数量的单位组成一个样本,也称分类抽样 数量的单位组成一个样本,也称分类抽样 sampling) (stratified sampling) ♦ 在分层或分类时,应使层内各单位的差异 尽可能小,而使层与层之间的差异尽可能 大
第四章 抽样分布
从两个正态总体中抽取的样本统计量的分布 二、标准差σ i未知但相等时两个平均数的和与差的 分布
t2 n 2
( y1 y2 ) ( 1 2 ) s s n
2 1 2 2
从两个正态总体中抽取的样本统计量的分布 三、两个样本方差比的分布——F分布
Fdf1 ,df2
t0.05(0.01)=? -t0.05(0.01)=? t0.05/2(0.01/2)=?
二、样本方差的分布
2 df
dfs 2
2
(n 1) s 2
2
2
2
2 K ( ) 2 e f df ( ) 2 0 , 0
df 1 2
,
2
0 K
y , y n
即 y 服从正态分布 N(μ,σ 2/n)。
标准差未知时平均数的分布——t分布
y t 具n-1自由度 s n 样本标准误
t分布的特征数:
t 0
(df>1) (df>2)
1:t 0
(df>3)
df t df 2
2:t
6 (df>4) df 4Biblioteka t分布曲线下总的面积等于1。
f=∞
f=5 f=1
图3-6 t分布曲线
t分布的累积分布函数为:
Ft ( df ) P(t t1 )
t1
f (t )dt
P(t ta ) P(t ta ) a
P( t t a ) a
2
- t (n)
t (n)
u
( y1 y2 ) ( 1 2 )
概率论抽样分布
概率论抽样分布说明在概率论中,抽样分布是指从总体中选取样本并计算样本统计量的分布。
通过研究抽样分布,可以推断总体的性质和参数。
在这篇文档中,我们将介绍概率论抽样分布的基本概念、特性以及常用的分布类型。
抽样分布的定义抽样分布是由于从总体中抽取样本导致的统计量的分布。
在统计学中,统计量是从样本数据中计算得出的数值,如样本均值、样本方差等。
通过从总体中不断抽取样本并计算统计量的值,可以得到抽样分布。
抽样分布的特性抽样分布具有以下特性:1.中心极限定理:当样本容量足够大时,抽样平均值的抽样分布近似呈正态分布。
2.抽样分布的均值等于总体均值:样本均值的期望值等于总体均值。
3.抽样分布的方差等于总体方差除以样本容量:样本均值的方差等于总体方差除以样本容量。
常见的抽样分布类型在概率论中,常用的抽样分布类型包括:1.正态分布:也称为高斯分布,是最常用的抽样分布。
当样本容量足够大时,均值的抽样分布近似呈正态分布。
2.t分布:用于小样本(样本容量较小)情况下对总体均值的推断。
相对于正态分布,t分布有更宽的尾部。
3.卡方分布:用于推断总体方差时的抽样分布。
卡方分布的形态由自由度决定。
4.F分布:用于比较两个总体方差是否相等的抽样分布。
F分布的形态由两个样本的自由度决定。
抽样分布的应用抽样分布广泛应用于统计学和概率论中的推断与检验问题。
通过从总体中抽取样本并计算统计量的分布,可以进行以下应用:1.参数估计:通过抽样分布,我们可以估计总体参数的取值,如总体均值、总体方差等。
2.假设检验:通过比较样本统计量与抽样分布的临界值,我们可以判断总体参数是否满足某个假设。
3.置信区间估计:通过计算抽样分布的分位数,我们可以得到总体参数的置信区间,从而评估参数的精确性。
总结抽样分布是概率论中的重要概念,用于推断总体的性质和参数。
具备了中心极限定理、均值和方差的性质等特点,常见的抽样分布类型包括正态分布、t分布、卡方分布和F分布。
通过抽样分布,我们可以进行参数估计、假设检验和置信区间估计等应用。
4.3抽样分布
(3) X与S2相互独立
(4) X ~ t(n 1)
Sn
已知, 2未知
(5) n ( Xi )2 ~ 2 (n)
i1
已知
LOGO
例1 设总体X 服从正态分布N (12, 2 ), 抽取容量为
25的样本,求样本均值X大于12.5的概率.如果(1)已
知 12;(2)未知,但已知样本方差S2 3.6.
n1 n2
服
从
F(n1,
n
)
2
分
布
.
LOGO
4.3.2 正态总体的抽样分布
由于要求具体抽样分布是困难的,有时甚至是不可 能的。正态总体的抽样分布有详尽的研究,本节主要 学习正态总体的抽样分布。
掌握正态分布、 2分布、t分布、F分布的一些结论
对于正态总体抽样分布的学习非常有用. 主要学习单个正态总体的抽样分布以及多个正态总
i1
于是P
10
i1
Xi 2
4
P
1 0.52
10 i1
Xi2
16
查表求02.10(10) 16.由此可得
P
10 i1
Xi
2
4
0.10.
(2) 由题设及定理4.3.2, 9S 2
0.52
10
P i1
(Xi
X )2
1
2.85
P
0.52
10 i1
查表得02.25(9) 11.4,由此可求得
n
n
该定理的证明由正态分布的性质3.1.10可得。
注意:当样本来自非正态总体时,若总体均值为,方差 为 样 本量2(充有分限大且时不,X为近零似)服,从由N中(心, 极)2.限定理可以证明当
5-4三大抽样分布
2
1 2
e x2 / 2dx
3
E
(
X
2 i
)
3
D(
2
)
nD(
X
2 i
)
n{ E (
X
4 i
)
[E(
X
2 i
)]2
}
2n
4、上侧分位数(重点)
设X : 2 (n),对给定的正数(0< 1),称满足条件: P{ X 2 (n)} 的点2 (n)为 2分布的上分位点.
说明:
(1)即随机变量X 落在点2 (n)右侧的概率等于的点.
其值可以查表求得.
f (y) n1
2 分布图形:
n4
n 10
y0 y0
O
5 10 15 20
y
3、主要特征:
(1)可加性: 如果 X ~ 2(n1 ), Y ~ 2(n2 ),并且X , Y相互独立, 则 X Y ~ 2(n1 n2 )
(2) 若 2 ~ 2 (n), 则 E( 2 ) n, D( 2 ) 2n
U ~ 2(n1 ),
F ( n2 , n1 )
V
~
2 (n2 ) , 使F
U / n1 V / n2
(2) 若 t ~ t(n), 则 t 2 ~ F (1, n) (P130-习8)
简证: t : t(n) X : N (0,1), Y : 2(n),使t X
Y /n t 2 X 2 , X 2 : 2(1), Y : 2(n), F分布定义
(2)上 分位点 2 (n) 可查 2(n) 分布表求得(见P250附表5).
(3)当 n 45 时,费歇证明: 2 2(n) 近 似 N ( 2n 1 , 1).
四章样本及抽样分布
E(X )
1 n
n i 1
E( X i )
D(X )
1 n2
n
2
D(Xi )
i 1
n
X ~ N(, 2 )
n
X ~ N (0, 1) / n
iid
2.若X1,,X n ~ N (, 2 ), 则 (1) X与S 2相互独立; (2) 2
(n 1)S 2
2
~
2 (n 1);
(3)T X ~ t(n 1).
第四 章 样本及抽样分布
引言 run 随机样本 抽样分布
4.1 随机样本 一、总体与样本
1. 总体:研究对象旳全体。 一般指研究对象旳某项数量指标。 构成总体旳元素称为个体。
从本质上讲,总体就是所研究旳随机变量或 随机变量旳分布。
2. 样本:来自总体旳部分个体X1, … ,Xn 假如满足: (1)同分布性: Xi, i=1,…,n与总体同分布. (2)独立性: X1,… ,Xn 相互独立; 则称为容量为n 旳简朴随
P{ 1
1
P{ 1 F
F (n2 , n1)}
} 1
F F1 (n1, n2 )
P{ 1
1 }
得证!
F F1 (n1, n2 )
4.3 正态总体旳抽样分布定理
iid
1.若X1 ,,Xn ~ N(, 2 ), 则U
X / n
~
N(0, 1)
证明:
X
1 n
n i 1
Xi
是n 个独立旳正态随 机变量旳线性组合,故 服从正态分布
i 1
称为自由度为n的 2 分布.
2.2—分布旳密度函数f(y)曲线
f
(y)
抽样及抽样分布
抽样及抽样分布引言在统计学中,抽样是从总体中选择一局部个体进行研究的过程。
通过抽样可以获得总体的估计值,从而对总体进行推断。
抽样是统计学的根底,也是进行统计推断的前提。
本文将介绍抽样的根本概念和方法,以及抽样分布的概念和特性。
抽样方法进行抽样时,需要选择适宜的抽样方法。
常见的抽样方法包括简单随机抽样、系统抽样、分层抽样和群组抽样等。
简单随机抽样简单随机抽样是最根本的抽样方法,每个个体被随机地选入样本,且每个个体被选入样本的概率相等。
这种方法可以确保样本具有代表性。
系统抽样系统抽样是按照一定的规那么从总体中选取样本,例如每隔一定间隔选取一个个体。
这种方法简单实用,但需要注意规那么的选择是否会引入偏差。
分层抽样分层抽样是将总体分成假设干层,然后从每层中随机选取个体组成样本。
这种方法可以保证每个层次都有足够的代表性。
群组抽样群组抽样是将总体划分为假设干群组,然后随机选取假设干群组作为样本。
这种方法适用于总体中包含多个群组,但群组内个体相似的情况。
抽样分布抽样分布是指抽样统计量的分布。
统计量可以是样本均值、样本方差、样本相关系数等。
样本均值的抽样分布假设总体服从正态分布,样本均值的抽样分布也会服从正态分布。
根据中心极限定理,当样本容量足够大时,样本均值的抽样分布将变得更加接近正态分布。
样本方差的抽样分布样本方差的抽样分布是以总体方差为参数的分布,通常服从卡方分布。
样本容量的大小将影响样本方差的抽样分布形状。
样本相关系数的抽样分布样本相关系数的抽样分布通常是以总体相关系数为参数的分布。
样本容量的增加会使样本相关系数的抽样分布趋向于正态分布。
抽样误差与置信区间抽样误差是指样本统计量与总体参数之间的差异。
抽样误差的大小会受到样本容量和抽样方法的影响。
为了评估抽样结果的可靠性,可以构建置信区间。
置信区间是总体参数的一个区间估计,表示总体参数落在该区间的概率。
置信区间的宽度与置信水平、样本容量以及总体标准差等相关。
抽样与抽样分布
抽样与抽样分布抽样是统计学中一种重要的数据收集方法,通过从总体中选择一部分样本来代表整体,可以更方便、更经济地进行数据分析和推断。
而抽样分布则是与抽样密切相关的概念,指的是样本统计量的概率分布。
本文将从抽样的定义和目的、抽样方法和抽样分布的性质等方面进行探讨。
一、抽样的定义和目的抽样是统计学中利用一定的方法和技术从总体中选取一部分个体作为样本,以了解总体特征或者对总体进行推断的过程。
抽样的目的在于通过对样本的观测和研究来推断总体的特征,而无需对整个总体进行调查。
抽样可以减少调查或实验的成本、节约时间,并且在一定程度上能够保证结果的可靠性和精确度。
二、抽样方法1. 简单随机抽样:简单随机抽样是指从总体中随机选择样本,使每一个样本都有相同的概率被选中。
简单随机抽样通常需要使用随机数表、随机数发生器或者抽签等方法来实现。
2. 系统抽样:系统抽样是按照一定的规则和系统性地从总体中选择样本,例如每隔一个固定的间隔选取一个样本。
系统抽样的优点在于操作简单,但是如果总体中存在某种周期性或者规律性的分布,可能会导致抽样结果的偏差。
3. 整群抽样:整群抽样是将总体根据某些特征进行分类,然后从每个分类中随机选择一定数量的群体作为样本。
整群抽样适用于总体中存在明显的群体结构的情况,可以提高样本的代表性。
4. 分层抽样:分层抽样是按照某种特征将总体分为若干层,然后从每一层中随机选择一定数量的样本。
分层抽样可以更好地体现总体的结构和差异,提高样本的代表性和准确性。
三、抽样分布的性质抽样分布是样本统计量的概率分布,其具有以下几个重要性质:1. 无偏性:如果样本统计量的期望值等于总体参数的真值,那么称该统计量是无偏的。
即样本统计量是对总体参数的无偏估计。
无偏性是抽样分布的重要性质,保证了样本统计量的可靠性和准确性。
2. 一致性:当样本数量趋向无穷大时,样本统计量的值趋向于总体参数的真值。
即样本统计量在大样本情况下能够接近总体参数,具有一致性。
抽样分布
x
/ n
x s/ n
N (0,1)
t=
N ( , )
2
t分布
总体方差未知或样本容量n小于30时,标准离差的分布呈t分布。
四、 t 分布
对于不同的自由度,t分布有不同的曲线。
四、 t 分布
( 1 ) t分布曲线左右对称,围绕平均数μt =0 向两侧递降。 (2)t分布受自由度df=n-1制约,每个df都有一条t分布曲线。 (3)df小,t值离散程度大。 (4)和正态分布相比,t分布的顶端偏低,尾部偏高,自由度
2 s1 F 2 s2
此F值具有s12的自由度df1=n1-1和s22的自由度 df2=n2-1。
六、 F 分布
df1 df1 df2 1 ( ) df1 df 2 2 F 2 2 2 f (F ) df1 df2 df1 df 2 df1 df2 ( ) ( ) (df1 F df2 ) 2 2 2
F分布是随自由度df1和df2进行变化的一组曲线。
F分布的概率累积函数
f (F )
F
0
f ( F )dF
六、F 分布
1
F分布的平均数μF=1 ,F的取值区间为[0,+∝ )
F分布曲线的形状仅决定于df1和df2。在df1=1或2时, 2 F分布曲线呈严重倾斜的反向J型,当df1≧ 3时,转
为左偏曲线。
第四章:统计数的分布——抽样分布
从总体中抽取的样本提供的信息仅是总体的一部分,它不能 提供完全准确的信息,必然存在着一定的误差。 对于样本容量相同的多次随机抽样样本,其统计量是变异的, 且其取值有一定的概率,即样本统计量也是一个随机变量,此 分布规律称为抽样分布(sampling distribution)。
概率论与数理统计 --- 第六章{样本及抽样分布} 第四节:抽样分布
P T 1.059
0.15.
例2:
从正态总体N ( , 0.5 )中抽取样本X 1 , , X 10 .
2
数理统计
10 2 (1)已知 0,求概率P X i 4 ; i 1 10 2 (2)未知,求概率P ( X i X ) 2.85 . i 1
S1 和S2 分别是这两个样本的样本方差, 则有:
2 2
(1)
S1
2 2
S2
~ F ( n1 1, n2 1);
2 2
若两方差 1 2,则
S1 1
2 2
2 2
S2 2
~ F ( n1 1, n2 1);
(2)
X Y ( 1 2 ) ( n1 1) S1 ( n2 1) S2
n取不同值时
( n 1) S
2
2
的分布
定理3 (样本均值的分布) 数理统计 设X1, X2, …, Xn是取自正态总体 N(μ, σ2)的样本, 2 X和S 分别为样本均值和样本方差, 则有:
X S n ~ t ( n 1)
证:由定理1、和t分布的定义可得: 2
X ~ N (0,1), ( n 1) S
2) F分布的分位点:
对于给定的, 1, 称满足条件: 0
P F F ( n1 , n2 )
( y )dy
F ( n1 , n2 )
的点F ( n1 , n2 )为F ( n1 , n2 )分布的上 分位点.
F分布的上分位点的性质:
F1 ( n1 , n2 ) 1 F ( n2 , n1 )
抽样和抽样分布
离散型随机变量的方差(实例)
【例】投掷一枚骰子,出现的点数是个离散型随 机变量,其概率分布为如下。计算数学期望和方 差 X = xi 1 2 3 4 5 6 P(X =xi)=pi 1/6 1/6 1/6 1/6 1/6 1/6
1 1 解:数学期望为: E ( X ) xi pi 1 6 3.5 6 6 i 1 6 方差为: D( X ) xi E ( X )2 pi
n N
二、试验
1.概念: 在相同条件下,对事物或现象所进行的观察。
例如:掷一枚骰子,观察其出现的点数;产品质 量检验,考察其是否是合格品等。
2.试验具有以下特点:
可以在相同的条件下重复进行; 每次试验的可能结果不止一个,但试验的所
有可能结果在试验之前是确切知道的;
在试验结束之前,不能确定该次试验的确切
i 1 n
( X取有限个值) ( X取无穷个值)
E ( X ) xi p i
i 1
(3)性质
第三章所讲的平均数的性质也完全适合于数学 期望。对于抽样分布通常要考虑多个变量的情 况,所以还要补充两条性质。 ①n个随机变量代数和的数学期望等于它们的 数学期望之和。 ②n个独立随机变量连乘积的数学期望等于它 们数学期望的乘积
两种抽样方法
重置抽样
1.概念: 也称有放回的抽样,从总体中抽取一个单位,登记 后再放回总体参加下一次的抽取,连续试验n次。 2.重置抽样排列数: 从总体N个单位,抽取样本容量为n个单位的重置 试验,可能抽取的样本点个数: n n
AN = N
不重置抽样
1.概念: 也称无放回的抽样,每次总体中抽取一个单 位,登记后不再放回原总体,不参加下一次抽 选,下一次继续从总体余下的单位抽取样本单 位,这样继续进行n次试验。 有n个单位的样本是由n次连续试验构成的,但 因每次抽出不重置,所以实质上等同于同时从 总体中抽取n个样本单位。
抽样分布的概念及重要性
抽样分布的概念及重要性抽样分布是统计学中一个重要的概念,它描述了从总体中抽取样本的过程中,统计量的分布情况。
在统计学中,我们通常无法对整个总体进行研究,而是通过抽取样本来推断总体的特征。
抽样分布的概念帮助我们理解样本统计量的变异性,并为统计推断提供了理论基础。
本文将介绍抽样分布的概念及其重要性。
一、抽样分布的概念抽样分布是指在相同条件下,重复从总体中抽取样本,并计算样本统计量的分布情况。
在抽样分布中,样本统计量可以是样本均值、样本比例、样本方差等。
抽样分布的特点是,当样本容量足够大时,样本统计量的分布会趋近于一个稳定的形态,即抽样分布的形状不会随着样本的变化而变化。
抽样分布的形态通常可以用正态分布来近似描述。
中心极限定理是支持抽样分布近似为正态分布的重要理论基础。
根据中心极限定理,当样本容量足够大时,无论总体分布是什么形态,样本均值的抽样分布都会近似于正态分布。
这使得我们可以利用正态分布的性质进行统计推断。
二、抽样分布的重要性抽样分布在统计学中具有重要的意义和应用价值。
以下是抽样分布的几个重要方面:1. 参数估计:抽样分布为参数估计提供了理论基础。
通过从总体中抽取样本,我们可以计算样本统计量,并利用抽样分布的性质来估计总体参数。
例如,通过计算样本均值来估计总体均值,通过计算样本比例来估计总体比例等。
2. 假设检验:抽样分布为假设检验提供了理论依据。
在假设检验中,我们需要根据样本数据来判断总体参数是否符合某个假设。
抽样分布的性质可以帮助我们计算出假设检验的统计量,并进行显著性检验。
3. 置信区间:抽样分布为置信区间的构建提供了理论基础。
置信区间是用来估计总体参数的范围,它可以告诉我们总体参数的估计结果的可信程度。
抽样分布的性质可以帮助我们计算出置信区间,并确定置信水平。
4. 抽样方法选择:抽样分布的性质可以帮助我们选择合适的抽样方法。
不同的抽样方法会对样本统计量的抽样分布产生不同的影响。
通过了解抽样分布的性质,我们可以选择适合的抽样方法,以提高统计推断的准确性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
其中, 通过如下积分来定义: 其中 伽玛函数 Γ(x)通过如下积分来定义 通过如下积分来定义
Γ( x) = ∫
+∞
0
e−t t x−1dt,
x > 0.
数理统计
Probability density function
Cumulative distribution function
χ2分布的性质
则: χ =
= P{T > 1.059}
X −µ ~ N(0,1) σ n
24 查自由度为 的t分布表, t0.15(24) = 1.059,即
P{T > 1.059} = 0.15. 故有 {X > 12.5} = 0.15. P
2 例2: 从正态总体N(µ,0.5 )中抽取样本X1 ,L , X10 .
数理统计
2 2 S1 σ1 (1) 2 2 ~ F(n1 − 1, n2 − 1); S2 σ2 X − Y − (µ1 − µ2 ) (2) ~ t(n1 + n2 − 2). 2 (n1 − 1)S12 + (n2 − 1)S2 1 1 + n1 + n2 − 2 n1 n2
例1: 设总体X服从正态分布N(12,σ 2 ),
U n 1 则称随机变量: 则称随机变量 F = V n2
数理统计
自由度为n 分布, 服从自由度为 服从自由度为 1及 n2 的F分布 分布 n1称为第自由度 n2称为第二自由度 称为第自由度 称为第二自由度 第自由度, 第二自由度. 记作: 记作 F~F(n1, n2) .
V n2 1 : F(n2 , n ). = 由定义可知: 由定义可知 1 F U n 1
1 F −α(n1, n2 ) = 1 Fα(n2 , n1 )
α
Fα(n1, n2 )
F分布的上α分位点可查表求得. 1 1 , 例 F0.95 (12,9) = = = 0.357. F0.05 (9,12) 2.80
二、正态总体统计量的分布
设总体X的均值为µ,方差为σ 2, X1 , X2 ,L , Xn是来自总体的一个样本, 则样本均值X和样本方差S2有:
12.5 抽取容量为25的样本, 求样本均值X大于 的概率.
数理统计
(1) 如果 已知σ = 2; (2) σ未知,但已知样本方差S2 = 5.57.
X − 12 12.5 − 12 > 解: (1) P{ X > 12.5} = P 2 25 2 25
X − 12 = P > 1.25 = 1 − Φ(1.25) = 0.1063 0.4 X −µ X − 12 12.5 ~ t(n −1) (2) P{ X > 12.5} = P > S n S 25 S 25
Probability density function
Cumulative distribution function
F分 的 质 分 布 性 :
1) F分布的数学期望为 E(F) = 分布的数学期望为: 分布的数学期望为
n2 , 若n2>2. n2 − 2 即它的数学期望并不依赖于第一自由度n 即它的数学期望并不依赖于第一自由度 1.
2
数理统计
1) 设 X1, X2,L, Xn 相互独立 都服从正态分布 N(µ,σ 2 ), 相互独立,
1
σ
2
2
∑( X − µ)
i=1 i
n
2
~ χ (n)
2
2) 设 X1 ~ χ (n1), X2 ~ χ (n2 ),且X1, X2相互独立, 相互独立,
2
这个性质叫 χ 分布的可加性.
2
则: X1 + X2 ~ χ (n1 + n2 ).
定义: 相互独立, 定义 设X~N(0, 1), Y~χ2(n), 且X与Y相互独立 ~ ~ ) 与 相互独立
X 则称变量: 则称变量 T = Yn
数理统计
所服从的分布为自由度为 的 分布. 所服从的分布为自由度为 n的 t 分布
记为: T ~ t(n). t分布又称为学生氏分布. 分
t(n)分布的概率密度函数为: 分布的概率密度函数为: 分布的概率密度函数为
n 取不同值时样本均值的分布
定理2 样本方差的分布 样本方差的分布) 定理 (样本方差的分布 数理统计 的样本, 设X1, X2, …, Xn是来自正态总体 N(µ, σ2) 的样本 X和 2 分别为样本均值和样本方差 则有 S 分别为样本均值和样本方差, 则有:
(1) (n − 1)S2
σ2
=
( Xi − X )2 ∑
10 2 1 ( )已知µ = 0,求概率P ∑Xi ≥ 4; i =1 10 2 2 ( )µ未知,求概率P ∑( Xi − X) ≥ 2.85 . i =1 2 10 Xi 有 解: (1) 由µ = 0, Xi 0.5 ~ N(0,1),则: ~ χ2 (10). ∑ 0.5 i= i =1
4 10 2 1 10 2 P ∑Xi ≥ 4 = P 2 ∑Xi ≥ 2 = P{Y 2 ≥ 16} 0.5 i =1 0.5 i=1
10 2 2 查表求χ0.10 (10) = 16. 由此可得:P ∑Xi ≥ 4 = 0.10. i =1
数理统计
第四节 抽样分布
三个重要分布 正态总体统计量的分布
一、三个重要分布 1. χ2分布(chi-square distribution)
数理统计
χ2分布是由正态分布派生出来的一种分布. 分布是由正态分布派生出来的一种分布. 正态分布派生出来的一种分布
定义: 互独立, 定义 设 X1, X2, …, Xn互独立 都服从正态分布 N(0, 1), 则称随机变量: 则称随机变量:χ 记为: 记为:
若F~F(n1,n2), F的概率密度为 的概率密度为: 的概率密度为
Γ( n1 +n2 ) n1 n1 n21 −1 n 2 ( n2 ) 2 ( y) 1 + n1 y n1 2 ψ ( y) = Γ( 2 ) Γ( n2 ) 2 0.
(
)
−
n1 +n2 2
, y>0 y≤0
数理统计
2
3) 若χ 2 ~ χ 2 (n), χ 2分布的数学期望与方差,
数理统计
E(χ2)=n, D(χ2)=2n. χ χ
Q Xi ~ N(0,1), ∴ E( Xi 2 ) = D( Xi ) = 1
D( Xi2 ) = E( Xi4 ) − [E( Xi2 )]2 = 3 − 1 = 2
E(χ ) = ∑ E( Xi ) = n, D(χ ) = ∑ D( Xi ) = 2n.
近似
即:当n足够大时,T ~ N(0,1).
3) t分 的分位点: 分布
数理统计
+∞
0 对于给定的α,< α < 1, 称满足条件:
P{t > tα (n)} = ∫
tα ( n)
h(t )dt = α
. 的点tα (n)为t(n)分布的上α分位点
α
tα(n)
t分布的上α分位点的性质: 分位点的性质: t1−α(n) = −tα(n)
P{ χ > χα (n)} = ∫
2 2 +∞
2 χα ( n)
f ( y)dy = α
2 的点χα (n)为χ 2 (n)分布的 α分位点 上 . 2 2 如图所示,χα (n)可通过查表求,例: χ0.1 (25) = 34.382.
α
2 χα(n)
2. t 分布(t-distribution)
(2) 由定理2, 9S 1 10 ( Xi − X)2 ~ χ 2 (9) = ∑ 0.52 0.52 i =1
2
数理统计
(n − 1)S2
σ2
~ χ 2 (n − 1)
2.85 10 1 10 2 2 P ∑( Xi − X) ≥ 2.85 = P 2 ∑( Xi − X) ≥ 2 0.5 i=1 0.5 i=1
S
X −µ
n
~ t(n −1)
1 2和 证:由定理 、 t分布的定义可得:
σ
则:
n ~ N(0,1), (n − 1)S2
σ2
~ χ 2 (n − 1), 且相互独立,
X −µ
σ
(n − 1)S
2
n (n − 1)
~ t(n − 1).
σ
2
定理4 两总体样本均值差 样本方差比的分布) 两总体样本均值差、 定理 (两总体样本均值差、样本方差比的分布
数理统计
2) F分布的分位点 分布的分位点: 分布的分位点
0 对于给定的α,< α < 1, 称满足条件:
P{ F > F (n1 , n2 )} = ∫ α
+∞ F ( n1 ,n2 ) α
ψ ( y)dy = α
. 的点F (n1 , n2 )为F(n1 , n2 )分布的上α分位点 α
F分布的上α分位点的性质: 分布的上α分位点的性质:
= P{Z2 ≥ 11.4}
查表得 χ
2 0.25
(9) = 11.4,由此可求得
10 2 P ∑( Xi − X) ≥ 2.85 = 0.25. i=1
t分布的上α分位点tα (n)可查表求得,例t0.025 (15) = 2.1315.
当n > 45时,对于常用的α的值,可用正态近似tα (n) ≈ zα .
3. F分布(F-distribution) 分布
定义: 相互独立, 定义 设 U~χ2(n1), V~χ2(n2), U 与V 相互独立 ~ ~