第三章应用数理统计抽样分布
00907701《应用数理统计》教学大纲
《运用数理统计》教学大纲课程名称:运用数理统计英文名称:ApplicationofMathematicalStatistics课程编号:00907701课程学时:32课程学分:2课程性质:学位课有用专业:全校各专业预修课程:初等数学,线性代数〔大年夜学工科〕,概率论与数理统计〔大年夜学工科〕大纲执笔人:周大年夜勇一、课程目的与恳求本课程讨论基础数理统计的数学实践跟方法,包括数理统计的全然不雅念,抽样分布,参数估计,假设检验,方差分析,回归分析,正交试验跟质量把持末尾,为众多学科专业需要较多统计货色的研究生,供应随机数学方面的训练,打下扎实的基础。
数理统计是关于数据资料的收集﹑拾掇﹑分析跟揣摸的学科,通过对本课程的深造,使老师在本科工程数学的基础上,进一步较收入地把持数理统计的全然实践跟方法,培养运用数理统计的方法分析跟处置有关理论征询题的才干,并为当前深造后继课程打下需要的基础。
二、教学内容及学时安排第一章抽样跟抽样分布4学时一、母体跟子样二、一些常用的抽样分布第二章参数估计8学时一、点估计跟估计量的求法二、估计量的好坏标准三、区间估计第三章假设检验8学时一、假设检验初述,二类差错二、检验母体平均数三、检验母体方差四、单侧假设检验五、分布假设检验第四章方差分析、正交试验方案6学时一、一元方差分析二、二元方差分析三、正交试验方案第五章回归分析6学时一、一元线性回归中的参数估计二、一元线性回归中的假设检验跟猜想三、可线性化的意愿非线性回归三、讲义及要紧参考书1、杨虎,刘琼荪,钟波《数理统计》初等教诲出版社,20042、汪荣鑫《数理统计》西安交通大年夜学出版社,19863、吴翊,李永乐,胡庆军《运用数理统计》国防科大年夜出版社,19954、朱勇华,邰淑彩,孙韫玉《运用数理统计》武汉大年夜学出版社,20005、茆诗松、王静龙《数理统计》华东师范大年夜学出版社,1990。
数理统计中的随机抽样和抽样分布——概率论知识要点
数理统计中的随机抽样和抽样分布——概率论知识要点概率论作为数理统计的基础,是研究随机现象及其规律的数学分支。
在数理统计中,随机抽样和抽样分布是非常重要的概念,本文将对这两个概念进行详细介绍和解释。
一、随机抽样随机抽样是指从总体中以随机的方式选择样本的过程。
在进行随机抽样时,每个个体被选中的概率应该是相等的,这样才能保证样本的代表性和可靠性。
随机抽样的方法有很多种,常用的包括简单随机抽样、分层抽样和系统抽样等。
1. 简单随机抽样简单随机抽样是最基本的抽样方法,它的特点是每个个体被选中的概率相等且相互独立。
简单随机抽样可以通过随机数表、随机数发生器等工具来实现。
在实际应用中,简单随机抽样常用于总体规模较小的情况。
2. 分层抽样分层抽样是将总体划分为若干个层次,然后从每个层次中随机选择样本。
这种抽样方法可以保证不同层次的个体在样本中的比例与总体中的比例相同,从而提高样本的代表性。
3. 系统抽样系统抽样是按照一定的规则从总体中选取样本的方法。
例如,可以按照一定的间隔从总体中选择样本,这个间隔称为抽样间隔。
系统抽样的优点是操作简便,但也存在可能引入系统误差的风险。
二、抽样分布抽样分布是指在随机抽样的基础上,通过大量重复抽样得到的统计量的分布情况。
在数理统计中,常用的抽样分布包括正态分布、t分布和F分布等。
1. 正态分布正态分布是一种重要的抽样分布,它具有对称、单峰和钟形曲线的特点。
在大样本情况下,根据中心极限定理,样本均值的分布接近于正态分布。
正态分布在数理统计中的应用非常广泛,例如用于估计总体均值和总体方差等。
2. t分布t分布是用于小样本情况下的抽样分布。
它相比于正态分布来说,具有更宽的尾部和更矮的峰值。
t分布的形状取决于自由度,自由度越大,t分布越接近于正态分布。
t分布在小样本情况下的参数估计和假设检验中经常被使用。
3. F分布F分布是用于比较两个样本方差是否显著不同的抽样分布。
F分布的形状取决于两个样本的自由度,它具有右偏和非对称的特点。
第三章应用数理统计抽样分布
总体分布
.3
.2
.1 0
1
234
均值和方差
N
xi
i1 2.5
N
N
(xi )2
2 i1
1.25
N
样本均值的抽样分布
现从总体中抽取n=2的简单随机样本,在重复抽 样条件下,共有42=16个样本。所有样本的结果为
•所有可能的n = 2 的样本(共16个)
•第一个
2
即当n充分大时,t分布近似于标准正态分布N (0,1)。
对于给定的数,且0 1,称满足等式:
Pt t (n)
t (n)
f
(t; n)dt
的数t
(n)称为t(n)分布的上分位点
表格可供查阅
图3.2.4
F分布
设U ~ 2 (n1), V ~ 2 (n2 )且设U与V独立,则称随机变量
3.2 随机抽样
二、随机抽样的定义
• 有限总体的简单随机抽样:假设总体容量为 N(有限),样本容量为n(<N),如果所 有容量为n的样本都有相同的概率可以从总 体中被抽取到,则称此方法为有限总体的简 单随机抽样
• 常用做法:利用随机数表
3.2 随机抽样
二、随机抽样的定义
系统抽样,分层抽样和整群抽样-近似随机抽样
3.2 随机抽样
二、随机抽样的定义
1. 抽样:从总体中抽取有限个个体对总体进行观 测的过程
2. 样本:从总体中抽取一部分个体,根据获得的 数据对总体分布进行推断,被抽出的部分个 体叫总体的一个样本
3.2 随机抽样
二、随机抽样的定义
在相同的条件下我们对总体X进行n次重复的、都 独立的观测,将n次观测结果按试验的次序记 为X1,X2,…Xn,由于它们是对随机变量X观测 的结果,且每次观测是在相同的条件下独立进 行的,故可以认为X1,X2,…Xn是相互独立的, 且都是与总体X具有相同分布的随机变量。这 样得到的X1,X2,…Xn称为来自总体X的一个简 单随机样本,n称为这个样本的容量。当n次观 测结束后,我们得到一组实数x1,x2,…,xn, 它们依次是随机变量X1,X2,…,Xn的观测值,称 为样本值。
统计学第3章抽样与抽样分布PPT资料(正式版)
3.1 常用的抽样方法
概率抽样
(probability sampling)
1. 也称随机抽样
按一定的概率以随机原则抽取样本
简单随机抽样
(simple random sampling)
1. 从总体N个单位中随机地抽取n个单位作为样本, 每个单位入抽样本的概率是相等的
2. 有重复抽样和不重复抽样
3 2.0 2.5 3.0 3.5
4
.3
2.5
.2
3.0
3.5 .1
4.0 0
P (X ) 1.0 1.5 2.0 2.5 3.0 3.5 4.0 X
样本均值的抽样分布
样本均值的分布与总体分布的比较 P101
总体分布
.3
.2
.1 0
1
234
= 2.5
σ2
.3 P ( X ) 抽样分布
.2
.1
0 1.0 1.5 2.0 2.5 3.0 3.5 4.0 X
当样本容量足够大时(n 30) ,样本均值的抽样分布逐渐趋于正态分布
有重复抽样和不重复抽样
既可以 对总体 参数进 行估计 ,也可 以对 从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的
各层的目标量进行估计
3.1.3 系统抽样
(systematic sampling)
1. 将总体中的所有单位按一定顺序排列,按 某规则确定一个随机起点, 然后每隔一定 的间隔抽取一个单位,直到抽取n个样本单 位.
2. 优点:操作简便,可提高估计的精度
3.1.4 整群抽样
1. 将总体中若干个单位合并为组(群),抽样 时直接抽取群,然后对中选群中的所有单 位全部实施调查
应用统计基本概念与抽样分布
”
表示抽取一件产品是正品;那么,产品的质量就可
以用X的分布来衡量。
X服从0-1分布,参数就是次品率p。如果为简单随
机样本,求样本分布.
解:总
P(X
体x)X的p概x率(1分布p为)1
x
,
所以( X1, X 2 , , X n )的概率分布为
n
P( X 1
x1, X 2
x2 ,, X n
xn )
i 1
x )
x 2
et dt
1
x
e2
2 0
2 X 密度为
f
(x)
1 2
e
x 2
,
x 0,
0, x 0
说明 2X ~ 2 (2)
• 假定子样是简单随机子样,则
2 Xi ~ 2 (2)
且它们之间相互独立,故有
n
2n X 2 Xi ~ 2 (2n) i 1
• t 分布
构造性的方式定义
定义1.6 设X ~ N (0,1) X与Y相互独立,记
10
10
P( X i xi ) pxi (1 p)1xi
i 1
i 1
p xi (1 p)10 xi
pt1 (1 p)10t1
且 T1 是服从二项分布
P(T1
t1 )
C t1 10
pt1
(1
p)10t1
故
P( X1 x1, X 2 x2 , X10 x10 | T1 t1)
)外,
其它都是合格品X i ( 0记,i 为3,4,, n
)。
当厂长问及检查结果时检验员可作如下两
种回答:
(1) 10件中有两件不合格;
(2) 前两件不合格。
统计学_抽样分布
统计学_抽样分布统计学——抽样分布在统计学的广袤天地中,抽样分布宛如一颗璀璨的明珠,散发着独特的光芒。
它不仅是理论研究的重要基石,更是实际应用中的得力工具。
那什么是抽样分布呢?简单来说,抽样分布就是从同一个总体中抽取多个样本,然后根据这些样本计算出某个统计量(比如均值、方差等)所形成的概率分布。
想象一下,我们有一个装满各种颜色球的大箱子,这就是我们的总体。
现在我们不能把所有的球都拿出来研究,只能随机抽取一部分球作为样本。
如果我们一次又一次地进行这样的抽样,并计算每次抽样的均值,那么这些均值所呈现出来的分布规律就是抽样分布。
抽样分布之所以重要,是因为它为我们提供了一种从样本推断总体的方法。
在实际情况中,我们往往很难直接研究总体的所有数据,而抽样分布则让我们能够通过对样本的分析来对总体的特征做出合理的估计和推断。
以均值的抽样分布为例。
假设总体的均值为μ,方差为σ²,从这个总体中抽取样本容量为 n 的简单随机样本。
根据中心极限定理,当样本容量足够大时(通常认为n ≥ 30),样本均值的抽样分布将近似服从正态分布,其均值等于总体均值μ,方差为总体方差σ²除以样本容量n 。
这意味着,如果我们知道了总体的均值和方差,以及样本的容量,就可以大致了解样本均值的分布情况。
这对于进行统计推断非常有帮助。
比如,我们可以根据抽样分布计算出某个样本均值出现的概率,从而判断这个样本是否具有代表性。
再来说说方差的抽样分布。
卡方分布在研究方差的抽样分布中起着关键作用。
假设从正态总体中抽取样本容量为 n 的简单随机样本,计算样本方差 s²,然后定义统计量(n 1)s²/σ²,它服从自由度为 n 1 的卡方分布。
抽样分布在实际生活中的应用广泛。
比如在质量控制中,工厂会从生产线上抽取一定数量的产品进行检测,通过样本的质量数据和抽样分布的知识,来判断整个生产线的产品质量是否符合标准。
在市场调查中,调查人员通过抽取一定数量的消费者进行问卷调查,然后利用抽样分布来推断全体消费者的偏好和需求。
第3章 抽样分布
第三章 抽样分布
χ (一)
2
分布
• 设 X 1 , X 2 ,L, X n 是来自总体 N (0,1) 的样本,则称统计量 的样本,
χ 2 = X 12 + X 22 + L + X n2
2 2 2 为服从自由度为 n 的 χ 分布,记为 χ ~ χ (n) 分布,
第三章 抽样分布
χ 2 分布的密度函数 曲线 分布的密度函数 密度函数f(y)曲线
2
χ 2 分布的数学期望和方差
E (χ 2 ) = n , D (χ 2 ) = 2n
3
χ 2 分布的分位点
对于给定的数 α ,且 0 <
α < 1 ,称满足条件
2 P{ χ 2 > χ α ( n )} =
∫χ
∞
α
2
(n)
f ( y ) dy = α
第三章 抽样分布
(二) t 分布
• 设 X ~ N (0,1) , ~ χ 2 (n),且设X 与 Y 独立,则称统计量 独立, Y
X t= Y /n
为服从自由度为 n 的 t 分布,记为 t ~ t (n) 。 分布, t • 可以证明,当 n 充分大时, 分布趋向于标准正态分 可以证明, 充分大时, 布。
第三章 抽样分布
t(n) 的概率密度为 (n) n + 1) Γ( n +1 t 2 )− 2 , − ∞ < t < ∞ 2 f (t) = (1 + n nπ Γ( n ) 2
第三章 抽样分布 三、 样本比例的抽样分布 • (一)重复抽样下样本比例的抽样分布 可以证明,
P(1 − P) p ~ N ( P, ) n
高中数学备课教案数理统计中的抽样分布与估计
高中数学备课教案数理统计中的抽样分布与估计数理统计是高中数学重要的内容之一。
学习数理统计中的抽样分布与估计对于学生进一步掌握数学知识、提高解决问题的能力有着极大的帮助。
本文将围绕抽样分布和估计两个方面,分别介绍其概念、性质、计算方法以及实际应用。
一、抽样分布抽样分布是指在相同条件下对总体进行多次抽样所得到的样本统计量的分布。
其中,样本统计量包括样本均值、样本方差等。
在应用中,我们通常使用t分布和χ²分布来描述样本均值和样本方差的分布。
t分布是指在总体服从正态分布条件下,对样本进行多次抽样所得到的样本均值的分布。
t分布具有以下性质:1. t分布的形状与样本数量有关,样本数量越多,t分布越趋近于正态分布;2. t分布的均值为0,方差为1;3. t分布在中心对称轴两侧均有概率密度,随着自由度的增加,t分布越趋近于正态分布。
χ²分布是指在总体服从正态分布条件下,对样本进行多次抽样所得到的样本方差的分布。
χ²分布具有以下性质:1. χ²分布的形状与样本数量有关,样本数量越多,χ²分布越趋近于正态分布;2. χ²分布的均值为自由度,方差为2自由度;3. χ²分布是非负且右偏的,随着自由度的增加,χ²分布的形态逐渐趋近于正态分布。
二、估计估计是指利用样本统计量(如样本均值、样本方差等)来推断总体参数。
常用的估计量包括点估计和区间估计。
点估计是指通过样本统计量来估计总体参数的具体值。
点估计常用的统计量包括样本均值、样本方差等。
例如,使用样本均值来估计总体均值,使用样本方差来估计总体方差等。
但是,由于样本随机性,因此点估计附带了一定的不确定性。
区间估计是为了解决点估计所带来的不确定性而提出的一种方法。
区间估计是通过利用样本统计量来计算总体参数的一个置信区间。
这个置信区间能够描述真实总体参数所在的不确定性范围。
三、应用实例抽样分布和估计在实际应用中有着广泛的应用,在以下领域尤其常见。
应用统计-基本概念与抽样分布
02
二项分布具有可加性,即两个 独立的二项随机变量之和仍服 从二项分布。
03
二项分布的方差计算公式为 $Var(X) = np(1-p)$,其中n为 试验次数,p为单次试验成功的 概率。
泊松分布特性
01
泊松分布适用于描述单位时间内随机事件发生的次数,其概率 质量函数为$P(X=k) = frac{e^{-lambda}lambda^k}{k!}$。
统计学发展历程
统计学起源于17世纪中叶,最初是为了研究国家的人口和财产状况而发展 起来的。
随着时间的推移,统计学逐渐扩展到其他领域,如生物学、医学、经济学 等。
现代统计学的发展已经与计算机科学紧密结合,使得大数据分析和机器学 习等方法得以广泛应用。
统计学应用领域
统计学在各个领域都有广 泛的应用,如社会科学、 医学、生物学、经济学、 市场营销等。
课程目标
掌握统计学的基本概念,如总体、个体、样本、 参数和统计量等。
熟悉常见的抽样分布,如正态分布、二项分布、 泊松分布等,以及它们的性质和应用场景。
理解抽样分布的概念及其在统计分析中的作用, 能够运用抽样分布对统计结果进行解释和推断。
课程目标
掌握统计学的基本概念,如总体、个体、样本、 参数和统计量等。
当总体被划分为若干层,并从每层中随机 抽取样本时,形成的抽样分布称为分层随 机抽样分布。
系统抽样分布
簇抽样分布
当总体按一定规则(如等距)划分为若干 部分,并从各部分随机抽取样本时,形成 的抽样分布称为系统抽样分布。
当总体被划分为若干簇,并从每簇中随机 抽取若干个单元组成样本时,形成的抽样 分布称为簇抽样分布。
统计学的基本方法包括描述性统计和推断性统计,描 述性统计主要关注数据的描述和可视化,而推断性统
高中数学备课教案数理统计中的抽样分布与抽样分布特性
高中数学备课教案数理统计中的抽样分布与抽样分布特性高中数学备课教案——数理统计中的抽样分布与抽样分布特性【引言】数理统计是数学的一个重要分支,用于描述和分析数据的规律性和规律性。
在数理统计的学习过程中,理解和应用抽样分布与抽样分布特性是非常关键的。
本教案将重点介绍抽样分布的概念、性质以及常见的抽样分布特性,帮助学生全面掌握相关知识。
【一、抽样分布的概念】抽样分布指的是从总体中随机抽取样本形成的分布。
简单来说,它是样本统计量的分布。
在统计学中,我们常常使用抽样分布来推断总体参数。
例如,我们可以通过样本均值的抽样分布来推断总体均值。
【二、抽样分布的性质】1. 抽样分布的中心:对于大样本而言,抽样分布的中心接近于总体参数。
例如,样本均值的抽样分布的中心趋近于总体均值。
2. 抽样分布的离散程度:抽样分布的离散程度与总体的离散程度有关。
当总体分布较为均匀时,抽样分布的离散程度相对较小。
3. 抽样分布的形状:随着样本容量的增加,抽样分布的形状逐渐接近正态分布。
这是基于中心极限定理得出的结论,对于样本容量较大的情况,抽样分布可以近似看作正态分布。
4. 抽样分布的标准误差:抽样分布的标准误差是样本统计量与总体参数的离散程度。
标准误差越小,说明样本统计量与总体参数的一致性越高。
【三、抽样分布特性】1. 抽样分布的偏度和峰度:样本统计量的抽样分布具有一定的偏度和峰度特性。
以样本均值为例,当样本容量较大时,抽样分布偏度较小,峰度较高,呈现出较为陡峭的形状。
2. 抽样分布的置信区间:抽样分布可以用于构造参数的置信区间。
通过样本统计量的抽样分布,我们可以计算出参数的置信区间,例如总体均值的置信区间。
3. 抽样分布与假设检验:抽样分布可以用于假设检验。
通过构建适当的抽样分布,我们可以判断总体参数是否满足某个假设条件。
4. 抽样分布与抽样误差:抽样误差是指样本统计量与总体参数之间的差异。
抽样分布提供了评估抽样误差的依据,可以通过抽样分布来估计抽样误差的大小。
数理统计中的抽样分布与统计推断
数理统计中的抽样分布与统计推断在数理统计中,抽样分布和统计推断是重要的基本概念。
通过抽样分布,我们可以推断总体的参数,并对样本数据进行可靠的统计推断。
本文将介绍抽样分布和统计推断的基本原理及应用。
一、抽样分布1. 抽样的定义和目的抽样是从总体中选取部分个体作为样本的过程。
通过抽样分布,我们可以知道样本统计量的概率分布。
常见的抽样方法有简单随机抽样、系统抽样、分层抽样等。
抽样的目的是为了在不损失精确度的情况下,通过样本对总体进行推断。
2. 样本统计量在抽样分布中,我们通常使用样本统计量来近似估计总体参数。
常见的样本统计量包括样本均值、样本方差等。
样本统计量的概率分布称为抽样分布。
通过样本统计量的抽样分布,我们可以推断总体参数的区间估计和假设检验。
3. 中心极限定理中心极限定理是抽样分布中的重要定理之一。
它表明,当样本容量足够大时,样本均值的抽样分布将近似符合正态分布。
而对于样本比例和样本差异等情况,也可通过中心极限定理进行近似处理。
二、统计推断1. 参数估计参数估计是统计推断中的核心内容之一。
通过样本数据,我们可以对总体的未知参数进行估计。
常用的参数估计方法有点估计和区间估计。
点估计是使用样本数据计算出一个无偏估计量,作为总体参数的点估计;区间估计则是对总体参数提供一个置信区间,即通过样本数据给出参数的一个范围估计。
2. 假设检验假设检验是另一个重要的统计推断方法。
通过构建假设,我们可以根据样本数据判断总体参数是否满足某种假设。
常见的假设检验方法包括单样本假设检验、双样本假设检验、方差分析等。
在假设检验中,我们会计算出一个检验统计量,并进行显著性水平的假设检验。
三、实际应用抽样分布和统计推断在实际应用中具有广泛的应用。
在医学研究中,通过抽样分布和统计推断可以判断某种药物是否有效;在市场调研中,可以通过样本数据推断人群对某种产品的需求。
统计推断还可以应用于工程管理、经济分析、环境监测等领域。
结语数理统计中的抽样分布和统计推断是统计学的基本概念,对于实际问题的分析和解决具有重要意义。
应用统计学第3章抽样分布
计量
2
X
2 1
X
2 2
X
2 n
为服从自由度为n 的 2 分布,记为 2 ~ 2(n)
2 的一个重要性质:可加性
上一页
下一页
返回本章首页
第三章 抽样分布
2. χ 2分布
χ2分布图 上一页
下一页
图3-2 返回本章首页
第三章 抽样分布
查表:
2. χ 2 分布
对于给定的α,0<α<1,可在 χ分2 布表中查得,即
上一页
下一页
返回本章首页
第三章 抽样分布
4. F 分布
P(F F ) F f (x)dx (0 1)
F分布图 上一页
F
下一页
图3-4 返回本章首页
第三章 抽样分布
5. 基4于.正3 态样总本体平样均本数的的均抽值样与方分差布的分布
有限总体
有限总体若采取有放回抽样,则与无限总体等价。有限 总体容量为N而采取无放回抽样,且n/N≤0.1,仍可视 为无限总体,而当n/N>0.1时则
n i 1
xi
, s2
1n n 1 i1 (xi
x)2
,s
1 n 1
n i 1
( xi
x)2
,
ak
1 n
n i 1
xik
( k 1,2,
), bk
1 n
n
(xi
i 1
x)k
( k 2,3,
)。
上一页
下一页
返回本章首页
第三章 抽样分布
第二节 抽样分布
二、几个常用的抽样分布
抽样分布的定义 统计量的分布称为抽样分布。 来自正态总体的几个常用统计量的分布,已 有一些重要的结果(人们已经获得这些统计量 的具体的分布密度函数)。下面介绍来自正态 总体的几个常用统计量的分布。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 证明了抽样平均数将趋近于总体平均数,为抽样分析 提供了科学依据。
样本均值的抽样分布
1. 在重复选取容量为n的样本时,由样本均 值的所有可能取值形成的相对频数分布
正态分布
• 密度函数:
正态分布是一个连续分布,形状呈钟型,中心为μ,两边对称 ,两个参数μ和σ2分别表示它的均值与离散程度。
正态分布
X
中心极限定理
当总体服从正态分布N(μ,σ2)时,来自该总体的所有 容量为n的样本的均值x也服从正态分布,x 的数
学期望为μ,方差为σ2/n。即x~N(μ,σ2/n)
n
0
F
n1,n2
方差 1 2n
形状 对称 右偏 对称 右偏
基于正态总体样本的均值与方差的分布
基于正态总体样本的均值与方差的分布
样本比例的抽样分布
• 重复抽样下样本比例的抽样分布 • 不重复抽样下样本比例的抽样分布 由样本均值的抽样分布性质类推得出。见书表3.2.1
3.2 随机抽样
二、随机抽样的定义
1. 抽样:从总体中抽取有限个个体对总体进行观 测的过程
2. 样本:从总体中抽取一部分个体,根据获得的 数据对总体分布进行推断,被抽出的部分个 体叫总体的一个样本
3.2 随机抽样
二、随机抽样的定义
在相同的条件下我们对总体X进行n次重复的、都 独立的观测,将n次观测结果按试验的次序记 为X1,X2,…Xn,由于它们是对随机变量X观测 的结果,且每次观测是在相同的条件下独立进 行的,故可以认为X1,X2,…Xn是相互独立的, 且X的一个简 单随机样本,n称为这个样本的容量。当n次观 测结束后,我们得到一组实数x1,x2,…,xn ,它们依次是随机变量X1,X2,…,Xn的观测值, 称为样本值。
•16个样本的均值(x)
•第一个
•第二个观察值
•观察值 •1 •2 •3 •4
•1 •1.0 •1.5 •2.0 •2.5
•2 •1.5 •2.0 •2.5 •3.0
•3 •2.0 •2.5 •3.0 •3.5
•4 •2.5 •3.0 •3.5 •4.0
P(x) 0.3
0.2
0.1
0 1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
• 统计量也是一个随机变量
3.3 抽样分布
• 最常用的统计量:样本矩
3.3 抽样分布
• 这些统计量的观测值分别为:
抽样分布的形成
(sampling distribution)
总体
计算样本统计
样
量
本
如:样本均值
、比例、方差
、矩
从抽样推断总体的依据
大数定理
• 一般意义:在随机试验过程中,虽然每次观察的结果 不同,但大量重复观察出现的结果的平均值却几乎总 是接近某个确定值。
第三章应用数理统计抽 样分布
2020年7月25日星期六
3.1 抽样
一、抽样的概念 • 如果所获得的数据是研究对象的全部,这组数
据就构成一个总体 • 如果所获得的数据只是这一总体所构成的集合
的某一个子集,它就是一个样本
二、抽样的类别 • 判断性抽样:根据专家意见选择样本 • 随机抽样:概率抽样
3.2 随机抽样
2. 一种理论概率分布
3. 推断总体均值的理论基础
样本均值的抽样分布
【例】设一个总体,含有4个元素(个体) ,即总体单位 数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4 。总 体的均值、方差及分布如下
总体分布
均值和方差
.3
.2
.1 0
1
234
样本均值的抽样分布
现从总体中抽取n=2的简单随机样本,在重复抽 样条件下,共有42=16个样本。所有样本的结果为
一、基本概念
1. 总体:试验的全部可能的观测值 2. 个体:试验的每一个观测值称为个体 3. 总体的容量:总体中所包含的个体数 4. 有限总体和无限总体:总体容量为有限的称
有限总体,否则称为无限总体
3.2 随机抽样
一、基本概念
• 对某个总体而言,个体的取值是按一定规律分布的,即总对应 着一个随机变量X,对总体的研究实际上是对一个随机变量X 的研究
• 一个总体就是一个具有确定概率分布的随机变量 例:对某天生产的产品进行质量检验,以0表示正品,1表示次
品。假设出现次品的概率为p(常数),则总体由0和1组成 ,这一总体对应一个参数为p的(0-1)分布的随机变量,即
我们就将它看作是(0-1)分布总体,即总体中的观测值是 (0-1)分布随机变量的可能取值。
=10
n= 4
n =16
= 50 X
总体分布
x
抽样分布
中心极限定理
中心极限定理:设从均值为,方差为 2的一个任意总
体中抽取容量为n的样本,当n充分大时,样本均值的抽 样分布近似服从均值为μ、方差为σ2/n的正态分布
一个任意分 布的总体
当样本容量足够 大时(n 30) , 样本均值的抽样 分布逐渐趋于正 态分布
• 整群抽样:总体分组后,从总体中随机抽取n组,这n组个体 组成一个样本
3.2 随机抽样
二、随机抽样的定义
• 一个样本中的每个个体必须取自同一个总体 • 取得任一个体的概率都不影响取得另外一个
个体的概率
3.3 抽样分布
一、统计量
• 设X1,X2,…,Xn是来自总体X的一个样本,g( X1,X2,…Xn)是X1,X2,…,Xn的函数(如均值, 方差),若函数g(X1,X2,…Xn)不含有任何未 知参数,则称g(X1,X2,…Xn)是一个统计量。 如果x1,x2,…,xn是相应于样本X1,X2,…,Xn的样本 值,则称g( x1,x2,…,xn)是统计量g( X1,X2,…Xn)的观测值
• 系统抽样:按一定原则或规律性进行抽样,如隔n天搜集一 次数据等,适合于数据没有系统性或周期性变化的情况,在 时间和费用上较节约
• 分层抽样:将总体分成许多阶层,每个阶层都是一个团体, 要求做到每个团体内的个体差异较小,而各阶层之间的差异 较大。然后在每个阶层内进行随机抽样,其样本容量可以按 各阶层占总体比例的大小而定
样本均值的抽样分布
样本均值的分布与总体分布的比较
总体分布
.3
.2
.1 0
1
234
= 2.5
σ2 =1.25
.3 P ( x )
抽样分布
.2
.1
0 1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
几个常用的抽样分布
• 正态分布 • 卡方分布 • t分布 • F分布 • 基于正态总体样本的均值与方差的分布
x
中心极限定理
x 的分布趋 于正态分布 的过程
抽样分布与总体分布的关系
总体分布
正态分布 正态分布
非正态分布
大样本
小样本
正态分布 非正态分布
图3.2.1
图3.2.2
图3.2.3
图3.2.4
图3.2.5
图3.2.6
几种分布的特征一览
分布 随机变量 样本空间 参数
均值
标准正态
Z
无
0
n
n
t
3.2 随机抽样
二、随机抽样的定义
• 有限总体的简单随机抽样:假设总体容量为 N(有限),样本容量为n(<N),如果所 有容量为n的样本都有相同的概率可以从总 体中被抽取到,则称此方法为有限总体的简 单随机抽样
• 常用做法:利用随机数表
3.2 随机抽样
二、随机抽样的定义
系统抽样,分层抽样和整群抽样-近似随机抽样
•所有可能的n = 2 的样本(共16个)
•第一个
•第二个观察值
•观察值
•1
•2
•3
•4
•1
•1,1
•1,2
•1,3
•1,4
•2
•2,1
•2,2
•2,3
•2,4
•3
•3,1
•3,2
•3,3
•3,4
•4
•4,1
•4,2
•4,3
•4,4
样本均值的抽样分布
计算出各样本的均值,如下表。并给出样本均 值的抽样分布