1-3 基本概念与抽样分布
第三章 抽样分布
集合体,具有可变性。
7
2、抽样
从总体中抽取有限个个体对总体进行观测 的过程叫做抽样。
在相同的条件下对总体 X 进行 n 次重复的、 独立的观测,将n次观测结果按试验的次序 记为 X1,X 2, ,X n,这样得到的 X1,X 2, ,X n 称为来自总体 X 的一个简单随机样本, n 称 为这个样本的容量。
第三章 抽样分布
学生姓名 小张 小刘 小李 小王 小赵 小黄
身高 X1 X2 X3 X4 X5 X6
小谭
小杜 小蔡 小唐 小高 小许 小卢 小吴 小郑
X7
X8 X9 X10 X11 X12 X13 X14 X15
2
12000名
求全校学生的平均身高
测量每一名学生的身高 ?
根据部分学生身高估计 全体学生身高
21
抽样时,可以作若干次抽取,若第一次抽样时,抽 到小王、小赵、小刘等100名学生,他们的身高可依 次表示为: x ,x , ,x ,则:
1 2 100
g(x1,x2, ,x100 ) x
x
n 1
100
i
100
称为统计量g(X1,X 2, ,X100 )的观测值
22
二、几种常用的抽样分布
3
学生姓名 小张 小王
身高 X1 X4
小赵
小蔡
X5
X9
样本
小唐
小吴
X10
X14
x1
4
学生姓名
小刘 小李
身高
X2 X3
小蔡
小许
X9
X12
样本
小卢
小郑
X13
X15
x2
5
C
6 12000
统计学抽样与抽样分布
3. 需要包含所有低阶段抽样单位的抽样框;同时由于
实行了再抽样,使调查单位在更广泛的范围内展开
4. 在大规模的抽样调查中,经常被采用的方法
概率抽样(小结)
非概率抽样
n也叫非随机抽样,是指从研究目的出发,根据调查者的 经验或判断,从总体中有意识地抽取若干单位构成样本。
n重点调查、典型调查、配额抽样(是按照一定标准或一 定条件分配样本单位数量,然后由调查者在规定的数额内 主观地抽取样本)、方便抽样(指调查者按其方便任意选 取样本。如商场柜台售货员拿着厂家的调查表对顾客的调 查)等就属于非随机抽样。
样本分量:其中每一个Xi是一个随机变量,称为样本 分量。
样本观察值:一次抽样中所观察到的样本数据x1、x2、 x3称为样本观察值。 对于某一既定的总体,由于抽样的方式方法不同,样 本容量也可大可小,因而,样本是不确定的、而是可5
一、 几个概念
(二)样本总体与样本指标
样本指标(统计量)。在抽样估计中,用来反 映样本总体数量特征的指标称为样本指标,也 称为样本统计量或估计量,是根据样本资料计 算的、用以估计或推断相应总体指标的综合指 标。
3
总体和参数(续)
通常所要估计的总体指标有
X
NX
一、 几个概念
(二)样本总体与样本指标
样本总体。简称样本(Sample),它是按照随机原则, 从总体中抽取的部分总体单位的集合体 。
样本容量:样本中所包含的个体的数量,一般用n表示。 在实际工作中,人们通常把n≥30的样本称为大样本, 而把n<30的样本称为小样本。
(二)抽样平均误差(抽样标准误)
抽样平均误差是反映抽样误差一般水平的指标(因为 抽样误差是一个随机变量,它的数值随着可能抽取的 样本不同而或大或小,为了总的衡量样本代表性的高 低,就需要计算抽样误差的一般水平)。通常用样本 估计量的标准差来反映所有可能样本估计值与其中心 值的平均离散程度。
初级1 -第三章简单随机抽样
n
n 1 N 1 n N
n 1 N 1
二、实施方法 • 抽签 制作N个同质的签,充分混合。从中一次抽出n个签, 或者先抽出一个签但不放回,再抽下一个签直到抽 满n个签为止。抽出的这n个签对应的单元入选样本, 这是不放回简单随机抽样;若从充分混合的N个签 中抽取一个,记录后放回,再抽取下一个,如此进 行,直到抽满n个为止,则是放回简单随机抽样。 抽签法的实施起来比较麻烦,尤其是当总体单元数 N较大时,所以该方法的使用场合为当总体单元数 N比较小,签的制作比较方便时。
第三章 简单随机抽样
第一节
基本问题
一、什么是简单随机抽样
从 N个单元的总体中抽取 n个单元组成的样本。总体单元数为 N,
样本量为 n。 若抽样是放回的,每次都是从 个总体单元中随机抽取1个单元,独 立重复抽取n次,得到 个单元组成的样本,叫做放回简单随机抽样。 若抽样是不放回的,每次都是从剩下的总体单元中随机抽取1个单 元,相继依次抽取n次,得到n个单元组成的样本,叫做不放回简单 随机抽样。
精度margin of error
对精度的要求通常以允许最大绝对误差
差限)或允许最大相对误差 (相对误差限)来表 示。
r
d(绝对误
d 1 P
P r 1
样本量足够大时,可用正态分布近似
ˆ tS ˆ d t V
2
第三章 基本概念
N n N 1
N n N
为 修正系数
2
为 S 修正系数
n f ,称抽样比, N
2
令
N n 1 f 有限总体调整系数 故, N 2
S V ( y ) (1 f ) n
抽样分布知识点总结
抽样分布知识点总结抽样分布是统计学中一个重要的概念,它描述了在进行抽样时得到的样本统计量的分布情况。
抽样分布是统计推断的基础,它可以帮助我们理解抽样误差以及估计参数的可信度。
在本文中,我们将对抽样分布的基本概念、性质和相关理论进行总结和讨论。
一、基本概念1.1 抽样与总体在统计学中,总体是指我们想要研究的所有个体的集合,而抽样则是从总体中选取一部分个体作为样本,以获得对总体特征的估计。
抽样可以是随机抽样、分层抽样、系统抽样等方法,目的是代表性地反映总体的特征。
1.2 样本统计量在抽样中,对样本数据进行统计分析得到的统计量称为样本统计量,常见的样本统计量有均值、方差、标准差、比例等。
样本统计量能够提供有关总体参数的估计和推断。
1.3 抽样分布抽样分布是描述样本统计量的分布情况的统计学概念。
当我们从总体中抽取多个样本,并计算每个样本的统计量时,得到的这些统计量的分布就是抽样分布。
抽样分布可以反映出样本统计量的可变性、偏移和分布形态等特征。
二、性质2.1 中心极限定理中心极限定理是抽样分布理论中的重要定理,它描述了在一定条件下,样本均值的抽样分布近似服从正态分布。
中心极限定理对于理解抽样分布的性质和应用具有重要意义,也为许多统计推断方法提供了理论基础。
2.2 大数定律大数定律是另一个重要的抽样分布性质,它描述了当样本容量足够大时,样本均值会收敛于总体均值,即样本均值的抽样分布会集中在总体均值附近。
大数定律为我们理解样本统计量的稳定性和准确性提供了重要参考。
2.3 置信区间置信区间是根据抽样分布推断总体参数的一种方法,通过对抽样分布的分布情况进行分析,我们可以建立对总体参数的置信区间,从而对总体特征进行推断。
置信区间对于统计推断的可信度和精度有着重要的作用。
三、理论基础3.1 样本容量样本容量是影响抽样分布的一个重要因素,在实际抽样中,样本容量的大小对于样本统计量的分布情况有着重要的影响。
通常情况下,样本容量越大,抽样分布的稳定性和准确性越高。
《统计学》第9章 抽样与抽样分布
二、抽样中的基本概念
⚫ 样本比例(成数)
p = n1 ,q = n0 = 1− p
n
n
⚫ 样本是非标志的标准差
(n = n0 + n1)
sp =
n p (1− p) =
n −1
n pq n −1
⚫ 样本是非标志的方差
s
2 p
=
n n −1
p(1 −
p)
=
n n −1
pq
第一节 抽样和抽样方法
三、抽样方法
三、抽样方法
⚫ 多阶段抽样
⚫ 在实践中总体所包括的单位数很多,分布很广,通过一次 抽样就选出有代表性的样本是很困难的。此时可将整个抽 样过程分为几个阶段,然后逐阶段进行抽样,最终得到所 需要的有代表性的样本。
第一节 抽样和抽样方法
三、抽样方法
⚫ 多阶段抽样
⚫ 阶段数不宜过多,一般采用两个、三个阶段,至多四个阶 段为宜,否则,手续繁琐,效果也不一定好。
第一节 抽样和抽样方法
二、抽样中的基本概念
⚫ 总体参数
⚫ 总体参数是根据总体各单位的标志值或特征计算的、反 映总体某一属性的综合指标。
⚫ 总体参数是唯一的、确定的常数,但一般情况下又是未 知的。
⚫ 常用的总体参数有 ⚫ 总体均值 ⚫ 总体标准差、总体方差 ⚫ 总体比例(成数)
第一节 抽样和抽样方法
⚫ 样本标准差
s =
1 n −1
n i =1
(xi
−
x )2,或s
=
1
m
m
(xi − x )2 fi
fi −1 i=1
i =1
⚫ 样本方差
( ) ( ) s2 = 1 n n −1 i=1
概率论抽样分布
概率论抽样分布说明在概率论中,抽样分布是指从总体中选取样本并计算样本统计量的分布。
通过研究抽样分布,可以推断总体的性质和参数。
在这篇文档中,我们将介绍概率论抽样分布的基本概念、特性以及常用的分布类型。
抽样分布的定义抽样分布是由于从总体中抽取样本导致的统计量的分布。
在统计学中,统计量是从样本数据中计算得出的数值,如样本均值、样本方差等。
通过从总体中不断抽取样本并计算统计量的值,可以得到抽样分布。
抽样分布的特性抽样分布具有以下特性:1.中心极限定理:当样本容量足够大时,抽样平均值的抽样分布近似呈正态分布。
2.抽样分布的均值等于总体均值:样本均值的期望值等于总体均值。
3.抽样分布的方差等于总体方差除以样本容量:样本均值的方差等于总体方差除以样本容量。
常见的抽样分布类型在概率论中,常用的抽样分布类型包括:1.正态分布:也称为高斯分布,是最常用的抽样分布。
当样本容量足够大时,均值的抽样分布近似呈正态分布。
2.t分布:用于小样本(样本容量较小)情况下对总体均值的推断。
相对于正态分布,t分布有更宽的尾部。
3.卡方分布:用于推断总体方差时的抽样分布。
卡方分布的形态由自由度决定。
4.F分布:用于比较两个总体方差是否相等的抽样分布。
F分布的形态由两个样本的自由度决定。
抽样分布的应用抽样分布广泛应用于统计学和概率论中的推断与检验问题。
通过从总体中抽取样本并计算统计量的分布,可以进行以下应用:1.参数估计:通过抽样分布,我们可以估计总体参数的取值,如总体均值、总体方差等。
2.假设检验:通过比较样本统计量与抽样分布的临界值,我们可以判断总体参数是否满足某个假设。
3.置信区间估计:通过计算抽样分布的分位数,我们可以得到总体参数的置信区间,从而评估参数的精确性。
总结抽样分布是概率论中的重要概念,用于推断总体的性质和参数。
具备了中心极限定理、均值和方差的性质等特点,常见的抽样分布类型包括正态分布、t分布、卡方分布和F分布。
通过抽样分布,我们可以进行参数估计、假设检验和置信区间估计等应用。
抽样分布基本概念
抽样分布根本概念引言抽样分布是统计学中一个重要的概念,它描述了在进行统计推断时所使用的样本统计量的分布情况。
在本文中,我们将讨论抽样分布的根本概念,包括样本、样本统计量、抽样分布的性质以及样本均值和样本比例的抽样分布。
样本与样本统计量在统计学中,样本是指从总体中随机选取的一局部观察对象。
样本的大小通常用字母n表示。
通过对样本进行测量和观察得到的某一特定数值称为样本统计量。
样本统计量是对总体参数的估计。
常见的样本统计量有样本均值、样本方差和样本比例。
样本均值是指样本中所有观察值的平均值,用符号X表示。
样本方差是指样本中所有观察值与样本均值之差的平方和的均值。
样本比例是指符合某一特征的观察值占样本总体的比例。
抽样分布的性质抽样分布是指在总体参数未知的情况下,对总体进行抽样并计算样本统计量后得到的分布。
在大样本情况下〔样本容量n足够大〕,根据中心极限定理,样本均值的抽样分布近似呈正态分布。
这意味着无论总体是什么样的分布,当样本容量足够大时,样本均值的抽样分布都可以近似看作是正态分布。
当总体分布为正态分布时,样本均值的抽样分布仍然是正态分布。
但是当总体分布为非正态分布时,样本均值的抽样分布仍然近似为正态分布,但不再是精确的正态分布。
样本均值的抽样分布样本均值的抽样分布被称为抽样分布。
当总体分布为正态分布时,不管样本容量大小,样本均值的抽样分布都是正态分布。
当总体分布为非正态分布时,当样本容量足够大时,样本均值的抽样分布近似为正态分布。
样本均值的抽样分布的均值等于总体均值,标准差等于总体标准差除以样本容量的平方根。
抽样分布的均值等于总体均值是因为样本均值是总体均值的无偏估计,即样本均值的期望值等于总体均值。
抽样分布的标准差等于总体标准差除以样本容量的平方根是因为样本均值的抽样分布的方差等于总体方差除以样本容量。
样本比例的抽样分布样本比例的抽样分布也是一个重要的抽样分布。
样本比例的抽样分布是二项分布的一种特殊情况。
三大抽样分布知识点一览
三大抽样分布知识点一览抽样分布的概念抽样分布:从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布称为抽样分布。
抽样分布是统计推断的理论基础。
如果从容量为N的有限总体抽样,若每次抽取容量为n的样本,那么一共可以得到N取n的组合个样本(所有可能的样本个数)。
抽样所得到的每一个样本可以计算一个平均数,全部可能的样本都被抽取后可以得到许多平均数。
如果将抽样所得到的所有可能的样本平均数集合起来便构成一个新的总体,平均数就成为这个新总体的变量。
由平均数构成的新总体的分布,称为平均数的抽样分布。
随机样本的任何一种统计数都可以是一个变量,这种变量的分布称为统计数的抽样分布。
三大抽样分布1. 卡方分布χ2(n)定义:若n个相互独立的随机变量ξ₁、ξ₂、……、ξn,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布(chi-square distribution)。
2. t分布定义:设X1服从标准正态分布N(0,1),X2服从自由度为n的χ2分布,且X1、X2相互独立,则称变量t=X1(X2/n)1/2所服从的分布为自由度为n的t分布。
3. F分布定义:设X1服从自由度为m的χ2分布,X2服从自由度为n的χ2分布,且X1、X2相互独立,则称变量F=(X1/m)/(X2/n)所服从的分布为F分布,其中第一自由度为m,第二自由度为n。
与正态分布一同构成数理统计中的四大分布。
由标准正态总体样本的适当组合构成的统计量形成数理统计中的其他三大基础分布。
所以,数理统计中总是以正态总体作为研究对象展开。
在数理统计中,"总体"、"抽样"、"样本"是三个基本概念,分位点是"小概率事件"发生的临界点,置信区间是参数估计和假设检验的核心计算问题。
概率论与数理统计基本概念及抽样分布PPT课件
~
2 (n1 ),
2 2
~
2 (n2 ), 且它们相互独立,
则
2 1
2 2
~
2 (n1
n2 )
《概率统计》
返回
下页
结束
4. 2分布的百分位点
对给定的α(0<α<1)
(1)称满足
P{ 2
2
(n)}
,即
f ( y)dy
x2 ( n)
的点为 2分布的上100α百分位点。
f(y)
(2)称满足
注:在研究中,往往关心每个个体的一个(或几个)数量指标和 该数量指标在总体中的分布情况. 这时,每个个体具有的数量 指标的全体就是总体.
或,总体:研究对象的某项数量指标的值的全体.
《概率统计》
某批 灯泡的 寿命
该批灯泡寿命的 全体就是总体
返回
下页
结束
为推断总体分布及各种特征,按一定规则从总体中抽取若 干个体进行观察试验,以获得有关总体的信息,这一抽取过程 为 “抽样”.
( x)
(1)称满足条件 P{X>Xα} =α,
α
即
( x)dx
X
的点Xα为N(0,1)分布的上100α百分位点.
X1-α
0
由于 P{X X } 1 记 -Xα= X1-α
(2)称满足条件 P {| X | X }
2
2
的点 X 为N(0,1)分布的双侧100α百分位点.
X
2
则
E(X )
E(1 n
n i 1
Xi)
1 n
n i 1
E(Xi )
1 n
n
D(X ) D(1 n
n i1
Xi)
第一节 抽样调查中的基本概念
面向21世纪 课程教材
第四章
抽样与抽样估计
第一节
五
五、抽样方法
抽样方法可分为重复抽样和不重复抽样两种。 • 重复抽样,也叫回置抽样,是指从总体的N个单位中 抽取一个容量为n的样本,每次抽出一个单位后,再将 其放回总体中参加下一次抽取,这样连续抽n次即得到 一个样本。采用重复抽样,同一总体单位有可能被重 复抽中,而且每次都是从N个总体单位中抽取,每个 总体单位在每次抽样中被抽中的概率都相同,n次抽取 就是n次相互独立的随机试验。 • 不重复抽样,也叫不回置抽样,是指抽中单位不再放 回总体中,下一个样本单位只能从余下的总体单位中 抽取。采用不重复抽样方法,同一总体单位不可能被 重复抽中。由于每次抽取是在不同数目的总体单位中 进行的,每个总体单位在各次抽样中被抽中的概率不 相等,即n次抽取可看作是n次互不独立的随机试验。
面向21世纪 课程教材
第四章
抽样与抽样估计
第一节
三
三、抽样框
• 当调查目的确定之后,所要研究的现象总体也 就随之而确定了。总体也叫抽样调查的目标总 体,确定了目标总体,也就确定了应该在什么 范围内进行抽样。有了目标总体,还必须明确 实际进行抽样的总体范围和抽样单位,这就需 要编制一个抽样框。抽样框是包括全部抽样单 位的名单框架。编制抽样框是实施抽样的基础。 抽样框的好坏通常会直接影响到抽样调查的随 机性和调查的效果。
而抽样误差则是不可避免的,但可以计算并加以控制。
在计算抽样误差时常常假设不存在登记性误差和系统偏 差。
面向21世纪 课程教材
第四章
抽样与抽样估计
第一节
四
• 实际应用中,抽样误差有三个密切联系而又相互区别的概念: (一)实际抽样误差 • 实际抽样误差是指某一具体样本的样本估计值与总体参数的真 实值之间的离差。实际抽样调查中,由于总体参数是未知数, 因此,每次抽样的实际抽样误差是无法计算的。 (二)抽样平均误差 • 统计学中常用标准差这一概念来测定某一变量的所有变量值 与其均值的平均差异程度,衡量均值的代表性大小。 (三)抽样极限误差 • 抽样极限误差是指一定概率下抽样误差的可能范围,也称为 允许误差。则这一概念可以表述为如下不等式:在一定概率下 • ˆ 上式表示:在一定概率下可认为样本估计量与相应总 体参数的误差绝对值不超过 。
抽样分布的概念及重要性
抽样分布的概念及重要性抽样分布是统计学中一个重要的概念,它描述了从总体中抽取样本的过程中,统计量的分布情况。
在统计学中,我们通常无法对整个总体进行研究,而是通过抽取样本来推断总体的特征。
抽样分布的概念帮助我们理解样本统计量的变异性,并为统计推断提供了理论基础。
本文将介绍抽样分布的概念及其重要性。
一、抽样分布的概念抽样分布是指在相同条件下,重复从总体中抽取样本,并计算样本统计量的分布情况。
在抽样过程中,每次抽取的样本可能不同,因此样本统计量的取值也会有所不同。
抽样分布描述了样本统计量的所有可能取值及其对应的概率分布。
常见的样本统计量包括样本均值、样本方差、样本比例等。
以样本均值为例,假设总体均值为μ,样本均值为x̄,抽样分布描述了在相同样本容量的情况下,样本均值的所有可能取值及其对应的概率分布。
根据中心极限定理,当样本容量足够大时,样本均值的抽样分布近似服从正态分布。
二、抽样分布的重要性抽样分布在统计学中具有重要的意义,它对统计推断和假设检验提供了理论基础,具体体现在以下几个方面:1. 参数估计:抽样分布可以用于估计总体参数。
通过抽取样本并计算样本统计量,我们可以对总体参数进行估计。
例如,通过计算样本均值来估计总体均值,通过计算样本比例来估计总体比例等。
抽样分布提供了样本统计量的分布情况,帮助我们确定估计值的可信度和置信区间。
2. 假设检验:抽样分布可以用于假设检验。
在假设检验中,我们通常需要比较样本统计量与假设值之间的差异,以判断差异是否显著。
抽样分布提供了样本统计量的分布情况,可以帮助我们计算出观察到的差异在抽样误差范围内的概率,从而判断差异是否显著。
3. 抽样方法选择:抽样分布可以帮助我们选择合适的抽样方法。
不同的抽样方法会对样本统计量的分布产生不同的影响。
通过了解抽样分布的特点,我们可以选择合适的抽样方法,以提高样本统计量的准确性和可靠性。
4. 统计推断:抽样分布是统计推断的基础。
统计推断是指通过样本数据对总体特征进行推断。
抽样分布的基本概念与基本原理
抽样的基本概念
抽样分布的基本原理
第一节 抽样的基本概念
抽样调查的特点 经济性 时效性 必要性
抽样所需样本必需要有代表性 抽样误差与非抽样误差
抽样误差是指随机抽取于总体中的一部分 的样本而引起的误差
非抽样误差是指在调查过程中出现的所有 人为错误
❖ 抽样方法
抽样方式
解:由于总体标准差未知 ,所以采用t分布
t
x
S
n
其中,n=25,自由度=n-1=24 t7 .6 8 .5,则 P (x 7 .6 ) P (t 2 .8 1 3 7 )
1 .6 / 2 5
查 t 分 布 表 得 , 0 . 0 0 2 5 P ( x 7 . 6 ) 0 . 0 0 5
概率抽样
非概率抽样
简单随机抽样 整群抽样
多阶段抽样
分层抽样 系统抽样
方便抽样 自愿样本 配额抽样
判断抽样 滚雪球抽样
第二节 抽样分布的基本原理
总体参数与样本统计量 抽样分布定理
x 总体标准差 不明确时 的抽样分布
比率抽样分布
❖ 总体参数
总体平均值 总体方差 总体标准差 总体比率
Xi
随着自由度的增加,t-分布与正态分布之间的差
距将会不断减小(n>30),且t-分布的离散程度
也将减小
t-分布的均值为0,方差为 (1) 2
❖ t分布与标准正态的对比
标准正态分布
标准正态分布
t (df = 13)
t 分布
x
t 分布与标准正态分布的比较
t (df = 5)
z
t
不同自由度的t分布
❖ t分布表的使用
样本统计量的概率分布,是一种理论分布
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
上页
下页
返回
由于抽样的目的是为了对总体进行统计推断, 为了使抽取的样本能很好地反映总体的信息, 必须考虑抽样方法. (2). 简单随机样本
最常用的一种抽样方法叫作“简单随机抽 样”,它要求抽取的样本满足下面三点:
解
例题 值1 样本 32 中位数 31 样本均值 36.5 样本极差 37 值2 65 值3 28 值4 35 值5 30 值6 29
上页
下页
返回
4. 经验分布函数
(1). 定义
当给定次序统计量的一组值 定义对
称Fn(x)为总体X的经验分布函数。为样本值不 超过x的频率。 上页 下页 返回
经验分布函数Fn(x)从样本直观得到描述性分布.
上页
下页 返回
样本是随机变量.
抽到哪5辆是随机的
容量为n的样本可以看作n维随机向量.
但是,一旦取定一组样本,得到的是n个具 体的数 (X1,X2,…,Xn),称为样本的一次观察值, 简称样本值 .
上页
下页 返回
样本具有两重性: 10. 随机性 样本(X1,X2,…,Xn)本身是随机向量。
20. 相对确定性
若n2>2
EX不依赖于第 一自由度n1.
上页
下页
返回
20. 若n1=1时,F~F(1, n2)= t 2(n2).
30. 极限分布 若X~F(n1,n2), n2>4,则
上页
下页
返回
40. 分解定理: 设X1, … ,Xn~N(0,σ2)且相互独立,
是柯赫伦(Cochran)分解定理的具体应用, 它也在方差分析中有重要作用。
某批 灯泡的寿命
国产轿车每公里 的耗油量
该批灯泡寿命的 全体就是总体
国产轿车每公里耗油 量的全体就是总体
上页
下页 返回
由于每个个体的出现是随机的,所以相应 的数量指标的出现也带有随机性. 从而可以把 这种数量指标看作一个随机变量,因此随机变 量的分布就是该数量指标在总体中的分布. 这样 总体就可以用一个随机变量及其分布来描述.
上页
下页
返回
(3). T变量的性质:
10. T ~ t(n)为具有自由度为n的t分布的随机变 量,则T的数字特征具有如下性质: 当 n =1时, T ~ t(n)实际上是柯西分布,任何 阶矩均不存在;
当n >2, E(T)=0; D(T)=n / (n-2) . 且有
上页
下页
返回
事实上
上页
下页
返回
它反映了总体k 阶矩 的信息
它们均是随机变量
样本k-阶中心矩
它反映了总体k 阶 中心矩的信息
k=1,2,…
上页
下页 返回
k=1时, A1称为样本均值
样本均值 k=2时, B2称为样本方差
它反映了总体 均值的信息 它反映了总体 方差的信息
更加常用简称为 样本方差
样本方差
上页
下页
返回
(2). 矩的性质
其在方差分析中有很重要的作用。
上页
下页 返回
40. 极限分布
应用Lindeberg中心极限定理可得:
上页
下页
返回
3. t -分布 (1). 定义: 设X~N(0,1) , Y~ 2(n), 且相互独立,则称随机 变量 记为T~t(n). 所服从的分布为自由度为 n的 t 分布,也称为t变量. (2). T变量的密度函数为:
数学定义: n个随机变量X1,X2,…,Xn独立同分 布(X与同分布),则称(X1,X2,…,Xn)来自总体X的容 量为n的简单随机样本,简称为样本.
简单随机样本是应用中最常见的情形,今后, 当说到“X1,X2,…,Xn是取自某总体的样本”时, 若不特别说明,就指简单随机样本.
上页
下页 返回
3. 总体、样本、样本值的关系 事实上我们抽样后得到的资料都是具体的、 确定的值. 如我们从某班大学生中抽取10人测量 身高,得到10个数,它们是样本取到的值而不是 样本. 我们只能观察到随机变量取的值而见不到 随机变量.
上页
下页
返回
2、 2 分布
是由正态分布派生出来的一种分布. (1). 定义 设 X1, … ,Xn~N(0,1)且相互独立,则称随机变量:
所服从的分布为自由度为 n 的 n为独立随机正态变量的个数, 也称为
上页
下页 返回
其中 Γ(x)为伽玛(Gamma)函数
可由数归 法得到
具有如下性质:
上页
下页
也称为F变量 服从自由度为n1及 n2 的F-分布,n1称为第一自 由度, n2称为第二自由度,记作 F~F(n1, n2) . 由定义可见, ~F(n2, n1)
上页
下页 返回
(2). 若X~F(n1,n2), X的概率密度为
(3). F变量的性质 10. 若X~F(n1,n2),X的数学特征:
上页
下页
返回
上页
下页
返回
(2). 最小、最大的分布
另外,(X(1),X(2),…,X(n))联合密度
上页
下页
返回
(3). 中位数、样本极差
中位数
样本极差 次序统计量、中位数、样本极差都是统计量。 极差可以反映样本值变化的程度或离散程度。
上页
下页 返回
例1. 用Excel计算下列样本中位数、均值、方 差、标准差、极差.
则称 x是X (概率分布)的 -上侧分位点.
特别地; (1).正态分布
查表P355页表1.
上页
下页
返回
查表P362页表4.
(3). T~ t(n) 学生氏分布
查表P360页表3.
上页
下页
返回
(4).F ~ F(m,n)
查表P366页表5.
上页
下页
返回
例1
解
上页
下页
返回
例2
解
上页
下页
返回
样本直方图可以描述. (2). 经验分布函数的性质 10. 具有通常分布函数的三个性质,图形呈跳跃上升; 20. Fn(x)是一个随机变量;
上页
下页
返回
30. 经验分布函数Fn(x)与总体分布函数F(x)的关系
格列汶科(Glivenko)定理:
上页
下页
返回
三、 抽样分布
统计量既然是依赖于样本的,而后者又是随 机变量,故统计量也是随机变量,因而就有一定 的分布,这个分布叫做统计量的“抽样分布” . 精确抽样分布 (小样本问题中使用) 抽样分布 渐近分布
10.随机性: X1,X2,…,Xn每个结果等可能被抽取。 20.代表性: X1,X2,…,Xn中每一个与所考察的总体 有相同的分布; 30.独立性: X1,X2,…,Xn是相互独立的随机变量,每 个样本值互不干扰。
上页
下页 返回
由简单随机抽样得到的样本称为简单随机样 本,它可以用与总体独立同分布的n个随机变量 X1,X2,…,Xn表示.
X1,X2,…,Xn是来自总体X~
则有
上页
下页
返回
30. 的说明
又相互独立
上页
下页
返回
2. 两个正态总体
情形
定理 3.
上页
下页
返回
或
也有
或
上页
下页
返回
或
统计四大分布的定义、基本性质以及 上述抽样分布定理在后面的学习中经常 用到,要理解,牢记!!
上页
下页 返回
五、分位点
下面给出概率分布的上侧分位数(分位点)的定义, 它在计算统计查表时经常使用. 1. 定义 设X是随机变量,对(0,1),若存在x使
上页
下页
返回
总体(理论分布) ? 样本 样本值
统计是从手中已有的资料--样本值,去推断总 体的情况---总体分布F(x)的性质. 样本是联系二者的桥梁
总体分布决定了样本取值的概率规律,也就是 样本取到样本值的规律,因而可以由样本值去推断 总体.
上页
下页 返回
实际上,样本的分布与总体分布的关系如下 定理1. 若总体的分布函数为F(x),则其简单随 机样本的联合分布函数为
§3 基本概念与抽样分布
一、基本概念 二、统计量 三、抽样分布 四、抽样分布定理 五、分位点
一、基本概念
1. 总体 一个统计问题总有它明确的研究对象. 研究对象的全体称为总体(母体), 总体中每个成员称为个体.
总体
…
研究某批灯泡的质量
上页
下页 返回
然而在统计研究中,人们关心总体仅仅是关心 其每个个体的一项(或几项)数量指标和该数量指标 在总体中的分布情况. 这时,每个个体具有的数量 指标的全体就是总体.
统计中,总体这个概念的要旨是:
总体就是一个随机变(向)量或其概率分布.
数理统计研究的内容: 总体相应随机变(向)量
的概率分布及数字特征.
上页
下页 返回
2. 样本
(1). 抽样、样本、样本值 为推断总体分布及各种特征,按一定规则从 总体中抽取若干个体进行观察试验,以获得有关 总体的信息,这一抽取过程称为 “抽样”,所 抽取的部分个体称为样本. 样本中所包含的个体 数目称为样本容量. 从国产轿车中抽5辆 进行耗油量试验 样本容量为 5
上页
下页
返回
二、统计量
1. 定义
由样本值去推断总体情况,需要对样本值进行 “加工”,这就要构造一些样本的函数,它把样 本中所含的(某一方面)的信息集中起来.
设(X1,X2,…,Xn)为总体X的一个样本, f(X1,X2,…,Xn) 是一个不含任何有关总体分布未知参数的函数,称 为此总体的一个统计量,它是完全由样本决定的量. 统计量实际上也是一个随机变量,它是一个 随机向量的函数。