统计量及分布
统计量及其分布
样本均值的抽样分布 (例题分析)
【例】设一个总体含有4 个个体,分别为X1=1、X2=2、 X3=3 、X4=4 。总体的均值、方差及分布如下。
总体均值和方差
总体的频数分布
X
i 1
N
i
N
N
2.5
2
2 ( X ) i i 1
0.02 0 2 1 0.1
21 Φ0.2
0.8414
(4) 样本 k 阶(原点)矩
1 n k Ak X i , k 1, 2, ; n i 1
1 n k 其观察值 k x i , k 1, 2, . n i 1
n n 1 2 1 2 2 E( S ) E X i nX (Xi X ) E n 1 i 1 n 1 i 1
2
1 n 2 2 E ( X i ) nE ( X ) n 1 i 1 2 1 n 2 2 2 ( ) n 2 n 1 i 1 n
n
k 1
n
2
2
n
,
定理 设总体X的期望E(X) = ,方差D(X) = 2,X1, X2,…,Xn为总体X的样本, X,S2分别为样本均值 和样本方差,则
E( X ) E( X )
D( X ) 2 D( X ) n n
E( S 2 ) D( X ) 2
思考:在分组样本场合,样本均值如何计算? 二者结果相同吗?
x1 f1 x n f n 其中 x n
《概率论与数理统计》统计量及其分布
但数理统计以概率论为基础,更着重于根据试验得
到的数据来对研究对象的客观规律作出种种合理的估
计和判断.
4
第5章
统计量及其分布
数
描述统计学
理
对随机现象进行观测、试验, 以取得有代表
统
性的观测值.
计
的
推断统计学
分
对已取得的观测值进行整理、分析, 作出推
类
断、决策,从而找出所研究的对象的规律性.
O
5
n 10
10
15
20
x
32
01
抽样分布
2. t 分布
2
X
~
N
(0,1)
,
Y
~
x
(n),且X与Y 独立,则
设随机变量
X
T
Y /n
服从自由度为n的t分布,记为t(n).
性质 密度f(t)是偶函数,且t分布的极限分布是标准正
态分布.
33
01
抽样分布
t分布的密度函数
n 1
n 1
那么如何来利用样本呢?
列表?
画图?
统计量!
样本来自于总体,含有总体性质的信息,但较为分
散. 为了进行统计推断,需要把分散的信息进行整理,
针对不同的研究目的,构造不同的样本函数,这种函
数在统计学中称为统计量.
18
本讲内容
01
总体与个体
02
样本
03
统计量
03
统计量
3.统计量
统计量——不含有未知参数的样本函数
f ( x)
n1
n2
x
第6章-统计量及其抽样分布
对应于每个数值的相对出现频数排成另一列, 由此,全部可能的样本统计量值形成了一个概 率分布,这个分布就是我们想要得到的抽样分 布。
样本均值的抽样分布 与中心极限定理
当总体服从正态分布N(μ,σ2)时,来自该总体的所有 容量为n的样本的均值x也服从正态分布,x 的数
1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
样本均值的抽样分布
所有样本均值的均值和1.0 1.5 4.0 16
2.5 m
n
(xi mx )2
s
2 x
i 1
M
M为样本数目
(1.0 2.5)2
(4.0 2.5)2
s2
0.625
16
n
1. 样本均值的均值(数学期望)等于总体均值 2. 样本均值的方差等于总体方差的1/n
从检查一部分得知全体。
复习 抽样方法
抽样方式
概率抽样
非概率抽样
简单随机抽样 整群抽样
多阶段抽样
分层抽样 系统抽样
方便抽样 自愿样本 配额抽样
判断抽样 滚雪球抽样
6.2.1 抽样分布 (sampling distribution)
1. 样本统计量的概率分布,是一种理论分布
在重复选取容量为n的样本时,由该统计量的所有可 能取值形成的相对频数分布
2. 随机变量是 样本统计量
样本均值, 样本比例,样本方差等
3. 结果来自容量相同的所有可能样本
4. 提供了样本统计量长远而稳定的信息,是进行推 断的理论基础,也是抽样推断科学性的重要依据
抽样分布的形成过程 (sampling
distribution)
统计量及其分布
思考题
设 X1, X2 , … , Xn 是取自正态总体 N (, 2 ),
的一个样本,求 E( XS 2 ) ?
定理 2 设 X1, X2 , … , Xn 是取自正态总体 N (, 2 )
的样本,X 和S 分别为样本均值和样本均方差,则有
1) X ~ N(0, 1); / n
2) X ~ t(n 1).
nx 2 ];
③ s
1 n 1
n i 1
( xi
x )2
;
④
ak
1 n
n i 1
xik ,
k 1, 2
;
⑤ bk
1 n
n
(xi x )k ,
i 1
k
1, 2
.
例1 设总体X 的期望为 E(X ) , 方差为 D(X ) 2 其样本为 X1, X2, , Xn , 求E(X ), D(X ), E(S 2) .
为t分布的上 分位点。
t1 (n) t (n)
若 0.5,直接查表;若 0.5, t (n) t1 (n).
当 n 45 , t (n) z .
(3) F-分布
设随机变量X与Y相互独立,且 X ~ 2 (n1), Y ~ 2 (n2 ),
则随机变量
F
X Y
/ n1 / n2
所服从的分布是自由度为 (n1, n2 )
~
F (2,
2)
作 业 17
P137: 4 P147: 4
1.6664.
解:因为
(n 1)
2
S
2
~ 2(n 1)
15S 2
2
~ 2(15)
P
S
2 2
1.6664
统计量及其分布教案
统计量及其分布教案教案标题:统计量及其分布教案一、教学目标:1. 理解统计量的概念并能正确区分常用的统计量。
2. 了解和掌握统计量的计算方法与应用。
3. 掌握统计量的分布特征及其在统计推断中的应用。
二、教学内容:1. 统计量的概念:a. 定义和目的:统计量用于对样本数据进行总结和描述,并从中推断总体特征。
b. 常用统计量的举例:均值、中位数、众数、方差等。
2. 统计量的计算方法:a. 样本均值的计算方法及应用。
b. 样本方差的计算方法及应用。
c. 样本标准差的计算方法及应用。
3. 统计量的分布特征:a. 正态分布的性质和应用。
b. t 分布的概念和特点。
c. 卡方分布的定义和用途。
4. 统计量在统计推断中的应用:a. 点估计和区间估计的概念和方法。
b. 假设检验的基本思想和步骤。
c. 统计量在假设检验中的作用和应用。
三、教学步骤:1. 导入部分:a. 引入统计量的概念及其在实际生活中的应用背景。
b. 师生互动讨论,学生提出对于统计量的初步理解和疑问。
2. 理论讲解:a. 通过例子和图表展示统计量的不同计算方法和应用。
b. 解答学生提出的问题,确保学生对统计量的概念和计算方法有清晰的理解。
3. 练习与实践:a. 基于实际数据,让学生进行统计量的计算和分析。
b. 学生小组合作讨论并展示各自的计算结果及分析。
c. 教师针对学生的计算过程和结果给予指导和评价。
4. 拓展和应用:a. 引导学生思考统计量在各个学科领域的应用情况。
b. 鼓励学生进行小研究,探索在实际问题中如何选择合适的统计量进行分析。
四、教学评价:1. 学生练习和实践的成果,包括计算的准确性和分析的合理性。
2. 学生对于统计量概念和计算方法的理解程度。
3. 学生对于统计量在实际问题中应用的思考和创造力。
五、教学资源:1. PowerPoint 或其他展示工具。
2. 统计软件或计算器。
3. 实际问题的数据材料。
六、教学延伸:1. 统计量的更高级应用:如方差分析、回归分析等。
统计学6
6 - 33
经济、管理类 基础课程
统计学
三、样本方差的分布
6 - 34
经济、管理类 基础课程
统计学
(一)样本方差的分布
设总体服从正态分布N 设总体服从正态分布N ~ (µ,σ2 ), X1,X2,… ,Xn为来自该正态总体的样本,则样本方差 为来自该正态总体的样本, s2 的分布为
(n −1)s
2
2. 3.
,则
Z=
X −µ
令 Y = Z 2 ,则 Y 服从自由度为1的χ2分布,即 服从自由度为1 分布,
σ
~ N(0,1)
Y ~ χ (1)
2
4.
当总体 X ~ N(µ,σ 2 ) ,从中抽取容量为n的样本,则 从中抽取容量为n的样本,
样 本 6 - 10
经济、管理类 基础课程
(三)抽样分布
(sampling distribution) distribution)
统计学
1. 样本统计量的概率分布 2. 是一种理论概率分布 3. 随机变量是 样本统计量
样本均值, 样本均值, 样本比例,样本方差等
4. 结果来自容量相同的所有可能样本 结果来自容量相同的所有可能样本 5. 提供了样本统计量长远我们稳定的信息,是进 行推断的理论基础,也是抽样推断科学性的重 要依据
总体分布、样本分布、抽样分布
三、渐进分布和近似分布
6-3
经济、管理类 基础课程
统计学
一、统计量
(一)统计量的概念 • 是样本的特征值 • 设X1 , X2 ,…, Xn是从总体中抽取的容量 为n的一个样本,如果由此样本构造一 个函数T 个函数T( X1 , X2 ,…, Xn ),不依赖于 任何未知参数,则称函数T 任何未知参数,则称函数T( X1 , X2 ,…, Xn )是一个统计量。
统计学第二章-统计量及其分布-重点难点归纳及答案解析
统计量及其分布习题知识点精析与应用一、填空题(将正确答案的序号填在括号内,共5小题,每小题2分,共10分)1、简单随机抽样样本均值X 的方差取决于 和_________,要使X 的标准差降低到原来的50%,则样本容量需要扩大到原来的 倍。
2、设1217,,,X X X 是总体(,4)N μ的样本,2S 是样本方差,若2()0.01P S a >=,则a =____________。
(注:20.99(17)33.4χ=, 20.995(17)35.7χ=, 20.99(16)32.0χ=, 20.995(16)34.2χ=)3、若(5)X t ,则2X 服从_______分布。
4、已知0.95(10,5) 4.74F =,则0.05(5,10)F 等于___________。
5、中心极限定理是说:如果总体存在有限的方差,那么,随着 的增加,不论这个总体变量的分布如何,抽样平均数的分布趋近于 。
,二、选择题(将正确答案的序号填在括号内,共5小题,每小题2分,共10分)1、中心极限定理可保证在大量观察下A 样本平均数趋近于总体平均数的趋势B 样本方差趋近于总体方差的趋势C 样本平均数分布趋近于正态分布的趋势D 样本比例趋近于总体比例的趋势2、设随机变量()(1)X t n n >,则21/Y X =服从21/Y X = 。
A 正态分布B 卡方分布C t 分布D F 分布3、根据抽样测定100名4岁男孩身体发育情况的资料,平均身高为95cm ,,标准差为0.4cm 。
至少以 的概率可确信4岁男孩平均身高在93.8cm 到96.2cm 之间。
A 68.27%B 90%C 95.45%D 99.73%4、某品牌袋装糖果重量的标准是(500±5)克。
为了检验该产品的重量是否符合标准,现从某日生产的这种糖果中随机抽查10袋,测得平均每袋重量为498克。
下列说法中错误的是( )A 、样本容量为10B 、抽样误差为2C 、样本平均每袋重量是统计量D 、498是估计值5、设总体均值为100,总体方差为25,在大样本情况下,无论总体的分布形式如何,样本平均数的分布都是服从或近似服从A (100/,25)N nB NC (100,25/)N nD (100,N 三、判断题1、所有可能样本平均数的方差等于总体方差。
统计量及其分布ppt课件
图5.1.1 SONY彩电彩色浓度分布图q
表5.1.1 各等级彩电的比例(%)
等级
I
|X-m|<5/3
II
III
5/3<|X-m|<10/3 10/3 <|X-m|<5
IV
|X-m|>5
美产 33.3 33.3 33.3
0
日产 68.3 27.1 4.3
0.3
抽样 :
5.1.2 样本
要了解总体的分布规律,在统计分析工作中,往往 是从总体中抽取一部分个体进行观测,这个过程称为抽 样。样本
x 344 344 x 347 347 x 351 351 x 355
x 355
由伯努里大数定律:
第25页
两点分布,只要 n 相当大,Fn(x)依概率收敛于F(x) 。
更深刻的结论:格里纹科定理
定理5.2.1 设 x1,x2,L,xn 是取自总体分布函数为F(x) 的样本F,n ( x ) 为其经验分布函数,当n 时,有
若以 p 表示这堆数中1的比例(不合格品率), 则该总体可由一个二点分布表示:
X01 P 1p p
比如:两个生产同类产品的工厂的产品 的总体分布:
例5.1.2 在二十世纪七十年代后期,美国消费者购买
日产SONY彩电的热情高于购买美产 SONY彩电,原因何在?
原因在于总体的差异上!
➢ 1979年4月17日日本《朝日新闻》刊登调查报 告指出N(m, (5/3)2),日产SONY彩电的彩色浓 度服从正态分布,而美产SONY彩电的彩色浓 度服从(m5 , m+5)上的均匀分布。
元件数 4 8 6 5 3 4 5 4
寿命范围 (192 216] (216 240] (240 264] (264 288] (288 312] (312 336] (336 360] (360 184]
统计量及其分布..
服从的分布可能是完全不知道的,或者知道其分布概
型,但是其中的某些参数是未知的。
例 5.0.1
某公司要采购一批产品,每件产品不
是合格品就是不合格品,但该批产品总有一 个不合格品率 p 。由此,若从该批产品中随 机抽取一件,用 X 表示这一件产品的不合格 数,不难看出 X 服从一个二点分布 b ( 1 , p ) , 但分布中的参数 p 是不知道的。一些问题:
表5.2.1 例5.2.2 的频数频率分布表 组序 分组区间 组中值 频数 频率 (%) 1 (147,157] 152 4 0.20 2 (157,167] 162 8 0.40 3 (167,177] 172 5 0.25 4 (177,187] 182 2 0.10 5 (187,197] 192 1 0.05 合计 20 1 累计频率 20 60 85 95 100
样;其中样本中所包含的个体数量称为样本容量。样本
中的个体称为样品。
5.1.2 样本
样本具有两重性:
• 一方面,由于样本是从总体中随机抽取的,抽 取前无法预知它们的数值,因此,样本是随机 变量,用大写字母 X1, X2, …, Xn 表示;
• 另一方面,样本在抽取以后经观测就有确定的 观测值,因此,样本又是一组数值。此时用小 写字母 x1, x2, …, xn 表示是恰当的。 在本书中,无论是样本还是其观测值,样本一般均用 x1, x2,… xn 表示,大家要注意从上下文中加以识别。
§5.1
总体与个体
在数理统计中,把研究对象的全体称为总体 (population)或母体,而把组成总体的每个单元
称为个体。
总体的三层含义:
• 研究对象的全体; • 数据; • 分布
(概率论与数理统计茆诗松)第5章统计量及其分布
统计量用于评估和 预测经济趋势例如 GDP、CPI等。
统计量用于研究经济 现象之间的相关性例 如通过回归分析探究 收入与消费的关系。
统计量用于风险评估 和决策制定例如在投 资组合优化中应用统 计量来降低风险。
统计量用于市场调研和 消费者行为分析例如通 过调查数据了解消费者 的购买意愿和偏好。
统计量用于描述大量粒子系统的宏观性质如温度、压强等。 在高能物理实验中统计量用于分析粒子碰撞数据以发现新粒子或研究基本粒子的相互作用。 在天体物理中统计量用于研究星系分布、宇宙射线等以揭示宇宙的演化历史和结构。 在凝聚态物理中统计量用于描述量子多体系统的性质如超导、量子相变等。
单击此处添加标题
性质:二项分布具有可加性即如果有两个独立的二项分布的随机变量X和Y那么 X+Y仍然服从二项分布。
单击此处添加标题
应用:二项分布在统计学、生物学、医学等领域有广泛的应用例如在遗传学中 研究基因的遗传规律在可靠性工程中研究设备的寿命等。
定义:泊松分布是一种离散概率分布描述了在单位时间内(或单位面积内)随机事件发生的次数。
适用范围:非参数检验适用于总体分布未知或已知分布不满足参数检验条件的情况能够更加灵活地处理 各种数据类型和分布。
添加标题
常见方法:常见的非参数检验方法包括符号检验、秩次检验、中位数检验等这些方法都是基于样本数据 本身的特性进行统计推断不需要对总体参数进行假设检验。
添加标题
优点与局限性:非参数检验具有适用范围广、灵活性高等优点但也存在一定的局限性如对于小样本数据 可能不太稳定等。因此在选择统计检验方法时需要根据具体情况进行综合考虑。
性
构造方法:利 用样本数据和 适当的数学方 法来构造有效
估计
应用:在统计 学、经济学、 社会学等领域
5.3统计量及其分布
例题1
现从离散均匀分布的总体中抽取容量为3的样本。 求有序统计量 x ( 1 ) , x ( 2 ) , x ( 3 ) 的分布列。 有序统计量既不相互 独立,又不同分布 X p 2 1/27 0 1/3 1 1/3 2 1/3
x(1)
p
0 19/27
1 7/27
2.单个次序统计量的分布
• • • • 定理: 设总体X的密度函数为p(x),分布函数为F(x) x1 , x 2 , L x n 为样本,则第k个次序统计量 x (k ) 的密度函数为
1.样本偏度
b3 γ1 = 2 3 b2
• 样本偏度反映了总体分布密度函数的对称性, • 当r1=0时,样本对称 • 当r1<0时,样本左尾长;当r1>0时,样本右尾长
2.样本峰度
b4 γ2 = 2 −3 b2
•样本峰度反映了总体分布密度曲线在其峰值 附近的陡峭程度。 •当r2<0时,曲线为平顶型; •当r2>0时,曲线为尖顶型 作业:268页16
2 i 2 i 2 i 2 i 2 2 i
2
2.性质
• 定理 设总体X具有二阶矩, x1 , x 2 , L x n 为总体 • 得到的样本,其中 E ( x) = µ Var ( x) = σ 2 < +∞
则E ( x) = µ
分析
2
Var ( x) =
σ
2
n
2
E (s ) = σ
2
2
1 E ( s ) = E[ ( xi − x) 2 ] ∑ n -1
四、次序统计量及其分布
• 1、定义 x • 设 x1 , x 2 ,L xn 是取自总体X的样本,(i ) 称为该样 本的第i个次序统计量。 • 最小次序统计量 最大次序统计量 从小到大排列后的有序样本
数理统计-第一章 统计量及其分布
太原理工大学 景英川
第一章 统计量及其分布
太原理工大学 景英川
第一章 统计量及其分布
但在实际中,在样本量特别大时 (如 n≥100 ),又常用分组样本来代替完 全样本,这时需要对样本进行分组整理, 它能简明扼要地表示样本,使人们能更 好地认识总体,这是分组样本的优点。
太原理工大学 景英川
第一章 统计量及其分布
则 Fn (x)是一非减右连续函数,且满足 Fn (-∞) =0, Fn (+ ∞)=1 由此可见, Fn (x)是一个分布函数,称 Fn (x)为经验分 布函数。 太原理工大学 景英川
第一章 统计量及其分布
1.6 某食品厂生产听装饮料,现从生产线上随机 抽取 5 听饮料,称得其净重为(单 位:克) 351 347 355 344 351 这是一个容量为 5 的样本,经排序可得有序样本:
而若第一次抽到的是合格品,则第二次抽到不合格品 的概率为
太原理工大学 景英川
第一章 统计量及其分布
显然,如此得到的样本不是简单随 机样本。但是,当 N 很大时,我们可 以看到上述二种情 形的概率都近似等 于 p。所以当 N 很大,而 n不大(一个 经验法则是 )时可以把 该样本近似地 看成简单随机样本。
从总体中抽取样本可以有不同的抽法,为了能 由样本对总体作出较可靠的推断,就希望 样本能很 好的代表总体。这就需要对抽样方法提出一些要 求,最常用的"简单随机抽样”有 如下二个要求: (1)样本具有随机性,即要求总体中每一个个体 都有同等机会被选入样本,这便意味着每一样品xi 与总体X有相同的分布。 (2)样本要有独立性,即要求样本中每一样品的 取值不影响其它样品的取值,这意 味着x1, x2, …,xn 相互独立。
第一章 统计量及其分布
6.2.常用统计量及抽样分布
1.
(n 1) S 2
2
~ 2 (n 1)
2. X 与 S 2 独立。 定理三 设 X 1 , X 2 , , X n 是来自正态总体N ( , 2 ) 的样本,X 是样
X , S 2 分别是样本均值和样本方差, 则有
X S/ n ~ t (n 1)
定理四 设 X 11,,X 22,,,X nn 与Y11,,Y22,,,,Ynn 是来自正态总体 N ((11,, 1212))和 N Y 是来自正态总体 N 和 设 X X , X 与Y Y 2 ) 和 N ( 2 , 2 ) 的样本,且这两个样本相互独立。设 n 1 1 n1 X i 1 X i , Y i 1 Yi 分别是这两个样本的均值; n2 n1 n 1 1 n1 2 2 2 S2 (Yi Y ) 2 S1 i1 ( X i X ) , n21 1 i 1 n1 1 分别是这两个样本的样本方差, 则有
则称随机变量
[(n1 n 2 ) / 2](n1 / n 2 ) n1 / 2 y ( n1 / 2 ) 1 , y0 ( y ) (n1 / 2)(n 2 / 2)[1 (n1 y / n 2 )]( n1 n2 ) / 2 0, 其它
其图形如右图所示
U / n1 F V / n2 服从自由度为 ((n1 ,,n 22)的2)) 服从自由度为 n1 n )的F 分布,记为 F ~ F n1 n
F (n1 , n 2 ) 分布的概率密度为
2 2 设 U ~ ( n1 ), V ~ (n 2 ), 且U , V 独立,
1 0.357 2.80
二、抽样分布定理
定理一 设 X 1 , X 2 , , X n 是来自正态总体N ( , 2 ) 的样本,X 是样 本,X 是样本均值,则有 X ~ N ( , 2 / n) 定理二 设 X 1 , X 2 , , X n 是来自正态总体N ( , 2 ) 的样本,X 是样 X , S 2 分别是样本均值和样本方差, 则有
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中心定位:将总体各间隔部分处于中间位置的单 位作为样本单位。
平均取样法:先按某有关标志对总体排序,并根 据抽样距离将总体各单位分为n个部分,在总 体各部分计算各单位排序标志值的平均数,比 较各单位标志值与平均数的大小,标志值最接 近该平均数的单位即为需要抽选的样本单位。
二、随机抽样的组织形式
二、随机抽样的组织形式
2 分层抽样
也称类型抽样或分类抽样,即将总体先按某一个重要标志 分层,再按比例从各层中随机抽取一定数目的单位组成 样本。
主要是为了提高调查精度, 适用于总体复杂,总体单位标志表现差异大的情况。 一般都用等比例分层抽样,就是按各层子总体的单位数占
总体单位总数的比例,分配每层应抽样的单位数。 但有时,各层子总体的单位数量相差极悬殊时,也可采用
一部分单元组成的全体。
样本中的每个(总体)单元称为样本单元。
样本所含单元的数目称为样本容量,用n表 示,n<50为小样本,n≥50为大样本。
一、抽样研究的基本概念
3 标志与标志表现 为说明总体单元在某一方面的特征而采用
的名称,称为标志,如“排污量”, “发芽率”
总体单元在某标志上的具体表现形式,称 为标志表现。有数量标志表现与品质标 志表现,前者为数值,称为标志值,后 者为字符描述。
简单随机抽样是在确定抽样框后,将总体单元编号,用 抽签、摇号或随机数码表等方法抽取样本单位的一种 组织形式。
简单随机抽样在理论上最符合随机原则,但它仅仅适用 于某种特征均匀分布的总体。当总体各单位的标志变 异大、分布不均匀时,简单随机抽样的效果就不理想。
另外,当总体单位数量很多时,一一编号是很困难的。
N
xi Pi
i 1
N i 1
xi
1 N
1 N
N
xi X
i 1
三、总体特征数与样本特征数
1.2 总体方差与总体标准差
定义:设总体含有N个单元,其标志值分
别为x1,x2,x3,……,XN,则总体方差 为:
2
1 N
N
(xi
i 1
x)2
总体标准差为:
1 N
N
(xi
i 1
x)2
三、总体特征数与样本特征数
三、总体特征数与样本特征数
总体与样本皆看做是随机变量,有一些重 要的特征数。
三、总体特征数与样本特征数
1 总体特征数
1.1 总体平均数
定义:设总体含有N个单元,其标志值分 别为x1,x2,x3,……,XN,总体平均数 为:
X 1 N
N
xi
i 1
P( xi) 1 , 所以,E ( )
N
一、抽样研究的基本概念
1 总体与总体单元 总体 指按照统计研究的目的而确定的同类事物或
现象的全体(研究对象)
把构成总体的每个基本单位称为总体单元(个 体),可以是自然单位,也可以是人为单位。
总体内所含的单元个数称为总体容量。用N表示, 分为有限总体和无限总体。
一、抽样研究的基本概念
2 样本与样本单元 样本 指从总体中按照预先给定的概率抽取
一、抽样研究的基本概念
4 抽样框 抽样时,把要研究的总体称为目的单元总
体。很多情况下,目的总体中总有一些 单位无法确定,实际调查中只能划定一 个尽可能接近总体的便于操作的框架, 作为抽样总体,即抽样框。
二、随机抽样的组织形式
为研究总体,统计推断中需要从总体中抽 取样本,在抽取样本时,自然希望样本 在尽可能大的程度上反映总体的特征, 这要求从总体中抽取样本是随机的。
但样本单位集中,明显地影响了样本单位在总体 内的均匀分布,与其他抽样方式比较,误差较 大,为了达到规定的精确度要求,往往需要多 抽一些群。
二、随机抽样的组织形式
5 阶段抽样 阶段抽样时先将总体分成若干大组,大组中再分
小组,还可以往下细分。 抽样时先抽大组,再从抽中的大组中抽取小组,
最后根据最终抽取的所有基本单位组成的样本, 进行调查。 阶段抽样区别于分类抽样,分类抽样是对各类进 行全面调查,在每一类中随机抽样。 也区别于整体抽样,整群抽样中群是随机抽样, 但对抽中的群,则要进行全面调查。阶段抽样 则在n个阶段都要进行随机抽取。
当通过试验后, ξi变为具体的样本值。
二、随机抽样的组织形式
不同的抽样组织形式,会有不同的抽样误 差,但抽样误差要求越小,则需要调查 的经费往往越大,应该在一定范围内选 择费用少的方案。
常用的抽样组织形式有:简单随机抽样、 分层抽样、等距抽样、整群抽样、阶段 抽样等。
ቤተ መጻሕፍቲ ባይዱ
二、随机抽样的组织形式
1 简单随机抽样
3 等距抽样 按有关标志排列的等距抽样中,第一个单位的确
定也有几种方法。
随机起点,对称等距抽样:排序后,首先对总体 各奇数部分的总体单位依其标志值大小由小到 大排队,而各偶数部分的总体单位则依其标志 值大小由大到小排队,然后在第一部分中随机 地确定第一个样本单位的序号,将其余各部分 与第一部分中随机确定的第一个样本单位对应 位次上的单位,定为样本单位。
所谓随机抽样就是要求每一个总体单元被 抽中为样本单元的概率相等。
二、随机抽样的组织形式
在随机抽样中,设抽中的单元标志值为ξ,总体ξ 是一个随机变量。
用重复抽样方式从总体中抽取n个单元组成样本, 设标志值为ξ1, ξ2, ξ3,…… ξn,则每个ξi均可 代表总体,即与ξ有相同的概率分布,并且ξ1, ξ2, ξ3,…… ξn相互独立。
1.3 总体变异系数 定义:总体变异系数为:
C.V . 100 %
两个总体的变异程度的比较可用变异系数,不能 单纯地用方差或标准差。
不等比例分层抽样,以保证单位数极少的子总体也能有 一定单位抽中。
二、随机抽样的组织形式
3 等距抽样 也称机械抽样或系统抽样,是先按某一标
志将总体所有单位排列顺序,然后再按 某种标志,取一定间隔顺序抽取单位, 组成样本。
分为:按无关标志排列 和 按有关标志排列。
二、随机抽样的组织形式
3 等距抽样 按有关标志排列的等距抽样中,第一个单位的确
二、随机抽样的组织形式
3 等距抽样
可以使样本单位在总体中分布比较均匀, 估计值的误差要小于简单随机抽样。
等距抽样操作简单易行,对总体结构有一 定了解时,可以提高抽样效率。
二、随机抽样的组织形式
4 整群抽样 将总体单位分成若干个群体,从中随机抽取部分
群体,由选中的群体所包含的全部单位组成样 本。
整群抽样组织方便,抽出的单位集中,调查方便, 费用也节省