统计学第六章抽样和抽样分布
概率论与数理统计(06)第6章 统计量及其抽样分布
σx =
σ
n
当样本容量足够 大时( 大时(n ≥ 30) , 样本均值的抽样 分布逐渐趋于正 态分布
6 - 11
µx = µ
xቤተ መጻሕፍቲ ባይዱ
x 的分布趋 于正态分布 的过程
6 - 12
6.4 正态总体 6.3.1 χ2分布 6.3.2 t 分布 6.3.3 F 分布
6 - 13
χ2 分布
第六章 样本与统计量
6.1引言 6.1引言
数理统计学: 运用概率论的基础知识,对要研究的随机现象进行 多次观察或试验,研究如何合理地获得数据资料, 建立有效的数学方法,根据所获得的数据资料,对 所关心的问题作出估计与检验。
6-1
§6.2总体与样本 6.2总体与样本
对某一问题的研究对象全体称为总体。 组成总体的某个基本单元,称为个体。 总体可以是具体事物的集合,如一批产品。 也可以是关于事物的度量数据集合,如长度测量。 总体可以包含有限个个体,也可以包含无限个个体。 有限总体在个体相当多的情况下,可以作为无限 总体进行研究。 总体中的个体,应当有共同的可观察的特征。该 特征与研究目的有关。
6 - 16
χ2分布
(图示) 图示)
n=1 n=4 n=10
n=20
6 - 17 不同容量样本的抽样分布
χ2
t 分布
6 - 18
t 分布
1. 高 塞 特 (W.S.Gosset) 于 1908 年 在 一 篇 以 (W. “Student”(学生)为笔名的论文中首次提出 Student”(学生)
X ~ N(µ,σ ) ,则
2
χ2分布
2. 3.
z=
X −µ
Y=z
抽样与抽样分布
抽样与抽样分布在统计学中,抽样是一种常用的数据收集方法,通过从总体中选择一部分样本来进行研究和分析。
抽样的目的是通过样本来推断总体的特征和性质。
在进行抽样时,我们需要了解抽样的方法和抽样分布的概念。
一、抽样方法1. 无偏抽样无偏抽样是指所有样本有相同被选中的机会。
这样可以确保样本的代表性,从而减小样本估计值和总体真值之间的误差。
常见的无偏抽样方法包括简单随机抽样、系统抽样和分层抽样等。
2. 有偏抽样有偏抽样是指样本的选择并不具有相等的机会。
这样可能导致样本的代表性不足,从而产生较大的估计误差。
有时,有偏抽样也可以用于特定的研究目的,但需要明确地说明和分析偏差带来的影响。
二、抽样分布1. 抽样分布的概念抽样分布是指统计量在各个可能样本上的取值分布。
统计量可以是样本均值、样本方差等。
抽样分布的性质对于进行统计推断和假设检验非常重要。
2. 样本均值的抽样分布样本均值的抽样分布在中心极限定理的条件下近似服从正态分布。
中心极限定理指出,当样本容量足够大时,无论总体分布如何,样本均值的抽样分布都会接近正态分布。
3. 样本比例的抽样分布样本比例的抽样分布在满足一些条件的情况下也近似服从正态分布。
这些条件包括样本容量足够大、总体比例接近0.5以及样本与总体之间的独立性等。
4. 样本方差的抽样分布样本方差的抽样分布不服从正态分布。
通常情况下,样本方差的抽样分布呈右偏态,即偏度大于0。
为了得到样本方差的抽样分布,可以使用抽样分布的近似分布,如卡方分布。
三、应用案例抽样与抽样分布的方法和理论在实际统计学中有广泛的应用。
以下是一些常见的应用案例:1. 调查研究在进行调查研究时,我们经常需要从总体中选择一部分样本进行问卷调查或面访。
通过利用抽样与抽样分布的方法,我们可以将样本的调查结果推广到总体中,从而得到总体的特征和性质。
2. 假设检验假设检验是统计学中常用的推断方法之一。
通过比较样本统计量与假设的总体参数值,我们可以判断假设的合理性。
6教育统计学第六章
n
(3)总体非正态分布条件下平均数的显著性检验
① 当 n≥30 时,尽管总体分布非正态,对于平均数的显 著性检验仍可用Z 检验。
Z
X
0(σ
已知)或
Z
X 0( σ 未知)
S
n
n
② 当 n<30 时,若总体分布非正态,对于平均数的显著 性检验不符合近似 Z 检验的条件,严格讲此时也不符合t 检验 的条件。
计算其置信区间:
X t SX (其X 中 t SX
2
2
)
SX
S n
小样本的情况
例如,从某小学二年级随机抽取12名学生,其阅读能 力得分为28、32、36、22、34、30、33、25、31、33、 29、26.试估计该校二年级阅读能力总体平均数95%和 99%的置信区间。
X 29.917 , S 4.100 , X 3.926
三、样本平均数与总体平均数离差统计量的形态
从正态总体中随机抽取样本容量为n的一切可 能样本平均数以总体平均数为中心呈正态分布。
当总体标准差已知时:
Z
X
X
X
n
当总体标准差未知时:
N (0,1)
总体标准差 的无偏估计量为
S (X X )2 n 1
S S X
X 2 ( X )2 / n
抽样分布是统计推断的理论依据。实际中只能抽取一个 随机样本根据一定的概率来推断总体的参数。即使是抽取一 切可能样本,计算出的某种统计量与总体相应参数的真值, 大多也是不相同的,这是由于抽样误差的缘故。抽样误差用 抽样分布的标准差来表示。因此,某种统计量在抽样分布上 的标准差称为该种统计量的标准误。
标准误越小,表明样本统计量与总体参数的值越接近, 样本对总体越有代表性,用样本统计量推断总体参数的可靠 度越大,所以标准误是统计推断可靠性的指标。
统计学第六章抽样推断
尖山一委…
尖山二委
居民一组
居民二
组
…
第六章 抽样推断
某外国公司在##进行 微波炉市场调查:
STAT
在商场的大门口
在微波炉柜台前
在市区街道旁边
在某个住宅小区
时间表抽样框
第六章 抽样推断
连续出产的产品总体 可以编制抽样框:均STAT 匀的出产时间、可以 预见到的产品总量.
连续到加油站加油的 汽车总体无法编制抽 样框:时间不定、总 量也无法确定.
抽样估计的特点
第六章 抽样推断
按随机原则抽取样本单位
目的是推断总体的数量特征
抽样推断的结果具有一定的可靠程度, 抽样误差可以事先计算并控制
抽样估计的应用
第六章 抽样推断
不可能进行全面调查时 不必要进行全面调查时 来不及进行全面调查时 对全面调查资料进行补充修正时
抽样调查研究
Sampling Study
P N nN N NN n
共n个
⒉ 不重复抽样的可能样本数目:
C N n N N 1 N n 1
第六章 抽样推断
第六章 抽样推断
STAT
★§1.1 抽样方案的设计 ★§1.2 简单随机抽样的抽样误差的测定
§1.3 简单随机抽样的抽样估计
第六章 抽样推断
§1.2 简单随机抽样的抽样误差的测定 STAT
n1 1{i n1E(xiX)2nn(E xX)2} 由E(于 xX)2D (x)D (i1 nxi)n 1 2i n1D (xi)n2
E(sn21)n11{n2nn2}
2
⒋ 样本成数:
pn1,qn0 1p nn
⒌ 样本单位是非标志的标准差:
第六章 抽样推断
统计学之抽样与抽样分布
的抽样分布
统计推断的过程
• 总体均值
m=?
• 从总体中抽取 • 样本容量为 n 的样本
• 用 作为m 的点估计
• 计算样本平均值
的抽样分布
的抽样分布是指所有可能的样本平均值 的概率分 布
的期望值
E( ) = = 总体平均值
的抽样分布
的标准差
•
有限总体
无限总体
• 当 n/N < .05时,可以将一个有限总体看作是无限
统计学之抽样与抽样分 布
2020年4月29日星期三
Chapter 7
抽样和抽样分布
本章主要内容
简单随机抽样 点估计 抽样分布 样本平均值 的抽样分布 样本比例 的抽样分布 抽样方法
•n = 100
•n = 30
统计推断
统计推断的目的是利用样本的信息推断总体的信息 总体是指感兴趣的所有元素的集合 样本是总体的一个子集 通过样本统计量对总体参数进行估计 只要抽样方法恰当,通过样本统计量可以对总体参数 进行很好的估计
也就是说,样本平均值在总体平均值+/-10分范围内的 概率为0.5036
•面积 = 2(.2518) = .5036
• 的抽样分布
•980 •990•1000
的抽样分布
的抽样分布是指所有可能的样本比例 的概率分布 的期望值
p = 总体比例
的抽样分布
的标准差 有限总体
无限总体
• 也称为样本比例的标准误
总体
•
称为有限总体校正因子.
• 也称为样本均值的标准误
的抽样分布
中心极限定理:只要样本容量足够大 (n > 30),不管总 体服从什么分布,样本平均值 都可以认为近似服从 正态分布。
统计学中抽样和抽样分布基础知识
样本均值的抽样分布
定义:样本均值的所有可能值的概率分布 样本均值的数学期望:对于简单随机样本时,样本均值的数学期望与总体均值相等 样本均值样本中具有感兴趣特征的个体个数/样本容量 样本比率的抽样分布:是样本比率的所有可能值的概率分布
样本比率的数学期望:样本比率的数学期望与总体比率相等 样本比率的标准差
有限总体:有限总体修正系数*无限总体样本比率的标准差 无限总体:根号下p(1-p)/n 样本比率的抽样分布的形态 当样本容量足够大,同时np≥5和n(1-p)大于等于5时,样本比率的抽样分布可以 用正态分布近似
统计学中抽样和抽样分布基础知识
抽样基本属于
抽样总体:抽取样本的总体 抽样框:用于抽选样本的个体清单 参数:总体的数字特征
抽样
从有限总体的抽样 建议采用概率抽样 简单随机样本:从容量为N的有限总体中抽取一个容量为n的样本,如果容量为n 的每一个可能的样本都以相等的概率被抽出,则称该样本为简单随机样本 无放回抽样和有放回抽样 无放回抽样:被抽取对象已经选入样本,不希望该对象被多次选入 有放回抽样:对已经出现过的随机数仍选入样本
点估计
样本统计量:为了估计总体参数,计算样本的特征 抽样总体和目标总体
目标总体是我们想要推断的总体 抽样总体是指实际抽取样本的总体 点估计的性质 无偏性:样本统计量是相应总体参数的无偏估计量 有效性:采用标准误差较小的点估计量,给出的估计值与总体参数更接近 一致性:大样本容量给出的点估计与总体均值更接近
其他抽样方法
分层随机抽样:总体中的个体首先被分成层,总体中的每一个体属于且仅属于某一 层,从每一层抽一个简单随机样本 整群抽样:总体中的个体首先被分成单个组,总体中的每一个个体属于且仅属于某 一群,有群为单位抽取一个简单随机样本 系统抽样:对容量很大的总体,第一个个体为随机抽样,总体个体排列时个体的随 机顺序 方便抽样:非概率抽样 判断抽样:对总体非常了解主观确定总体中认为最具代表性的个体组成样本
统计学 第6章 统计量及其抽样分布
1. 样本统计量的概率分布,是一种理论分布
2. 随机变量是样本统计量
3. 结果来自容量相同的所有可能样本 4. 提供了样本统计量长远而稳定的信息,是进行 推断的理论基础,也是抽样推断科学性的重要 依据
6 - 8 / 55
统计学
STATISTICS (第五版)
重要统计量
1.样本均值:
n 1 若X ~ N(, 2), X X i, n i 1
1 n 1 则E X EX i ,D X 2 n i 1 n 2.样本方差:
n 1 2 S2 ( X X ) i n 1 i 1
1 1 2 2 DX i 2 n n n i 1
X ~ (n)
2
6 - 13 / 55
统计学
STATISTICS (第五版)
2分布
(图示)
n=1 n=4 n=10
n=20
6 - 14 / 55
不同容量样本的抽样分布
2
统计学
STATISTICS (第五版)
2 分布:
定理:如果随机变量 X1, X 2, , X n 相互独立,且都服从 同一正态分布
6.1.1 6.1.2 6.1.3 6.1.4
6 - 4 / 55
统计学
STATISTICS (第五版)
统计量
(statistic)
1. 设 X1,X2,…,Xn 是从总体 X中抽取的容量为 n的一个样本,如果由此样本构造一个函 数 T(X1,X2,…,Xn) ,不依赖于任何未知参 数,则称函数 T(X1,X2,…,Xn) 是一个统计 量
6 - 2 / 55
统计学
STATISTICS (第五版)
第六章 统计量及其抽样分布
样本均值的抽样分布
样本均值的抽样分布
1. 容量相同的所有可能样本的样本均值的概率分 布
2. 一种理论概率分布 3. 进行推断总体总体均值的理论基础
样本均值的抽样分布
(例题分析)
【例】设一个总体,含有4个元素(个体) ,即总体单位 数N=4。4 个个体分别为x1=1、x2=2、x3=3 、x4=4 。 总体的均值、方差及分布如下
第 一
16个样本的均值(x)
个
第二个观察值
观 察值1 2
3
4
11
1.
20.
52. 0.
5
21
2.
25.
03. 5.
0
23
2.
30.
53. 0.
5
24
3.
35.
04. 5.
0
.3 P (X ) .2 .1 0
1.0 1.5 2.0 2.5 3.0 3.5 4.0 X
第六章 统计量及其抽样分布
抽样理论依据: 1、大数定律 (1)独立同分布大数定律:证明当N足够大时,平均数据有稳定性,为用样本平 均数估计总体平均数提供了理论依据。 (2)贝努力大数定律:证明当n足够大时,频率具有稳定性,为用频率代替概率 提供了理论依据 2、中心极限定律 (1)独立同分布中心极限定律:设从均值为u、方差为s2(有限)的任意一个总体 中抽取样本量为n的样本,但n充分大时,样本均值X的抽样分布近似服从均值为u, 方差为s2/n的正态分布。 (2)德莫佛-拉普拉斯中心极限定律:证明属性总体的样本数和样本方差,在n足 够大时,同样趋于正态分布。
(central limit theorem)
统计学课件第六章抽样调查PPT课件
特点
每个样本被选中的机会都 相等,样本的代表性相对 较好。
分层抽样
定义
先将总体按一定标准分成 若干层次或群,然后从各 层或群中按随机原则抽取 样本。
方法
分类抽样、比例抽样、类 型抽样。
特点
能够提高样本的代表性, 降低误差,减少资源浪费。
系统抽样
定义
先将总体中的所有个体按某种顺序排列,然后按 照固定的间隔或系统选取样本。
改进抽样方法
采用更科学的抽样方法和技术,如分层抽样、系统抽样等,以提 高样本的代表性。
提高样本代表性
在抽样过程中尽量减少非随机误差,如无回答、不完整数据等, 以提高样本对总体的代表性。
05 抽样调查的组织与实施
抽样调查的设计
确定调查目的
明确调查的目标和意图,为后 续的抽样设计提供指导。
确定调查对象
合理安排问题的顺序、布局和格式,以提高 问卷的易用性和回答率。
确定调查方式
选择合适的调查方式,如自填式、面访式等, 并确定数据收集的途径。
测试与修正
对问卷进行测试和修正,确保问卷的准确性 和可靠性。
调查的实施与质量控制
培训调查员
对调查员进行培训,确保他们了解调 查目的、问卷内容、调查方法等。
现场实施
将总体分成若干个群集或组,然后从每个 群集或组中抽取一定数量的样本,也称为 簇抽样或组抽样。
抽样调查的应用场景
01
02
03
04
市场调查
通过对目标市场的部分消费者 进行调查,了解市场需求、消 费者行为和产品反馈等信息。
社会调查
通过对一定范围内的社会成员 进行调查,了解社会现象、人 口状况和社会问题等信息。
统计学课件第六章抽样调查ppt课 件
贾俊平《统计学》第五版第6章_统计量及其抽样分布
6. 3. 3 F分布 定义6.5 设随机变量Y与Z相互独立,且Y与Z分别服从自 由度为m和n的 2 分布
Y ~ 2 (m)
Z ~ 2 (n)
(6. 5)
Y/m nY 则称 X Z/n mZ
X服从第一自由度为m,第二自由度为n的F分布,记为 F(m,n),简记为X~F(m,n) 。
1 ( X i X )2 n 1 i1
2 2 (n 1)S x (m 1)S y
n
Sy
2
1 m (Yi Y )2 m 1 i1
S xy
nm2
6 - 23
( X Y ) ( 1 2 ) mn ~ t (n m 2) (6. 4) S xy mn
6-3
统计学(第三版)
6. 1
统计量
6. 1 统计量
6.1.1 统计量的概念 统计量是样本的函数,它不依赖于任何未知参 数; 根据不同的研究目的,可构造不同的统计量; 利用构造的统计量,用样本性质推断总体的性 质; 统计量是统计推断的基础,在统计学中占据着 非常重要的地位。
6-5
统计学(第三版)
统计学(第三版)
6.3 由正态分布得到的几个重要分布
证明:
X 1 1 X , Y i Yi n i 1 m i 1
n m
Sx
2
1 n 1 m 2 2 (Xi X ) , Sy (Yi Y ) 2 n 1 i 1 m 1 i 1
2
(n 1) S x
但对于较小的 n, t分布与N(0,1) 分布相差很大.
6 - 20
统计学(第三版)
6.3 由正态分布得到的几个重要分布
第六章统计量及其抽样分布(统计学贾俊平)
2 分布, X ~ N ( 0 , 1 ) , Y ~ ( n ) 2. 定义6.4 设随机变量 X 其分布称为t分布, 且 X与Y 独立,则 t Y /n
记为t(n),其中n为自由度。
6.3.2
3. t分布的概率密度函数曲线
2. 定义6.5
设随机变量 Y与Z 相互独立,且 Y与Z 2 分别服从自由度为m和n的 分布,随机变量X
Y/ m nY 有如下表达式: X Z/ n mZ
则称X服从第一自由度为m,第二自由度为n的
~ F ( m , n ) F分布,记为F(m,n),简记为 X
6.3.3
3. F分布的概率密度函数曲线
平方和
n
i 1
X i2 服从自由度为n的 2 分布。
3. 自由度是统计学中常用的一个概念,可以解释 为独立变量的个数。
6.3.1
2
2
分布
X 4. 设 X~ N ( , ) ,则 Z ~N ( 0 , 1 )
1 ) 令 Y Z2,则 Y ~ 2( 2 ( n ) 分布的概率密度函数曲线为 5.
n X 10 9 . 9 10 P ( Z 1 ) P ( ) P ( Z 1 ) P (X 9 .9 ) 0 . 1 0 . 1 1 ( 1 ) 1 0 . 8413 0 . 1587 1 P ( Z 1 )
统计量概念的例题
, X , , X 【例6.1】设 X 是从某总体X中抽取的 1 2 n
一个样本,判断下列各量是否为统计量。
1 n (1 ) X Xi n i1
2 ( 3 ) [X E ( X )] i i 1 n
第六章 抽样分布及总体平均数的估计
• 对总体参数的一种看法 总体参数包括总体均值、比例、方差等 分析之前必需陈述
三 假设检验的基本原理
2、什么是假设检验?
1)概念 事先对总体参数或分布形式作出某种假设, 然后利用样本 信息来判断原假设是否成立。 2) 类型 参数假设检验 非参数假设检验 3)特点 采用逻辑上的反证法 依据统计上的小概率原理
二 总体平均数的估计
(3)区间估计(interval estimation)
根据估计量以一定可靠程度推断总体参数所在的区间 范围,用数轴上一段距离表示未知参数可能落入的范围, 虽不具体指出总体参数等于什么,但能指出未知总体参数 落入某一区间的概率有多大。
(4)置信区间(confidence interval)
一 抽样分布与平均数抽样分布
3、样本平均数与总体平均数离差的形态
(2)总体方差未知 总体正态,样本平均数与总体平均数的离差统 计量呈 t 分布; 总体非正态,但满足n>30这一条件,样本平均 数与总体平均数的离差统计量 近似t 分布。
t分布
t 分布(t-distribution)是统计分析中应用较多 的一种随机变量函数的分布,是统计学者高赛特 1908年以笔名“Student”发表的论文中推导出来 的一种分布,又叫学生氏分布。这种分布是一种 左右对称,峰态比较高狭,分布形状随样本容量 n-1的变化而变化的一组分布。
二 总体平均数的估计
4 总体方差σ2未知时,总体平均数μ的估计 用样本的无偏方差作为总体方差的估计值,样本 平均数的分布为t分布,应查t值表,包括以下两 种情况:
(1)总体的分布为正态时,可不管n值大小。 (2)总体分布为非正态,只有n>30,才能用概率对其样本 分布进行解释。
统计学简答题总结
统计学简答题总结第六章抽样与抽样分布6、1 解释总体分布、样本分布与抽样分布得含义(或三种不同性质得分布)总体分布:总体中各元素得观测值所形成得相对频数分布,称为总体分布。
样本分布:从总体中抽取一个容量为n得样本,由这n个观测值形成得相对频数分布,称为样本分布。
抽样分布:在重复选取样本量为n得样本时,由该样本统计量得所有可能取值形成得相对频数分布。
6、2 解释中心极限定理得含义从均值为μ、方差为σ 2 得总体中,抽取容量为n得随机样本,当n充分大时(通常要求n ≧30),样本均值得抽样分布近似服从均值为μ、方差为σ 2 /n 得正态分布。
6.3重复抽样与不重复抽样相比,抽样均值抽样分布得标准差有何不同?重复抽样:从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二个元素,直至抽取个元素为止。
不重复抽样:一个元素被抽中后不再放回总体,而就是从所剩元素中抽取第二个元素,直到抽取个元素为止。
样本均值得方差:重复抽样不重复抽样6.4样本均值得分布与总体分布得关系就是什么?样本均值与总体分布得关系:a无论就是重复还就是不重复抽样,样本均值得数学期望始终等于总体均值;b在重复抽样条件下,样本均值得方差为总体方差得1/n;在不重复抽样条件下,样本均值得方差为6.5样本方差与两个样本得方差比各服从什么分布?对于来自正态总体得简单随机样本,则比值得抽样分布服从自由度为得分布,即两个样本方差比得抽样分布,服从分子自由度为(),分母自由度为() 得F分布,即6、6 分布与F分布得图形各有什么特点?分布得性质特点:1.分布得变量值始终为正2.分布得形状取决于其自由度n得大小,通常为不对称得正偏分布,但随着自由度得增大逐渐趋于对称3.期望为E()=n,方差为D()=2n(n为自由度)4.可加性:若U与V为两个独立得服从χ2分布得随机变量,U~ (),V~ (),则U+V这一随机变量服从自由度为+得分布F分布图形得特点:1、它就是一种非对称分布;2、它有两个自由度,即n -1与m-1,相应得分布记为F( n –1, m-1), n –1通常称为分子自由度, m-1通常称为分母自由度;3、F分布就是一个以自由度n –1与m-1为参数得分布族,不同得自由度决定了F 分布得形状。
应用统计学第6章 抽样分布与参数估计
μx
6. 3抽样分布
多大是足够的大?
6. 3抽样分布
例子
假设总体的平均数μ = 8 且标准差σ = 3. 假 设选中容量n = 36随机样本。
样本平均数介于7.8和8.2之间的概率是多少?
第6章 6. 3抽样分布
例子
(续)
结论:
即使总体非正态分布, 中心极限定理可以应用 (n > 30)
6.2 抽样误差
样本统计量和对应的总体参数之间的差异,称之为抽 样误差。
抽样误差的产生是由于抽样的非全面性和随机性所引 起的,是偶然性误差。
非抽样误差
抽样框误差 系统性误差 测量误差 登记误差
6. 3抽样分布
6. 3抽样分布
6.3.1 样本均值的抽样分布
6. 3抽样分布
1.样本均值的均值
样)
6. 3抽样分布
p的抽样分布
近乎正态分布分布,如果:
n 5
P( ps)
抽样分布
.3
且
.2
.1
n(1 ) 5
0 0 . 2 .4 .6
p
81
μ 其中 p
π
且
π(1 π)
σp
n
(其中 π = 总体比例)
6. 3抽样分布
比例的Z值
使用公式将p标准化为Z值:
p
Z
σp
p (1 )
n
在判断样本中,我们得到预先选好的专家就主题 发表的意见。
6.1 抽样理由和抽样方法
样本类型:概率样本
在概率样本中, 样本中条目的选择基于已知的概率。
概率样本
简单 随机样本
系统样本
分层样本 群样本
6.1 抽样理由和抽样方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2021/3/4
统计学第六章抽样和抽样分布
4
一、总体与样本
▪ 把握两个问题: ▪ 1、总体和总体参数; ▪ 2、样本和样本统计量。
2021/3/4
统计学第六章抽样和抽样分布
5
1、总体与总体参数
(1)总体:指根据研究目的确定的所 要研究的同类事物的全体,是所要说 明其数量特征的研究对象。按所研究 标志性质不同,分为变量总体和属性 总体,分别研究总体的数量特征和品 质特征。 构成总体的个别事物(基本单元 )就是总体单位,也称个体。总体单 位的总数称为总体容量,记作N。
缺点:受主观影响易产生倾向性误差; 不能计算、控制误差,无法说明调查结果 的可靠程度。
抽样一般都是指概率抽样。
2021/3/4
统计学第六章抽样和抽样分布
15
2、重复抽样和非重复抽样
(1)重复抽样:又称重置抽样,是指从总体 中抽出一个样本单位,记录其标志值后,又将 其放回总体中继续参加下一轮单位的抽取。特 点是:第一,n个单位的样本是由n次试验的结 果构成的。第二,每次试验是独立的,即其试 验的结果与前次、后次的结果无关。第三,每 次试验是在相同条件下进行的,每个单位在多 次试验中选中的机会(概率)是相同的。在重复 试验中,样本可能的个数是 N n ,N为总体单位 数,n为样本容量。
2021/3/4
统计学第六章抽样和抽样分布
16
2、重复抽样和非重复抽样
(2)非重复抽样:又称为不重置抽样,即每次从
总体抽取一个单位,登记后不放回原总体,不参加下
一轮抽样。下一次继续从总体中余下的单位抽取样本
。特点是:第一,n个单位的样本由 n 次试验结果构成
统计学第六章抽样和抽样分 布
第六章 抽样与抽样分布
▪ 本章内容:抽样与抽样分布是推断统 计学中的最基本内容。学习本章了解 抽样的概率抽样方法;理解抽样分布 的概念和形式;掌握样本平均数、样 本比例的抽样分布;了解抽样组织方 式及其抽样分布。重点是样本平均数、 样本比例的抽样分布。
2021/3/4
统计学第六章抽样和抽样分布
2021/3/4
统计学第六章抽样和抽样分布
6
1、总体与总体参数
▪ (2)总体参数:指抽样估计中用来反映总体数量特征 的指标。研究目的确定后,总体确定,总体参数存在 但未知,需要估计。
▪ A、变量总体中各单位可以直接用数量表示,设各单 位变量值为:X1, X2,… XN,则总体参数有均值, 标准差或方差以及总体标志总量,即
2021/3/4
统计学第六章抽样和抽样分布
9
2、样本和样本统计量
(2)样本统计量:又称样本指标或估计量
,它是根据样本资料计算的、用以估计和推
断相应总体参数的综合指标,常用的有:
n
xi
x i1 (或
xf )
n f
s2
1n
n 1 i1
xi x 2 (或
2
xx
f ),s
s2
f 1
总体成数,如前面所学P=N1/ N, Q=N0/N,P+Q=1,则总体参数有均值, 标准差或方差以及具有某一属性的单位
总数,即:
__
X P
P(1P),NP
2021/3/4
统计学第六章抽样和抽样分布
8
2、样本和样本统计量
(1)样本:是从总体中抽出的部分单位 的集合,样本所包含的总体单位个数称为样本 容量,一般用n表示。把n≥30的样本称为大样
随机原则:就是排除主观意愿的干扰,使 总体的每一个单位都有一定的概率被抽选为样 本单位,每个单位能否入样是随机的。
概率抽样的基本组织方式有:简单随机抽 样、分层抽样、等距抽样和整群抽样。
2021/3/4
统计学第六章抽样和抽样分布
12
1、概率抽样与非概率抽样
▪ (2)概率抽样的特点:A、避免主观选 样带来的倾向性误差(系统偏差),使 样本资料能够估计、推断总体的数量特 征;B、因为抽样建立在概率和数理统 计基础上,可以计算和控制抽样误差, 能说明估计结果的可靠程度。
配额抽样:指抽选一群特定数目的满足特定 条件的被调查者的抽样方法,这群被调查者已知 对此研究主题有用,配额通常是年龄、收入、职 业等,使用配额抽样有助于降低非概率抽样方法 的偏差。
2021/3/4
统计学第六章抽样和抽样分布
14
1、概率抽样与非概率抽样(源自)非概率抽样:适用于:了解总体大致情况,总结经 验教训,进行大规模调查前的试点等,有 其优越性。
▪ 实际中,在不可能或不必要全面调查时, 常用概率抽样推断总体,还可以修正或 补充全面调查的结果。
2021/3/4
统计学第六章抽样和抽样分布
13
1、概率抽样与非概率抽样
(3)非概率抽样:又称非随机抽样,指从研 究目的出发,根据研究者的经验或判断,从总体 中有意识抽取若干个单位构成样本。有重点调查、 典型调查、配额抽样、方便抽样等 。
2
第六章 抽样与抽样分布
▪ 本章分三节: ▪ 第一节 抽样的基本概念 ▪ 第二节 抽样分布 ▪ 第三节 抽样组织方式及其抽样分
布
2021/3/4
统计学第六章抽样和抽样分布
3
第一节 抽样的基本概念
▪ 本节需要把握四个问题: ▪ 一、总体与样本; ▪ 二、抽样方法; ▪ 三、抽样框; ▪ 四、抽样误差。
本, n﹤30的样本称为小样本。对于既定总体,
由于抽取样本的方式方法不同,样本容量可大 可小,样本不确定。样本的内部构成与总体内 部构成总有一定差异,即样本不能完全代表总 体,用样本估计总体总存在代表性误差。
样本个数:又称样本可能数目,它是指 从一个总体中可能抽取多少个样本。样本个数 的多少与抽样方法有关。
x p n1 ,s p(1 p)
n
2021/3/4
统计学第六章抽样和抽样分布
10
二、抽样方法
▪ 把握以下问题: ▪ 1、概率抽样与非概率抽样; ▪ 2、重复抽样与不重复抽样。
2021/3/4
统计学第六章抽样和抽样分布
11
1、概率抽样与非概率抽样
(1)概率抽样:又称随机抽样,指按随机 原则抽取样本。
N
Xi
Xi1 (或
N
XF ) , 21N
F
Ni1
Xi X2(或
2
XX F )
F
2,NX
▪ 我们研究变量X值的全体,X的取值有一定分布,为一 个随机变量。
2021/3/4
统计学第六章抽样和抽样分布
7
1、总体与总体参数
▪ (2)总体参数:B、对于属性总体,
各单位不能用数值来表示,但可以计算