第4章抽样与抽样分布解读
田间试验与统计方法第四章理论分布和抽样分布
•
•表4.2 调查单位为5株的概率分布表(p=0.35,q=0.65)
•
•
受害株数(y)
•图4.1 棉株受危害的概率分布图 •(p=0.35,n=5)
•
•(•三) 小概率事件实际不可能性原理
•小概率事件----随机事件的概率表示随机事件在试验中出现的 可能性大小。随机事件的概率很小如,小于0.05或0.01或0.001
•小概率原理----统计学上,把小概率事件在一次试验中看成是 实际不可能发生的事件,称为小概率事件实际不可能性原理, 简称小概率原理。
估计的概率称为实验概率或统计概率,以
表示。
•此处P代表概率,P(A)代表事件A的概率,P(A)变化的范围为 0~1,即0≤P(A)≤1。
•
பைடு நூலகம்
(二) 概率的古典定义
概率的统计定义是在大量的试验中以频率的稳定性为基础上提出来的。
不需要做试验,根据随机事件本身的特性就可以确定事件出 现的概率,称为古典概率。
这就要求有一个能够刻划事件发生可能性大小的数量指标, 这指标应该是事件本身所固有的,且不随人的主观意志而改变 ,人们称之为概率(probability)。
事件A的概率记为P(A)。
•
•二、概率 (一)概率的统计定义
思考:投掷一枚硬币,出现正面的概
率是多大?(0表示反面,1表示正 面)反复做它,那么所有出现正面 的结果平均值是多少?
•
结果事前不可预言,呈偶然性、不确定性
•
例,种子发芽,抛硬币
•
随机现象或不确定性现象,有如下特点: (1)在一定的条件实现时,有多种可能的结果发生,事前人们不 能预言将出现哪种结果;对一次或少数几次观察或试验而言, 其结果呈现偶然性、不确定性; (2) 但在相同条件下进行大量重复试验时,其试验结果却呈现出 某种固有的特定的规律性——频率的稳定性,通常称之为随机 现象的统计规律性。
教育与心理统计学 第四章 抽样理论与参数估计考研笔记-精品
第四章抽样理论与参数估计第一节抽样理论的基本知识分层抽样,又叫分层随机抽样,这种抽样方法是按照总体已有的某些特征,承认总体中已有的差异,按差异将总体分为几个不同的部分,每一部分称为一个层,在每一个层中实行简单随机抽样。
它充分利用了总体的已知信息,因而是一种非常适用的抽样方法,其样本代表性及推论的精确性一般优于简单随机抽样。
分层的原则是层与层之间的变异越大越好,各层内的变异要小。
试述分层抽样的原则和方法?分层抽样是按照总体上已有的某些特征,将总体分成几个不同部分,在分别在每一部分中随机抽样。
分层的总的原则是:各层内的变异要小,而层与层之间的变异越大越好。
在具体操作中,没有一成不变的标准,研究人员可根据研究需要依照多个分层标准,视具体情况而定。
⑷两阶段随机抽样两阶段随机抽样首先将总体分成M个部分,每一部分叫做一个"集团"(或"群"),第一步从M个集团中随机抽取m个"集团”作为第一阶段样本,第二步是分别从所选取的m个"集团”中抽取个体(g构成第二阶段样本。
一般而言,两阶段抽样相对于简单随机抽样,标准误要大些,但是,两阶段抽样简便易行,节省经草贼,因而它是大规模调查研究中常被使用的抽样方法。
例如,如果我们要了解全国城市初中二年级学生的身高,第一步我们可以从全国几百个城市中随机抽取几十个城市作为第一阶段的样本。
第二步,在第一阶段随机抽取出来的城市中再随机抽取初中二年级的学生。
(二)非旃抽样非概率抽样不是完全按随机原则选取样本,有方便抽样、判断抽样。
方便抽样是由调查人员自由、方便地选择被调查者的非随机选样。
判断抽样是通过某些条件过滤,然后选择某些被调查者参与调查的抽样法。
当采取非概率抽样的方法选取样本时,研究者要说明采用此种方取样的原因以及对研究结果可能造成的影响。
第二节抽样分布[统计量分布、基本随机变量函数的分布]总体:又称母全体、全域,指具有某种特征的一类事物的全体。
《抽样和抽样分布》课件
$number {01}
目录
• 抽样调查的基本概念 • 抽样分布的基础知识 • 抽样分布的原理 • 抽样误差的评估 • 实际应用中的抽样技术 • 案例分析
01
抽样调查的基本概念
抽样的定义和意义
定义
抽样是从总体中选取一部分个体 进行研究的方法。
意义
通过对部分个体的研究,推断出 总体的特征,以节省时间和资源 。
适用场景
当总体中存在周期性变化 或某种明显的模式时,系 统抽样能够提高样本的代 表性。
注意事项
要确保抽样的间隔与总体 中的变化模式相匹配,以 避免偏差。
分层抽样
分层抽样
注意事项
将总体分成若干层,然后从每层中随 机抽取一定数量的样本。
要确保分层依据合理,且层内样本的 抽取方法一致,以避免层间和层内的 偏差。
抽样误差的衡量指标
抽样平均误差
抽样平均误差是衡量抽样误差大小的指标,它反映了样本统 计量与总体参数之间的平均偏差。
抽样变异系数
抽样变异系数是衡量非系统抽样误差的指标,它反映了由于 随机性引起的样本统计量与总体参数之间的偏差程度。
05
实际应用中的抽样技术系统ຫໍສະໝຸດ 样010203
系统抽样
按照某种规则,每隔一定 数量的个体进行抽样,直 到达到所需的样本量。
步骤 1. 明确研究目的和要求。 2. 确定总体和样本规模。
抽样的原则和步骤
01 02 03
3. 选择合适的抽样方法。 4. 制定详细的抽样计划。
5. 实施抽样调查。
02
抽样分布的基础知识
总体和样本
1 2
3
总体
研究对象的全体集合。
样本
统计学中抽样和抽样分布基础知识
样本均值的抽样分布
定义:样本均值的所有可能值的概率分布 样本均值的数学期望:对于简单随机样本时,样本均值的数学期望与总体均值相等 样本均值样本中具有感兴趣特征的个体个数/样本容量 样本比率的抽样分布:是样本比率的所有可能值的概率分布
样本比率的数学期望:样本比率的数学期望与总体比率相等 样本比率的标准差
有限总体:有限总体修正系数*无限总体样本比率的标准差 无限总体:根号下p(1-p)/n 样本比率的抽样分布的形态 当样本容量足够大,同时np≥5和n(1-p)大于等于5时,样本比率的抽样分布可以 用正态分布近似
统计学中抽样和抽样分布基础知识
抽样基本属于
抽样总体:抽取样本的总体 抽样框:用于抽选样本的个体清单 参数:总体的数字特征
抽样
从有限总体的抽样 建议采用概率抽样 简单随机样本:从容量为N的有限总体中抽取一个容量为n的样本,如果容量为n 的每一个可能的样本都以相等的概率被抽出,则称该样本为简单随机样本 无放回抽样和有放回抽样 无放回抽样:被抽取对象已经选入样本,不希望该对象被多次选入 有放回抽样:对已经出现过的随机数仍选入样本
点估计
样本统计量:为了估计总体参数,计算样本的特征 抽样总体和目标总体
目标总体是我们想要推断的总体 抽样总体是指实际抽取样本的总体 点估计的性质 无偏性:样本统计量是相应总体参数的无偏估计量 有效性:采用标准误差较小的点估计量,给出的估计值与总体参数更接近 一致性:大样本容量给出的点估计与总体均值更接近
其他抽样方法
分层随机抽样:总体中的个体首先被分成层,总体中的每一个体属于且仅属于某一 层,从每一层抽一个简单随机样本 整群抽样:总体中的个体首先被分成单个组,总体中的每一个个体属于且仅属于某 一群,有群为单位抽取一个简单随机样本 系统抽样:对容量很大的总体,第一个个体为随机抽样,总体个体排列时个体的随 机顺序 方便抽样:非概率抽样 判断抽样:对总体非常了解主观确定总体中认为最具代表性的个体组成样本
第四章 抽样
主讲人: 张建鹏 要内容
一、抽样的意义与作用 二、概率抽样的原理与程序 三、概率抽样方法 四、非概率抽样方法 五、样本规模与抽样误差
2
一、抽样的意义与作用
1. 相关概念 (1). 总体(population):构成它的所有元素的集合 N 表示。元素则是构成总体的基本的单元。 如:海医学生新闻获得方式调查 某市居民家庭生活状况 (2). 样本(sample):从总体中按一定方式抽取的一部 分元素的集合。用n表示 如:从海医1万名学生中,按一定方式抽取300人进行 调查,这300人构成该总体的一个样本。
28
分层(最佳)抽样法
定义:又称非比例抽样法,根据各层样本标准差 的大小确定各层的样本数目的方法。 计算公式为:
ni = n * ( N i Si / ∑ N i Si )
(1)
式中:ni ----- 各类型应抽选的样本单位数 n ----- 样本单位数 Ni ----- 各类型的调查单位数 Si ----- 各类型调查单位数的样本标准差
14
抽样设计的五个步骤 1)定义目标总体 (如上述案例中正在上学的 年龄在8-17岁的年轻人) 2)制定抽样框 (例如上述案例中的所有县及 县内的城市和城镇) 3)选择一种抽样技术 (如上述案例中的三段 分层概率抽样) 4)实际抽取样本 (样本容量,1000名;执行 抽样过程和对调查员指令) 5)评估样本质量 (如检测样本平均年龄是否 与全国普查数据一致或接近)
33
整群抽样与分层抽样的比较
特征 样本来源 抽样目的 划分原则 整群抽样 一个或几个 不提高成本而提 高抽样效率 分层抽样 所有层 不提高成本而提 高精度
群中的个体异质, 层中个体同质, 群间同质 层间异质
(04)第4章+抽样与抽样分布
4-6
统计学
STATISTICS
例题分析
♦ 假定我们刚刚已取了飞机制造所用的铆钉的25个 假定我们刚刚已取了飞机制造所用的铆钉的25个
一组的样本。检测铆钉的抗剪强度,破坏每个铆 钉所需的力是响应变量。对这组样本,可以求得 各种描述性的测量(均值、方差等)。 ♦ 然而,我们的感兴趣的是总体,并不是样本自身。 被测试的铆钉在测试时已被破坏,不能再用在飞 机的制造上,所以我们肯定不能测试所有的铆钉。 我们必须从这组样本或几组这样的样本来决定总 体的某些特性。 ♦ 因此,我们必须设法推断信息,也即基于样本的 观测结果作出总体的推断
(例题分析) 例题分析)
计算出各样本的均值,如下表。 计算出各样本的均值,如下表。并给出样本均 值的抽样分布
4 - 32
样本均值的抽样分布
统计学
STATISTICS
(例题分析) 例题分析)
【例】设一个总体,含有4个元素(个体) ,即总体单位 设一个总体,含有4个元素(个体) 数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4 。总 个个体分别为x 体的均值、 体的均值、方差及分布如下 总体分布
4 - 17
统计学
STATISTICS
分层抽样
分层抽样
统计学
STATISTICS
(stratified sampling) sampling)
♦ 分层抽样:在抽样之前先将总体的单位按 分层抽样:
某种特征或某种规则划分为若干层(类), 然后从不同的层中独立、随机地抽取一定 数量的单位组成一个样本,也称分类抽样 数量的单位组成一个样本,也称分类抽样 sampling) (stratified sampling) ♦ 在分层或分类时,应使层内各单位的差异 尽可能小,而使层与层之间的差异尽可能 大
第四章 抽样
• 3.设计抽样方案 • 4.制定抽样框
– 制定抽样框就是依据已经明确界定的总体范围,收集总体中全部抽样单位 的名单,并统一编号。
• 5.实际抽取样本 • 6.样本评估
– 样本评估就是对样本的质量和代表性进行检验,其目的是防止因样本的偏 差过大而导致的失误。
– 实际抽取样本就是在上述几个步骤的基础上,严格按照所选定的抽样方法, 从抽样框中抽取一个个的抽样单位,构成样本。
运用:
• 从侨光分校的7000位学生中,抽取100位学 生进行调查查,以研究学生对学校教学条 件的满意度。之前所做的普查表现出的对 学校教学条件的平均满意度为85%,现通 过抽查统计后的满意度为80%。 • 请说出本次抽查中的总体、样本、抽样元 素、抽样单位、抽样框、参数值、统计值、 抽样误差。
二、抽样的作用
• 分类抽样有着突出的优点: 第一,分类抽样能够克服简单随机抽样的缺 点,适用于总体内个体数目较多,结构较复杂, 内部差异较大的情况。 第二,精确度较高。 第三,便于对不同层面的问题进行探索。 第四,便于分工,使工作效率提高。 分类抽样的缺点是,如何分类通常由人们主 观判定,因此要求调查者具备较高的素质与能力, 并且必须事先对总体各单位的情况有较多的了解, 而它们在实际工作中有时难以完全实现,这就会 影响分类的科学性和精确性。
三、抽样的类型
• 概率抽样 • 非概率抽样
– 根据抽取对象的具体方式,人们把抽样分为许多不同 的类型。总的来说,各种抽样都可以归为概率抽样与 非概率抽样两大类。这是两种有着本质区别的抽样类 型。概率抽样是依据概率论的基本原理,按照随机原 则进行的抽样,因而它能够避免抽样过程中的人为误 差,保证样本的代表性;而非概率抽样则主要是依据 研究者的主观意愿、判断或是否方便等因素来抽取对 象,它不考虑抽样中的等概率原则,因而往往产生较 大的误差,难以保证样本的代表性。 概率抽样与非概率抽样又各自包括了许多具体类 型。分别适用于不同调查对象。联系实际认识概率抽 样的不同类型及其适用性是掌握抽样方法的关键。
第四章 抽样
(1)概率抽样:简单随机抽样、系统抽样、 分层抽样、整群抽样、多段抽样、PPS抽样、 户内抽样 (2)非概率抽样:偶遇抽样、判断抽样、 定额抽样、雪球抽样
二、概率抽样的原理与程序
(一)概率抽样的基本原理 1、总体的同质性与异质性 同质性:如果某个总体中的每一个成员在所有方 面都相同,那么,我们就说这个总体具有完全的 同质性。 否则,就存在不同程度的异质性。 同质性总体不需要抽样。 社会各种总体的异质性决定了严格的概率抽样的 必要性。
(二)系统抽样
3、系统抽样优缺点: <1>优点: ①易于实施,工作量少。 ②样本在总体中分布更为均匀,抽样误差 小于或至多等于简单随机抽样。
(二)系统抽样
<2>系统抽样缺点: ①系统抽样是以总体的随机排列为前提, 如果总体的排列出现有规律分布时,会使 系统抽样产生极大误差。 ②当总体内个体类别之间的数目悬殊过大 时,样本的代表性可能较差。 <3>适用范围:系统抽样最适用于同质性较 高的总体。
人们通常采用下列几组数字
有90%的样本统计值落在u〒1.65SE(样本 平均数的标准差)之间; 有95%的样本统计值落在u〒1.96SE之间; 有98%的样本统计值落在u〒2.33SE之间; 有99%的样本统计值落在u〒2.58SE之间。 其中,百分数表示置信水平,u〒1.65SE等 表示置信区间。
随机数表抽样举例
3、简单随机抽样方法
①当总体元素较少时:常用的办法类似于 抽签,即把总体中每一个单位都编号,将 这些号码写在一张张小纸条上,然后放入 一容器如纸盒、口袋中,搅拌均匀后,从 中任意抽取,直到抽够预定的样本数目。 这样,由抽中的号码所代表的元素组成就 是一个简单随机样本。
06 第四章 抽样
现在,我们决定从那里开始。可以闭着眼睛随便戳一个数字。也
(二)方法
A 总体元素较少时,类似于抽签方法。
B 总体元素较多时,随机数表法 小总体时 抓阄,抽签, 较大总体时 随机数字表.使用方法. 简单随机样本是概率抽样的理想类型,他从 随机样本的抽取到对总体进行推断有一套健全的规 则.但是当总体所含个体的数目太多时采用这种方法 不仅费事,工作繁杂,而且费用太高.此外当总体内分 类明显时,这种抽样无法按类别特征自动分配样本数, 若想保证样本的代表性,必须增大样本量,从而使整 个工作的工作量增大.
因此,我们在使用系统抽样方法时,一定要注意抽样
框的编制方法。
注意:
总体名单中,个体的排列具有某种次序上的先后、等级上的高低的情况
例如:我们从2000户家庭的社区,抽取50户进行消费状况的调查,
而2000户家庭的名单是按照家庭收入的多少按照由高到低排列的。
抽样间距=2000/50=40
如果两个人选择样本,一个人选择初始号码为3,另一个人选择初 始号码为38,那么肯定前者家庭平均收入远远高于后者。
随机数表中的数码
8432990906 1053873020 9427410041 0139022507 9361404310 1359866042 6321912683 9420582507 2725651176
选用的数码
0906
不选用的原因
后面四位数大于3000
四章样本及抽样分布
E(X )
1 n
n i 1
E( X i )
D(X )
1 n2
n
2
D(Xi )
i 1
n
X ~ N(, 2 )
n
X ~ N (0, 1) / n
iid
2.若X1,,X n ~ N (, 2 ), 则 (1) X与S 2相互独立; (2) 2
(n 1)S 2
2
~
2 (n 1);
(3)T X ~ t(n 1).
第四 章 样本及抽样分布
引言 run 随机样本 抽样分布
4.1 随机样本 一、总体与样本
1. 总体:研究对象旳全体。 一般指研究对象旳某项数量指标。 构成总体旳元素称为个体。
从本质上讲,总体就是所研究旳随机变量或 随机变量旳分布。
2. 样本:来自总体旳部分个体X1, … ,Xn 假如满足: (1)同分布性: Xi, i=1,…,n与总体同分布. (2)独立性: X1,… ,Xn 相互独立; 则称为容量为n 旳简朴随
P{ 1
1
P{ 1 F
F (n2 , n1)}
} 1
F F1 (n1, n2 )
P{ 1
1 }
得证!
F F1 (n1, n2 )
4.3 正态总体旳抽样分布定理
iid
1.若X1 ,,Xn ~ N(, 2 ), 则U
X / n
~
N(0, 1)
证明:
X
1 n
n i 1
Xi
是n 个独立旳正态随 机变量旳线性组合,故 服从正态分布
i 1
称为自由度为n的 2 分布.
2.2—分布旳密度函数f(y)曲线
f
(y)
统计学抽样与抽样分布
总体和参数(续)
通常所要估计的总体指标有
X
NX
一、 几个概念
(二)样本总体与样本指标
样本总体。简称样本(Sample),它是按照随机原则, 从总体中抽取的部分总体单位的集合体 。
样本容量:样本中所包含的个体的数量,一般用n表示。 在实际工作中,人们通常把n≥30的样本称为大样本, 而把n<30的样本称为小样本。
可以看成是一组随机变量。
设X1, X2,… , Xn是来自总体X 的一个样本,g(X1, X2,… , Xn) 是 X1, X2,… , Xn的一个函数。若 g 是连续函数,且 g 中不含任何未 知参数,则称 g(X1, X2,… , Xn) 是一个统计量。统计量也是一个随
机变量。
设x1, x2,… , xn 是相应于样本X1, X2,… , Xn的一个样本值, 则 称 g(x1, x2,… , xn ) 是统计量 g(X1, X2,… , Xn) 的一个观测值。
1 n 1
n i 1
(Xi
X )2
,
(4)样本比例:P =k/n,其中k为样本中某属性出现次数 s
概率抽样
(probability sampling)
u概率抽样也叫随机抽样,是指按随机原则抽取样本。
u随机原则,就是排除主观意识的干扰,使总体每一个单位都有
一定的概率被抽选为样本单位,每个单位能否入选是随机的。
u 特点
能有效地避免主观选样带来的倾向性误差(系统偏差), 使样本资料能够用于估计和推断总体的数量特征,而且 这种估计和推断得以建立在概率论和数理统计的科学理 论之上
可以计算和控制抽样误差,说明估计的可靠程度。
u作用:
在不可能或不必要进行全面调查时,利用概率抽样来推 断总体;
统计学之抽样与抽样分布培训课件
2021/3/5
第四章 抽样和抽样分布
36
3.3 不重置抽样下的抽样分布
例 解:已知 X, N 100 000人 ; 总体
n4=-4300 , n1 360
样本
为 样本了签解约某率地p区 31600万 9名0%农民工签 重置订抽样劳下动: 合同的签4约00率,随机抽取
F x2 F x1
X
F x1 XXP X x1 FPx 2x1PXX x 2x2
x1
x2
2021/3/5
第四章 抽样和抽样分布
4
2.1 离散型随机变量概率分布
在统计中,通常要求 X 落入[ x1 , x2 )的概率。 对于离散型随机变量:
Px1 X x2 F x2 F x1 F X x1 F X x2
x
n
( x11 … x1n )
x1
X
X1
( x21 … x2n )
x2
X3 X2
…
……
……
XN
(xm1 …xmn )
xm
E x X ; x X n
2021/3/5
第四章 抽样和抽样分布
25
3.2 重置抽样下的抽样分布
x
x X
X
n
X
2021/3/5
第四章 抽样和抽样分布
26
3.2 重置抽样下的抽样分布 样本平均数的分布: 1. 样本平均数的期望(平均数)
x2
3. Pf xx1 — XX 的x密2 度 函 数f xdx
x1
2021/3/5
第四章 抽样和抽样分布
9
2.2 连续型随机变量概率分布
4抽样与抽样分布
抽样方法-概率抽样
根据已知的概率选取样本 简单随机抽样:完全随机抽取样本; 分层抽样:总体分“层”,在每一层内进行抽样; 整群抽样:将总体划分为若干群,将一组被调查者
(群)作为一个抽样单位。(群内的个体存在差异, 理想情况是每个群都是总体的一个缩影) 等距抽样:在样本框中,每隔一定距离抽选一个被调 查者。
f (x)
1
(x)2
e , 2 2
2
x
记为 X ~ N (, 2 )
最常见的连续型随机变量的概率分布
标准正态分布: 0, 2 1
Z X
标准正态分布
标准正态分布的计算
(z) 1 (z)
( Z 1.645) 0.90
P(a Z b) (b) (a) ( Z 1.96) 0.95
本快速准确的预测选举,误差在2%之内。
抽样的基本概念
抽样调查,按照随机原则从全部研究对象中抽 取一部分单位进行调查,并以调查结果对总体 数量特征作出具有一定可靠程度的估计与推断, 从而认识总体的一种统计方法。
随机原则:指样本单位的抽取不受主观因素及 其他系统性因素的影响,每个总体单位都有均 等的被抽中机会。
随机原则的实现
抽签法,是将总体中每个单位的编号写在外形 完全一致的签上,将其搅拌均匀,从中任意抽 选,签上的号码所对应的单位就是样本单位。
随机数表法:将总体中每个单位编上号码,然 后使用随机数表,查出所要抽取的调查单位。
计算机模拟法:是将随机数字编制为程序存储 在计算机中,需要时将总体中各单位编上号码, 启用随机数字发生器输出随机数字。
4 统计抽样与抽样分布
抽样的基本概念 抽样方法 抽样分布的概念 样本均值的抽样分布
统计学之抽样与抽样分布
正确答案: d. n/N > 0.05
8. 从一个均匀分布的总体中抽取一个样本容量为45的样本, 从什么分布?
a. 指数分布 b. 正态分布 c. 均匀分布 d. 无法判断
正确答案: b. 正态分布
考察所有900个申请者
• 考试成绩
• 总体平均成绩
xi 990
900
• 总体标准差
(xi )2 80 900
考察所有900个申请者
• 无相同工作经验的申请者比例
• 总体比例
p 648 .72 900
使用随机数表随机选择30个申请者作为样本进行研 究,从书上随机数表第三列开始
统计学之抽样与抽样分 布
2021年7月19日星期一
Chapter 7
抽样和抽样分布
本章主要内容
简单随机抽样 点估计 抽样分布
样本平均值x 的抽样分布 样本比例 p 的抽样分布
抽样方法
n = 100
n = 30
统计推断
统计推断的目的是利用样本的信息推断总体的信息 总体是指感兴趣的所有元素的集合 样本是总体的一个子集 通过样本统计量对总体参数进行估计 只要抽样方法恰当,通过样本统计量可以对总体参 数进行很好的估计
点估计
• x 作为 的点估计值 x xi 29,910 997
30 30
• s 作为 的点估计值
s
(xi x )2 163,996 75.2
29
29
• p 作为p 的点估计值
p 20 30 .68
值得注意的是,不同的随机数会导致不同的抽样,也就会 数的不同的点估计值
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
某企业有职工5000名,现要随机抽取100人进行家庭收入水平调查。
抽取方法:按与研究目的无直接关系的姓名笔划对总体进行排
列,把总体划分为K=5000/100=50个相等的间隔,在第1至第50 人中随机抽取一名,如抽到第10名,后面间隔依次抽取第60, 110,160,210,…直到4960为止,总共抽取50同名职工组成一 个抽样总体。
等距抽样的优点:(1)能保证被抽取到的样本单位在全及总体中均 匀分布;(2)简化抽样过程。 等距抽样应注意:要避免抽样间隔或样本距离和现象本身的节奏性或 循环周期相重合。
天津城市建设学院 经济与管理学院
应用统计学
13
Thinking a question!
一个单位的职工500人,其中不到35岁的有125人,35到49岁的有280人,50岁 以上的有95人。为了了解这个单位职工与身体状况有关的某项指标,要从中 抽取一个容量为100的样本。由于职工年龄与这项指标有关,试问:应用什么 方法抽取?能在500人中任意取100个吗?能将100个份额均分到这三部分中吗?
天津城市建设学院 经济与管理学院
应用统计学
9
简单随机抽样Simple random sampling
有限总体的随机抽样:假设总体容量为N(有限),样本容量为n(n<
N),如果所有容量为n的样本都有相同的概率可以从总体中被抽取到,称此 方法为有限总体的简单随机抽样。
简单随机抽样
方法:每个样本单位被抽中的概率相等,样本的每个单位 完全独立,彼此间无一定的关联性和排斥性。 抽取样本的方法:有放回抽样和无放回抽样。 适合:总体内部差异不是很大,规模也不大的情况 。
4
抽样问题的提出
总体
样
样本统计量
本
例如:样本均值、
比例、方差
天津城市建设学院 经济与管理学院
应用统计学
5
抽样推断
抽样推断是按随机原则从全部研究对象中抽取部分单位进行观察,并根据样 本的实际数据对总体的数量特征作出具有一定可靠程度的估计和判断。
无法通过全面调查了解全部现象
误差可以事先计算 并加以控制
抽样具体作法
①抽签法:将总体的全部单位逐一作签,搅拌均匀后进行抽取。 ②随机数字表法。将总体所有单位编号,然后从随机数字表 中一个随机起点(任一排或一列),开始从左向右或从右向左、 向上或向下抽取,直到达到所需的样本容量为止。
天津城市建设学院 经济与管理学院
应用统计学
10
简单随机抽样Simple random sampling
1
简单易行
2 符合调查目的和特殊需要 3 适用于总体的构成单位极
不相同而样本数很小
天津旅游市 场状况进行
调查
4 设计调查者对总体特征相当了解
天津城市建设学院 经济与管理学院
应用统计学
8
第四章 抽样与抽样分布
抽样与 抽样分布
抽样的概念 随机抽样方法 抽样分布
几种与正态分布有关的概率分布 几种统计量的概率分布
······
· ·· ··
编号的方法
➢一种是利用原有的顺序或编号 。如学生的注册名单, 或者是从生产流水线上下来的、有编号的产品等。 ➢对所研究的总体已有所了解,则可用已知的相关变量对 抽样框中的单位进行编号。
天津城市建设学院 经济与管理学院
应用统计学
12
系统抽样(Systematic sampling)
没有必要进行全面调查
部分推断 整体
运用概率 估计方法
既节省大量人力物力,又能反映总体情况
推断建立在随机取 样的基础上
天津城市建设学院 经济与管理学院
应用统计学
6
关于抽样的几个概念
全及总体(Population):调查研究的事物或现象的全体 个体(Item unit):组成总体的每个元素 样本(Sample):从总体中所抽取的部分个体 样本容量(Sample size):样本中所含个体的数量
样本平均数 X;
样本比率 p; 样本方差 S 2 样本标准差 S
总体平均数 ;
总体
总体比率 p;
总体方差 2
总体标准差
样
本
天津城市建设学院 经济与管理学院
应用统计学
7
判断抽样(Judgment sampling)
判断抽样又称“立意抽样”,是指根据调查人员的主观经验从总体样本
中选择那些被判断为最能代表总体的单位作样本的抽样方法。
把总体视为一个随机变量 X,其概率密度函数为 f(x),X1, X 2 ,
的样本。当 X1, X2 , X n 这n个随机变量满足: X1, X2 , X n 与总体有相同的概率分布; X1, X 2 , X n 相互独立的。
则称 X1, X 2 , X n为无限总体 X的简单随机样本,简称样本。
几种与正态分布有关的概率分布 几种统计量的概率分布
天津城市建设学院 经济与管理学院
应用统计学
3
推断统计学ential Statistics
了解世界人口的智商 灯泡等产品的合格率
生产线上的产品
天津城市建设学院 经济与管理学院
研究对象庞大 毁坏性试验 无限总体
抽样Sampling
应用统计学
为了使样本更充分地反映总体的情
考察对象的特点
况,常将总体分成几个部分,然后
是由具有明显差 异的几部分组成!
?
按照各部分所占的比例进行抽样, 这种抽样叫做“分层抽样”,其中
所分成的各部分叫做“层”。
天津城市建设学院 经济与管理学院
应用统计学
14
分层抽样( stratified sampling)
应用统计学 Applied Statistics
经济与管理学院
2020年11月17日
教学内容
1. 导论(2)
2. 统计调查与统计资料整理(4)
3. 统计数字描述(6)
4. 抽样与抽样分布(6)
5. 参数估计(8)
天津城市建设学院 经济与管理学院
应用统计学
2
第四章 抽样与抽样分布
抽样与 抽样分布
抽样的概念 随机抽样方法 抽样分布
Xn为取自 X
联合概率密度
n
( g x1,x2, xn)=(f x1) (f x2) (f xn)= (f xi) i1
天津城市建设学院 经济与管理学院
应用统计学
11
系统抽样(Systematic sampling)
系统抽样
亦称为等距抽样或者机械抽样。 方法:抽样框中的N个单位被分成k个系统,k等于抽样框 的容量N除以所需的样本容量n,在抽样框中前面的k个个 体或单位中随机抽出第一个样本单位,然后,可在其后 的每隔k个单位抽取样本中其余的部分。