2012年统计学第8章抽样调查理论与方法
统计学名词解释整理
第一章:绪论第一节统计的产生与发展1.统计—总括地计算;对某一现象有关的数据进行搜集、整理、计算和分析等;统计学概括地说统计就是用数字作为语言表述事实。
它有三层含义即:统计资料、统计工作、统计学2统计资料是反映一定社会经济现象或科学技术内容的统计数字和相联系的文字分析报告。
3统计工作是在一定理论指导下,采用适宜的科学方法搜集、处理统计资料的一系列调查研究过程。
3统计学是研究如何测定、收集、整理、归纳和分析反映客观现象总体数量的数据,以便给出正确认识的方法论科学。
其目的就是探索数据内在的数量规律性(为什么?)。
P8三者之间的关系:统计工作和统计资料是过程与成果的关系;统计工作和统计学是实践与理论的关系,理论源于实践,理论又高于实践,反过来又指导实践。
统计学是统计工作的经验概括和总结,是系统化了的知识体系。
第二节统计的基本问题1.统计的作用认识世界的有力武器是治国和管理的重要手段是科学研究的有效工具P42.统计的特点数量性总体性(综合性)具体性3.统计工作过程统计设计→统计调查→统计整理→统计分析4、统计设计就是根据统计活动的目的,结合研究对象的性质、特点,对统计范围、统计指标、分类目录、资料搜集整理方法、分析要求及有关组织工作等方面所作出的整体规划。
5、统计调查就是根据统计活动的目的所确定的统计指标,把研究对象中各总体单位的某些必须了解的特征记录下来。
6、统计整理就是根据统计设计的要求,将调查资料进行审核、分组、汇总、编制统计表等科学加工处理的过程,以便清晰地反映研究总体的综合特征。
7、统计分析就是根据统计研究的任务,以统计数据为基础,结合具体情况,运用静态和动态分析方法进行研究,肯定成绩,发现问题,找出原因,根据事物的本质及其规律性,提出解决问题的方法,更好地为社会主义现代化建设服务。
第三节统计学的若干基本概念1、总体:指在某种共性的基础上由许多个别事物结合起来的整体。
简言之总体是同质个体所组成的整体。
抽样理论与方法(统计学专业)
统计学群抽样 从总体中随机抽取一些小群体,将小群体的所有元素构成样本. 对小群体的抽取可采用简单随机抽样、系统抽样、分层抽样的方法。 优点: 1。简化抽样过程 2。降低收集资料的费用 3。扩大抽样范围 缺点:代表性比较差
统计学专业硕士课
1.1.2 概率抽样
多阶段抽样 多级抽样或分段抽样,按照抽样元素的隶属关系或 层次关系,把抽样过程分为几个阶段进行。 步骤: 1。以大群为单位编制抽样框 2。抽取若干大群 3。以小群为单位给每个大群编制抽样框 4。分别从每个大群中抽取小群 5。根据需要重复3、4步骤 6。得到基本元素,构成研究样本 优点:方便易行
统计学专业硕士课
1.1.2 概率抽样
简单随机抽样 单纯随机抽样:按照等概率原则直接从含有N个元素的总 体中随机抽取n个元素组成样本(N>n)。 常用的方法:抽签、随机数字表
优点:可能产生代表性样本 缺点:不容易做 编号难 必须能够接触到被选中的个体 成分比例难
统计学专业硕士课
1.1.2 概率抽样
统计学专业硕士课
1.1.1. 非概率抽样
采用判断抽样法应注意的问题:
一要选好专家,二要应极力避免挑选极端情况的样本,“多数型”、“平 均型” 两种具体做法 专家判断选择样本 : 平均型 统计判断选择样本: 多数型
利用调查总体的全面统计资料,按照一定的标准选择样本
统计学专业硕士课
1.1.1. 非概率抽样
随机抽出 样本,客 观性强
不能计算 和判断抽 样误差
只能定期 采用
统计学专业硕士课
1.1.1. 非概率抽样
非随机抽样的含义、应用范围 (一)非随机抽样的含义 它是在不确定总体中,按照非随机原则选取样本,并用这部分样本指标 的调查结果,来判断总体指标的一种抽样类型。 (二)非随机抽样的范围 1.当对调查的总体不够清楚,或者太复杂,不适于采取随机抽样时,那 么,就需要用非随机抽样来抽出样本; 2.适用于经常性的调查和方便灵活的调查。
统计学 第八章 抽样调查
20
一、重复(置)抽样分布
样本日平均工资 频数 1 2 3 4 5 4 频率 1/25 2/25 3/25 4/25 5/25 4/25
2.抽样平均数的标准差又称为抽样平均误差或抽 样标准误差,重复抽样的抽样平均误差等于总体标 准差除以样本单位数的平方根。即:
(X )
2 ( X X )
M
2 ( X )
M
n
2
n
32 4元 2
24
样本平均数的分布与总体分布的比较
总体分布
% 20
样本平均数的分布
X
n
修正因子
(
N 1
)
n
(1
N
)
30
二、不重复(置)抽样分布
(二)抽样成数的分布
E ( p) P
XP P
P(1 P) N n ( ) P ( ) E pp n N 1 P(1 P) n (1 ) n N
31
例8-7:要估计某地区10000名适龄儿童的入学率,
总体容量N=10000 样本单位数n=100 样本均值(平均耐用时间) x=1055小
时,样本成数(合格率) p=91%
依据样本统计量可以对总体参数进行估 计(估计方法将在第三节介绍)。
10
五、样本统计量的计算 公式
•样本均值 :
在样本资料未分组的情况下:
《统计学》习题集
第一章总论一、判断题:1、社会经济统计的研究对象是社会经济现象总体的各个方面。
2、在统计调查过程中所采用的大量观察法,是必须对研究对象的所有单位进行调查。
3、在全国工业普查中,全国工业企业数是统计总体,每个工业企业是总体单位。
4、总体单位是标志的承担者,标志是依附于总体单位的。
5、当对品质标志的标志表现所对应的单位进行总计时就形成统计指标。
6、因为统计指标都是用数值表示的,所以数量标志就是统计指标。
7、统计指标及其数值可以作为总体。
8、所有的统计指标和可变的数量标志都是变量。
二、填空题:1、“统计”一词的含义是、和。
它们之间的关系是统计工作的成果,和统计工作是理论和实践的关系。
2、统计学的研究对象是。
3、标志是说明特征的,分标志和品质标志两种,前者的具体表现是,后者的具体表现是。
4、当我们要研究工业企业生产经营状况时,全部工业企业就构成,而每一个工业企业则是。
5、工人的年龄、工资、工龄属于标志,而工人的性别、民族、工种属于标志。
6、设备台数、工人人数属于变量,而身高、年龄、体重属于变量。
7、统计研究的基本方法是、、综合指标法。
8、要了解某一个企业的产品生产情况,总体是,总体单位是。
9、性别是标志,标志表现则具体为。
10、在人口总体中,总体单位是,“文化程度”是总体单位的标志。
三、单项选择题:1、统计总体的基本特征表现为:()A、同质性、广泛性、社会性B、同质性、大量性、变异性C、同质性、综合性、大量性2、研究某市工业企业生产设备使用状况,那么,统计总体为( )A、该市全部工业企业B、该市每一个工业企业C、该市全部工业企业每一台设备D、该市工业企业的全部生产设备3、某组五名学生的考试得分分别为:60、70、80、85、90,这五个数字是:( )A、指标B、标志C、变量值D、变量4、要了解某班40名学生的学习情况,则总体单位是:( )A、40个学生B、每一个学生的成绩C、每一个学生D、40个学生的学习成绩5、数量指标的表现形式为:( )A、相对数B、绝对数C、平均数6、某学生某门课考试成绩为80分,则成绩是:( )A、品质标志B、变量C、变量值D、标志值7、某店有50名职工,把他们的工资加起来除以50,这是:( )A、对50个变量求平均B、对50个变量值求平均C、对50个标志求平均D、对50个指标求平均8、某市全部商店作为总体,每一个商店为总体单位,则该市全部商品零售额是:( )A、品质标志B、质量指标C、数量指标D、变量值9、了解某地区工业企业职工情况,下面哪个是统计指标()A、该地区所有职工的工资水平B、该地区工业企业职工的文化程度C、该地区工业企业职工的工资总额D、该地区职工所从事的工种10、统计工作的过程不包括()A、统计调查B、统计分布C、统计整理D、统计分析四、多项选择题:1、要研究某局所属30个企业职工的工资水平,则:( )A、总体是某局B、总体是某局所属30个企业C、总体是30个企业全部职工D、总体是30个企业全部职工的工资E、总体单位是每一个企业F、总体单位是每一名职工2、下列指标中哪些是质量指标:( )A、工人劳动生产率B、设备利用率C、新产品数量D、单位产品工时消耗量E、废品量F、利润额3、下列变量中哪些是连续变量:( )A、身高B、人数C、体重D、年龄E、设备台数F、企业数4、以某市工业企业为总体则下列各项中哪些是指标:( )A、某市某厂职工人数B、全市工业企业总产值C、全市工业企业职工平均工资D、全市工业企业数5、要了解某地区全部成年人口的就业情况,那么()A、全部成年人是研究的总体B、成年人口总数是统计指标C、成年人口变业率是统计标志D、“职业”是每个人的特征,是数量标志E、某人职业是“教师”,这里的“教师”是标志表现6、国家统计系统的功能或统计的职能是()A、信息职能B、咨询职能C、监督职能D、决策职能E、协调职能7、在工业普查中()A、工业企业总数是统计总体B、每一个工业企业是总体单位C、固定资产总额是统计指标D、机器台数是连续变量E、职工人数是离散变量8、下列各项中属于统计指标的有()A、2009年全国人均总产值B、某台机床使用年限C、某市年供水量D、某地区原煤生产量E、某学员平均成绩第二章统计设计和统计调查一、判断题:1、全面调查和非全面调查是根据调查结果所得的资料是否全面来划分的。
2012年统计学第8章抽样调查理论与方法
8-26
一、估计总体均值时样本容量的确定
重复抽样时
1. 估计总体均值时样本容量n为 允许误差
n x
(z 2 )2 2
2
x
其中: x
z 2
n
2. 可见,样本容量
✓ 与总体方差成正比 ✓ 与允许误差成反比 ✓ 与置信度成正比
《统计学》第8章抽样调查理论与方法
8-27
不重复抽样时:
n x
NZ2 / 2 2
X
1 N
N i 1
Xi
N
X Xi N X
i 1
总体比例 总体方差 标准差
P N1 ,Q N0 N N1 1 P N NN
2
1 N
N
(Xi X )2
i 1
1 N
N
( Xi X )2
i 1
《统计学》第8章抽样调查理论与方法
8-9
统计量:是根据样本的n个单元的变量值计 算出来一个量,也叫估计量
解:Q N 15000 n 150
p 147 98% 150
p
p(1 p) n
0.98 (1 0.98) 1.14% 150
若按不重复抽样方式:
p
p(1 p) (1 n ) 0.98 (1 0.98) (1 150 ) 1.1374%
n
N
150
15000
《统计学》第8章抽样调查理论与方法
8-24
8.5.1影响样本容量确定的主要因素
总体被研究标志的变异程度 调查者对推断精确度的要求 抽样调查的方式和方法 人力、物力和财力的允许条件
《统计学》第8章抽样调查理论与方法
8-25
8.5.2 样本容量的确定
一、估计总体均值时样本容量的确定 二、估计总体比率时样本容量的确定
抽样调查理论及方法
《市场调查》:第六章抽样调查理论及方法一、抽样调查(Sampling Survey)意义抽样调查为科学研究方法中重要技术之一,是指就所要研究的某特定现象之母群体中,依随机原理抽取一部份作为样本(Sample),以为研究母群体(Population)之依据。
将样本研究结果,在抽样信赖水准内,推算母群体可能特性以为决策之参考。
抽样调查之优点:1.利用抽样技术及机率理论,可获得既定精确估计值,以代表母群体特征。
2.节省调查人力,物力,时间及经费。
3.经由少数优秀人员施予特殊训练及配合特殊设备,施行调查,可得较深入且正确调查结果。
故在实地市场调查中,抽样调查为一不可或者之工具。
抽样调查基本目的乃在信息之搜集作成结论,以供决策参考。
有效抽样调查应具有准则有下:1.有效原则抽样调查应该(1)符合调查目的之需要,(2)所获信息价值应超过所支付成本。
2.可测量原则抽样的正确程度必须能够测量,否则抽样调查就失去意义。
3.简单原则抽样调查必须保持简单性要求。
俾使抽样调查顺利进行,以避免不必要之节外生枝。
二、抽样调查的基本术语1母群体(Population)在调查研究中,调查研究对象的集合体。
调查台北市中学生,则在台北市上课之54所中学生总数,便是调查研究之母群体。
2抽样架构(Sampling frame)整体抽样单位的详细名单,以供抽样之用。
例如以台北市医师为抽样单位,则台北市医师公会名册,便是抽样架构。
如果以学校班级为抽样单位,则学校60班班级名册便是抽样构架。
抽样架构有三种型态:具体的抽样架构:每一个抽样单位名字皆列成表册,可以直接按表册名字抽取样本。
抽象的抽样架构:没有抽样单位之名册,只要符合调查之条件就有被抽样之可能。
例如在百货公司举行消费者抽样,随然没有抽样名册,但是抽样架构却冥冥中隐约出现。
阶段式抽样架构:在采用分段抽样中,依抽样阶段之不同,产生不同之抽样架构。
3抽样单位(Sampling unit)在抽样架构上排列的名单之个别单位。
35第8章抽样调查理论与方法
《统计学》第8章抽样调查理论与方法
8-11
概率抽样
(probability sampling)
又称随机抽样,是指依据随机原则,按照某种事 先设计的程序,从总体中抽取部分单元的抽样方 法
特点
✓ 按一定的概率以随机原则抽取样本
抽取样本时使每个单位都有一定的机会(概率)被 抽中
“随机”不等于“随便” “随机”不等于“等概率” ✓ 用样本指标数值去推断总体的指标数值
✓ 抽样调查会产生抽样误差,这个误差可以计算,并且 可以加以控制
2020/3/25
《统计学》第8章抽样调查理论与方法
8-12
概率抽样 (probability sampling)
概率抽样被视为狭义的抽样调查,在实践中被广 泛加以采用,通常所谓的抽样调查,均指概率抽 样调查。
概率抽样有多种形式:简单随机抽样、分层抽样、 系统抽样、整群抽样等。
2020/3/25
《统计学》第8章抽样调查理论与方法
8-6
便利抽样
是根据调查者的方便与否来抽取样本的一种非概 率抽样方法。典型的形式是“拦截式”调查。调 查过程中由调查员依据方便的原则,自行确定入 抽样本的单位
✓调查员在街头、公园、商店等公共场所进行拦 截调查
✓厂家在出售产品柜台前对路过顾客进行的调查
8-15
分层抽样
(stratified sampling)
一般选择“平均型” 、“众数型”、“特殊型” 单元作为样本
样本量小及样本不易分门别类挑选时有其较大的优 越性
由于其估计精度严重依赖于研究者对调查对象的了 解程度、判断水平和对结果的解释情况,所以,一 般不轻易地用于对总体进行数量方面的判断
2020/3/25
《统计学》第8章抽样调查理论与方法
抽样调查研究方法
数据收集:
通过问卷
调查和访
谈调查收
集数据
结果解释:
分析结果
显示,该
产品在某
地区受到
较高评价,
尤其是年
轻消费者
群体
成果利
用:企业
根据调查
结果调整
市场策
略,提高
产品竞争
力
实例二:某疾病发病率调查
01
背景:某地区政府想要了解某疾病的发病率及其影响因素
02
抽样设计:采用整群抽样方法,按行政区划将总体分为若干群
质量和控制非抽样误差等
• 了解各种误差的来源和影响
• 优化抽样设计:选择合适的抽样方法
• 评估调查结果的可靠性和有效性
和样本容量
• 提高数据质量:采用有效的数据收集
和整理方法
• 控制非抽样误差:改进测量工具、调
查方法和样本选择
05
抽样调查的结果解释与报告
抽样调查结果的解释与评估
抽样结果的评估主要包括准确性、可靠性和有效性
03
抽样数据的收集与整理
数据收集的方法与技巧
数据收集的方法主要有问卷调查、访谈调查和观察
调查
数据收集的技巧包括明确目的、设计合
适的问题和保持客观
• 问卷调查通过设计问卷收集数据
• 明确目的:确保数据收集的目的性和
• 访谈调查通过面对面访谈收集数据
针对性
• 观察调查通过观察和记录收集数据
• 设计合适的问题:设计简洁明了、易
• 测量工具:如问卷、访谈和观察工具的质量和准确性
• 调查方法:如数据收集和整理的方法和技巧
• 样本选择:如样本抽取的随机性和代表性
• 非抽样误差可以通过改进测量工具、优化调查方法和改进样本选
《市场调查》:抽样调查理论及方法
《市场调查》:抽样调查理论及方法一、抽样调查(Sampling Survey)意义抽样调查为科学研究方法中重要技术之一,是指就所要研究的某特定现象之母群体中,依随机原理抽取一部份作为样本(Sample),以为研究母群体(Population)之依据。
将样本研究结果,在抽样信赖水准内,推算母群体可能特性以为决策之参考。
抽样调查之优点:1.利用抽样技术及机率理论,可获得既定精确估计值,以代表母群体特征。
2.节省调查人力,物力,时间及经费。
3.经由少数优秀人员施予特殊训练及配合特殊设备,施行调查,可得较深入且正确调查结果。
故在实地市场调查中,抽样调查为一不可或者之工具。
抽样调查基本目的乃在信息之搜集作成结论,以供决策参考。
有效抽样调查应具有准则有下:1.有效原则抽样调查应该(1)符合调查目的之需要,(2)所获信息价值应超过所支付成本。
2.可测量原则抽样的正确程度必须能够测量,否则抽样调查就失去意义。
3.简单原则抽样调查必须保持简单性要求。
俾使抽样调查顺利进行,以避免不必要之节外生枝。
二、抽样调查的基本术语1母群体(Population)在调查研究中,调查研究对象的集合体。
调查台北市中学生,则在台北市上课之54所中学生总数,便是调查研究之母群体。
2抽样架构(Sampling frame)整体抽样单位的详细名单,以供抽样之用。
例如以台北市医师为抽样单位,则台北市医师公会名册,便是抽样架构。
如果以学校班级为抽样单位,则学校60班班级名册便是抽样构架。
抽样架构有三种型态:具体的抽样架构:每一个抽样单位名字皆列成表册,可以直接按表册名字抽取样本。
抽象的抽样架构:没有抽样单位之名册,只要符合调查之条件就有被抽样之可能。
例如在百货公司举行消费者抽样,随然没有抽样名册,但是抽样架构却冥冥中隐约出现。
阶段式抽样架构:在采用分段抽样中,依抽样阶段之不同,产生不同之抽样架构。
3抽样单位(Sampling unit)在抽样架构上排列的名单之个别单位。
电子课件 [统计学原理与实务(第3版)][曹印革][电子教案和习题解答] 第八章 抽样推断分析
注:极限误差与概率度和抽样平均误差三者之 间存在如下关系:
1.在平均误差保持不变的情况下,增大概率度 的值,把握程度相应增加,误差范围也随之扩大, 这时估计的精确度将降低;反之,要提高估计的精 确度,就得缩小概率度值,此时把握程度也会相应 降低。
2.在概率度保持不变的情况下,抽样平均误差 小,则误差范围就就小,估计的精确度就高;反之, 抽样平均误差大,误差范围就大,估计的精确度就 低。
2.特点 (1)抽样推断是由部分推算总体的一种认识方法。 (2)抽样推断是建立在按随机原则抽取样本的基础上。 (3)抽样推断是运用概率估计的方法。 (4)抽样推断产生的误差可以事先计算、并加以控制。
二、抽样推断的作用 1.应用抽样推断法可对某些不可能或不容易进行全面 调查而又要了解其全面情况的社会经济现象进行数量 方面的统计分析。 2.应用抽样法可对全面调查的结果加以补充或订正。 3.应用抽样法可对生产过程中产品质量进行检查和控 制。 4.应用抽样推断法可对总体的某种假设进行检验,判 断假设的真伪。
4.当抽样调查是为了检验全面统计数字的质量时,全 及总体的标志变异指标或是有实际资料的,可以直接 代入公式计算必要的抽样单位数。 5.如有几个方差可以选用时,宜选择最大数值。对于 成数方差,如果没有资料时,可取其最大值0.25。 6.一个总体往往可以同时计算抽样平均数和抽样成数。 由于它们的方差和允许误差范围不同,因此,需要的 必要抽样单位数也不相同。为了防止由于样本单位数 不足而扩大抽样误差,在实际工作中往往根据比较大 的必要抽样单位数进行抽样,以满足共同的需要。
等距抽样示意图
(四)整群抽样 也称集团抽样、区域抽样,是将总体各单位按时
间或空间形式划分成许多群,然后按纯随机抽样或机 械抽样方式从中抽取部分群,对中选的所有单位进行 全面调查的抽样组织方式。
统计学抽样调查ppt课件
(一)用于一些不可能或不必要进行全面调查 的社会经济现象,以达到对总体数量特征的 认识,可以取得事半功倍的效果
(二)对全面调查的资料进行补充和修正 (三)广泛运用于工业生产过程中的质量检验
与控制
病原体侵入机体,消弱机体防御机能 ,破坏 机体内 环境的 相对稳 定性, 且在一 定部位 生长繁 殖,引 起不同 程度的 病理生 理过程
样本成数的平均误差的计算公式。
1.在重复抽样下:
μp=
σ2
n
n
=
p (1 p )
n
2.在不重复抽样下:
μp=
2 Nn
( )= n N 1
p (1 p ) n
(N n) N 1
病原体侵入机体,消弱机体防御机能 ,破坏 机体内 环境的 相对稳 定性, 且在一 定部位 生长繁 殖,引 起不同 程度的 病理生 理过程
第二节、抽样误差和抽样估计
一、抽样误差 (一)概念:是指抽样估计值与被估计的
未知的真实参数( 总体特征值)之差。 (二)误差的来源
1、登记性误差 2、系统性误差 3、偶然性误差
病原体侵入机体,消弱机体防御机能 ,破坏 机体内 环境的 相对稳 定性, 且在一 定部位 生长繁 殖,引 起不同 程度的 病理生 理过程
病原体侵入机体,消弱机体防御机能 ,破坏 机体内 环境的 相对稳 定性, 且在一 定部位 生长繁 殖,引 起不同 程度的 病理生 理过程
2、区间估计
对于总体的未知指标X, 根据样本确定 总体指标所在的区间,并指出估计推断的可 靠程度。
x1、x2(x1 x < 2),使随机区间 (x1,x2)
包含X的概率等于给定值1-α(0<α<1),
病原体侵入机体,消弱机体防御机能 ,破坏 机体内 环境的 相对稳 定性, 且在一 定部位 生长繁 殖,引 起不同 程度的 病理生 理过程
经济统计学中的抽样调查方法
经济统计学中的抽样调查方法引言经济统计学是研究经济现象和经济活动的科学,而抽样调查方法则是经济统计学中一种重要的数据收集手段。
本文将探讨经济统计学中的抽样调查方法,包括其定义、应用领域、优点和局限性等方面。
一、抽样调查方法的定义抽样调查方法是指通过从总体中选取一部分个体进行数据收集和分析的方法。
在经济统计学中,抽样调查方法常用于对经济现象、经济活动以及经济主体进行研究和分析。
二、抽样调查方法的应用领域1.宏观经济统计抽样调查方法在宏观经济统计中起到了重要的作用。
例如,国家统计局通过对一部分家庭进行抽样调查,得出全国居民收入、消费水平等宏观经济指标。
这些指标对于政府决策、经济政策制定以及宏观经济研究都具有重要的参考价值。
2.企业调查抽样调查方法也常用于对企业进行调查。
例如,为了了解某个行业的市场情况,研究人员可以通过对该行业中的一部分企业进行抽样调查,从而得到有关市场规模、市场份额、产品需求等信息。
3.消费者行为研究抽样调查方法在消费者行为研究中也得到了广泛的应用。
例如,市场调研公司可以通过对一部分消费者进行抽样调查,了解他们的购买偏好、消费习惯等信息,从而为企业制定市场营销策略提供依据。
三、抽样调查方法的优点1.经济高效相比于全面调查,抽样调查方法可以大大减少数据收集和分析的成本和时间。
通过对一部分个体进行调查,可以得出对总体具有代表性的结论,从而减少了调查的工作量和费用。
2.精确可靠合理的抽样调查方法可以保证数据的精确性和可靠性。
通过科学的样本设计和抽样方法,可以减小抽样误差,从而得到对总体的准确估计。
3.实用灵活抽样调查方法具有灵活性,可以根据研究目的和实际情况进行调整。
研究人员可以根据需要选择不同的抽样方法,如简单随机抽样、分层抽样、整群抽样等,以满足研究的要求。
四、抽样调查方法的局限性1.样本误差抽样调查方法存在样本误差的问题。
由于样本是从总体中选取的一部分个体,所以样本结果与总体结果之间存在一定的差异。
抽样调查理论与方法基本概念
抽样调查理论与方法基本概念(2011年12月22日整理)一、基本概念(一)抽样调查与非抽样调查1.调查分类:①根据调查是否针对总体的所有单元分为全面调查和非全面调查;②根据调查单元是否按照一定的概率入样分为概率抽样调查和非概率抽样调查。
2.非全面调查相对于全面调查的优点:①时间短速度快;②费用少成本低;③调查结果比较准确;④应用范围广泛。
3.概率抽样分类:①根据调查单元的入样概率是否相等分为等概率抽样和不等概率抽样;②根据具体的抽样方式分为简单随机抽样、分层抽样、整群抽样、系统抽样、多阶段抽样等。
优点:①能够保证样本的代表性,避免人为干扰的因素;②用概率抽样取得的样本去估计总体特征时,可以对抽样产生的抽样误差进行估计。
4.非概率抽样分类:①根据具体的抽样方式分为判断抽样、便利抽样、自愿样本、滚雪球抽样、配额抽样等;②判断抽样包括典型调查和重点调查两种取样方式。
缺点:①难以评价样本的代表性;②无法估计抽样误差;③偏倚往往较大。
5.抽样调查,是非全面调查中的一种重要方法,它是按照一定程序从所研究对象的全体(总体)中抽取一部分(样本)进行调查或观察,获取数据,并以此对总体的一定目标量(参数)作出推断(例如估计)。
(二)总体与样本1.总体:分为目标总体和实际总体,目标总体是研究目标所针对的总体;实际总体是实际调查时所针对的有限的、具体的总体。
2.抽样框与抽样单元包含所有抽样单元的总体称为抽样框,构成抽样框的单元称为抽样单元。
抽样框的形式:名单、手册、地图、数据包等。
抽样框的要求:①抽样框必须是有序的,即抽样单元必须编号,且根据某种顺序进行了排列;②抽样框中包含的抽样单元必须“不重不漏”,否则将会出现抽样框误差。
3.抽样与样本样本:从总体中按照一定程序抽得的那部分个体或者抽样单元。
(三)总体特征与估计量1.总体特征:总体某个特征或属性的数量表现。
通常有4种:①总体总值Y;②总体均值Y;③总体比例P;④总体比率R。
生物统计学2012
生物统计学20121、样本:从总体中抽出的个体的组成的集合。
2、水平:每个因素根据其质或量所分的等级或所处的状态。
3、精确性:试验观察值彼此接近的程度。
4、几何平均数:n个观察值的积开n次方。
5、试验设计:试验单位的选取、重复数的确定以及试验单位的分组。
6、总体:研究对象的全体。
7、处理:多个实验因素水平的组合。
8、准确性:观察值与参数差异的程度。
9、统计量:表示样本特征的值。
10:小概率原理:小概率事件在一次试验中不可能发生。
11、随机抽样:总体中每个个体有相同的机会进入样本的抽样。
12、变异系数:标准差除以平均数的商,是衡量数据变异程度的一个统计量。
13、概率:频率的稳定值。
14、互作:因素间相互促进或抑制的作用。
15:误差:指由于试验条件或偶然因素引起的观察值与真值的差异。
计算题1某品种羊成年体重(单位:㎏)x~N(30,102),该品种羊成年体重大于55.8㎏、小于13.6㎏、为13.6~46.4 ㎏的个体所占比例。
2芦花公鸡与黑色母鸡杂交,子二代中芦花与黑色的比例为3:1,则5只雏鸡有4只芦花的概率。
求8只雏鸡平均有几只芦花鸡以及出现芦花鸡数的标准差。
3某鸡疾病致死率20%,现抽取5只病鸡,求死亡数不超过一只的概率。
4袋中有10只乒乓球,分别编号为1到10,从中随机抽取3只,记录其编号,则最小的号码为5的概率。
10求8.9,9.0,7.2,7.5,10.3的几何平均数,2.4,3.2,5.6,5.2,4.1的调和平均数。
1计算下列两个玉米品种10个果穗长度(cm)的标准差和变异系数,并解释所得结果。
24号:19,21,20,20,18,19,22,21,21,19金皇后:16,21,24,15,26,18,20,19,22,192假设一批茌梨平均单果重225g,标准差为24g,试求单果重在180-260g间的概率有多少?3设以同性别、同年龄、同月龄的小白鼠接种某种病菌,假定接种后经过一段时间生存的概率为0.425,若5只一组进行随机抽样,试问其中“四生一死”的概率有多大?4有一正态分布的平均数为16,方差为4,试计算:(1)落于10到20之间的数据的百分数;(2)小于12或大于20的数据的百分数。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计算出来的用于反映总体的数量特征的指
标
调查的目标量都是由总体的某些指标来表
示的
总体参数表现为一系列唯一的常数,但往 往却是未知的,需要去推断和估计
《统计学》第8章抽样调查理论与方法 8-8
#常见的总体参数包括: 总体均值(平均数) 总体总值(总和) 总体比例 总体方差
x Z 2 x
p Z 2 p
《统计学》第8章抽样调查理论与方法 8-22
8.4 抽样方案设计
1.抽样方案设计的基本原则 简单随机抽样 分层抽样 整群抽样
《统计学》第8章抽样调查理论与方法
8-23
8.5 样本容量的确定
8.5.1影响样本容量确定的主要因素 8.5.2确定抽样单元数的方法
ˆ :不可知 实际抽样误差:
抽样平均误差: 考虑所有可能样本所 得估计值的平均实际误差, 即实际误
ˆ ) ,由于正负误 差的平均值: E (
差相互抵消仍无法反映误差大小 均方误差: 为避免抽样平均误差过程 中的正负抵消,考虑平均平方误差:
《统计学》第8章抽样调查理论与方法
第8章 抽样调查理论与方法
(一)教学目的与要求:掌握抽样调查的 概念、作用;掌握抽样方法和样本可能数 目;掌握抽样误差的计算;掌握样本容量 的确定;了解抽样方案的设计。 (二)教学的重点与难点:抽样误差的计 算和样本容量的确定 (三)课时安排:8课时
《统计学》第8章抽样调查理论与方法
8-1
第8章 抽样调查理论与方法
p
p
p(1 p) n (1 ) n N
《统计学》第8章抽样调查理论与方法 8-18
例
某玻璃器皿厂某日生产15000只印花玻璃 杯,现按重复抽样方式从中抽取150只进行 质量检验,结果有147只合格,其余3只为不 合格品,试求这批印花玻璃杯合格率(成数) 的抽样平均误差。
n 150 147 98% 150
《统计学》第8章抽样调查理论与方法
8-11
8.3.1 抽样调查中的误差来源
抽样调查中误差可分为非抽样误差及抽样误差 两大类。
#非抽样误差:指不是由于抽样引起的,在全面普 查中也存在。
《统计学》第8章抽样调查理论与方法
8-12
#抽样误差:指由于抽样所造成的误差(用样本估计总
体而产生的误差)。其根源在于样本的随机性,使
x 400 100 (1 100 10000 ) 1.99(小时 )
8-17
《统计学》第8章抽样调查理论与方法
(二) 样本比例的抽样平均误差 p
已证明得:比例的平均数就是比例本身
比例的方差是
P(1 P)
在重复抽样情况下: p(1 p) P n 在不重复抽样情况下:
统计量:是根据样本的n个单元的变量值计 算出来一个量,也叫估计量 (1)样本指标是随机变量 (2)往往构成了用于估计总体参数的估计 量。 (常用的有样本均值、样本比例、样本方差、 样本标准差。见教科书203页!)
《统计学》第8章抽样调查理论与方法 8-10
8.3 抽样误差
8.3.1抽样调查中误差的来源 8.3.2抽样平均误差、方差与偏差 8.3.3抽样平均误差的计算 8.3.4抽样极限误差与置信度
解: N 15000 p
p
p(1 p) 0.98 (1 0.98) 1.14% n 150 若按不重复抽样方式:
p
p(1 p) n 0.98 (1 0.98) 150 (1 ) (1 ) 1.1374% n N 150 15000
不重复抽样时: NZ / 2 nx 2 2 2 N x Z / 2
2 2
《统计学》第8章抽样调查理论与方法
8-28
估计总体均值时样本容量的确定 (例题分析)
【例】拥有工商管理学士学位的大学毕业生年薪 的标准差大约为 2000 元,假定想要估计年薪 95% 的置信区间,希望允许误差为400元,应抽取多大 的样本容量?
8-14
8.3.3 抽样平均误差的计算
本章主要讨论简单随机抽样条件下,以及估计量 是无偏估计量的抽样平均误差的计算
(一) 样本平均数的抽样平均误差 x
1.重复抽样
总体标准差
n 2 n
8-15
x 或 x
样本容量
《统计学》第8章抽样调查理论与方法
例
某灯泡厂从一天所生产的产品10,000个中抽 取100个检查其寿命,得平均寿命为2000小时 (一般为重复抽样),根据以往资料:σ =20小 时, 202 抽样平均误差 2(小时) 100
《统计学》第8章抽样调查理论与方法
8-24
8.5.1影响样本容量确定的主要因素
总体被研究标志的变异程度 调查者对推断精确度的要求 抽样调查的方式和方法 人力、物力和财力的允许条件
《统计学》第8章抽样调查理论与方法
8-25
8.5.2
样本容量的确定
一、估计总体均值时样本容量的确定 二、估计总体比率时样本容量的确定
x
根据以往资料,产品质量不太稳定,若σ =200小时,
2002 则: x 20(小时) 100
《统计学》第8章抽样调查理论与方法 8-16
2.不重复抽样:
x
2
Nn
n
N 1
但实际中, 往往N很大,n很小,故改用下列公式: x 2 (1 n )
n N 上例中,若为不重复抽样,则:
市场调查
卫生调查 资源环境调查
《统计学》第8章抽样调查理论与方法
8-6
8.2 抽样调查的基本概念
8.2.1 总体与样本
8.2.2 总体参数与统计量
8.2.3 抽样单元与抽样框 8.2.4 抽样方法与样本可能数目 8.2.5 精度与费用
《统计学》第8章抽样调查理论与方法
8-7
8.2.2 总体参数与统计量
《统计学》第8章抽样调查理论与方法
8-29
估计总体均值时样本容量的确定 (例题分析)
x =400, 1-=95%, z/2=1.96 解: 已知 =2000, 应抽取的样本容量为
n
( z 2 )
2
2
2 x
(1.96) 进位取整 2000 ! 2 400
2 2
96.04 97 (人)
《统计学》第8章抽样调查理论与方法
8-26
重复抽样时
一、估计总体均值时样本容量的确定
允许误差
1. 估计总体均值时样本容量n为
nx
( z 2 )2 2
2 x
其中: x z 2
n
2. 可见,样本容量
与总体方差成正比 与允许误差成反比 与置信度成正比
《统计学》第8章抽样调查理论与方法 8-27
位数目多,又缺乏原始记录作依据的现象
对普查资料的质量进行检查和修正 抽样调查方法可以用于工业生产过程中的质量控 制
《统计学》第8章抽样调查理论与方法 8-5
8.1.3
抽样调查的应用领域
社会经济现象的调查
如:人口变动、农产量、城市居民家计、农村经济、小型
工业企业生产情况、小型商业企业交易情况调查 社会性的民意调查
1 X N
N i 1
X
i 1
N
i
X Xi N X
P
N N N1 N1 ,Q 0 1 P N N N
2 ( X X ) i i 1 N
1 2 N
标准差
1 N
2 ( X X ) i i 1
N
《统计学》第8章抽样调查理论与方法
8-9
解:
N 4000, 0.2,t 3, 1.5 32 (1.5)2 4000 n 2 450(人) 2 2 2 2 2 N Z 2 (0.2) 4000 3 (1.5) 1 若误差范围缩小 (即0.1M 3 ),保证程度不变 2 32 (1.5)2 4000 则 n 1344(人) 2 2 2 (0.1) 4000 3 (1.5)
8-20
8.3.4 抽样极限误差和置信度
实际问题中,估计量的精度通常采用抽样极限误 差来表示或要求
抽样极限误差:是根据概率理论,以一定的可靠 程度保证抽样误差不超过某一给定的范围,也称 作抽样允许误差。常用△表示。 。
《统计学》第8章抽样调查理论与方法
8-21
抽样极限误差与抽样平均误差之间有关系,且 这种关系与估计量的分布有关 大样本时,可推得:
《统计学》第8章抽样调查理论与方法 8-19
得取总体方差的途径有:
1. 用过去全面调查或抽样调查的资料,若同时有几个方差的
资料,应选用数值较大的那个;
2. 用样本标准差代替全及标准差;
3. 在大规模调查前,先搞个小规模的试验性的调查来确定总
体方差; 4. 用估计的方法。
《统计学》第8章抽样调查理论与方法
8.1 抽样调查的意义
8.2 抽样调查的基本概念
8.3 抽样误差 8.4 抽样方案设计 8.5 样本容量的确定
《统计学》第8章抽样调查理论与方法
8-2
8.1 抽样调查的意义
8.1.1 抽样调查的概念 8.1.2 抽样调查的作用 8.1.3 抽样调查的应用领域
《统计学》第8章抽样调查理论与方法
2
《统计学》第8章抽样调查理论与方法 8-31
估计总体比率时样本容量的确定 (例题分析) 【例】根据以往 解 : 已 知 P=90% , =0.05 , 的生产统计,某 z/2=1.96, P =5% 种产品的合格率 应抽取的样本容量为 约为 90%,现要 2 ( z ) P (1 P ) 2 求允许误差为 nP 2 5% , 在 求 95% P 的置信区间时, (1.96) 2 0.9 (1 进位 0.9) 应抽取多少个产 0.052 取整! 品作为样本? 138.3 139