第七章 样本设计

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

从总体中抽取样本,由 样本测得变量的观测值,从 而获取样本数据,根据样本 数据计算有关的统计量,并 由此来推断总体参数。 样本数据的整理过程与
变 量
统计量的计算的过程同时也
述描
述描
样本数据 图 表
是对样本数据的描述过程, 因此统计方法包括抽样、描
统计量
述与推断三个方面的内容。
个体
总体由我们所 感兴趣的所有个体 的集合构成。
200只灯泡样本的可使用小时数
49 61 82 79 72 68 70 84 62 67 75 98 79 65 77 58 88 74 83 92 59 68 57 98 98 86 69 81 76 63 65 58 76
我们对总体中众多个体某一个或 几个方面的属性感兴趣,这些属性称 为变量(variable) 。如本例中灯泡 的“使用小时数”就是一个变量。
59
74 85 75 69 82 61 62 85
67
65 99 77 76 96 73 71 92
61
82 59 51 89 77 72 81 64
71
86 92 45 75 102 76 65 73
样本数据是就某一个或某几个变 量,对样本中的个体集得到的数据。 本例表中的数据就是一个典型的样本 数据。
二、样本误差
• 总体参数(population parameter)

Xi
i 1 N
N
2
(X
i 1
N
i
)2
N
2 x ?
• 样本统计量(sample statistic)
1 n X Xi n i 1
1 n S ( X i X )2 n i 1
三、抽样
1.抽样的作用 a) 费用低 b) 速度快 c) 准确度高 d) 信息有深度 e) 保护性强
三、抽样
2.抽样带来的问题(Errors Associated With Samp ling) ① 抽样误差(random sampling error)——由于 用样本数据对总体特征进行估计所引起的代 表性误差;
② 效度——衡量测量效果正确性的一个重要指 标,指在一定条件下进行多次测量,所得结 果的平均值与真实值之间的相符程度。
实际使用:内容效度、准则效度和结构效度
三、抽样
测量目的是对体育运动的兴趣,测量题目是“您喜欢 汽车吗?”——缺乏内容效度 企业调查员工的工作积极性,用问卷调查,同时还比 照相关领导的打分评价,二者一致性高——具备准则 效度
抽样框设计不当,可能导致抽样调查得出错误的 结果。
一次失败的调查:1936年《文学摘要》对美国 大选预测
《 Literary Digest》以电话簿和汽车执照上的地址,以及 俱乐部成员名单上的地址发出1000万封信,收到回信200 多万封,预测结果:兰登以57%对43%的比例获胜; 最后选举结果却是,罗思福以62%对38%的巨大优势获胜, 连任总统。
Chapter 7
样 本 设计
主要内容
7.1 目标总体与样本
7.2 样本大小的确定 7.3 设计抽样过程
学习目标
1. 熟悉并掌握样本大小的确定及计算 2. 熟悉并掌握调查抽样的方法
统计的基本程序图
总体参数 变 量 一个典型的统计问题 某电子公司采用新技术生 产出一批高亮度灯泡。这批灯 泡的使用寿命多长?合格率是 多少?与传统技术相比,灯泡 的使用寿命是否有所提高? 样 本 推 断 总 抽 体 样 推 断
90
96 66 68 85 83 74 73 73
78
75 86 72 67 68 91 77 63
71
64 96 77 87 72 76 79 63
101
76 89 60 80 67 83 94 89
78
72 81 87 84 92 66 63 82
43
77 71 84 93 89 68 59 64
Systematic error Administrative error
Errors Associated With Sampling
Random sample error Planned sample
Total population
Sampling frame
Nonresponse error
变量(variable) n×p项观测值 (observation)。
观测1 变量1 变量2 变量k 变量p
X11
X12
X1k
X1P
与某一个
观测2 X21 X22 X2k X2P
体相联系的各 个变量的取值, 称为一个观测。
观测j Xj1 Xj2 Xjk Xjp
观测n
Xn1
Xn2
Xnk
Xnp
数据阵列的 一般结构
抽样框 全部院系列表 被选中的院系的专业列表 被选中的专业的年级列表 所有年级的班级列表 被选中的班级的学生名单
三、抽样
1.定义:抽样是按一定规则从总体构成中抽取一定 量的样本,通过对样本的调查研究获得有关目标总 体信息的方法。
抽样使我们能从总体具有代表性的部分样本中获取数据,从而可以 得到关于整个总体的有效结论。 ———[英]托尼· 普罗科特
Step 1
Step 2 Step 3 Step 4
定义总体 识别抽样框
确定样本规模
设计抽样过程 抽取样本
Step 5
抽样步骤
7.2 样本大小的确定
一、概述
二、样本误差 三、样本的计算
ห้องสมุดไป่ตู้
一、概述
• 样本大小的决定方法取决于是使用概率抽样还是非 概率抽样。
• 非概率抽样的样本大小通常取决于主观因素,以及 现有资金、时间等约束条件。 • 概率抽样的样本大小与误差估计的精确度有关,而 调查的误差程度取决于项目要求。
总体指标和样本指标符号及计算公式
总体指标 单位数目 均值 样本指标
N
n
Xi
i 1
2
2

2
1 X N
N
1 n x xi n i 1
1 n S ( x x )2 n 1 i 1
1 n S ( xi x ) 2 n 1 i 1
方差
标准差
1 N (Xi X ) N i 1
Respondents Sampling frame error
好的样本
总体
抽样误差(sampling error) 抽样随机性造成的随机误差。
背离随机原则的坏的样 本会造成数据的系统误差。
坏的样本
三、抽样
P S es ed
P 表示未知的、真实的总体特征; S 表示从样本得来的结果; es 表示抽样误差; ed 表示数据收集误差或非抽样误差。
三、抽样
提高调查效度的方法(减少非抽样误差的方法): 严格调查程序、规范调查步骤、加强人员的培训 和管理,合理地设计问题和答卷,改进测量方法 和工具。
三、抽样
③ 精度——三者的关系:对于测量或调查来说, 信度高的效度未必高,反过来效度高的信度 未必高,但精度高的信度和效度肯定高。
A
C
B
D
Reliability and Validity on Target
② 非抽样误差(nonsampling error/systematic er ror)——无应答误差、选择误差、测量误差 等。
Random sampling error
Nonresponse error Respondent error
Total error
Response bias
Data processing error Sample selection error Interviewer error Interviewer cheating
2
2 sx ?
?
背景案例:某城市一所大学有学生5000人,该大学计划 思考:这个假设是否有效(效度)?假如另 从城里募集一些资金来扩建一个教学项目。理由之一是 外调查400个学生的一个样本,结果是否会改 向城里人说明大学的存在对城里人、特别是对商人有较 大的经济利益。作为这个研究的一部分,要从学生中抽 变? 样调查他们在该城市的月花费。这个结果被用来估计所 这种改变就是由样本误差引起的; 有学生整体的花费。
三、抽样
4. 信度、效度与精度的衡量方法
① 信度——在一定条件下进行多次测量时,所 得结果之间的符合程度,理论上用样本平均 数的方差或标准差来表示;
实际使用:再测信度、复本信度和折半信度衡 量
三、抽样
提高调查信度的方法(减少抽样误差的方 法):使用概率抽样方法,合理设计样本 容量。
三、抽样
1 N (Xi X ) N i 1
2
标准误差
x
SX

n
N n N
S n
• 标准差(standard deviation)SD,即标准偏差 • 标准误差(standard error)SE,指样本统计量的 标准差。即抽样误差
• 标准差表示数据的离散程度. • 标准误表示抽样误差的大小.
三、抽样
一、目标总体的定义
总体(population):是指营销调研对象的总体,它可以 是一群人,一些家庭,某类企业或活动等.总体单位数 通常用“N”表示。 ① ② ③ ④ 总体的特征 大量性 同质性 差异性 客观性
二、确定总体的构成
总体的构成,就是指一系列组成总体的个体或组成 部分。
定义总体
Step 1
Step 2 Step 3 Step 4 识别抽样框
确定样本规模
设计抽样过程 抽取样本
Step 5
抽样步骤
Step 1
Step 2 Step 3 Step 4
定义总体 识别抽样框 确定样本规模
设计抽样过程
抽取样本
Step 5
抽样步骤
7.1 目标总体与样本
一、目标总体的定义 二、确定总体的构成
符合要求的城市列表 被选中的城市的社区列表 被选中的社区的家庭列表 被选中家庭50岁及以上男性列表
50岁及以上男性
课堂作业
☻ 调查南京邮电大学在校学生每月伙食费使用状况。
请分别描述出“总体”、“个体”、“样本”和“抽样框”, 并设计出“多阶段抽样框”。
阶 1 2 3 4 5

抽样单位 院 系 专 业 年 级 班级 大学生
思考:造成调查结果与事实严重不符的主要原因是什么?
二、确定总体的构成
多阶段抽样框:抽样过程可能是由多个阶段构 成,所以对应于抽样的不同阶段也应该选择不 同的抽样框。
如:对特大城市的50岁以上男性进行调研
阶 段
1 2 3 4
抽样单位
人口超过5,000,000的城市 城 市 社 区 家 庭
抽样框
抽样框(sampling frame):即总体的构成清单,指 用以代表总体,并从中抽选样本的一个框架,由互 不交叉的各个抽样单位组成一个统计总体。 抽样框的具体形式——包括总体全部单位的名册、 登记表、电话号码簿、地图、企业名录、编码表、 数据库等。
二、确定总体的构成
① ② ③ ④ 抽样框的要求 完整性——避免总体不完整 实时性——避免抽样框老化 可得性——避免增加抽样成本 代表性——避免抽样框超限或重叠
案例:某县的自行车使用者调研 目标总体——该县所有的自行车拥有者 总体的构成——该县每个拥有自行车的人(有执照 的+没执照的) 实际总体——该县每个持有执照的自行车拥有者
二、确定总体的构成
目标总体 Vs. 实际总体
重合
交叉
实际总体大 于目标总体
目标总体大 于实际总体
二、确定总体的构成
样本是总体 的一个子集。
总体 样本 抽样
某电子公司从其灯泡产品中随机抽取二百只,测得其使用 小时数数据如下:
107 54 66 62 74 92 75 65 81 83 78 73 65 62 116 86 78 90 81 62 70 66 68 71 79 65 73 88 62 75 79 70 66 97 80 86 88 80 77 89 62 83 81 94 76 84 68 64 68 103 71 94 93 77 77 79 88 74 79 78 88 71 71 61 72 63 94 62 61 78 89 63 74 85 65 84 66
2.抽样调查的特点
特点
优点
缺点
费用低,易广泛应用
方案设计比较复杂
质量可控,可信度高
对设计人员的要求较高
时间短,收效快
3.抽样调查的程序
抽样调查程序
定 义 总 体 及 样 本 单 位
选 择 抽 样

选 择 抽 样 方 法
确 定 样 本 容 量
制 订 抽 取 样 本 操 作 程 序
进 入 调 查 阶 段
三、抽样
3. 信度、效度与精度
① 信度(Reliability):表示测量结果中随机误差(rando m sampling error)大小的程度;
② 效度(Validity):表示测量结果中系统误差(system atic error)大小的程度;
③ 精度(Sensitivity):信度与效度的综合。
相关文档
最新文档