第二章抽样方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
在一次抽样中,抽样框的பைடு நூலகம்目是与抽样单位的层 次相对应的。
上面的例子中有三个层次的抽样单位:学校、班 级、学生,则对应的抽样框也应有三个:全部学校的 名单、抽取的学校样本中的全部班级的名单、抽取班 级中的所有学生的名单。
4、参数值与统计值: 参数值也称总体值,它是关于总体中某一变量的 综合描述,或者说是总体中所有个体的某种特征的 综合数量表现。 在统计中最常见的总体值是某一变量的平均值 例如:平均年龄、平均收入等。 总体值只有通过对总体中的每一个个体都进行调 查或测量才能得到。
在样本量相同的情况下,置信水平越高,置信区间 越宽。在置信区间不变的情况下,样本量越多,置信 水平越高
例:
美国Gallup(盖洛普)公司就消费者对美国产品质量的看
法,对美国、德国和日本三国共计3,500名消费者(每个国家
约1,200名)分别进行了调查,调查结果:有55%的美国人认为
美国产品质量好,而只有26%的德国人和17%的日本人持同样
例2:为了了解参加某种知识竞赛的1000名学生 的成绩,应采用什么样的抽样方法恰当?
例3:一个单位的职工500人,其中不到35岁的 有125人,35到49岁的有280人,50岁以上的有95人。 为了了解这个单位职工与身体状况有关的某项指标, 要从中抽取一个容量为100的样本。由于职工年龄与 这项指标有关,试问:应用什么方法抽取?能在500 人中任意取100个吗?能将100个份额均分到这三部 分中吗?
抽样误差的来源: 1、登记性误差; 2、代表性误差: A、系统性误差; B、偶然性误差,抽样误差特指偶然性误差。 影响抽样误差的因素:抽样单位数的多少,总 体中被研究标志的变动程度的大小。
6、置信水平与置信区间: 置信水平是指总体参数值落在样本统计值某一正 负区间的概率。
置信区间是指某一置信水平下,样本统计值与总 体参数值的误差范围。
看法。抽样误差为±3%,置信水平为95%。则这三个国家消
费者的置信区间分别为:
国别 样本均值 抽样误差 置信 区 间
美国 55%
±3%
52%-58%
德国 26%
±3%
23%-29%
日本 17%
±3%
14%-20%
二、抽样的基本程序
1.界定总体 界定总体就是在具体抽样前,明确从中抽取样 本的总体的范围与界限。
5.实际抽取样本 实际抽取样本就是在上述几个步骤的基础上,严 格按照所选定的抽样方法,从抽样框中抽取一个个 的抽样单位,构成样本。 6.样本评估 样本评估就是对样本的质量和代表性进行检验, 其目的是防止因样本的偏差过大而导致的失误。
三、抽样的原则 1、目的性原则。 目的性原则是指在进行抽样方案设计时,要以课 题研究的总体方案和研究的目标为依据。以研究的问 题为出发点,从最有利于研究资料的获取,以及最符 合研究的目的等因素来考虑抽样方案和抽样方法的设 计。
第二章 抽样方法
第一节 抽样设计的基本知识 第二节 随机抽样技术 第三节 非随机抽样技术 第四节 样本容量的确定
第一节 抽样设计的基本知识
案例: 1、1936年,兰登总统当选 2、1948年,杜鲁们总统当选 3、1996年, 美国总统大选 问题: 例1:某灯泡厂生产的灯泡10000只,怎样才能 了解这批灯泡的使用寿命呢?
统计值也称样本值,它是关于样本中某一变量的 综合描述,或者说是样本中所有个体的某种特征的 综合数量表现。
样本值是从样本的所有个体中计算出来的,它是 相应的总体值的估计量。
抽样的目的之一,就是通过这些样本值去估计和 推断各种总体值。
抽样设计的目标,就是尽可能使所抽取的样本的 估计量接近总体的参数值。
5、抽样误差: 总体的异质性和样本与总体范围的差异性,在用 样本的统计值去推算总体的参数值时总会有偏差, 这种偏差就是抽样误差。它是样本代表性大小的一 个标准。
当总体相当大时,可能被抽取的样本非常多,不 可能列出所有的实际抽样误差,而用平均抽样误差来 表征各样本实际抽样误差的平均水平。
抽样误差是指样本指标值与被推断的总体指标值 之差。主要包括:样本平均数与总体平均数之差;样 本成数与总体成数之差。
抽样比:指样本量 n 与总体的容量N的比例 2、个体与抽样单位: 个体是收集信息的基本单位,即分析单位。个体 可以是人,也可以是家庭、组织、社区等,也可以 是文化产物,例如文章、杂志、歌曲、词汇等。
抽样单位是一次直接的抽样所使用的基本单位。
二者比较:
A:个体与抽样单位在有些研究中是相同的,有时又是不 同的。(与选用的抽样方法有关)
B:在实际抽样中,抽样单位往往是多层次的。 例如:上面的例子,要抽取1000名学生,可先抽 取若干学校,然后从这些学校样本中抽取若干班级, 最后从班级样本中抽取学生样本。这时抽样单位是 学校、班级、学生三种,分别称为初级抽样单位、 次级抽样单位和终极抽样单位。
3、抽样框又称抽样范围,它是指一次直接抽样 时总体中所有抽样单位的名单。
一、抽样的基本术语
抽样:是通过抽取总体中的部分单元,收集这些 单元的信息,运用数理统计的原理和方法,对总体进 行推断的一种手段。
总体
抽取样本 推断总体
样本
1、总体与样本。总体是指研究对象的全体,它 是由研究对象中的单元组成的。总体中单元的数目 称作总体容量。
样本是从总体中按照一定方式抽取出的一部分元 素的集合。
2.决定抽样方法 各种不同的抽样方法都有自身的特点和适用范 围。因此,我们在具体实施抽样之前,应依据调 查研究的目的、界定的总体范围、要求确定样本 的规模和要求量化的精确程度来决定具体采用哪 种抽样方法。
3.设计抽样方案 4.制定抽样框 制定抽样框就是依据已经明确界定的总体范围, 收集总体中全部抽样单位的名单,并统一编号。
例如:从某省总数为12.8万人的大学生总体中,按一定方 式抽取1000名大学生进行调查,单个的大学生既是构成某省 12.8万名大学生的个体(也就是我们所要分析的对象),又 是我们从总体中一次直接抽取1000名大学生的样本时所用的 抽样单位。
但是,当我们从这一总体中一次直接抽取出40个班级,而 以这40个班级中的全部学生(假定正好1000名)作为我们的 样本时,抽样单位(班级)与个体(学生)就不是一样的了。
上面的例子中有三个层次的抽样单位:学校、班 级、学生,则对应的抽样框也应有三个:全部学校的 名单、抽取的学校样本中的全部班级的名单、抽取班 级中的所有学生的名单。
4、参数值与统计值: 参数值也称总体值,它是关于总体中某一变量的 综合描述,或者说是总体中所有个体的某种特征的 综合数量表现。 在统计中最常见的总体值是某一变量的平均值 例如:平均年龄、平均收入等。 总体值只有通过对总体中的每一个个体都进行调 查或测量才能得到。
在样本量相同的情况下,置信水平越高,置信区间 越宽。在置信区间不变的情况下,样本量越多,置信 水平越高
例:
美国Gallup(盖洛普)公司就消费者对美国产品质量的看
法,对美国、德国和日本三国共计3,500名消费者(每个国家
约1,200名)分别进行了调查,调查结果:有55%的美国人认为
美国产品质量好,而只有26%的德国人和17%的日本人持同样
例2:为了了解参加某种知识竞赛的1000名学生 的成绩,应采用什么样的抽样方法恰当?
例3:一个单位的职工500人,其中不到35岁的 有125人,35到49岁的有280人,50岁以上的有95人。 为了了解这个单位职工与身体状况有关的某项指标, 要从中抽取一个容量为100的样本。由于职工年龄与 这项指标有关,试问:应用什么方法抽取?能在500 人中任意取100个吗?能将100个份额均分到这三部 分中吗?
抽样误差的来源: 1、登记性误差; 2、代表性误差: A、系统性误差; B、偶然性误差,抽样误差特指偶然性误差。 影响抽样误差的因素:抽样单位数的多少,总 体中被研究标志的变动程度的大小。
6、置信水平与置信区间: 置信水平是指总体参数值落在样本统计值某一正 负区间的概率。
置信区间是指某一置信水平下,样本统计值与总 体参数值的误差范围。
看法。抽样误差为±3%,置信水平为95%。则这三个国家消
费者的置信区间分别为:
国别 样本均值 抽样误差 置信 区 间
美国 55%
±3%
52%-58%
德国 26%
±3%
23%-29%
日本 17%
±3%
14%-20%
二、抽样的基本程序
1.界定总体 界定总体就是在具体抽样前,明确从中抽取样 本的总体的范围与界限。
5.实际抽取样本 实际抽取样本就是在上述几个步骤的基础上,严 格按照所选定的抽样方法,从抽样框中抽取一个个 的抽样单位,构成样本。 6.样本评估 样本评估就是对样本的质量和代表性进行检验, 其目的是防止因样本的偏差过大而导致的失误。
三、抽样的原则 1、目的性原则。 目的性原则是指在进行抽样方案设计时,要以课 题研究的总体方案和研究的目标为依据。以研究的问 题为出发点,从最有利于研究资料的获取,以及最符 合研究的目的等因素来考虑抽样方案和抽样方法的设 计。
第二章 抽样方法
第一节 抽样设计的基本知识 第二节 随机抽样技术 第三节 非随机抽样技术 第四节 样本容量的确定
第一节 抽样设计的基本知识
案例: 1、1936年,兰登总统当选 2、1948年,杜鲁们总统当选 3、1996年, 美国总统大选 问题: 例1:某灯泡厂生产的灯泡10000只,怎样才能 了解这批灯泡的使用寿命呢?
统计值也称样本值,它是关于样本中某一变量的 综合描述,或者说是样本中所有个体的某种特征的 综合数量表现。
样本值是从样本的所有个体中计算出来的,它是 相应的总体值的估计量。
抽样的目的之一,就是通过这些样本值去估计和 推断各种总体值。
抽样设计的目标,就是尽可能使所抽取的样本的 估计量接近总体的参数值。
5、抽样误差: 总体的异质性和样本与总体范围的差异性,在用 样本的统计值去推算总体的参数值时总会有偏差, 这种偏差就是抽样误差。它是样本代表性大小的一 个标准。
当总体相当大时,可能被抽取的样本非常多,不 可能列出所有的实际抽样误差,而用平均抽样误差来 表征各样本实际抽样误差的平均水平。
抽样误差是指样本指标值与被推断的总体指标值 之差。主要包括:样本平均数与总体平均数之差;样 本成数与总体成数之差。
抽样比:指样本量 n 与总体的容量N的比例 2、个体与抽样单位: 个体是收集信息的基本单位,即分析单位。个体 可以是人,也可以是家庭、组织、社区等,也可以 是文化产物,例如文章、杂志、歌曲、词汇等。
抽样单位是一次直接的抽样所使用的基本单位。
二者比较:
A:个体与抽样单位在有些研究中是相同的,有时又是不 同的。(与选用的抽样方法有关)
B:在实际抽样中,抽样单位往往是多层次的。 例如:上面的例子,要抽取1000名学生,可先抽 取若干学校,然后从这些学校样本中抽取若干班级, 最后从班级样本中抽取学生样本。这时抽样单位是 学校、班级、学生三种,分别称为初级抽样单位、 次级抽样单位和终极抽样单位。
3、抽样框又称抽样范围,它是指一次直接抽样 时总体中所有抽样单位的名单。
一、抽样的基本术语
抽样:是通过抽取总体中的部分单元,收集这些 单元的信息,运用数理统计的原理和方法,对总体进 行推断的一种手段。
总体
抽取样本 推断总体
样本
1、总体与样本。总体是指研究对象的全体,它 是由研究对象中的单元组成的。总体中单元的数目 称作总体容量。
样本是从总体中按照一定方式抽取出的一部分元 素的集合。
2.决定抽样方法 各种不同的抽样方法都有自身的特点和适用范 围。因此,我们在具体实施抽样之前,应依据调 查研究的目的、界定的总体范围、要求确定样本 的规模和要求量化的精确程度来决定具体采用哪 种抽样方法。
3.设计抽样方案 4.制定抽样框 制定抽样框就是依据已经明确界定的总体范围, 收集总体中全部抽样单位的名单,并统一编号。
例如:从某省总数为12.8万人的大学生总体中,按一定方 式抽取1000名大学生进行调查,单个的大学生既是构成某省 12.8万名大学生的个体(也就是我们所要分析的对象),又 是我们从总体中一次直接抽取1000名大学生的样本时所用的 抽样单位。
但是,当我们从这一总体中一次直接抽取出40个班级,而 以这40个班级中的全部学生(假定正好1000名)作为我们的 样本时,抽样单位(班级)与个体(学生)就不是一样的了。