第三章_抽样与抽样分布2014分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
国政府制定了一个“抓阄”的征兵计划。该计划打 算把 1 到 366 的号码随机地分配给一年中每一天,然 后由军事部门按分配的号码顺序把生日与之对应的 年轻人分批征召入伍。这种方法的目的是为了给大 家相等的机会卷入这场不受欢迎的战争中,因此被 征召的可能性应该是随机的 在第一年的征兵计划中,号码1被分配给了9月14日, 分配方法是随机抽取一个大容器中的366个写上了日 子的乒乓球。结果所有年满18岁且生于9月14日的合 格青年将作为第一批被征召入伍。生日被分配为号 码2的青年则在第二批被征召入伍,以此类推
判断抽样 滚雪球抽样
湖北大学商学院 chen qianli
非概率抽样与概率抽样
• 统计推断是根据一部分单位构成的样本来
推断总体特征的统计方法,尽管样本的大 小很重要,但决定统计推断最关键的因素 是样本的代表性,即能否及在多大程度上 代表总体。 • 非概率抽样是指人为地选择一部分单位作 为样本的方法,尽管有时并不是那么明显。 如方便抽样和自愿样本。
湖北大学商学院 chen qianli
统计应用
“抓阄”征兵计划
然而结果是,有 73 个较小的号码被分配给了前半
年的日子,同时有110个较小的号码被分配给了后 半年的日子。换句话说,如果你生于后半年的某 一天,那么,你因为被分配给一个较小号码而去 服兵役的机会要大于生于前半年的人 在这种情况下,两个数字之间只应该有随机误差, 而73和110之间的差别超出了随机性所能解释的范 围。这种非随机性是由于乒乓球在被抽取之前没 有被充分搅拌造成的。在第二年,主管这件事的 部门在抓阄之前去咨询了统计学家 (这可能使生于 后半年的人感觉稍微舒服些)
2. 优点:操作简便,可提高估计的精度 3. 缺点:对估计量方差的估计比较困难
湖北大学商学院 chen qianli
3.1 常用的抽样方法
非概率抽样与概率抽样 简单随机抽样 分层抽样 系统抽样 整群抽样
湖北大学商学院 chen qianli
抽样方法
抽样方式
概率抽样 非概率抽样
简单随机抽样 整群抽样 多阶段抽样
分层抽样 系统抽样
方便抽样 自愿样本 配额抽样
用样本统计量对目标量进行估计比较方便
4. 局限性:当N很大时,不易构造抽样框
– –
湖北大学商学院 chen qianli
抽出的单位很分散,给实施调查增加了困难 没有利用其他辅助信息以提高估计的效率
simple random sampling
• A simple random sample (SRS) of size
湖北大学商学院 chen qianli
非概率抽样
•
A voluntary response sample consists of
people who choose themselves by responding to a general appeal. Voluntary response samples are biased because people with strong opinions, especially negative opinions, are most likely to respond. convenience sampling chooses the individuals easiest to reach. Here is an example of convenience sampling. Both voluntary response samples and convenience samples produce samples that are almost guaranteed not to represent the entire population. These sampling methods display bias, or systematic error, in favoring some parts of the population湖北大学商学院 over others . chen qianli
第 三 章 抽样与抽样分布
3.1 常用的抽样方法 3.2 抽样分布 3.3 中心极限定理的应用
湖北大学商学院 chen qianli
你不必吃完整一头牛,才知道它的 肉是咬不动的。
Samel Johnson
湖北大学商学院 chen qianli
统计应用
“抓阄”征兵计划
在美国的对越战争中,为使前线有足够的士兵,美
湖北大学商学院 chen qianli
统计应用
“抓阄”征兵计划
我们知道,并不是所有的人都被征召入伍,因此,生日
被分配的号码较大的人也许永远轮不上到军队服役 这种抓阄看起来对决定应该被征召入伍是一个相当不错 的方法。然而,在抓阄的第二天,当所有的日子和它们 对应的号码公布以后,统计学家们开始研究这些数据。 经过观察和计算,统计学家们发现了一些规律。例如, 我们本应期望应该有差不多一半的较小的号码(1到183) 被分配给前半年的日子,即从1月份到6月份;另外一半 较小的号码被分配给后半年的日子,从7月到12月份。 由于抓阄的随机性,前半年中可能不会分到正好一半较 小的号码,但是应当接近一半
divide the population into groups of similar individuals, called strata. Then choose a separate SRS in each stratum and combine these SRSs to form the full sample. • A market research firm in California uses random digit dialing to choose telephone numbers at random. Numbers are selected separately within each California area code. The size of the sample in each area code is proportional to the population living there.
湖北大学商学院 chen qianli
系统抽样
(systematic sampling)
1. 将总体中的所有单位(抽样单位)按一定顺
序排列,在规定的范围内随机地抽取一个 单位作为初始单位,然后按事先规定好的 规则确定其他样本单位
– 先从数字 1 到 k 之间随机抽取一个数字 r 作为 初始单位,以后依次取r+k,r+2k等单位
n consists of n individuals from the
population chosen in such a way that every set of n individuals has an equal chance to be the sample actually selected.
湖北大学商学院chen qianli
• 方便抽样(convenience sampling)是由调查人
员的便利来获取样本的方法,最典型的形式为商 场或购物中心的消费者调查。但商场调查的人并 不能代表人口总体,如这些人可能比较有钱,青 少年或退休人士较多,且调查倾向于外表整洁, 看起来不具威胁的人,由此商场的样本是有偏的, 代表性较差。 自愿样本,又称自愿回应样本(voluntary response sample)是指对某一诉求的回应而自然 形成的样本。如写信回应、电话回应或网上回应, 样本是由本调查者自己决定的,样本也是有偏的。
简单随机抽样的一般步骤
• 1 确定抽样框,对每个个体指定一个数字代
码,一般要求每个代码具有相同的位数。 • 2 利用随机数表来随机选取代码。 • 现在大部分统计软件可以对一组数据直接 进行简单抽样。
湖北大学商学院 chen qianli
分层抽样
(stratified sampling)
1. 将总体单位按某种特征或某种规则划分为
湖北大学simple random sample)
1. 由简单随机抽样形成的样本 2. 从总体N个单位中随机地抽取n个单位作为
样本,使得每一个容量为 n 样本都有相同 的机会(概率)被抽中 3. 参数估计和假设检验所依据的主要是简单 随机样本
湖北大学商学院 chen qianli
湖北大学商学院 chen qianli
简单随机抽样(simple random sampling)
1. 从总体N个单位中随机地抽取n个单位作为样本,使
2. 3.
得每一个容量为 n 样本都有相同的机会 ( 概率 ) 被抽 中 (注意:教材中SRS的定义“每一个总体单位有 相同的机会被抽中”是不正确的。考虑一个有相同 数量的男性和女性组成的总体,随机抛掷一枚硬币, 如正面朝上,随机选择 100 名女性构成样本,如反 面朝上,随机选择 100 名男性构成样本,每个人被 抽中的概率相同但显然不是SRS) 抽取元素的具体方法有重复抽样和不重复抽样 特点:简单、直观,在抽样框完整时,可直接抽取样本
湖北大学商学院 chen qianli
Probability Sample
• Probability Sample • A probability sample is a sample chosen
by chance. We must know what samples are possible and what chance, or probability, each possible sample has. • In every case, however, the use of chance to select the sample is the essential principle of statistical sampling.
湖北大学商学院 chen qianli
Stratified Random Sample
• The value of stratified random sampling depends
on how homogeneous the elements are within the strata. If elements within strata are alike, the strata will have low variances. Thus relatively small sample size can be used to obtain good estimates of the strata characteristics. If strata are homogeneous, the stratified random sampling procedure provides results just as precise as those of simple random sampling by using a smaller total sample size
概率抽样
(probability sampling)
1. 根据随机性原则来抽取样本单位,也称随机 2.
抽样,随机性原则来消除人为因素的影响, 具有较好的代表性,目前成为抽样的主要的 专业方法,如盖洛普的调查等。 特点
– 按一定的概率以随机原则抽取样本 • 抽取样本时使每个单位都有一定的机会被抽中 – 每个单位被抽中的概率是已知的,或是可以计算 出来的 – 当用样本对总体目标量进行 估计时,要考虑到每个样本 单位被抽中的概率
不同的层,然后从不同的层中独立、随机 地抽取样本 2. 优点
– 保证样本的结构与总体的结构比较相近,从 而提高估计的精度 – 组织实施调查方便 – 既可以对总体参数进行估计,也可以对各层 的目标量进行估计
湖北大学商学院 chen qianli
Stratified Random Sample
• To select a stratified random sample, first
判断抽样 滚雪球抽样
湖北大学商学院 chen qianli
非概率抽样与概率抽样
• 统计推断是根据一部分单位构成的样本来
推断总体特征的统计方法,尽管样本的大 小很重要,但决定统计推断最关键的因素 是样本的代表性,即能否及在多大程度上 代表总体。 • 非概率抽样是指人为地选择一部分单位作 为样本的方法,尽管有时并不是那么明显。 如方便抽样和自愿样本。
湖北大学商学院 chen qianli
统计应用
“抓阄”征兵计划
然而结果是,有 73 个较小的号码被分配给了前半
年的日子,同时有110个较小的号码被分配给了后 半年的日子。换句话说,如果你生于后半年的某 一天,那么,你因为被分配给一个较小号码而去 服兵役的机会要大于生于前半年的人 在这种情况下,两个数字之间只应该有随机误差, 而73和110之间的差别超出了随机性所能解释的范 围。这种非随机性是由于乒乓球在被抽取之前没 有被充分搅拌造成的。在第二年,主管这件事的 部门在抓阄之前去咨询了统计学家 (这可能使生于 后半年的人感觉稍微舒服些)
2. 优点:操作简便,可提高估计的精度 3. 缺点:对估计量方差的估计比较困难
湖北大学商学院 chen qianli
3.1 常用的抽样方法
非概率抽样与概率抽样 简单随机抽样 分层抽样 系统抽样 整群抽样
湖北大学商学院 chen qianli
抽样方法
抽样方式
概率抽样 非概率抽样
简单随机抽样 整群抽样 多阶段抽样
分层抽样 系统抽样
方便抽样 自愿样本 配额抽样
用样本统计量对目标量进行估计比较方便
4. 局限性:当N很大时,不易构造抽样框
– –
湖北大学商学院 chen qianli
抽出的单位很分散,给实施调查增加了困难 没有利用其他辅助信息以提高估计的效率
simple random sampling
• A simple random sample (SRS) of size
湖北大学商学院 chen qianli
非概率抽样
•
A voluntary response sample consists of
people who choose themselves by responding to a general appeal. Voluntary response samples are biased because people with strong opinions, especially negative opinions, are most likely to respond. convenience sampling chooses the individuals easiest to reach. Here is an example of convenience sampling. Both voluntary response samples and convenience samples produce samples that are almost guaranteed not to represent the entire population. These sampling methods display bias, or systematic error, in favoring some parts of the population湖北大学商学院 over others . chen qianli
第 三 章 抽样与抽样分布
3.1 常用的抽样方法 3.2 抽样分布 3.3 中心极限定理的应用
湖北大学商学院 chen qianli
你不必吃完整一头牛,才知道它的 肉是咬不动的。
Samel Johnson
湖北大学商学院 chen qianli
统计应用
“抓阄”征兵计划
在美国的对越战争中,为使前线有足够的士兵,美
湖北大学商学院 chen qianli
统计应用
“抓阄”征兵计划
我们知道,并不是所有的人都被征召入伍,因此,生日
被分配的号码较大的人也许永远轮不上到军队服役 这种抓阄看起来对决定应该被征召入伍是一个相当不错 的方法。然而,在抓阄的第二天,当所有的日子和它们 对应的号码公布以后,统计学家们开始研究这些数据。 经过观察和计算,统计学家们发现了一些规律。例如, 我们本应期望应该有差不多一半的较小的号码(1到183) 被分配给前半年的日子,即从1月份到6月份;另外一半 较小的号码被分配给后半年的日子,从7月到12月份。 由于抓阄的随机性,前半年中可能不会分到正好一半较 小的号码,但是应当接近一半
divide the population into groups of similar individuals, called strata. Then choose a separate SRS in each stratum and combine these SRSs to form the full sample. • A market research firm in California uses random digit dialing to choose telephone numbers at random. Numbers are selected separately within each California area code. The size of the sample in each area code is proportional to the population living there.
湖北大学商学院 chen qianli
系统抽样
(systematic sampling)
1. 将总体中的所有单位(抽样单位)按一定顺
序排列,在规定的范围内随机地抽取一个 单位作为初始单位,然后按事先规定好的 规则确定其他样本单位
– 先从数字 1 到 k 之间随机抽取一个数字 r 作为 初始单位,以后依次取r+k,r+2k等单位
n consists of n individuals from the
population chosen in such a way that every set of n individuals has an equal chance to be the sample actually selected.
湖北大学商学院chen qianli
• 方便抽样(convenience sampling)是由调查人
员的便利来获取样本的方法,最典型的形式为商 场或购物中心的消费者调查。但商场调查的人并 不能代表人口总体,如这些人可能比较有钱,青 少年或退休人士较多,且调查倾向于外表整洁, 看起来不具威胁的人,由此商场的样本是有偏的, 代表性较差。 自愿样本,又称自愿回应样本(voluntary response sample)是指对某一诉求的回应而自然 形成的样本。如写信回应、电话回应或网上回应, 样本是由本调查者自己决定的,样本也是有偏的。
简单随机抽样的一般步骤
• 1 确定抽样框,对每个个体指定一个数字代
码,一般要求每个代码具有相同的位数。 • 2 利用随机数表来随机选取代码。 • 现在大部分统计软件可以对一组数据直接 进行简单抽样。
湖北大学商学院 chen qianli
分层抽样
(stratified sampling)
1. 将总体单位按某种特征或某种规则划分为
湖北大学simple random sample)
1. 由简单随机抽样形成的样本 2. 从总体N个单位中随机地抽取n个单位作为
样本,使得每一个容量为 n 样本都有相同 的机会(概率)被抽中 3. 参数估计和假设检验所依据的主要是简单 随机样本
湖北大学商学院 chen qianli
湖北大学商学院 chen qianli
简单随机抽样(simple random sampling)
1. 从总体N个单位中随机地抽取n个单位作为样本,使
2. 3.
得每一个容量为 n 样本都有相同的机会 ( 概率 ) 被抽 中 (注意:教材中SRS的定义“每一个总体单位有 相同的机会被抽中”是不正确的。考虑一个有相同 数量的男性和女性组成的总体,随机抛掷一枚硬币, 如正面朝上,随机选择 100 名女性构成样本,如反 面朝上,随机选择 100 名男性构成样本,每个人被 抽中的概率相同但显然不是SRS) 抽取元素的具体方法有重复抽样和不重复抽样 特点:简单、直观,在抽样框完整时,可直接抽取样本
湖北大学商学院 chen qianli
Probability Sample
• Probability Sample • A probability sample is a sample chosen
by chance. We must know what samples are possible and what chance, or probability, each possible sample has. • In every case, however, the use of chance to select the sample is the essential principle of statistical sampling.
湖北大学商学院 chen qianli
Stratified Random Sample
• The value of stratified random sampling depends
on how homogeneous the elements are within the strata. If elements within strata are alike, the strata will have low variances. Thus relatively small sample size can be used to obtain good estimates of the strata characteristics. If strata are homogeneous, the stratified random sampling procedure provides results just as precise as those of simple random sampling by using a smaller total sample size
概率抽样
(probability sampling)
1. 根据随机性原则来抽取样本单位,也称随机 2.
抽样,随机性原则来消除人为因素的影响, 具有较好的代表性,目前成为抽样的主要的 专业方法,如盖洛普的调查等。 特点
– 按一定的概率以随机原则抽取样本 • 抽取样本时使每个单位都有一定的机会被抽中 – 每个单位被抽中的概率是已知的,或是可以计算 出来的 – 当用样本对总体目标量进行 估计时,要考虑到每个样本 单位被抽中的概率
不同的层,然后从不同的层中独立、随机 地抽取样本 2. 优点
– 保证样本的结构与总体的结构比较相近,从 而提高估计的精度 – 组织实施调查方便 – 既可以对总体参数进行估计,也可以对各层 的目标量进行估计
湖北大学商学院 chen qianli
Stratified Random Sample
• To select a stratified random sample, first