统计学基础 第7章--抽样推断分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1. 抽样平均误差
(1)抽样平均误差的概念
抽样平均误差是反映抽样误差一般水平的指标。 x 表示抽样平均数的抽样平均误差, p 表示抽样成数的抽样平均误差,
M 表示全部可能的样本数目。
提 示
上述公式只能表示抽样 平均误差的意义。 实际工作中不能用其来计算。 在抽样推断中总体指标 是不知道的,需要推断 才能得到。 另外还需知道所有可能的样 本平均数和成数,这实际上 也是很难办到的。
总体成数P
指总体中具有某一标志表现的单位数占总体全部单位数 的比重。
设总体N个单位中,有N1个单位具有某种属性,N0个单位不具 有某种属性。
N1 P N
Q
N0 1 P N
1)全及指标 (参数)
总体成数标准差 如果品质标志表现只有是、非两种,把“是”的标志表 示为1,而“非”的标志表示为0。那么成数就可以视为 (0,1)分布的平均数。
4. 抽样组织方式
(1)简单随机抽样
简单随机抽样又称为纯随机抽样。它是对总体各 单位不作任何加工整理,直接从总体中随机抽取调查 单位的抽样调查方式,是最基本也是最简单的一种。
(2)类型抽样
类型抽样又称为分层抽样或分类抽样。它是先对 总体各单位按某一标志加以分组,然后再从各组中按 随机原则抽取一定单位构成样本的抽样组织方式。
p t p
2. 抽样极限误差
(2)抽样极限误差的计算
1)重复条件下
2 平均数的抽样极限误差 x t x t n 成数的抽样极限误差 t t P(1 P)

国家旅游局自1993年起,每年委托国家统计局城市 社会经济调查总队(现为国家统计局城市社会经济调查 司),对我国大陆地区城镇居民国内旅游情况进行抽样 调查(2006年以前未将西藏纳入调查范围)。同时,在 连续三年(1997—1999年)与国家统计局城市社会经济 调查总队合作开展农村居民国内旅游调查取得经验的基 础上,从2000年开始,委托国家统计局农村社会经济调 查总队(现为国家统计局农村社会经济调查司)在我国 除西藏以外的大陆地区开展了农村居民国内旅游抽样调 查。根据2007年这两项调查的结果,对全国国内旅游人 数、出游率、出游花费等主要指标进行测算,从而分别 得出2007年城镇居民旅游总体情况、农村居民旅游总体 情况及全国国内居民旅游总体情况。
1)全及指标 (参数)
◆ 总体平均数和总体标准差
总体平均数

X
总体各单位某一数量标志标志值的算术平均数。
X X源自文库 N
或 X
XF F
总体标准差
测定总体各单位标志值差异程度的指标。
X
(X X )
N
2

X
(X X ) F F
2
1)全及指标 (参数)
◆ 总体成数和总体成数标准差
4. 抽样组织方式
(3)等距抽样
等距抽样又称为机械抽样或系统抽样。它是先将 总体各单位按某一标志排序,然后按照固定的顺序和 相同的间隔来抽选样本单位的抽样组织形式。
(4)整群抽样
整群抽样也称为分群抽样或集团抽样。它是将总 体划分为若干群,然后以群为单位从中随机抽取部分 群,对中选群中的所有单位进行全面调查的抽样组织 方式。
7.2
抽样误差
抽样误差是指按照随机原则抽取的样本计 算的样本指标,在代表总体指标时产生的离差, 即样本平均数与总体平均数的离差,样本成数 与总体成数的离差。这种误差是抽样推断所特 有的,用部分单位资料估计总体数量特征不可 避免的误差。由于总体指标是未知的,而样本 指标又是随机变量,不是唯一的,所以,抽样 误差也是一个随机变量,即有多少种可能的样 本就有多少种可能的实际抽样误差。
n p 1 n

n0 q 1 p n
2)样本指标(统计量)

样本成数标准差
s p pq p(1 p)
提示
全及总体是唯一确定的, 反映全及总体数量特征的全及指标也是个定值。 从一个总体中可抽取多个样本, 样本总体不是唯一的,样本指标是随机变量。
3.抽样方法
(1)重复抽样 从总体N个单位中随机抽取一个容量为n的样本,每 次从总体中抽取一个单位,并把它看作是一次试验, 把结果登记下来,又重新放回,参加下一次抽选,连 续进行n次试验构成一个样本的方法。 从总体N个单位中,用重复抽样的方法,随机抽取n 个单位构成一个样本,则共可抽取个 N n 个样本。 总体有A、B、C、D四个单位,用重复抽样的方法抽 取2个单位构成样本。全部可能抽取的样本数目为42=16 个,它们是:AA AB AC AD BA BB BC BD CA CB CC CD DA DB DC DD
章首引例
由国家旅游局与国家统计局城市社会经济调查司、农 村社会经济调查司合作,在我国大陆地区开展的国内旅游 抽样调查结果表明,2007年我国国内旅游人数继续平稳增 长,国内旅游收入突破7000亿元;国内旅游总人数为16.10 亿人次,比上年增长15.5%;国内旅游总收入为7770.62亿 元,比上年增长24.7%;国内游客人均花费482.6元/人次, 比上年增长8%。 上述案例中,为什么采取抽样调查这种非全面调查方式 同样可以取得反映全国国内旅游情况的资料?案例中的数据 是采用何种方法估计推断的?
(2)抽样平均误差的计算公式
2)在不重复抽样的条件下
抽样平均数的抽样平均误差
2 N n 2 n x ( ) (1 ) n N 1 n N
成数的抽样平均误差
p
P(1 P) N n P(1 P) n ( ) (1 ) n N 1 n N
提 示
应用上述公式计算抽样平均误差时, 一般总体方差是未知的, 通常使用样本方差来代替, 有时也可用小规模的试验性调查资料来代替。
7.1 抽样推断的基本概念
1. 抽样推断的概念及特点 (1)抽样推断的概念 抽样推断就是按照随机抽样的原则, 从总体中抽出一部分单位作为样本,并 利用样本的实际资料计算样本指标值, 然后根据样本指标对总体指标(数量特 征)做出具有一定可靠程度的估计和判 断的一种统计分析方法。
1. 抽样推断的概念及特点
样本个数(样本可能数目)
样本个数指有多少个样本。是从一个全及总体中可能 抽取的样本数目。
2. 抽样推断中的几个基本概念
(3)全及指标和抽样指标
1)全及指标 (参数)
指根据全及总体各个单位的标志值或标志属性计算的, 反映总体某种特征或属性的统计指标。 全及指标是总体变量的函数,其数值是由总体各单位 的标志值或标志属性决定的。由于一个全及指标的指标值是 确定的、唯一的,所以称为参数。常用的全及指标包括总 体平均数和总体标准差、总体成数和总体成数标准差。
反映样本各单位某一数量标志标志值的算术平均数。
x x n

xf x f
样本标准差
用来测定样本各单位标志值变异程度的指标。
sx
( x x)
n
2

sx
( x x) f
2
f
2)样本指标(统计量)
◆ 样本成数和样本成数标准差


样本成数p
样本中具有某一标志表现的单位数占全部样本单位数 的比重。 设样本n个单位中,有n1个单位具有某种属性,n0个单 位不具有某种属性,则
(3)全及指标和抽样指标
2)样本指标(统计量)
样本指标
根据样本各单位标志值或标志属性计算的综合指标。 它是样本变量的函数,用来估计总体参数的,又称为 统计量,它和总体参数相对应。 统计量有样本平均数、样本成数、样本标准差(或 样本方差)。
2)样本指标(统计量)
◆ 样本平均数和样本标准差
样本平均数
94%(1 94%) 100 (1 ) 2.25% 100 1000
P
P(1 P) n (1 ) n N
提示
平均数的抽样平均误差的计量单位与平均 数的计量单位相同,成数的抽样平均误差一般 用百分数来表示。
1. 抽样平均误差
(3)影响抽样误差大小的因素
总体各单位标志值的差异程度 正比 样本的单位数 反比 抽样误差 抽样方法
不重复抽样 重复抽样 抽样误差小 抽样误差大
抽样误差
抽样调查的组织形式
在样本容量相同的情况下 采用等距抽样或类型抽样 抽样误差就比简单随机抽样 或整群抽样小。
2. 抽样极限误差
(1)抽样极限误差的含义
抽样极限误差是指联系一定可靠程度的抽样误差 的可能范围,是进行抽样推断时可以允许的误差范围, 故又称为允许误差,用 表示。 根据可靠程度的要求,抽样极限误差与抽样平均 误差之间的关系式为: t 抽样平均数的抽样极限误差 x t x 抽样成数的抽样极限误差
第7章 抽样推断分析
学习目标
理解抽样推断的概念和特点、掌握抽样推断中 涉及的几个基本概念;知道如何采用重复抽样和 不重复抽样方法选取样本,能结合实际有关资料 进行点估计和区间估计,并能确定必要样本容量; 熟练应用Excel进行抽样推断。
关键术语
抽样推断 点估计 抽样平均误差 区间估计 抽样极限误差
章首引例
1) 样本平均数的抽样平均误差
x
(x X )
M
2
2) 样本成数的抽样平均误差
p
( p P)
M
2
1. 抽样平均误差
(2)抽样平均误差的计算公式
1)在重复抽样的条件下 抽样平均数的抽样平均误差 成数的抽样平均误差 检 查 点
2 x n
p
P(1 P) n
某电视台想了解观众对某个电视 专题栏目的喜欢程度, 假定总体变异程度不变, 如样本容量减少1/2或增加1倍, 抽样平均误差将会如何变化?
(2)抽样推断的特点
遵循随机取样的原则 由部分资料推算总体的数量特征 抽样误差可以事先计算和控制
2. 抽样推断中的几个基本概念
(1)全及总体和样本总体
全及总体
指所要认识的研究对象的全体。是所要认识的、具有 某种共同性质的许多单位的集合体。 总体单位总数用“N”表示。 在抽样推断中,全及总体是客观存在、唯一确定的。
3.抽样方法
(2)不重复抽样
从总体N个单位中抽取一个容量为n的样本,每次 从总体中抽取一个单位,但每次抽出一个单位后就不 再放回参加下一次的抽选,连续进行n次抽取构成一个 样本的方法。 从总体N个单位中,用不重复抽样的方法,抽取n 个单位构成一个样本,全部可能抽取的样本数目为
( N 1)(N 2)......(N n 1) 个 N 总体有A、B、C、D四个单位,用重复抽样的方法抽 取2个单位构成样本。全部可能抽取的样本数目为4×3 =12 个,它们是:AB AC AD BA BC BD CA CB CD DA DB DC
样本总体
指从全及总体中随机抽取出来,作为代表这一总体的 那部分单位组成的集合体。 样本总体的单位数通常用“n”来表示。 在抽样推断中,样本不是唯一确定的,而是随机的。
2. 抽样推断中的几个基本概念
(2)样本容量和样本个数
样本容量
样本所容纳的单位个数称为样本容量。 样本容量是一个样本所包含的单位数。 样本容量≥30为大样本,<30为小样本。
抽样平均误差的计算
【例7-1】某高等职业技术学院2009年9月从1000名新生 中随机抽取100名进行英语口语测试,测得平均成绩为76 分,标准差为11.2分,其中60分以上的学生有94名。根 据上述资料,计算该校新生英语口语平均成绩和及格率 的抽样平均误差。
已知 N 1000 n 100 x 76 s x 11.2 2 2 由于总体方差不知道,需用 s x 代替 p(1 p) 代替 P(1 P) 重复抽样条件下:
平均成绩的抽样 2 11.2 2 x 1.12 (分) n 100 平均误差 及格率的抽样 p P(1 P) 94% (1 94%) 2.37% n 100 平均误差
x 2
及格率 p
94 94 % 100
不重复抽样条件下:
n 11.22 100 (1 ) (1 ) 1.06 (分) n N 100 1000
XP 0 N 0 1 N1 N1 N
(0 P) 2 N 0 (1 P) 2 N1 P 2 N 0 Q 2 N1 P N N
P 2Q Q 2 P PQ ( P Q) PQ P(1 P)
分组讨论:
全及指标虽然是客观存在的, 为什么在抽样推断中是不可能直 接计算的,只能推断得出?
相关文档
最新文档