第六章 抽样推断

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

重复纯随机抽样条件下, 重复纯随机抽样条件下,抽样平均误差计算
µx =
δ
2
n
=
δ
n
式中
µ x — 抽样平均数的平均误差; δ — 全及总体标准差;
n — 样本总体单位数。
没有全及总体标准差资料时,用抽样总体标准差 s 代替 没有全及总体标准差资料时,
2
µx =
s s = n n
重复抽样情况下抽样成数的平均误差计算 设:总体具有某种标志的单位数为 总体单位数 N1
2012-4-12
统计学---古老又现代的学科 认识社会的有力武器! 统计学---古老又现代的学科 认识社会的有力武器! ---
13
wk.baidu.com
抽样平均误差的计算方法
重复抽样情况下抽样平均数的平均误差计算
µx =
( x − X )2 ∑ K
式中
µ x — 抽样平均数的平均误差;
x — 抽样总体平均数; X — 全及总体平均数; K — 样本平均指标个数或抽样成数 的个数(样本可能数目)。
重复抽样和不重复抽样
重复抽样——从全及总体 个单位中抽取 个样本,每 从全及总体N个单位中抽取 个样本, 重复抽样 从全及总体 个单位中抽取n个样本 次从总体中随机抽出一个单位后, 次从总体中随机抽出一个单位后,再放 回总体中重新参加下一次抽取 不重复抽样——从全及总体 个单位中抽取 个样本, 从全及总体N个单位中抽取 个样本, 不重复抽样 从全及总体 个单位中抽取n个样本 当某一个单位被随机抽出后, 当某一个单位被随机抽出后,不再放 回总体
例:某村5 000亩粮食耕地,用不重复抽样方法抽取50亩, 求得其平均亩产为400公斤。若确定抽样误差为10公斤,请 估计5 000亩粮食耕地亩产和总产水平。 解:(1)估计亩产
x − ∆x ≤ X ≤ x + ∆x 400 − 10 ≤ 亩产 ≤ 400 + 10 (公斤) 390 ≤ 亩产 ≤ 410 (公斤)
区间推断的可靠程度(置信度) 区间推断的可靠程度(置信度) 令
∆x
µx
= t则∆ x = t ⋅ µ x = t则∆ p = t ⋅ µ p
∆p
µp

式中:t 式中:t — 概率度(极限误差为平均误差的倍数)
x − t ⋅µx ≤ X ≤ x + t ⋅µx
依据中心极限定律, 依据中心极限定律,当 n≥30,抽样平均指标近似服从 正态分布, 正态分布,全及指标所落范围就可以用曲线所围成的面积大 小来计算。 小来计算。
全及总体和抽样总体
全及总体——指研究对象的全部单位,即具有同一性 质的若干单位的集合体,简称总体,抽样调查中又叫全 及总体。 无限总体——包含的单位数 N 是无限的或相对无限 包含的单位数 有限总体——包含的单位数 N 是有限 包含的单位数 抽样总体——抽样总体也叫子样,在总体中按随机原 则抽取的那一部分单位所构成的集合体,简称样本。 大样本—— n ≥30 小样本 ——n≤30 1<n<N
有: 抽样平均数的平均误差
µx =
式中
δ2
n (1 − ) n N
没有全及总体标准差资 料时, 料时 , 用抽样总体标准 差 s 代替
δ — 全及总体标准差;
N — 总体单位数; n — 抽样总体单位数。
µx =
s2 n (1 − ) n N
抽样成数平均误差
µp =
式中
p (1 − p ) n (1 − ) n N
总体不具有某种标志的单位数为 N0 N = N1 + N0 则:总体具有某种标志的全及成数 P = N1 / N 总体不具有某种标志的比重 Q = N0 / N
有: P + Q = N1 / N + N0 / N = 1
Q=1-P
∴ 总体成数的平均数 XP
∑ Xf = ∑f
1 × N1 + 0 × N 0 N1 = = =P N N
影响抽样误差的因素
全及总体标志变动程度
——与抽样误差的大小成正比关系 与抽样误差的大小成正比关系
样本单位数
——与抽样误差的大小成反比关系 与抽样误差的大小成反比关系
抽样组织形式
——抽样组织形式不同,抽样误差的大小不同 抽样组织形式不同, 抽样组织形式不同
●管理类专业的必学课程
经济统计学原理——数字化管理的基础
全及指标和抽样指标
全及指标——根据全及总体各个单位的标志值计算 的反映其某种特征的综合指标 _ 全及平均数(总体平均数)(X)——全及总体某一变 全及总体某一变 量值的算术平均数 全及成数(总体成数)(P)——全及总体具有某种标 全及总体具有某种标 志的单位数在总体中所占的比重 总体方差(δ2)和总体标准差(δ)——测定全及总体标 测定全及总体标 志变异程度的指标
p — 抽样成数; N — 总体单位数; n — 样本总体单位数。
抽样平均误差的计算
抽样形式 抽样平均 误差 重复抽样 不重复抽样
µx =
s2 n (1 − ) n N
µx =
s n
抽样成数 µp = 平均误差 应用条件
p (1 − p ) n
µp =
p (1 − p ) n (1 − ) n N
第一节 抽样调查的意义及其理论依据 一、抽样调查的意义
抽样调查的定义
——是按 ——是按随机原则从总体中抽取一部分单位为 样本,对其进行调查,根据样本指标推断总体指标 的一种非全面调查方法。
抽样调查的特点
按随机原则抽取样本单位 是一种非全面调查 节约人力、物力和财力 可靠性高,误差可以事先计算并加以控制 应用概率论的理论与方法,用样本的指标数 值推断总体的指标数值
- △x= ∣x - X∣ △p= ∣p - P∣ 等价变换:
x − ∆x ≤ X ≤ x + ∆x p−∆p ≤ P ≤ p+∆p
(1) (2)
说明: 全及平均指标以抽样平均指标为中心, 说明:(1)式表示全及平均指标 全及平均指标 落在抽样平均指标x ± △x 范围内; (2)式表示全及成数 全及成数以抽样成数为中心,落在抽样 全及成数 成数 p ±△p 范围内。
µp =
p (1 − p) = n
0.6 × 0.4 = 4.9% 100
• 不重复抽样的抽样成数平均误差为: 不重复抽样的抽样成数平均误差为:
µp =
p (1 − p) n (1 − ) = n N
0.6 × 0.4 100 (1 − ) = 4.88% 100 10000
第三节 抽样估计
根据样本指标对对应的总体指标加以估计和判断的一种 方法。 方法。 点估计 ——以样本指标直接替代总体指标的 估计值 ,不考 虑误差与可靠程度。 区间估计 区间估计的含义 ——根据样本指标和抽样误差推断总体指标的可能 范围,并说明估计总体指标的准确程度和可靠性。 抽样极限误差△-、△p x ——抽样指标与全及指标之间抽样误差的可能范围。
二、抽样调查的作用
可对不可能或不必要全面调查的 现象作全面研究 节约人力、 物力和财力, 节约人力 、 物力和财力 , 取得事半功 倍的效果 对全面调查的数据资料作质量检 验和修正 可对工业产品生产质量进行控制 可对总体的假设进行检验, 可对总体的假设进行检验,判断真伪
三、抽样推断中常用的几个基本概念
n < 5% N
n ≥ 5% N
例6.1 某地对2800户农户年收入进行调查,抽取5%农户作样 本,调查显示:2000年每人年平均收入为5965元,其年收入 的标准差为104.80元,试计算重复抽样和不重复抽样的抽样 平均误差。 已知: 已知:N=2800(户),n=2800×5%=140(户),s=104.80(元) • 重复抽样的抽样平均数的抽样平均误差为: 重复抽样的抽样平均数的抽样平均误差为:
2
成数的标准差平方为
δ P2 =
∑(X − X P ) f ∑f
(1 − P) 2 N 1 + (0 − P) 2 N 0 = N1 + N 0
(1 − P) 2 N 1 + P 2 N 0 (1 − P) 2 N 1 P 2 N 0 = = + N N N = (1 − P ) 2 P + P 2 Q = (1 − P) 2 P + (1 − P ) P 2 = (1 − 2 P + P 2 ) P + P 2 − P 3 = P − P 2 = P(1 − P)
第二节 抽样误差 一、抽样误差的概念
抽样误差 —— 统计调查时 , 调查来的资料与 ——统计调查时 统计调查时,
实际情况的差异称为统计误差。 实际情况的差异称为统计误差。
[原因]
一是在统计调查和统计资料整理过程中由于 登记误差和计算不准而产生的误差(可避免) 登记误差和计算不准而产生的误差(可避免) 二是在抽样调查中, 按随机原则同取样本时, 二是在抽样调查中 , 按随机原则同取样本时 , 由于样本内部构成与总体内部构成不可能完全 一致, 不可避免) 一致,肯定存在误差 (不可避免)
第六章 抽样推断
第一节 抽样调查的意义及其理论依据
一、抽样调查的意义 二、抽样调查的作用 三、抽样推断中常用的几个基本概念 四、抽样调查的理论依据
第二节 抽样误差
一、抽样误差的概念 二、抽样平均误差的计算
第三节 全及总体指标的推断
一、直接推断法 二、修正系数法
第四节 抽样方案的设计
一、抽样方案设计的基本原则 二、样本单位数的确定 三、抽样调查的组织形式及其抽样误差
68.27%
X-3µ X-2µ X-µ
X
X+µ X+2µ X+3µ
95.45% 99.73% 其中:概率度 t 与概率 F(t) 对应
概率度 t 与概率 F(t) 的对应关系表(常用) 概率度(t) 概率F(t) 概率度(t) 概率F(t)
0.67 1.00 1.50 1.96 2.00
(2)估计总产
390 × 5000 ≤ 总产 ≤ 410 × 5000 (公斤) 1950000 ≤ 总产 ≤ 2050000(公斤)
例:从某品种农作物播种地块随机抽取秧苗1 000棵,其中 死苗80棵。若确定抽样极限误差为3%,试估计该农作物秧 苗的成活率区间。 解:该农作物秧苗的成活率区间
p−∆p ≤ P ≤ p+∆p 1000 − 80 1000 − 80 − 3 % ≤ 成活率 ≤ + 3% 1000 1000 89 % ≤ 成活率 ≤ 95 %
总体成数的标准差
δ P = P(1 − P)
∴ 抽样成数的平均误差
µp =
P(1 − P) n
p (1 − p ) n
没有全及总体标准差资料时, 没有全及总体标准差资料时,用抽样总体标准差 s 代替
µp =
s
n p — 抽样成数
=
不重复抽样情况下, 不重复抽样情况下,抽样平均数的平均误差和抽样成数的 平均误差计算 设:全及总体单位数 抽样总体单位数 N n
µx =
s n
=
104.8 140
= 8.86(元)
• 不重复抽样的抽样平均数的抽样平均误差为: 不重复抽样的抽样平均数的抽样平均误差为:
µx =
s2 n 104.8 2 140 (1 − ) = (1 − ) = 8.63(元) n N 140 2800
例6.2 某厂生产某产品,按正常生产检验产品中一级品率占 60%。现从10 000件产品中抽取100件产品进行检验,试按重 复和不重复抽样计算一级产品率的抽样成数的平均误差。 已知:p=0.6,N=10 000 件,n=100 件 •重复抽样的抽样成数平均误差: 重复抽样的抽样成数平均误差: 重复抽样的抽样成数平均误差
四、抽样调查的理论依据
大数定律(大数法则) 大数定律(大数法则) 对某现象观察,由于 受偶然因素影响, 受偶然因素影响,每次结 果不同, 果不同,但经大量观察并 综合平均后, 综合平均后,将消除偶然 的差异, 的差异,而接近总体平均 值,使现象总体某标志规 律及其共同特征在数量、 律及其共同特征在数量、 质量上显示出来。 质量上显示出来。 中心极限定律 只要样本容量n 在充分大的条件下 一般要求n>30) ( 一般要求 n>30) , 不论全及总体的变 量分布是否属于正 态分布, 态分布 , 其抽样平 均数也是趋向于正 态分布的。 态分布的。
抽样指标——根据抽样总体各个单位标志值计算的综合 指标,与全及指标相对应 _ 抽样平均数(x)——抽样总体中某一变量值 观测值 的 抽样总体中某一变量值(观测值 抽样总体中某一变量值 观测值)的 算术平均数 抽样成数(p)——具有某种标志的单位数在抽样总体 具有某种标志的单位数在抽样总体 中所占的比重 样本方差(s2)和样本标准差(s)——说明抽样总体标志 说明抽样总体标志 变异程度的指标
相关文档
最新文档