统计学原理第5章

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
某商场出售某种商品的价格和销售 资料如下表:
等级 单价(元/公斤) 销售额(万元)
一级 二级 三级
20 16 12
216 115.2 72
试求该商品的平均销售价格。
平均商品销售价值:
M x 16.8 M x
(元/公斤)
两种不同水稻品种,分别在5个田块上试种,其产 量如下: 甲品种 乙品种 田块面积 产 量 田块面积 产 量 (亩) (公斤) (亩) (公斤)
四、抽 样 极 限 误 差
含义: 抽样极限误差指在进行抽样估计时,根据研究 对象的变异程度和分析任务的要求所确定的样 本指标与总体指标之间可允许的最大误差范围。 计算方法: 它等于样本指标可允许变动的上限 或下限与总体指标之差的绝对值。
x x X
抽样平均数极限误差:
x x ≤ X ≤


抽样推断的误差可以事先计算并加以控制。
二、抽样推断的内容
参数估计 参数估计是依据所获 得的样本观察资料,对所研究现 象总体的水平、结构、规模等数 量特征进行估计。 假设检验 假设检验是利用样本 的实际资料来检验事先对总体某 些数量特征所作的假设是否可信 的一种统计分析方法。
三、有关抽样的基本概念
因V乙<V甲 故乙品种具有较大稳定性,宜于推广。
第五章
抽样估计
教学目的与要求
抽样估计是抽样调查的继续,它提供 了一套利用抽样资料来估计总体数量特征 的方法。通过本章的学习,要理解和掌握 抽样估计的概念、特点,抽样误差的含义、 计算方法,抽样估计的置信度,推断总体 参数的方法,能结合实际资料进行抽样估 计。
300 1 0.806 (%) 60000
p
p1 p n
p
p 1 p n 1 n N
0.98 0.02 300
计算结果表明:不重复抽样的平均误差小于重复抽样,
但是“N”的数值越大,则两种方法计算 的抽样平均误差就越接近。
x x
p
抽样成数极限误差: Δ p =│p - P│
p -Δ p ≤P≤ p+Δ
五、抽样误差的概率度
抽样误差的概率度是测量抽样估计可靠 含 义 程度的一个参数。用符号“ t ”表示。
公式表示: t= Δ μ
(t 是极限误差与抽样平均误差的比值)
上式可变形为: Δ =tμ
(极限误差是 t 倍的抽样平均误差)
生有80人。根据样本资料推断全部学生中戴 眼镜的学生所占比重时,抽样误差为多大?
例题四: 一批食品罐头共60000桶,随机抽查300桶
,发现有6桶不合格,求合格品率的抽样平 均误差?
例 题 三 解:
已知:
n 400
n1 80
n1 80 则:样本成数 p 20 % n 400
p
重复抽样: 又称回置抽样。 可能组成的样本数目:Nn 不重复抽样:又称不回置抽样。 可能组成的样本数目: N(N-1)(N-2)……(N-n+1)
例如:从A、B、C、D四个单位中,抽出两个单位构成 一个样本,问可能组成的样本数目是多少?
重复抽样 AA BA CA DA
AB
BB CB DB
AC
BC CC DC
x甲
xf f
2500 500(公斤) 5
x乙
3120 520 (公斤 ) 6

55.3公斤
(x x) f
2
f
15275 5
甲 55.3 V甲 100% 11.06% x甲 500

9900 40.6公斤 6
40.6 V乙 100 % 7.8% 520
1 n
③可通过调整样本单位数来控制抽样平均误差。
例题:假定抽样单位数增加 2 倍、0.5 倍时,抽样平均误差怎样变化?
解:抽样单位数增加 2 倍,即为原来的 3 倍 则: x
1 0.577 3n 3
即:当样本单位数增加2倍时,抽样平均误差为原来的0.577倍。 抽样单位数增加 0.5倍,即为原来的 1.5倍
2、样本的单位数
3、抽样方法
4、抽样调查的组织形式
三、抽样平均误差
抽样平均误差是抽样
平均数或抽样成数的标准 差,反映了抽样指标与总
体指标的平均误差程度。
假设总体包含1、2、3、4、5,五 个数字。 则:总体平均数为
1+2+3+4+5 =3 x = 5 现在,采用重复抽样从中抽出 两个,组成一个样本。可能组成的 样本数目:25个。 如: 1+3 =2 1+4 =2.5 2+4 =3 2 2 2 3+5 = 4 …….. 2
分 析 步 骤: 1、抽取样本,计算样本指标。 2、根据给定的F(t)查表求得概率度 t 。 3、根据概率度和抽样平均误差计算极限误差。 4、计算被估计值的上、下限,对总体参数作 出区间估计。
例 题 一:
某农场进行小麦产量抽样调查, 小麦播种总面积为1万亩,采用不重 复简单随机抽样,从中抽选了100亩 作为样本进行实割实测,测得样本平 均亩产400斤,方差144斤。
第三节
抽样估计的方法
无偏性
一、总体参数的点估计
总体参数点估计的特点: 总体参数优良估计的标准 一致性
有效性
二、总体参数的区间估计
总体参数区间估计的特点: 估计值 区间估计三要素 抽样误差范围
x, p x , p
x , p
抽样估计的置信度
F t
什 么 是 抽 样 估 计 的 置 信 度? 抽样估计的置信度就是表明抽 样指标和总体指标的误差不超过一
定范围的概率保证程度。 符号表示: P( x - X ≤Δ ) x
理论已经证明,在大样本的情 况下,抽样平均数的分布接近于正 态分布,分布特点是:抽样平均数 以总体平均数为中心,两边完全对 称分布,即抽样平均数的正误差与 负误差的可能性是完全相等的。且 抽样平均数愈接近总体平均数,出 现的可能性愈大,概率愈大;反之, 抽样平均数愈离开总体平均数,出 现的可能性愈小,概率愈小,趋于0。 (见下图)
n
N
计算结果表明:根据部分产品推断全部产品的平均使用寿命 时,采用不重复抽样比重复抽样的平均误差要小。
抽样成数平均误差的计算方法
采用重复抽样:
p

p p 1 n
p 1 p n 1 n N
采用不重复抽样: p
例题三: 某校随机抽选400名学生,发现戴眼镜的学
多数样本指标与总体指标都
有误差,误差有大、有小,有正、
有负,抽样平均误差就是将所有
的误差综合起来,再求其平均数,
所以抽样平均误差是反映抽样误 差一般水平的指标。
பைடு நூலகம்
抽样平均误差的计算公式
抽样平均数 的平均误差
x
x X
M
2
抽样成数 平均误差
p
p P 2
M
(以上两个公式实际上就是第四章讲的标准差。 但反映的是样本指标与总体指标的平均离差程度) 实际上,利用上述两个公式是计算不出抽样平均误差的。
正态概率分布图
因为扩大或缩小以后 的平均误差,就是极 限误差: Δ=tμ 所以,抽样平均误 差的系数就是概 率度t。
68.27%
数理统计已经证明,抽样 误差的概率就是概率度的 函数,二者对应的函数 关系已编成“正态分布 概率表”。
95.45% x+1μ x+2μ X 由此可知,误差范围愈大,抽样估计的置信度愈高,但抽样估计 的精确度愈低;反之,误差范围愈小,则抽样估计的置信度 愈低,但抽样估计的精确度愈高。 x-2μ x-1μ
本章主要内容
•抽样推断的一般问题
•抽样误差
•抽样估计的方法 •抽样组织设计
第一节
概 念
抽样推断的一般问题
一、抽样推断的概念和特点
抽样推断是按随机原则从全部 研究对象中抽取部分单位进行观察, 并根据样本的实际数据对总体的数 量特征作出具有一定可靠程度的估 计和判断。 它是由部分推断整体的一种认识方法。 抽样推断建立在随机取样的基础上。 抽样推断运用概率估计的方法。
1.2 1.1 1.0 0.9 0.8
600 495 445 540 420
1.5 1.4 1.2 1.0 0.9
840 770 540 520 450
要求:
⑴分别计算两品种的单位面积产量。
⑵计算两品种亩产量的标准差和标
准差系数。
⑶假定生产条件相同,确定哪一品 种具有较大稳定性,宜于推广。
产量 x f x 面积 f
(1)以95.45%的可靠性推断该农 场小麦平均亩产可能在多少斤之间? 若概率保证程度不变,要求抽样允许 误差不超过1斤,问至少应抽多少亩 作为样本?
∑X X= N ∑XF X= ∑F 2 = Σ(X-X)2 σ N 2 2 = Σ(X-X)F σ ΣF N1 P= N
研究总体中 的数量标志 参数 研究总体中 的品质标志
(只有两种表现) 总体方差
总体成数
成数方差 σ 2 = P(1-P)
统计量
研究数 量标志
根据样本数据计算的综合指标。 x = ∑x n 样本平均数 ∑xf x = ∑f
则: x

1.5n

1 0.8165 1.5
即:当样本单位数增加0.5倍时,抽样平均误差为原来的0.8165倍。
采用不重复抽样:
x

n 1 n N
2
公式表明:抽样平均误差不仅与总体变异程度、 样本容量有关,而且与总体单位数的多少有关。
例题一:随机抽选某校学生100人,调查他们的体

x x
n
2
样本标准差
x
x x
f
2
f
研究品 质标志
样本成数 p = 成数标准差
n n
p
p1 p
(三)样本容量和样本个数
样本容量:一个样本包含的单位数。用 “n”表示。 一般要求 n ≥30 样本个数:从一个全及总体中可能抽取的样本数目。
(四)重复抽样和不重复抽样
重。得到他们的平均体重为58公斤,标 准差为10公斤。问抽样推断的平均误差 是多少?
例题二: 某厂生产一种新型灯泡共2000只,随机
抽出400只作耐用时间试验,测试结果 平均使用寿命为4800小时,样本标准差 为300小时,求抽样推断的平均误差?
例题一解: 则:
已知: n=100
x=58
σ=10
x
三、总体参数区间估计的方法
(一)根据给定的抽样误差范围, 求概率保证程度
分析步骤: 1、抽取样本,计算抽样指标。
2、根据给定的极限误差范围估 计总体参数的上限和下限。 3、计算概率度。 4、查表求出概率F(t),并对 总体参数作出区间估计。
(二)根据给定的概率F(t),推算 抽样极限误差的可能范围
p1 p n
0.2 0.8 0.02 400
即:根据样本资料推断全部学生中戴眼镜的学
生所占的比重时,推断的平均误差为2%。
例 题 四 解:
已知: N 60000
则:样本合格率
n 300
n1 6
n n1 300 6 p 0.98 n 300
0.98 0.02 0.808 (%) 300
想一想,为什么?
抽样平均数平均误差的计算方法
采用重复抽样:
x

n
此公式说明,抽样平均误差与总体标准差成正比, 与样本容量成反比。(当总体标准差未知时,可 用样本标准差代替) (教材P180例题)
通过例题可说明以下几点: ①样本平均数的平均数等于总体平均数。 ②抽样平均数的标准差仅为总体标准差的
AD
BD CD DD
Nn = 42
=16 (个样本)
不重复抽样
N(N-1)(N-2)……. 4×3 = 12(个样本)
第二节
抽 样 误 差
一、抽样误差的含义
由于随机抽样的偶然因素使样本
各单位的结构不足以代表总体各单位 的结构,而引起抽样指标和全及指标 之间的绝对离差。
二、影响抽样误差大小的因素
1、总体各单位标志值的差异程度
(一)总 体 和 样 本
总体: 又称全及总体。指所要认识的 研究对象全体。总体单位总数用“N” 表示。 样本: 又称子样。是从全及总体中随 机抽取出来,作为代表这一总体的 那部分单位组成的集合体。样本单 位总数用“n”表示。
(二)参 数 和 统 计 量
参 数 反映总体数量特征的全及指标。
总体平均数

n

10 1(公斤) 100
即:当根据样本学生的平均体重估计全部学生的平均 体重时,抽样平均误差为1公斤。
例题二解: 已知: N=2000 n=400 σ=300 则: x=4800
x

300 15(小时) n 400
400 2000
x
3002 400 2 n 1 13.42(小时) 1
相关文档
最新文档