统计学课件第五章 统计资料的推断

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

实际抽样误差 r
实际抽样误差为样本统计量与总体参数之间
的离差
Ù
(q
-
q
)。
抽样平均误差 ü
以样本统计量为变量值,以对应的总体参数为平
均数计算的标准差,以符号μ表示。反映所有可能
样本统计量与其中心的平均离散程度
抽样极限误差 ü
指在一定概率下实际抽样误差的可能范围,也称
为允许误差,以符号 D 表示
抽样平均误差 抽样平均误差的计算公式:
=
=
= 3575.87
36 - 1
35
标准差为:
sn -1 =
s2 n -1
=
3575 .87 = 59 .80 (克)
第五章 统计资料的推断
★ §5.1 简单随机抽样 ★ §5.2 参数点估计 ★ §5.3 参数区间估计
§5.4 假设检验
每次得到的样本不同,相应样本统计量也会有 变化。且可能比总体指标大或者小。
4
〖例〗一批货物(1800箱)运抵仓库,随 机抽取2%进行检验,获得下列资料。
平均每箱重量(克) 抽样数目f(
500—540
3
540—580
5
580—620
6
620—660
wenku.baidu.com
10
660—700
7
700—740
5
合计
36
求该批货物每箱平均重量、该批货物重量
的方差、标准差。
分析:由于这批货物运抵仓库后,是随机抽取 2%进行检验来获得上面资料的。因此,上 述资料属于抽样资料,要用样本指标计算。
计算
公式 (4)总体比例的计算公式为:
p1 =
f1
m
,L, pi =
fi
m
,L, pm =
fm
m
å fi
å fi
å fi
i=1
i=1
i=1
一个特例:是非标志总体
指总体中全部单位只具有“是”或 概念 “否”、“有”或“无”两种表现形式的
标志值
为了研究是非标志总体的数量特征,令
分组 具有某一属性 不具有某一属性
2
-
ns 2} n
=s2
计算 公式
(3)样本比例的计算公式为:
p1
=
n1 n
,L ,
pi
=
ni n
,L ,
pk
=
nk n
参参数数点点估估计计
指直接以样本指标来估计总体指
标,也叫定值估计
X Ü x, s Ü s, P Ü p
优点 简单,具体明确
缺点
无法控制误差,仅适用于对推断的准 确程度与可靠程度要求不高的情况
样本平均数
m=
å(x - X )2
x
可能样本个数
样本成数
mp =
å( p - P)2 可能样本个数
〖 例 〗 现 有 A、B、C、D四 名 工人 构成 的总体,他们的日产量分别为22、24、26、 28件。从四名工人中任取两名构成一个样 本,请利用重复抽样和不重复抽样的方法 计算抽样平均误差。
【分析】 本题要求我们计算抽样平均误差。
根据样本情况推断总体情况
总体和样本
• 统计研究中的总体(population),是指 我们求取信息的对象全体。
• 样本(sample)是总体的一部分,我们 从样本搜集信息,以便对整个总体作某 些结论。
不可靠的样本
• 从总体抽样时,如果选最容易取得的,称为方 便抽样(convenience sampling)。例如只看箱 子上层苹果的质量。
合计
单位数F N1 N0
N
标志值X 1 0 —
是非标志总体的指标
成数
是非标志总体中具有某种表现或不具 有某种表现的单位数占全部总体单位 总数的比重。
具具有有某某种种标标志志表表现现的的 单单位位数数所所占占的的成成数数 不不具具有有某某种种标标志志表表现现 的的单单位位数数所所占占的的成成数数
P
=
N1 N
根据抽样平均误差的计算公式,我们必须
先计算出三类数值: 总体平均日产量、
样 本 平 均 日 产 量 、可能样本总数。
总体平均日产量 X = 22 + 24 + 26 + 28 = 25(件) 4
1、重复抽样。样本数为 4´ 4 = 16
(22,22) x1 = 22 (22,24) x2 = 23 (22,26) x3 = 24
P = N1 = 380 = 95﹪,Q = N0 = 20 = 5﹪,
N 400
N 400
所以有:X P = P = 0.95
s p = PQ = 0.95´(1- 0.95) = 0.218
样本指标
样本指标也称为统计量或抽样指标,它是根据 抽样各单位的标志值或标志特征值计算的、用 以估计和推断相应总体指标的综合指标。
=
(X i - X )2
i=1 m
fi
fi
i=1
计算
公式 (3)总体标准差的计算公式为:
m
s=
( X1 - X )2 f1 + ( X 2 - X )2 f2 + LL + ( X m - X )2 fm = f1 + f 2 + LL + fm
å (X i - X )2 fi
i =1 m
å fi
i =1
(22,28) x4 = 25 (24,22) x5 = 23 (24,24) x6 = 24
(24,26) x7 = 25 (24,28) x8 = 26 (26,22) x9 = 24
(26,24) x10 = 25 (26,26) x11 = 26 (26,28) x12 = 27
(28,22) x13 = 25 (28,24) x14 = 26 (28,26) x15 = 27
解:
该批货物每箱平均重量为:
x=
m
å xi fi
i=1
m
å fi
i =1
方差为:
= 520 ´ 3 +L + 720 ´ 5 = 22720 = 631.11(克)
3 +L + 5
36
m
å ( X i - X )2 fi
s = 2
i =1
n-1
m
å fi -1
i =1
(520 - 631.11)2 ´ 3 +L + (720 - 631.11)2 ´ 5 125155.56
n(x
-
m)2}
å =
1
n
E{
n -1 i=1
( xi
-
m)2
-
n( x
-
m)2}
å =
1n {
n -1 i=1
E ( xi
-
m)2 -
n
nE ( x
-
m)2}
å å 由于E(x - m)2
=
D(x) =
D(
xi i=1 ) =
n
1 n2
n i =1
s2 D(xi ) = n
E
(
s2 n -1
)
=
1 {ns n -1
=
å xi fi
i=1
m
å fi
i=1
设总体均值为m 方差为s 2
E(x)
=
E êëé
1 n
( x1
+
x2
+L
+
xn
)úûù
=
1 n [E(x1) +
E(x2) +L+
E(xn )]
= 1 nE(x) n
=m
计算 公式
(2)样本方差的计算公式为:
m
å s 2 å n -1
=
( X1
-
X
)2
f1
+
(X2 f1 +
Ù
J1
q
Ù
J2
抽抽样样误误差差
指样本指标与它估计的总体相应指标的差 数。
抽样误差究竟是什么性质的误差,我们必 须从统计误差的种类说起。
登记性误差 统计误差
代表性误差
登记性误差是指在调查过程中由于主、客观 原因引起的登记、汇总或计算等方面的差错而造 成的误差。
代表性误差是指由于样本结构与总体结构不 同(即就被研究标志而言,样本单位的构成与总 体单位的构成不一致),样本不能完全代表总体 而产生的样本指标与总体指标之间的误差。
Ù
lim P(q -q < e ) = 1(e为任意小正数)
n®¥
3
③有效性
ÙÙ
Ù
Ù
存在两个样本统计量q 1、q 2,若q 1的方差小于q 2的方差,即
Ù
Ù
D(q 1) < D(q 2 )
Ù
则称 q 1是较有效的样本统计量。
计算 公式
(1)样本平均数的计算公式为:
m
x=
x1 f1 + x 2 f2 + L L + x m f m f1 + f 2 + L L + f m
注意 一个样本也常常有多个样本指标,它们 从不同的角度反映了样本分布的基本状况和主要 特征。但由于样本不是唯一确定的,因此,依据 样本的数据计算的样本指标也不是唯一确定的。
常用的样本指标有样本平均数 x、样本比
例P、样本标准差s或方差 s2以及样本单位总量n 或样本中某一部分单位总数 n1 等。
设样本中,n个总体单位按某项标志的标志 值分组,分组结果为:
• 自发性回应样本(voluntary response sample) 则是经由对某一诉求的回应而自然形成的。例 如写信回应或电话回应意见调查。
• 方便抽样及自发性回应样本常常是有偏的
可靠的样本
• 简单随机样本
– 大小为n的简单随机样本(SRS, simple random sample)是有n个个体的样本。其选 取的方法,是使得总体中任意一个个体,中 选的概率都相同。
- X )2 f2 + LL + ( X m f2 + LL + fm -1
-
X
)2
fm
=
(X i - X )2 fi
i=1 m
fi -1
i =1
å E ( sn2-1 )
=
E
é êë
n
1 -1
n i =1
( xi
-
x)2
ù úû
å =
1 n -1
n
E{
i=1
[( xi
-
m)
-(x
-
m )]2 }
å å =
Q
=
N0 N
且有 P + Q
=
N1 N
+ N0
N
=
N1 + N0 N
=
N N
=1
2

åå 值 X P =
Xf = N1 ´1 + N0 ´ 0 = N1 = P
f
N
N
å 标
准 sp =
å 差
(X - X)2 f =
(1- P)2 N1 + (0 - P)2 N0
f
N1 + N0
= Q2P + P2Q = PQ(Q + P) = PQ
方差
s 2 = PQ = P(1- P)
当P
=Q
=
0.5时,有
s
2 max
= 0.25
离散系数
Vs
=
sP XP
=
PQ = P
Q P
〖例〗某厂某月份生产了400件产品,其中 合格品380件,不合格品20件。求产品质量 分布的集中趋势与离散趋势。
解:
己知N = 400件,N1 = 380件,N0 = 20件,则
1 n -1
n
E{
i =1
( xi
-
m)2
-
n
2
i =1
( xi
-
m )( x
-
m)
+
n( x
-
m)2}
n
n
由于å (xi - m) = å xi - nm = nx - nm = n(x - m)
i =1
i=1
å E(
s2 n -1
)
=
1 n -1
n
E{
i =1
( xi
-
m)2
-
2n(x
-
m)2
+
第五章 统计资料的推断
★ §5.1 简单随机抽样
§5.2 参数点估计 §5.3 参数区间估计 §5.4 假设检验
抽样调查
抽样调查是按随机原则从总体中 抽取一部分单位进行调查,并以调查 结果对总体数量特征作出具有一定可 靠程度的估计与推断,从而认识总体 的一种统计方法。 又称它为抽样调查 或抽样估计。
(28,28) x16 = 28
mx =
å (xi - X )2 可能样本个数
=
40 16 = 1 . 581(件)
2、不重复抽样。样本数为 4´ 3 = 12
(22,24) x 2 = 23 (24,22) x5 = 23 (26,22) x9 = 24 (28,22) x13 = 25
重复抽样
不重复抽样
第五章 统计资料的推断
★ §5.1 简单随机抽样 ★ §5.2 参数点估计
§5.3 参数区间估计 §5.4 假设检验
1
总体指标
概念 1.总体指标
总体指标也称为母体参数、总体参数或全及指标,它 是根据总体各单位的标志值或标志特征计算的,反映 总体某种属性的综合指标。
注意 一个总体常常有多个总体参数,它们从 不同的角度反映了总体分布的基本状况和主要特 征。由于全及总体是唯一确定的,因此,依据全 及总体的数据计算的全及指标也是唯一确定的。
5
系统误差 代表性误差
随机误差 ü
随机误差又称 偶然性误差, 或抽样误差, 是指按随机原 则抽样,但由 于抽到不同样 本而产生的误 差。
系统误差又称偏差,是指没有严格 按照随机原则抽样而使样本指标数 值系统地高于或低于相应总体指标 数值。如抽样框不科学、有意多选 较好或较差的单位等,都会造成样 本指标的系统误差。
变量值x 次数f
x1 , x 2 ,L L , x m f1 , f 2 ,L L , f m
注意
样本统计量要符合三个评选标准:①无 偏性②一致性③有效性
①无偏性
Ù
要求样本统计量q 的数学期望等于总体参数q 的真值,即
Ù
E(q ) = q ②一致性
Ù
当n ® ¥时,样本统计量 q 按概率收敛于总体参数 q
m
X
=
X 1 f1 + X 2 f 2 + L L + X m fm f1 + f2 + L L + fm
=
å X i fi
i=1
m
å fi
i=1
计算 公式
(2)总体方差的计算公式为:
m
å å s 2 =
( X1 - X )2 f1 + ( X 2 - X )2 f2 + LL + ( X m - X )2 fm f1 + f 2 + LL + f m
常用的总体指标有总体平均数 X 、总体 比例P、总体标准差σ或方差 s 2以及总体单位总
量N或总体中某一部分单位总数 N1等。
设总体中,N个总体单位按某项标志的标 志值分组,分组结果为:
变量值X 次数F
X 1, X 2 ,L L , X m F1 , F 2 ,L L , F m
计算 公式
(1)总体平均数的计算公式为:
相关文档
最新文档