05第五章抽样推断
《抽样推断概述》课件
实际应用中的问题
1 样本容量的影响
探讨样本容量对推断结 果的影响,以及如何选 择适当的样本容量。
2 多重比较问题
解决多重比较问题时需 要注意的统计学考虑因 素。
3 可信度分布分析
介绍可信度分布分析的 概念,以及如何使用该 方法进行推断。
总结和展望
1 抽样推断的局限性
总结抽样推断的局限性,例如样本偏差和抽样误差的不可避免性。
《抽样推断概述》PPT课 件
抽样推断概述PPT课件大纲
背景引入
1 认识抽样推断
了解抽样推断的定义、作用和重要性。
2 抽样推断的应用领域
探索抽样推断在实际应用中的广泛领域, 如市场调研、医学研究和金融分析。
样本的概念
1 总体和样本
2 抽样方法
解释总体和样本的概念, 以及它们在抽样推断中 的作用。
介绍常用的抽样方法, 如简单随机抽样、分层 抽样和整群抽样。
3 样本误差与抽样误差
讨论样本误差和抽样误 差的含义和影响。
统计推断的基本步骤
1 点估计与区间估计
比较点估计和区间估计的优缺点,以及它们在推断中的应用。
2 统计假设检验与置信区间
解释统计假设检验步骤和置信区间的概念,并讨论它们的意义和用途。
3 参数和统计量
区分参数和统计量的概念,以及它们在推断中的不同作用。
常见的统计学方法
1 正态分布的基础知识
2 单样本均值的检验
介绍正态分布的特点和定理,以及它在统 计学方法中的重要性。
解释如何使用单样本均值的检验来推断总 体均值。
3 双样本均值的检验
4 方差分析
说明如何通过双样本均值的检验来比较不 同总体均值。
讨论方差分析的原理和应用,以及它在多 总体比较中的优势。
第5章__抽样推断
抽样误差的影响因素
(1)总体各单位标志变异程度。 (2)样本容量的大小。 (3)抽样方法。 (4)抽样的组织形式。
四、抽样极限误差
含义:
抽样极限误差指在进行抽样估计时,根据研究对象的变 异程度和分析任务的要求所确定的样本指标与总体指标 之间可允许的最大误差范围。
计算方法:
它等于样本指标可允许变动的上限或下限与总体指标 之差的绝对值。
则:
x
n
10 1(公斤) 100
即:当根据样本学生的平均体重估计全部学生的平均 体重时,抽样平均误差为1公斤。
例题二解 已知: N 2000, n 400, x 4800, 300
则:
x
n
300 15(小时) 400
x
2 1 n
3002 1
400
13.42(小时)
n N
-20
400
-15
225
-5
25
0
0
-15
225
-10
100
0
0
5
25
-5
25
0
0
10
100
15
225
0
0
5
25
15
225
20
400
0
2000
样本平均数的平均数( x )
x
样本可能数目
960 16
60元
所以 (x) X
样抽样平均误差x
x (x)2
样本可能数目
2000 11.18元 16
四个工人工资分别为40、50、70、80元
抽样平均误差 x
n
15.81 11.18元 2
第5章抽样推断40页PPT
例 题二:
某厂生产一种新型灯泡共2000只,随机抽出400只 作耐用时间试验,测试结果平均使用寿命为4800小时, 样本标准差为300小时,求抽样推断的平均误差?
解: 则:
已知 N 20 ,n 0 4 00 ,x 0 48 , 0 3 000
x
n
3001(5小)时 400
x
2 1 n
则:样本合格率 pnn130060.98 n 300
p
p 1 p 0 .9 8 0 .0 20 .8( 0% 8 )
n
300
p
p1p1n
n N
0.980.021 300 0.80(6 %) 300 60000
4、抽样调查的组织形式。选择不同的抽样组织形式,也会有 不同的抽样误差。
抽样平均误差
抽样平均误差是抽样平均数或抽样成数的标准差。反映了抽 样平均数与总体平均数抽样,成数与总体成数的平均误差程度。
抽样平均数的 平均误差
x
抽样成数的 平均误差
p
重复抽样 2
nn
p(1 p) n
不重复抽样
2 (1 n )
总体平均数
X
Xf f
总体标准差
(X X)2 f f
总体成数
p N1 N
成数标准差 p P(1P)
将总体N个单位分成性质相反的两组,其中具有某特征
《统计学原理》第5章:抽样推断
σ
n )
抽样推断的基本原理
抽样推断的优良标准
设θ 为待估计的总体参数, θ为样本统计量,则 θ的优良标 准为: 1若 E(θ ) =θ ,则称 θ为 θ 的无偏估计量(无偏性)
更有效的估计量(有效性) 2若σθ1 < σθ2,则称θ1为比θ2
3若 越大σθ 越小,则称 θ 为θ 的一致估计量(一 致性)
即中选成分相同但中选顺序不同的视为同一样本
抽样推断的一般问题
抽样组织方式
简单随机抽样 类型抽样 整群抽样 等距抽样 多阶段抽样 多重抽样
抽样推断的一般问题
样本可能数目
按照一定的抽样方法和组织方式,从总体N中抽取n个 单位构成样本,一共可以抽出的不同样本的数量,一般 用M表示. 考虑顺序的不重复抽样 考虑顺序的重复抽样 不考虑顺序的不重复抽样 不考虑顺序的重复抽样
抽样推断的一般问题
全及总体指标:参数 (未知量) 统计推断 样本总体指标:统计量 (已知量)
抽样推断的一般问题
抽样推断的特点 按随机原则抽取样本 运用概率论的理论和方法,用样本指标来推断 总体指标。 推断的误差可以事先计算和控制。
抽样推断的一般问题
抽样推断的应用 无法或 很难进行全面调查而又需要了解 其全面情况时 某些可以采用全面调查的社会经济现象, 也可采用抽样推断。 可用于生产过程的质量控制 进行假设检验
抽样推断的基本原理
抽样推断的优良标准——有效性 中位数的抽样分布
9 8 7 6 5 4 3 2 1 0 -1 45 50 55 60 65 70 75
平均数的抽样 分布
E(x) =
E ( me ) =
e
σx <σm
抽样推断的基本原理
统计学05第五章抽样推断
(2)
计算 p
p1 p
n
(3) 根据 F Z 查表 Z
(4) 计算 Z
(5) 写出:P : p , p
2020/11/17
第五章 抽样推断
44
2.3 区间估计
【例5-5】某工厂要估计一批总数5 000件的产品的废品率,于是随机抽 出 400 件产品进行检测,发现有32 件废品。在置信度为 90% 的要求下, 试给出该批产品的废品率的区间估 计。
总体参数和样本统 x计 量x-x2 n
总体参数和样本统计量的计算公式
总体参数
X X1 X2 XN N
样本统计量
x x1 x2 xn n
P N1 N
p n1 n
X X X 2 N
S x x-x 2 n1
P P 1 P
p p 1 p
2020/11/17
2020/11/17
第五章 抽样推断
35
2.3 区间估计
2. 给定 , 已知 X , 总体平均数的估计:
步骤
内
容
(1) 抽样,计算 x 区间的中心
(2) 计算抽样平均误差: X n
(3) 计算 Z 查表F Z
(4) 根据 x 和 : X : x ,x
2020/11/17
参数估计要求:
1. 精确性—适当的极限误差范围; 2. 可靠性—估计结果正确的概率。
参数估计—点估计和区间估计。
2020/11/17
第五章 抽样推断
16
2.2 点估计
点估计就是根据总体参数与样本统计 量之间的内在联系,直接以样本统计量 作为相应总体参数的估计值,点估计又 称为定值估计。
常用的点估计量有:
22
统计学课件05第5章抽样与参数估计
反映样本数据的集中趋势和平均水平。
样本方差
定义
样本方差是每个样本数据与样本均值差的平方和的平均值,即 $s^2 = frac{1}{n} sum_{i=1}^{n} (x_i - overline{x})^2$。
计算方法
先计算每个样本数据与样本均值的差,然后将差平方,最后求和平 均。
作用
反映样本数据的离散程度和波动情况。
样本量的确定
根据调查目的和精度要求确定样 本量:精度要求越高,需要的样
本量越大。
根据总体规模和抽样方法确定样 本量:总体规模越大,需要的样 本量越大;分层或整群抽样较简 单随机抽样需要的样本量更大。
根据调查资源确定样本量:资源 有限时,需要在满足调查目的和 精度要求的前提下,合理确定样
本量。
02 参数估计
大数定律的数学表达
设随机变量X1,X2,...,Xn是相互独立的,且具有相同的分布函数F(x),则对于任意正实数ε,有 lim(n->∞)P(|X1+X2+...+Xn/n-E(X))/ε)=0,其中E(X)是随机变量X的期望值。
大数定律的实例
在抛硬币实验中,随着实验次数的增加,正面朝上的频率将趋近于0.5。
中心极限定理
中心极限定理定义
中心极限定理是指在大量独立同分布的随机变量中,不论 这些随机变量的分布是什么,它们的平均值的分布总是趋 近于正态分布。
中心极限定理的数学表达
设随机变量X1,X2,...,Xn是相互独立的,且具有相同的分布 函数F(x),则对于任意实数x,有lim(n->∞)P(∑Xi≤x)=∫(∞->x)F(t)dt。
样本分布的性质
无偏性
如果样本统计量的数学期 望等于总体参数,则该统 计量是无偏的。
统计学课件:抽样推断
3.当总体X~N(, 2),从中抽取容量为n的样本,则
n
2
(n 1)s2
2
~
(2 n-1); 2
(xi x)2
i 1
2
~
(2 n-1)
4. 2—分布的性质 (1)分布可加性 若X ~ 2(n1),Y~ 2(n2 ), X,Y独立,则 X +Y ~ 2(n1+n2 ) (2)期望与方差 若X~ 2(n),则 E(X)= n,D(X)=2n
3、进行产品质量检验 4、进行假设检验
(一)总体和样本 1、总体 总体也称全及总体,指所有认识的研究对象全体,它是
有所研究范围内具有某种共同性质的全体单位所组成的 集合体。 一般用英文字母大写N来表示总体的单位数。 2、样本 样本又称子样,它是从全及总体中随机抽取出来,作为 代表这一总体的那部分单位组成的集合体。 一般用英文小写字母n来表示样本的单位数。
5. 分位点 设X ~ 2(n),若对于:0<<1,
存在 2 (n) 0 满足
P{X 2 (n)} ,
则称 2 (n) 为 2 (n) 分布的上分位点。
2
(n
)
(二)t 分布
若X 服从N (0,1),Y 服从自由度为n的 2分布, 且X 和Y 独立,则 X
Y /n 服从自由度为n的 t分布。
1、全及指标 根据各单位的标志值或标志属性计算的,反映总体
数量特征的综合指标称为全及指标,又称为参数。
设总体变量 X 为: X1, X 2 ,X N 则有:
X X XF N F
2 X X 2 X X 2 F
N
F
设总体 N 个单位,有 N1 个单位具有某种性质, N0 个单位不具有某种性质,
《抽样推断》课件 (2)
参数估计
通过样本数据得到总体参数的估计值。
1
点估计
用单个统计量估计总体参数。
2
区间估计
用一个区间估计总体参数,包含真实参数的可能范围。
3
最大似然估计
选择使样本数据出现的概率最大的参数估计值。
置信区间的计算
置信区间提供了一个总体参数的范围估计。
计算方法
正态分布假设
根据样本数据和置信水平, 使用统计方法计算置信区间。
《抽样推断》PPT课件 (2)
抽样推断是统计学的重要概念之一,通过从总体中选取一部分样本,对总体 的特征进行推断。本课件将介绍抽样推断的概念、抽样方法、样本容量的确 定、参数估计、置信区间的计算、假设检验的基本原理以及实例分析。
抽样推断的概念
抽样推断是从样本数据中,通过统计方法推断总体的特征。借助抽样推断,我们能够在研究中得 到有关总体的重要信息,而无需对整个总体进行研究。
3 分层抽样
4 整群抽样
将总体划分为若干层,每层内进行简单 随机抽样。
将总体划分为若干群,随机抽取群内的 全部个体作为样本。
样本容量的确定
样本容量的大小对抽样推断的准确性有重要影响。
总体大小
总体越大,需要的样本容 量越大。
可接受的抽
置信水平
置信水平越高,需要的样 本容量越大。
在满足一定条件下,可以使 用正态分布进行置信区间的 计算。
置信水平
置信区间给出的范围包含了 真实总体参数的概率。
假设检验的基本原理
假设检验用于对总体参数的某个假设进行验证。
原假设
对总体参数的一个特定 值或范围的假设。
备择假设
与原假设相对立的假设。
检验统计量
用于比较观察到的样本 数据与原假设的预期值。
第5章 抽样推断(完整版)(08经济国贸)
样本比例的抽样分布
比例
(proportion)
– – 不同性别的人与全部人数之比 合格品(或不合格品) 与全部产品总数之比
1. 总体(或样本)中具有某种属性的单位与全部单位 总数之比
STAT
2. 总体比例可表示为
3. 样本比例可表示为
4.
n0 p n 或
N0 N
N1 或 1 N
n1 1 p n
特点
又被称作重置抽样、有放回抽样 登记 特征 放回 总体 继续 抽取
同一总体单位有可能被重复抽中, 而且每次抽取都是独立进行
2、不重复抽样
又被称作不重置抽样、不放 回抽样 抽出 个体 登记 特征 继续 抽取
特点
同一总体中每个单位被抽中的机会并 不均等,在连续抽取时,每次抽取都 不是独立进行
是最为常用的抽样方法,用于无限总 体和许多有限总体样本单位的抽样。
抽样平均误差的计算公式
⒈ 样本平均数的抽样平均误差
重复抽样时:
STAT
x
2
n
n
不重复抽样时:
x
N n
2
n N 1
2
n 1 n N
抽样平均误差的计算公式 ⒉ 样本成数的抽样平均误差 重复抽样时:
STAT
p
P 1 P n
样本平均数的抽样分布
(例题分析)
STAT
【例】设一个总体,含有4个元素(个体) ,即总体单位 数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4 。总 体的平均数、方差及分布如下 总体分布
.3
平均数和方差
X
x
i 1
市场调查第05章 - 抽样调查
Ni ni n, i (1, m) N
式中,m表示分层数目;ni表示第i层样本单位数;Ni表示第i层样 本总单位数;N表示总体单位数;n表示“样本容量”。
【案例分析】
某公司要分析某地家用电器的消费者购买行为,该地共有居民 20000户,按经济收入高低进行分类,其中高收入的居民为2000 户,占总体的10%,中收入的居民为6000户,占总体的30%,低 收入的居民为12000户,占总体的60%。要从中抽选200户进行调 查,则3类居民分别抽取多少样本?
调查总体中的 所有单位加以 编号,
根据编号的位 数确定适用若 干位数字
查随机数表
37 41 49 66 89
21 56 25 14 77
99 47 33 17 19
42 19 37 35 51
61 28 14 64 28
直到抽足预定 样本数目为止
(3)简单随机抽样优缺点:
优点:简单、直观、容易理解、易于操作 缺点: ① 必须对总体单位加以编号,总体庞大是不具操作性; ② 有些总体不能采用随机抽样。例如对不断生产的大量产品 进行质量检验; ③ 当总体标志变动度较大时,简单随机抽样的代表性不如“分 层随机抽样”代表性高; 适用:总体单位数不大,且分布均匀的总体。
【案例分析】
仍以上面的“购买行为分析”为例。各层样本标准差高收入为300 元,中收入为200元,低收入为50元,如: 调查单位数与样本标准差乘积计算表
各层次 各层的调查单位数 (户) Ni 高 中 低 ∑ NiSi 2000 6000 12000 各层的样本标准差 (元)Si 300 200 50 600000 1200000 600000 2400000 乘积 NiSi
随机抽样调查.特点(P115)
统计学第五章抽样推断
统计学第五章抽样推断二、单项选择题1、对总体的数量特征进行抽样估计的前提是抽样必须遵循(B)。
A.大量性B.随机性C.可靠性D.准确性2、一般认为大样本的样本单位数至少要大于(A)。
A.30B.50C.100D.2003、抽样平均误差是指(D)。
A.抽中样本的样本指标与总体指标的实际误差B.抽中样本的样本指标与总体指标的误差范围C.所有可能样本的抽样误差的算术平均数D.所有可能样本的样本指标的标准差4、在其它条件相同的情况下,重复抽样的抽样误差(A)不重复抽样的抽样误差。
A.大于B.小于C.总是等于D.通常小于或等于5、在其它条件不变的情况下,要使抽样误差减少1/3,样本单位数必须增加(D)。
A.1/3B.1.25倍C.3倍D.9倍6、从产品生产线上每隔10分钟抽取一件产品进行质量检验。
推断全天产品的合格率时,其抽样平均误差常常是按(C)的误差公式近似计算的。
A.简单随机抽样B.整群抽样C.等距抽样D.类型抽样7、通常使样本单位在总体中分布最不均匀的抽样组织方式是(B)。
A.简单随机抽样B.整群抽样C.分层抽样D.等距抽样9、抽样平均误差和极限误差的关系是(D)A抽样平均误差大于极限误差B抽样平均误差等于极限误差C抽样平均误差小于极限误差D抽样平均误差大于、等于、小于极限误差都可能10、抽样平均误差的实质是(D)A、总体标准差B、样本标准差C、抽样误差的标准差D、全部可能样本平均数的标准差三、多项选择题C、可以计算抽样误差D、以概率论和数理统计学为理论基础2、影响抽样平均误差大小的因素有(ABCD)。
A、总体各单位标志值的差异程度B、抽样数目C、样本各单位标志值的差异程度D、抽样组织方式E、抽样推断的把握程度3、影响必要的抽样数目的因素有(BCDE)。
A、总体各单位标志值的差异程度B、样本各单位标志值的差异程度C、抽样方法和抽样组织方式D、抽样推断的把握程度E、允许误差4、计算抽样平均误差时,由于总体方差是未知的,通常有下列代替方法(ACE)。
05第五章 抽样调查
(三)分层抽样 1.分层抽样的含义 分层抽样,又称为分类抽样,它是先将总体中 的所有单位按其一定的属性或特征分成相互不重叠 的若干层,然后在每一层中分别抽取样本,最后把 各层中抽出的样本合在一起构成总体的样本的方法。 2.分层抽样程序 3.等比例分层抽样 4.不等比例分层抽样
【例5-3】某地共有居民4万户,按经济收入高低进行分类,其中高收 入居民为8000户,中等收入居民为24000户,低收入居民有8000户。 要从中抽出800户进行购买力调查,采用等比例分层抽样,如何抽取? 分析:因为购买力是与家庭的收入水平密切相关的,所以以收入水平作 为分层变量是合适的。按此变量将总体分为高收入户、中等收入户和低 收入户三层。具体的抽样程序如下: 第一步,计算各层在总体中的比例。 高收入户:8000/40000=20%;中等收入户: 24000/40000=60%;低收入户:8000/40000=20%。 第二步,各层在总体中所占的比例与各层在样本中所占的比例是一样的。 因此,计算样本在各层中的具体分布数目。 高收入户:800*20%=160(户); 中等收入户:800*60%=480(户); 低收入户:800*20%=160(户)。 第三步,在各层中采用等距抽样方法抽取样本单位。
小结
重点:抽样调查的分类和抽样误差的测定。
难点:样本容量的估计及抽样误差的测定。
作业
1.简要回答单纯随机抽样的具体分类及其各 自特点。 2.简述类型随机抽样的优点及其适用范围。
【例5-2】现有180名学生,要利用等距抽样法从中抽取 15名学生作研究样本,其方法如下:先将学生按与学生学 习成绩无关的标志编号,假设按学生座位顺序把学生编为1 -180号,然后按下述步骤抽取:
(1)确定抽样间隔距离k=180/15=12 (2)随机抽取了编号34为起点,即决定从第34号单位作 为第一个样本。先前抽取样本为34-12=22号单位;向后 抽取样本为34+12=46;如此类推,抽出的15个样本为: (10),(22),(34),(46),(58),(70), (82),(94)(106),(118),(130), (142),(154),(166),(178)
第五章抽样推断ppt课件
在99.73%概率保证程度下,估计该厂全部灯泡平均耐用时间 在919~933.8小时之间。
⑵ p=0.4%
p1p0.00 0.4 990 6 .2% 8
p
n
500
概率保证程度为0.6827时,t=1
1 0.28 %
p
p
p 0 . 4 % 0 . 2 % 0 . 8 1 % p 2 0 . , 4 % 0 . 2 % 0 . 8 6 %
第五章 参数估计
本章学习目的与要求 第一节 抽样分布 第二节 抽样误差 第三节 抽样估计方法 第四节 抽样组织设计
下一页 前往本节首页
本章学习目的与要求
目的: 学习目的在于提供一套利用抽样资料来估计总体数量特征的方法。
要求: ⒈明确抽样调查的概念、特点、作用; ⒉了解抽样误差的影响要素; ⒊掌握抽样平均误差的计算方法; ⒋掌握抽样估计方法与样本容量确定的方法; ⒌了解类型抽样、等距抽样、整群抽样的含义、特点 与适用场所。
2.不反复抽样的条件下
抽样平 :x均 n X 2 ((N N 误 1 n )); 差 N 很 当大时 x 近 n X 2(1 似 N n) 为
式中,N为总体单位数;n为样本容量;σX2 为总体方差,普通情况下是未 知,可用样本方差替代 σx 2
成数的抽样平:均 p 误np2(差 (NN1n));当 N很大时近 p似 nP 2(1为 N n)
〔1〕估计值 〔2〕抽样误差范围 〔3〕概率保证程度
上一页 下一页 前往本节首页
〔二〕总体平均数(成数)的区间估计
表
xx X xx ,
达
或Xxx ,xx
式 其中,Δx tμx 为极限误差
pp P pp,
或P pp, pp
统计学基础-抽样推断
(2) 随机数字法
第一节 抽样推断的一般问题
(一)简单随机抽样 当给总体各单位编码后,将数码写在结构无效
的签上,将签混匀后即可抽取。这种方法简便易行,但对较大 的总体而言,编码的工作量很大且混匀有困难,所以它具有一 定局限性。
第一节 抽样推断的一般问题
(一)简单随机抽样
随机数字可以借助计算机获得,也可应用随 机数表,其中随机数表方法应用较为普遍。利用随机数表进行抽 样时,首先为每个总体单位编码,根据编码的最大位数确定将要 使用随机数表的列数;然后从表中任意一列、任意一行开始,由 纵向或横向画线取数,遇到属于总体单位编码范围内的数组就确 定为样本单位,接着继续往下找。如果要求不重复抽样时,遇到 重复出现的数字(组)就弃之,直到取足要求的单位数为止。
第一节 抽样推断的一般问题
(二) 总体 指标 和样 本指
标
样本指标是指根据样本总体中各总体单位在某 一标志上所表现的标志值计算的,用以反映样本总 体数量特征的综合指标,又称为统计量。与总体指 标相对应,常用的样本指标有样本平均数、样本标 准差 s、样本方差 s2、样本成数 p 等。
第一节 抽样推断的一般问题
重复抽样条件下: M N n
不重复抽样条件下: M N! (N n)!
第一节 抽样推断的一般问题
(一)简单随机抽样
简单随机抽样是指从含有N个单位的总体中,随机抽取n个 单位作为样本,使得每一个容量为n的样本都有相同的概率被抽 中,这样的抽样方式又称纯随机抽样。具体做法分为以下两种:
(1) 抽签法
第一节 抽样推断的一般问题
(二)分层抽样
它是在各类型组中按不同的比 例分配样本单位数的方法,又称最优分配法。当各类型组 的单位数相差悬殊或标志变异程度相差较大时,采用等数 或等比例分配方法的抽样效果较差,这时宜采用不等比例 类型抽样法进行抽样。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2. 根据样本统计量的抽样分布能够对样本统计量与 总体参数的接近程度给出一个概率度量 比如是,95某%班级平均置分信数区在间75~85之样间(本点,统估计计置量)信水平
置信下限
置信上限
2021/1/2
第五章 抽样推断
2021/1/2
第五章 抽样推断
35
置信区间的表述
(confidence interval)
1. 当抽取了一个具体的样本,用该样本所构造的区间是一 个特定的常数区间,我们无法知道这个样本所产生的区 间是否包含总体参数的真值,因为它可能是包含总体均 值的区间中的一个,也可能是未包含总体均值的那一个
2. 一个特定的区间总是“包含”或“绝对不包含”参数的 真值,不存在“以多大的概率包含总体参数”的问题
总体参数和样本统计量的计算公式
总体参数
X X1 X2 XN N
样本统计量
x x1 x2 xn n
P N1 N
p n1 n
X X X 2 N
S x x-x 2 n1
P P 1 P
p p 1 p
2021/1/2
第五章 抽样推断
10
1.3 抽样推断的基本条件
2021/1/2
第五章 抽样推断
22
2.2 点估计
优良估计量的三个标准: 1.无偏性: (unbiasedness)
E (统计量) = 总体参数
样本平均数 — E x x X
样本成数 — E p p P
2021/1/2
第五章 抽样推断
23
2.2 点估计
优良估计量的三个标准:
2.一致性:(consistency)
2. 统计学家在某种程度上确信这个区间会包含真正的总体 参数,所以给它取名为置信区间
3. 如果用某种方法构造的所有区间中有95%的区间包含总 体参数的真值,5%的区间不包含总体参数的真值,那么, 用该方法构造的区间称为置信水平为95%的置信区间。 同样,其他置信水平的区间也可以用类似的方式进行表 述
第五章
抽样推断
第一节 抽样推断及其特点 第二节 总体参数估计 第三节 假设检验概述
2021/1/2
第五章 抽样推断
1
统计名言
不象其他科学,统计从来不打算使自 己完美无缺,统计意味着你永远不需 要确定无疑
—— Gudmund R.Iversen
2021/1/2
第五章 抽样推断
2
参数估计在统计方法中的地位
公式 x x 2
n
作用
反映样本的 离散程度
S 2 x
x x2
n1
推断总体
2021/1/2
第五章 抽样推断
28
2.2 点估计
总体参数的点估计:
原则优 缺:点总: 体参数估计值就取统
计量11..的简 无值单 法明 提了 供; 误差情况;
2. 2.
能 估 X 提 计 x供 的具 可体 靠 Pˆ 估 程 p度 计无 值。
置信区间的表述
(confidence interval)
1. 使用一个较大的置信水平会得到一个比较宽的置信区间, 而使用一个较大的样本则会得到一个较准确(较窄)的区间。 直观地说,较宽的区间会有更大的可能性包含参数
2. 但实际应用中,过宽的区间往往没有实际意义 比如,天气预报说“在一年内会下一场雨”,虽然这很 有把握,但有什么意义呢?另一方面,要求过于准确 (过窄)的区间同样不一定有意义,因为过窄的区间虽 然看上去很准确,但把握性就会降低,除非无限制增 加样本量,而现实中样本量总是有限的
3. 区间估计总是要给结论留点儿余地
2021/1/2
第五章 抽样推断
38
置信区间与置信水平的关系
均值的抽样分布
x
/2
1 –
/2
x
x
(1 - ) % 区间包含了 % 的区间未包含
2021/1/2
第五章 抽样推断
39
2.3 区间估计
1. 区间的确定:
ΔΔ
x
1. 区间的中心
2. — 统计量的值,如x 、:p 2. 区间的半径 Δ 3. — 允许(极限)误差。
2021/1/2
第五章 抽样推断
4
大学生每周上网花多少时间?
回答类别 3小时以下 3~6小时 6~9小时 9~12小时 12小时以上
合计
人数(人) 32 35 33 29 71 200
频率(%) 16 17.5 16.5 14.5 35.5 100
平均上网时间为8.58小时,标准差为0.69小时。全校学生 每周的平均上网时间是多少?每周上网时间在12小时以 上的学生比例是多少?你做出估计的理论依据是什么?
抽样推断的基本条件
1. 选择统计量—优良估计量。 2. 合适的允许误差—精确性。 3. 可接受的置信度—可靠性。
精确性和可靠性是一对矛盾。要根据问 题的性质和研究的需要在二者间权衡。
2021/1/2
第五章 抽样推断
11
1.4 抽样推断的误差 统计误差的分类
登记性误差
可消除
统计误差
代表性误差
系统误差 抽样误差
2021/1/2
第五章 抽样推断
19
2.1 总体参数估计概述
总体参数估计就是以样本统计量来估 计总体参数。
参数估计要求:
1. 精确性—适当的极限误差范围; 2. 可靠性—估计结果正确的概率。
参数估计—点估计和区间估计。
2021/1/2
第五章 抽样推断
20
2.2 点估计(point estimate)
2021/1/2
第五章 抽样推断
可消除 可控制
12
1.4 抽样推断的误差
抽样误差
1. 抽样实际误差:
对某一样本而言,由随机因素引起的 样本统计量与总体参数在数量上的差异 就是抽样实际误差。
xX
2021/1/2
第五章 抽样推断
13
1.4 抽样推断的误差
2. 抽样平均(标准)误差:
抽样平均误差是抽样平均数的标准差,它 反映样本平均数(样本成数)与总体平均数 (总体成数)之间的平均差异程度。
抽样推断的方法: —总体参数的估计 —总体参数的假设检验。
2021/1/2
第五章 抽样推断
7
1.1 抽样推断及其特点 抽样推断的特点
1. 抽样推断必须遵循随机原则。 2. 对抽样误差可以事先加以计算和控制。 3. 具有经济性、时效性,应用广泛的特点。 4. 可对全面调查的结果进行检验和修正。
2021/1/2
σ 2 优良估计量 σ 2 其他估计量
σ 2 x σ 2 c
2021/1/2
第五章 抽样推断
26
2.2 点估计 总体参数
优良估计量
2X
2 P
2021/1/2
S 2 x x x 2 n1
2 p p1 p
第五章 抽样推断
27
2.2 点估计
样本方差
符号 2 x
第五章 抽样推断
8
1.2 总体参数和样本统计量
பைடு நூலகம்
含义
总体参数与样本统计量的比较
总体参数
样本统计量
总体的指标
样本的指标
性 质 唯一、常量
不唯一、随机变量
特点 未知
易求
常 见 X、P、 X
x、p、S x
目 的 利用样本统计量推断总体参数
2021/1/2
第五章 抽样推断
9
1.2
总体参数和样本统 x计 量x-x2 n
2021/1/2
第五章 抽样推断
34
置信区间的表述
(confidence interval)
1. 总体参数的真值是固定的,而用样本构造的区间则是不 固定的,因此置信区间是一个随机区间,它会因样本的 不同而变化,而且不是所有的区间都包含总体参数
2. 实际估计时往往只抽取一个样本,此时所构造的是与该 样本相联系的一定置信水平(比如95%)下的置信区间。 我们只能希望这个区间是大量包含总体参数真值的区间 中的一个,但它也可能是少数几个不包含参数真值的区 间中的一个
X
x
n
p
P 1 P
n
2021/1/2
第五章 抽样推断
14
1.4 抽样推断的误差
总体标准差和成数的确定:
总体变化不大,采用过去总体指标数值做代 替;
用样本标准差σ(x) 或样本成数 p 替代; 对于成数,可取 P = 0.5;如果有多个 P 值,
取其最接近 0.5 的P 做替代。
2021/1/2
第五章 抽样推断
15
1.4 抽样推断的误差
3. 抽样极限(允许)误差
是样本统计量与被估计的总体参数之 绝对离差的最大允许值,常用Δ表示,可 简称为极限误差或允许误差。
xX x
;
pP p
2021/1/2
第五章 抽样推断
16
1.4 抽样推断的误差
Δ和μ的关系:
Z
Z
Z —概率度,Z 表示以抽样平均误差为标 准单位对极限误差的度量值。由Z 确定的概率 保证程度F(Z)—置信度。
点估计就是根据总体参数与样本统计 量之间的内在联系,直接以样本统计量 作为相应总体参数的估计值,点估计又 称为定值估计。
常用的点估计量有:
Xˆ x Pˆ p ˆ 2 S 2 ( x x )2
n1
2021/1/2
第五章 抽样推断
21
估计量与估计值
(estimator & estimated value)
2021/1/2
第五章 抽样推断