05第五章 抽样推断

合集下载

05第五章抽样推断

05第五章抽样推断

极限误差标准化的意义:
x ~ N X , μ2
Z~N ( 0, 1 )
Z
S
μ
ΔΔ
X X X
Z 0 Z
2019/11/19
第五章 抽样推断
18
第二节 总体参数的估计
2.1 总体参数估计概述 2.2 点估计 2.3 区间估计 2.4 样本容量的确定
2.1 总体参数估计概述
总体参数估计就是以样本统计量来估 计总体参数。
2. 抽样平均(标准)误差:
抽样平均误差是抽样平均数的标准差,它 反映样本平均数(样本成数)与总体平均数 (总体成数)之间的平均差异程度。
X

x
n
p
P 1 P
n
2019/11/19
第五章 抽样推断
14
1.4 抽样推断的误差
总体标准差和成数的确定:
总体变化不大,采用过去总体指标数值做 代替;
xX x

pP p
2019/11/19
第五章 抽样推断
16
1.4 抽样推断的误差
Δ和μ的关系:
Z Z
Z —概率度,Z 表示以抽样平均误差为标 准单位对极限误差的度量值。由Z 确定的概 率保证程度F(Z)—置信度。
2019/11/19
第五章 抽样推断
17
1.4 抽样推断的误差
2019/11/19
第五章 抽样推断
5
第一节 抽样推断及其特点
1.1 抽样推断的特点 1.2 总体参数和样本统计量 1.3 抽样推断的基本条件 1.4 抽样推断的误差
1.1 抽样推断及其特点
抽样推断(统计推断)
— 按随机原则从总体中抽取部分单位构成 样本,在一定的可靠程度下,根据样本的数 量特征对总体的数量特征加以推断的方法。

统计学 第五章

统计学      第五章

第五章 抽样推断抽样推断定义:是一种非全面调查,是按随机原则,从总体中抽取一部分单位进行调查,并以其结果对总体某一数量特征作出估计和推断的一种统计方法。

(一) 总体和样本在抽样推断中面临两个不同的总体,即全及总体和样本总体,全及总体也叫母体,简称总体。

全及总体的单位数用N 表示全及总体⎪⎩⎪⎨⎧⎩⎨⎧属性总体有限总体无限总体变量总体样本总体又叫抽样总体、子样,简称样本,样本总体的单位数称样本容量,用n 表示。

(二) 参数和统计量参数亦称全及指标,由于全及总体是唯一确定的,故根据全及总体计算的参数也是个定值 对于属性总体,可以有如下参数,全及总体成数p ,全及总体标准差)(2p p σσ方差 属性总体标准差:()p p p-=1σ统计量即样本指标设样本总体有n 个变量:n x x x x ,...,,,321 则:样本平均数 nx x ∑=(三) 样本容量与样本个数样本容量是指一个样本所包含的单位数,用n 来表示,一般地,样本单位数达到或超过30个的样本称为大样本,而在30个以下称为小样本。

社会经济统计的抽样推断多属于大样本,而科学实验的抽样观察则多取小样本。

样本个数又称样本可能数目,是指从全及总体中可能抽取的样本的个数。

一个总体可能抽取多少样本,与样本容量大小有关,也与抽样的方法有关。

在样本容量确定之后,样本的可能数目便完全取决于抽样方法。

抽样误差是抽样调查自身所固有的,不可避免的误差,虽然不能消除这种误差,但有办法进行计算,并能对其加以控制。

抽样平均误差越大,表示样本的代表性越低;抽样平均误差越小,表示样本的代表性越高。

在重复简单随机抽样时,样本平均数的抽样分布有数学期望值E(a)=a(a代表全及总体平均数,即X)X⇔。

样本平均数的平均数=总体平均数抽样平均误差=抽样标准误差=样本平均数的标准差(它反映抽样平均数与总体平均数的平均误差程度)例题:某班组4个工人的月工资(N=4)分别是:1400元,1500元,1600元,1700元,现用重复简单随机抽样的方法从全及总体中抽选出容量大小为2的样本(n=2),求抽样平均误差?解:全及总体平均工资)(15501700160015001400元=+++=X全及总体标准差()4500002=-=∑NX Xσ抽样平均误差x μ=nnσσ=2=)(0569.792*450000元=例题:某班组4个工人的月工资(N=4)分别是:1400元,1500元,1600元,1700元,现用不重复简单随机抽样的方法从全部总体中抽选容量大小为2的样本(n=2),求抽样平均误差?解:全及总体平均工资)(155041700160015001400元=+++==∑NXX全及总体标准差()4500002=-=∑NX Xσx μ=⎪⎭⎫ ⎝⎛--∙12N n N n σ=)(55.6414244*250000元=--∙例题:某电子元件厂,生产某型号晶体管,按正常生产试验,产品中属于一级品的占70%,现在从10000件晶体管中,抽取100件进行抽查检验,求一级品率的抽样平均误差? 解:已知:P=0.7 , P(1-P)=0.21在重复抽样的情况下,抽样平均误差为:()np p p -=1μ=%58.410021.0=在不重复抽样的情况下,抽样平均误差为:()⎪⎭⎫⎝⎛-∙-=N n n p p p 11μ=%56.410000*********.0=⎪⎭⎫ ⎝⎛-∙参数估计()()⎪⎪⎩⎪⎪⎨⎧→-==+≤≤是概率度是置信度,极限误差)样本指标总体指标极限误差—(样本指标区间估计:求不高的情况准确程度与可靠程度要点估计:适用于推断的t t F t F P α1例题:已知某车间某产品的合格率在某个置信度下的估计区间是(85%,95%),还已知样本容量为100,求置信度?解:显然p p ∆-=85%,p p ∆+=95%,即p=90%,p ∆=5%p ∆=μ⋅t μpt ∆=⇒=()()67.1100%901%90%51=-∙=-∆np p p ()t F =0.9052即置信度为90.51% ★求置信度,只需要求出t影响抽样数目的因素⎪⎪⎪⎪⎩⎪⎪⎪⎪⎨⎧∆样本单位不重置抽样可以少抽些单位,抽样需要多抽一些样本、在同等条件下,重置单位,则反之值越大,则多抽些样本、概率度则反之单位,的值大可以少抽些样本)、允许误差(极限误差越多,则反之值越大,必要抽样数目、总体标准差4321t x σ例题:某城市组织职工家庭生活抽样调查,职工家庭平均每户每月收入的标准差为11.50元,要求把握程度为95.45%,允许误差为1元,问需抽选多少户? 解:()t F =0.95452=⇒t , 元元,150.11=∆=x σxt n 222∆=σ=()户529150.1142=∙。

《统计学原理》第5章:抽样推断

《统计学原理》第5章:抽样推断

σ
n )
抽样推断的基本原理
抽样推断的优良标准
设θ 为待估计的总体参数, θ为样本统计量,则 θ的优良标 准为: 1若 E(θ ) =θ ,则称 θ为 θ 的无偏估计量(无偏性)
更有效的估计量(有效性) 2若σθ1 < σθ2,则称θ1为比θ2
3若 越大σθ 越小,则称 θ 为θ 的一致估计量(一 致性)
即中选成分相同但中选顺序不同的视为同一样本
抽样推断的一般问题
抽样组织方式
简单随机抽样 类型抽样 整群抽样 等距抽样 多阶段抽样 多重抽样
抽样推断的一般问题
样本可能数目
按照一定的抽样方法和组织方式,从总体N中抽取n个 单位构成样本,一共可以抽出的不同样本的数量,一般 用M表示. 考虑顺序的不重复抽样 考虑顺序的重复抽样 不考虑顺序的不重复抽样 不考虑顺序的重复抽样
抽样推断的一般问题
全及总体指标:参数 (未知量) 统计推断 样本总体指标:统计量 (已知量)
抽样推断的一般问题
抽样推断的特点 按随机原则抽取样本 运用概率论的理论和方法,用样本指标来推断 总体指标。 推断的误差可以事先计算和控制。
抽样推断的一般问题
抽样推断的应用 无法或 很难进行全面调查而又需要了解 其全面情况时 某些可以采用全面调查的社会经济现象, 也可采用抽样推断。 可用于生产过程的质量控制 进行假设检验
抽样推断的基本原理
抽样推断的优良标准——有效性 中位数的抽样分布
9 8 7 6 5 4 3 2 1 0 -1 45 50 55 60 65 70 75
平均数的抽样 分布
E(x) =
E ( me ) =
e
σx <σm
抽样推断的基本原理

抽 样 与 抽 样 推断

抽 样 与 抽 样 推断

(四)总体参数和样本统计量符号
总体指标符号 总体容量: N 总体平均数: X 总体成数: P 总体方差: 2 总体标准差: 样本指标符号 样本容量: n 样本平均数: x 样本成数: p 样本方差: S 2 样本标准差: S
第二节
抽样误差
一、抽样误差
(一)概念:抽样误差是指抽样估计值与被 估计总体的特征值之间的离差。即: 抽样误差(平均数)= 抽样误差(成 数) =
2)代表性误差:指在用样本数据进行推 断时所产生的随机误差。原因有: A. 抽取样本时没有遵循随机原则; B. 样本结构与总体结构的差异; C. 样本容量不足; 这类误差通常无法消除,但可以事先 控制或计算。
2. 根据是否带有倾向性,分为:
系统性误差(系统性登记误差、系统性代表误差) 非系统性误差(非系统性登记误差、非系统性代表误 差). 1)系统性误差:登记时有意识地虚报、瞒报以及在选 择代表性单位时有意识地选大或小造成的,带有明显 的系统偏高或偏低倾向; 2.非系统性误差:由于技术的原因或客观的偶然性造成 的,不带有倾向性。相比而言,系统性误差危害更大。
(二)抽样推断的特征
1.抽样估计是由部分推断总体的一种认识方法。 2.抽样估计建立在随机取样的基础上。 3.抽样估计运用的是不确定的概率估计方法。 4.抽样估计的误差可以事先计算并加以控制。
(三)抽样推断的应用范围:
1.对无限总体不可能进行全面调查 2.总体范围过大,或过于分散,很难或不 必要进行全面调查 3.对于具有破坏性的质量检验不能进行全 面调查 4.限于人力、物力、财力不便进行全面调 查 5.对全面调查统计资料的质量进行检查和 修正
xi
xi X
x
i
X

2

统计学第5章抽样推断

统计学第5章抽样推断
就 是 由 样 本 指 标 直 接 代 替 全 及 指 标 , 不 考 虑
任 何 抽 样 误 差 因 素 。 即 用 x直 接 代 表 X , 用 p 直 接 代 表 P。
例 在 全 部 产 品 中 , 抽 取 100件 进 行 仔 细 检 查 , 得 到 平 均 重 量 x1002克 , 合 格 率 p98% , 我 们 直 接 推 断 全 部 产 品 的 平 均 重 量 X 1002克 , 合 格 率 P 98% 。
(1)
2
n
(1 )
12 2 (1
100
) 1.19 (千克 )
x
n
N
100 10000
(2) 若以概率 95.45%(t 2)保证,该农场 10000 亩小麦的平均
亩产量的可能范围为:
X : x 400 2 1.19 x
X (: 397 .62 ,402.38 ) (3) 若以概率 99.73%(t 3)保证,该农场 10000 亩小麦的平均
在重复抽样情况下:
p (1 p )
p
n
在不重复抽样情况下:
p (1 p ) n
(1 )
p
n
N

某玻璃器皿厂某日生产15000只印花玻璃 杯,现按重复抽样方式从中抽取150只进行 质量检验,结果有147只合格,其余3只为不 合格品,试求这批印花玻璃杯合格率(成数) 的抽样平均误差。
N15000n150
二、区间估计
根据样本指标和抽样误差去推断全及 指标的可能范围,它能说清楚估计的准 确程度和把握程度。
总体平均数和总体成数的估计
X :(x x, x x)
1的概率保证下:x tx
P:(pp, pp)
1的概率保证下: p tp

统计学第五抽样推断

统计学第五抽样推断

抽样推断的几个基本概念
常用的总体参数和统计量 :
抽样推断的几个基本概念
(三)样本容量和样本个数 1、样本容量:即一个样本中所包含的单 位数,一般用n表示。n≥30为大样本,n <30为小样本。 2、样本个数:是指在一个总体中所有可 能被抽取或可能构成的样本数目。 注意:在实际统计中我们只是抽取一个 样本,但进行抽样推断必须要考虑全部 的可能样本。
s x n n
2 ( x x ) s n 2 ( x x ) f f
抽样平均误差的计算
(三)影响抽样(平均)误差的因素 1、总体标志变异程度的大小(总体标准 差σ的大小),它与μ成正比例变化。 2、样本容量的大小,它与μ成反比例。 3、抽样方法的不同,重复抽样的μ总是 大于不重复抽样的μ。 4、抽样的组织形式,抽样的组织形式不 同,抽样误差也不同。
总体参数的区间估计
查正态概率双侧临界值表有:t=1.96
x
2
15 0.9487 n 15.8114
Δx= tμx=1.96×0.9487=1.86 则,65-1.86≤ X ≤65+1.86 即95%的估计区间为:63.14≤ X ≤66.86 计算结果说明有95%的把握认为总体平 均数介于63.14千克到66.86千克之间。
P( x X x t x ) F (t )
即:
P( x t x X x t x ) F (t )
(置信区间) (置信度)
总体参数的区间估计
(二)区间估计的方法及要素 2、总体成数的区间估计 P( p P p t p ) F (t )
(一)区间估计的概念
在统计分析中,我们常常用一个区间及 其出现的概率来估计总体参数。这种估 计总体参数的方法称为区间估计。 具体地说,区间估计是用估计量所构成 的区间来估计总体参数,并以一定的概 率保证总体参数将落在所估计的区间内。

安徽财经大学统计学课件-第05章 抽样推断

安徽财经大学统计学课件-第05章  抽样推断
1.重复抽样的条件下 2.不重复抽样的条件下
20
统计学
第五章
抽样推断
第二节 抽样误差
1.重复抽样的条件下
抽样平均误差: x
X
n
式中,n为样本容量; x为总体标准差一般情 况下是未知,可用样本标准差 x替代 。
成数的抽样平均误差 p :
p
n
式中,n为样本容量; p为总体成数标准差一 般情况下是未知,可用样本成数标准差 p 替代 。
第五章
抽样推断
本章主要内容
第一节 第二节 第三节 第四节

抽样推断的一般问题 抽样误差 参数估计 抽样组织设计
1
想一想 Thinking Challenge

消费者协会接到消费者投诉,指 控品牌纸包装饮料存在容量不足, 有欺骗消费者之嫌。包装上标明 的容量为250毫升。消费者协会 从市场上随机抽取50盒该品牌纸 包装饮品,测试发现平均含量为 248毫升,小于250毫升。这是生 产中正常的波动,还是厂商的有 意行为?消费者协会能否根据该 样本数据,判定饮料厂商欺骗了 消费者呢?
38
250 ml
2
统计学
第五章
抽样推断第一节 抽样推断的一般问题
第一节
抽样推断的一般问题
一、抽样推断的概念 二、抽样推断的特征 三、抽样推断的内容 四、有关抽样的基本概念

本章目录
3
统计学
第五章
抽样推断第一节 抽样推断的一般问题
一、抽样推断的概念

抽样推断是根据随机原则从总体中抽取部分总体 单位,以这一部分总体单位的实际数据推算总体 相应数量特征的一种统计分析方法。 随机原则是指在抽样调查中,使每一个单位被抽 中的概率都相等且不等于0。 随机抽样的目的是使样本与总体同分布。

统计学05第五章抽样推断

统计学05第五章抽样推断

布来计算。
0
2019/11/22
第五章 抽样推断
40
2.3 区间估计
【例 5-4】 从某校学生中随机抽取 25人,调查到他们平均每天参加体育 锻炼的时间为25分钟,标准差为8分 钟。试以95%的置信水平估计该校学 生平均每天参加体育锻炼的时间。
2019/11/22
第五章 抽样推断
41
2.3 区间估计
Z~N ( 0, 1 )
Z
S
μ
ΔΔ
X X X
Z 0 Z
2019/11/22
第五章 抽样推断
31
2.3 区间估计
二 总体平均数的区间估计:
X : FZ 1
Δ
FZ , Z FZ Z

Δ
x
x x
2019/11/22
第五章 抽样推断
总体参数和样本统计量的计算公式
总体参数
样本统计量
X X1 X2 XN N
x x1 x2 xn n
P N1 N
p n1 n
X X X 2 N
S x x-x 2 n1
P P 1 P
p p 1 p
t X : x ,x
2019/11/22
第五章 抽样推断
39
2.3 区间估计
正态分布与 t 分布的比较
t 分布的应用
当 n 大,
N0, 1
S x自实由际 度 参数大估计中,当样本 t 分容布量大N 0于,13 0时,总体均值的
区t 间 0估 , σ 2计ν通 常还是用正态分
0.15
X : 4 0.45, 4 0.45 3.55, 4.45小时

第五章 抽样推断

第五章 抽样推断

不重复抽样
总体单位数N不变,同一单位可能 多次被抽中。
每次从总体中抽选一个单位后就不 再将其放回参加下一次的抽选。又 称不放回抽样.
总体单位数减少n,同一单位只可 能被抽中一次。
抽样方法的分类
根据对样本的要求不同,可分为:
考虑顺序抽样 考虑各单位的中选顺序。 ABC≠CBA
例如:从1,2,3三个数中取两个数排成一个两位数,显然 十位数取1,个位数取2,和十位数取2,个位数取1是完 全不同的.
X f1N 10N 0N 1P
f
N
N
标 准
p
(XX)2f 1P2N10P2N0
f
N1N0

Q2PP2Q PQ QP PQ
是非标志总体的指标
方差
2P Q P 1P
当 PQ 0.5 时, m 2 a 有 x 0.25
标准差系数
V X P P
P 1P 1PQ
P
PP
是非标志总体的指标
【例】某厂某月份生产了400件产品,其中 合格品380件,不合格品20件。求产品质量 分布的集中趋势与离中趋势。
总体未 知参数
分布的形状 及接近总体
主要样本 平均数 比率(成参数数)的程方度差
x 统计量
p
S2
抽样分布
从同一总体中,抽取样本容量相同 的所有可能样本后,计算每个样本 统计量的取值和相应的概率,组成 样本统计量的概率分布。
注意:统计量的取值不但和样本容量有关,而且和抽样方法 有关,以下分别研究重复抽样和不重复抽样的抽样分布。
抽样调查的理论基础
表明大量随机观象平均结果具有稳定性的性
大数定律 质。大数定律论证了如果独立随机变量总体
存在有限的平均数和方差,则对于充分大的 样本可以近乎100%的概率,期望样本平均 数与总体平均数的绝对离差为任意小。

《统计学原理》第5章:抽样推断

《统计学原理》第5章:抽样推断
lim P( x X ) 1
n
抽样推断的基本原理
统计推断的理论基础—样本的概率分布
按一定方法随机抽取样本时,所有可能样本的 特征值及其所对应的概率分布情况
学生 A B C D E F G 成绩 30 40 50 60 70 80 90
按随机原则考虑顺序重复抽样抽选出4名学生。
抽样推断的一般问题
样本可能数目
按照一定的抽样方法和组织方式,从总体N中抽取n个 单位构成样本,一共可以抽出的不同样本的数量,一般 用M表示.
考虑顺序的不重复抽样 考虑顺序的重复抽样
M N! (N n)!
M Nn
不考虑顺序的不重复抽样 不考虑顺序的重复抽样
M N! n!(N n)!
全及指标与样本指标
•根据全及总体中各单位的标志值或标志属性计算得 来,反映总体某种特征的指标 •根据样本总体中各单位的标志值或标志属性计算得 来的综合指标.
抽样推断的一般问题
抽样方法
•重复抽样和不重复抽样
•考虑顺序的抽样和不考虑顺序的抽样
抽样推断的一般问题
抽样方法—重复抽样
从总体N个单位中随机抽取一个容量为n的样本,每 次抽取一个单位,把结果登记后再放回到总体中,重新 参加下一次的抽取.
抽出个体
登记特征
放回总体
继续抽取
抽样推断的一般问题
抽样方法—不重复抽样
从总体N个单位中随机抽取一个容量为n的样本, 每次抽取一个单位,把结果登记后不再放回到 总体参加下一次的抽取.
抽出 个体
登记 特征
继续 抽取
抽样推断的一般问题
抽样方法—考虑顺序的抽样
从总体N个单位中抽取n个单位构成样本,不但考虑样本 各单位成分的不同,而且还要考虑样本各单位的中选顺 序.

05第五章抽样推断.pptx

05第五章抽样推断.pptx

2020/10/22
第五章 抽样推断
17
1.4 抽样推断的误差
极限误差标准化的意义:
x ~ N X , μ2
Z~N ( 0, 1 )
Z
S
μ
ΔΔ
X X X
Z 0 Z
2020/10/22
第五章 抽样推断
18
第二节 总体参数的估计
2.1 总体参数估计概述 2.2 点估计 2.3 区间估计 2.4 样本容量的确定
2020/10/22
第五章 抽样推断
5
第一节 抽样推断及其特点
1.1 抽样推断的特点 1.2 总体参数和样本统计量 1.3 抽样推断的基本条件 1.4 抽样推断的误差
2020/10/22
第五章 抽样推断
6
1.1 抽样推断及其特点
抽样推断(统计推断)
— 按随机原则从总体中抽取部分单位构成 样本,在一定的可靠程度下,根据样本的数 量特征对总体的数量特征加以推断的方法。
点估计就是根据总体参数与样本统计 量之间的内在联系,直接以样本统计量 作为相应总体参数的估计值,点估计又 称为定值估计。
常用的点估计量有:
Xˆ x Pˆ p ˆ 2 S 2 ( x x )2
n1
2020/10/22
第五章 抽样推断
21
估计量与估计值
(estimator & estimated value)
X
x
n
p
P 1 P
n
2020/10/22
第五章 抽样推断
14
1.4 抽样推断的误差
总体标准差和成数的确定:
总体变化不大,采用过去总体指标数值做代 替;
用样本标准差σ(x) 或样本成数 p 替代; 对于成数,可取 P = 0.5;如果有多个 P 值,

5 应用统计学(教案)-抽样推断

5 应用统计学(教案)-抽样推断

4、抽样估计的一般步骤
设计抽样方案 抽取样本单位 收集样本资料
整理样本资料
推断总体指标
(1)抽样方案设计的基本准则
随机原则: 确保每个总体单位都有 被抽取的可能。 抽样误差最小: 控制和选择抽样数 目及抽样组织方式 费用最少: 在误差达到一定要求的 条件下,选择费用最少 的方案。
(2)抽样方案设计的主要内容 ① 编制抽样框 抽样框即总体单位的名单。 主要形式: 名单抽样框 区域抽样框 时间表抽样框 编制要求: 应包括全部总体单位 总体单位不应重复 应便于抽样的实施 应尽量利用资料,提高抽 样效果
第五章 抽样推断
基本概念
抽样误差
抽样估计 抽样组织方式
第一节 抽样估计的基本概念
一、抽样估计的意义和一般步骤 1、抽样估计的概念
抽样估计 按随机原则从总体中抽取一部 分单位进行调查,并以调查结 果对总体数量特征作出具有一 定可靠程度的估计与推断,从 而认识总体的一种统计方法。 也是一种收集资料的方法,所以也称为抽 样调查。
另外,分两个以上阶段完成抽取样本的多阶段抽 样,多在总体单位数量多分布广时采用。一般前阶段 采用分层或有关标志排队等距抽样;后阶段采用简单 随机或无关标志排队等距抽样。
④ 确定抽样数目 抽样数目: 即样本容量、样本单位数 大样本:n ≥ 30 小样本:n < 30 抽样数目的确定,与抽样误差、费 用及抽样组织方式有直接的关系。 误差小费用多时抽样数目多,误差 大费用少时抽样数目少;分层抽样除确 定整个样本容量外,还需确定子样本容 量;整群抽样需确定样本群数;多阶段 抽样需确定各阶段抽样数目。
| x - X |≤△ x (在一定概率下) 置信度、概率保证度、 可信度、把握程度,)与△x 是一对矛盾

第五章抽样推断ppt课件

第五章抽样推断ppt课件

在99.73%概率保证程度下,估计该厂全部灯泡平均耐用时间 在919~933.8小时之间。
⑵ p=0.4%
p1p0.00 0.4 990 6 .2% 8
p
n
500
概率保证程度为0.6827时,t=1
1 0.28 %
p
p
p 0 . 4 % 0 . 2 % 0 . 8 1 % p 2 0 . , 4 % 0 . 2 % 0 . 8 6 %
第五章 参数估计
本章学习目的与要求 第一节 抽样分布 第二节 抽样误差 第三节 抽样估计方法 第四节 抽样组织设计
下一页 前往本节首页
本章学习目的与要求
目的: 学习目的在于提供一套利用抽样资料来估计总体数量特征的方法。
要求: ⒈明确抽样调查的概念、特点、作用; ⒉了解抽样误差的影响要素; ⒊掌握抽样平均误差的计算方法; ⒋掌握抽样估计方法与样本容量确定的方法; ⒌了解类型抽样、等距抽样、整群抽样的含义、特点 与适用场所。
2.不反复抽样的条件下
抽样平 :x均 n X 2 ((N N 误 1 n )); 差 N 很 当大时 x 近 n X 2(1 似 N n) 为
式中,N为总体单位数;n为样本容量;σX2 为总体方差,普通情况下是未 知,可用样本方差替代 σx 2
成数的抽样平:均 p 误np2(差 (NN1n));当 N很大时近 p似 nP 2(1为 N n)
〔1〕估计值 〔2〕抽样误差范围 〔3〕概率保证程度
上一页 下一页 前往本节首页
〔二〕总体平均数(成数)的区间估计

xx X xx ,

或Xxx ,xx
式 其中,Δx tμx 为极限误差
pp P pp,
或P pp, pp

【统计学概论】抽样推断

【统计学概论】抽样推断

每包重量(克) 149以下 149—150
150—151 151以上
包数 10 20 50 20
(1)以99.73%的概率保证估计这批茶叶平均每包重量的 可能范围
(2)以同样的概率保证估计这批茶叶包装的合格率的可 能范围
• 三必要抽样数目的确定
• (一)影响抽样数目的因素

影响抽样数目的因素有:
(一)总体和样本
总体:调查研究的事物或现象的全体,所包含 的单位数用“N”表示。
样本:从总体中所抽取的部分个体所构成的小 的总体,当中所包含的单位数用“n”
表 示,称为“样本容量”。 样本可分为: 大样本 小样本
(二)全及指标与样本指标 (参数与统计量)
1、全及指标:说明全及总体的综合数量 特征,是唯一的,又称为“参数”。
尺度,用“ ”。
2、公式:
(1)重复抽样条件下:
(2)不重复抽样条件下:
五、抽样极限(允许)误差
1、概念:是在一定的概率保证下,用样本 指标估计全及指标时允许出现的
最 大误差,用“△”表示.
2、计算公式: 根据置信度(即可靠性,F(t)=1-α),
查正态概率分布表,查得对应的概率度t。 (在总体方差未知的情况下)
例3:P94
例4 P95
例5 P96
三、抽样误差
1、概念:是在遵循随机原则的条件下,用 样本指标来代表全及指标所不可避免 的误差。就是统计误差中的随机误差
抽样误差=样本指标 -全及指标 2、影响因素:
①抽取单位数n的多少 ②被研究标志的变异程度 ③抽样方法 ④抽样组织方式
四、抽样平均误差
1、概念:是所有可能组成的样本的抽样误 差的平均数,反映样本指标与全及指标的 平均误差程度,是衡量样本代表性大小的
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

置信水平
(confidence level)
1.
2.
将构造置信区间的步骤重复很多次,置信区间 包含总体参数真值的次数所占的比例,也称置 信度 表示为 (1 - 为是总体参数未在区间内的比例
3.
常用的置信水平值有 99%, 95%, 90% 相应的 为0.01,0.05,0.10
总体参数估计就是以样本统计量来估 计总体参数。 参数估计要求:
1. 精确性—适当的极限误差范围;
2. 可靠性—估计结果正确的概率。
参数估计—点估计和区间估计。
2014-3-30 第五章 抽样推断 20
2.2 点估计(point estimate)
点估计就是根据总体参数与样本统计 量之间的内在联系,直接以样本统计量 作为相应总体参数的估计值,点估计又 称为定值估计。 常用的点估计量有:
第五章
抽样推断
第一节 抽样推断及其特点
第二节 总体参数估计 第三节 假设检验概述
统计名言
不象其他科学,统计从来不打算使自 己完美无缺,统计意味着你永远不需 要确定无疑
—— Gudmund R.Iversen
参数估计在统计方法中的地位
统计方法
描述统计 推断统计
参数估计
2014-3-30 第五章 抽样推断
ˆ x X
2014-3-30
2 ( x x )
ˆp ˆ 2 S2 P
n1

21
第五章 抽样推断
估计量与估计值
(estimator & estimated value)
1. 2.
3. 4.
参数估计 (parameter estimation) 就是用样本统计量去估 计总体的参数 估计量:用于估计总体参数的统计量的名称 如样本均值,样本比例,样本方差等 例如: 样本均值就是总体均值 的一个估计量 参数用 表示,估计量用 表示 ˆ 估计值:估计参数时计算出来的统计量的具体值 如果样本均值 x =80,则80就是 的估计值
2.一致性:(consistency)
样 本 总体 P ε 1 lim n 统计量 参数
xX ε
第五章 抽样推断
lim P
n
2014-3-30
1
24
2.2 点估计
优良估计量的三个标准:
σ x

σX n
x
X
X
2014-3-30
第五章 抽样推断
总体变化不大,采用过去总体指标数值做
代替;
用样本标准差σ(x) 或样本成数 对于成数,可取
p 替代;
P = 0.5;如果有多个 P 值,
取其最接近 0.5 的P 做替代。
2014-3-30 15
第五章 抽样推断
1.4 抽样推断的误差
3. 抽样极限(允许)误差
是样本统计量与被估计的总体参数之 绝对离差的最大允许值,常用Δ表示, 可简称为极限误差或允许误差。
使用一个较大的置信水平会得到一个比较宽的置信区间, 而使用一个较大的样本则会得到一个较准确(较窄)的区间。 直观地说,较宽的区间会有更大的可能性包含参数 但实际应用中,过宽的区间往往没有实际意义 比如,天气预报说“在一年内会下一场雨”,虽然这很 有把握,但有什么意义呢?另一方面,要求过于准确 (过窄)的区间同样不一定有意义,因为过窄的区间虽 然看上去很准确,但把握性就会降低,除非无限制增 加样本量,而现实中样本量总是有限的 区间估计总是要给结论留点儿余地
计量的值 1. 简单明了; 无法提供误差情况; 1.
ˆ 估计的可靠程度无 p P x 能提供具体估计值。 X 作用: 区间估计的基础。 从知晓。
2. 2.
2014-3-30 第五章 抽样推断 29
2.3 区间估计(interval estimate)
一 区间估计的含义:
总体参数
θ
ˆ 1
概率 P=1-α=?
ˆ 1
区间大小 — 估计的精确性; 概率高低 — 估计的准确性。
2014-3-30 第五章 抽样推断 30
区间估计
(interval estimate)
1.
在点估计的基础上,给出总体参数估计的一个估 计区间,该区间由样本统计量加减估计误差而得 到 根据样本统计量的抽样分布能够对样本统计量与 总体参数的接近程度给出一个概率度量 样本统计量 置信区间 比如,某班级平均分数在 75~85之间,臵信水平 (点估计) 是95%
8
1.2 总体参数和样本统计量
总体参数与样本统计量的比较 总体参数
含义 性质 特点 常见 目的
2014-3-30
样本统计量
样本的指标 不唯一、随机变量 易求
总体的指标 唯一、常量 未知
X、P、 X
x、p、S x
利用样本统计量推断总体参数
第五章 抽样推断 9
x 1.2 总体参数和样本统计量
假设检验
3
大学生每周上网花多少时间?

为了解学生每周上网花费的时间,中国人民大学公共管理 学院的4名本科生对全校部分本科生做了问卷调查。调查的 对象为中国人民大学在校本科生,调查内容包括上网时间、 途径、支出、目的、关心的校园网内容,以及学生对收费 的态度,包括收费方式、价格等问卷调查由调查员直接到 宿舍发放幵当场回收。对四个年级中每年级各发 60 份问卷, 其中男、女生各30份。共收回有效问卷共200份。其中有关 上网时间方面的数据经整理如下表所示
2
2014-3-30

p p1 p
27
n1
第五章 抽样推断
2.2 点估计
样本方差
符号 公式

2
x
2
S x
2
x x
n
x x
n1
2
反映样本的 作用 离散程度
2014-3-30 第五章 抽样推断
推断总体
28
2.2 点估计
总体参数的点估计:
优点: 缺点: 原则:总体参数估计值就取统
1.4 抽样推断的误差
统计误差的分类
登记性误差
可消除
统 计 误 差
代表性误差
系统误差
可消除
抽样误差
可控制
2014-3-30
第五章 抽样推断
12
1.4 抽样推断的误差
抽样误差
1. 抽样实际误差:
对某一样本而言,由随机因素引起的 样本统计量与总体参数在数量上的差异 就是抽样实际误差。
xX
2014-3-30 第五章 抽样推断 13
2014-3-30 第五章 抽样推断 5
第一节
抽样推断及其特点
1.1 抽样推断的特点 1.2 总体参数和样本统计量 1.3 抽样推断的基本条件
1.4 抽样推断的误差
1.1 抽样推断及其特点
抽样推断(统计推断)
— 按随机原则从总体中抽取部分单位构成 样本,在一定的可靠程度下,根据样本的数 量特征对总体的数量特征加以推断的方法。 抽样推断的方法:
2014-3-30
第五章 抽样推断
22
2.2 点估计
优良估计量的三个标准: 1.无偏性: (unbiasedness)
E (统计量) = 总体参数
样本平均数— E x

x X
样本成数— E p p P
2014-3-30 第五章 抽样推断 23
2.2 点估计
优良估计量的三个标准:
2.
置信下限
2014-3-30 第五章 抽样推断
置信上限
31
区间估计的图示
x z 2 x
- 2.58x -1.65 x
x

+1.65x +2.58x
x
-1.96 x
+1.96x
90%的样本 95% 的样本 99% 的样本
2014-3-3பைடு நூலகம் 第五章 抽样推断 32
1.4 抽样推断的误差
2. 抽样平均(标准)误差:
抽样平均误差是抽样平均数的标准差,它 反映样本平均数(样本成数)与总体平均数 (总体成数)之间的平均差异程度。
x
2014-3-30
X
n
p
P 1 P n
14
第五章 抽样推断
1.4 抽样推断的误差
总体标准差和成数的确定:
2014-3-30
p p 1 p
第五章 抽样推断 10
1.3 抽样推断的基本条件
抽样推断的基本条件
1. 选择统计量—优良估计量。 2. 合适的允许误差—精确性。 3. 可接受的置信度—可靠性。
精确性和可靠性是一对矛盾。要根据问 题的性质和研究的需要在二者间权衡。
2014-3-30 第五章 抽样推断 11
2. 3.
2014-3-30
第五章 抽样推断
36
置信区间的表述
(95%的置信区间)
点估计值
我没有抓住参数!

从均值为 n=10的 20个样本构造出的20个置信区间 抽样推断 2014-3-30 185的总体中抽出第五章 37
置信区间的表述
(confidence interval)
1.
2.
3.
2.
2014-3-30
第五章 抽样推断
35
置信区间的表述
(confidence interval)
1.
当抽取了一个具体的样本,用该样本所构造的区间是一 个特定的常数区间,我们无法知道这个样本所产生的区 间是否包含总体参数的真值,因为它可能是包含总体均 值的区间中的一个,也可能是未包含总体均值的那一个 一个特定的区间总是“包含”或“绝对不包含”参数的 真值,不存在“以多大的概率包含总体参数”的问题 置信水平只是告诉我们在多次估计得到的区间中大概有 多少个区间包含了参数的真值,而不是针对所抽取的这 个样本所构建的区间而言的
相关文档
最新文档