抽样检验-第五章抽样推断 精品

合集下载

第五章第四节抽样检验

第五章第四节抽样检验

是先站在生产方的立场来制定,用加严
保护使用方,当一贯比AQL好时,使用放
宽严格度来鼓励生产方。
P0
p1
p
AQL
1.主要适用于连续批的检验,也可适用于 孤立批。
连续批:待检批可利用最近已检批可提供 的质量信息,连续递交的检验批。
孤立批:脱离已生产或者汇集的批系统不 属于当前检验批系列的批。
孤立批的情况有:
Pa(p)=∑P(X=d) 称所给定的函数Pa(p)为抽样方案(n Ac,Re)的 抽检特性函数,简称OC函数。曲线称为抽样方案的抽检 特性曲线,简称OC曲线,也称接收概率曲线。 每个抽样方案,都有它特定的OC曲线。
错误的观点:Ac=0的方案最严格,最让人放心
①N=1000,n=100,Ac=0; ②N=1000,n=170,Ac=1; ③N=1000,n=240,Ac=2
给出AQL值,并不意味着生产方有权提供已知的不合格品。无 论是抽样检验中或其他场合发现的不合格品,都应该逐个剔除。
当以不合格品百分数表示质量水平时,AQL值应不超过10%不 合格品;当以每百单位不合格数表示质量水平时,可使用的AQL值 最高可达1000个不合格。
(3) 优先AQL和制定原则
GB/T 2828.1表中给出的AQL值称为优先的AQL系列。
当指定的对某一产品进行检验的AQL是这些优先的AQL当中之一时, 就可以使用这些表。
a) AQL在制定时以产品为核心,并与产品质量特性的重要度有关。 1.重要程度:AQL(A类)<AQL(B类)<AQL(C类) 2.检验项目:AQL(少) < AQL(多) 3.AQL(军用产品)<AQL(民用产品) 4.AQL(电器性能)<AQL(机械性能)<AQL(外观)
第四节 抽样检验

第5章 抽样推断(完整版)(08经济国贸)资料

第5章 抽样推断(完整版)(08经济国贸)资料

3、抽样推断的应用
不可能进行全面调查时 不必要进行全面调查时 来不及进行全面调查时 对全面调查资料进行补充修正时
4、抽样推断的一般步骤














样 本
样 本 统
总 体










二、总体参数 指被估计的总体指标,又被称
为全及指标
设总体中 N 个总体单位某项标志的标志值分别 为 X1, X 2 , X N ,其中具有某种属性的有 N1个 单位,不具有某种属性的有 N0个单位,则
1.25
样本均值的抽样分布
(例题分析)
STAT
最优抽取
能使样本结构更接近于总体结构,提高样本的 代表性;能同时推断总体指标和各子总体的指标
3·等距抽样(机械抽样或系统抽样)
——将总体单位按某一标志排序,而后按一 定的间隔抽取样本单位。
随机起点
半距起点
对称起点
······
(总体单位按某一标志排序)
按无关标志排队,其抽样效果相当于简单随机抽样; 按有关标志排队,其抽样效果相当于类型抽样。
4·整群抽样(集团抽样)
—— 将总体全部单位分为若干“群”,然后 随机抽取一部分“群”,被抽中群体的所有 单位构成样本
例:总体群数R=16 样本群数r=4
A D
E
B F G
CM N
J H
L K
P O I
LP HD
样本容量
n nd np nl nh
简单、方便,能节省人力、物力、财 力和时间,但其样本代表性可能较差

统计学 第五章

统计学      第五章

第五章 抽样推断抽样推断定义:是一种非全面调查,是按随机原则,从总体中抽取一部分单位进行调查,并以其结果对总体某一数量特征作出估计和推断的一种统计方法。

(一) 总体和样本在抽样推断中面临两个不同的总体,即全及总体和样本总体,全及总体也叫母体,简称总体。

全及总体的单位数用N 表示全及总体⎪⎩⎪⎨⎧⎩⎨⎧属性总体有限总体无限总体变量总体样本总体又叫抽样总体、子样,简称样本,样本总体的单位数称样本容量,用n 表示。

(二) 参数和统计量参数亦称全及指标,由于全及总体是唯一确定的,故根据全及总体计算的参数也是个定值 对于属性总体,可以有如下参数,全及总体成数p ,全及总体标准差)(2p p σσ方差 属性总体标准差:()p p p-=1σ统计量即样本指标设样本总体有n 个变量:n x x x x ,...,,,321 则:样本平均数 nx x ∑=(三) 样本容量与样本个数样本容量是指一个样本所包含的单位数,用n 来表示,一般地,样本单位数达到或超过30个的样本称为大样本,而在30个以下称为小样本。

社会经济统计的抽样推断多属于大样本,而科学实验的抽样观察则多取小样本。

样本个数又称样本可能数目,是指从全及总体中可能抽取的样本的个数。

一个总体可能抽取多少样本,与样本容量大小有关,也与抽样的方法有关。

在样本容量确定之后,样本的可能数目便完全取决于抽样方法。

抽样误差是抽样调查自身所固有的,不可避免的误差,虽然不能消除这种误差,但有办法进行计算,并能对其加以控制。

抽样平均误差越大,表示样本的代表性越低;抽样平均误差越小,表示样本的代表性越高。

在重复简单随机抽样时,样本平均数的抽样分布有数学期望值E(a)=a(a代表全及总体平均数,即X)X⇔。

样本平均数的平均数=总体平均数抽样平均误差=抽样标准误差=样本平均数的标准差(它反映抽样平均数与总体平均数的平均误差程度)例题:某班组4个工人的月工资(N=4)分别是:1400元,1500元,1600元,1700元,现用重复简单随机抽样的方法从全及总体中抽选出容量大小为2的样本(n=2),求抽样平均误差?解:全及总体平均工资)(15501700160015001400元=+++=X全及总体标准差()4500002=-=∑NX Xσ抽样平均误差x μ=nnσσ=2=)(0569.792*450000元=例题:某班组4个工人的月工资(N=4)分别是:1400元,1500元,1600元,1700元,现用不重复简单随机抽样的方法从全部总体中抽选容量大小为2的样本(n=2),求抽样平均误差?解:全及总体平均工资)(155041700160015001400元=+++==∑NXX全及总体标准差()4500002=-=∑NX Xσx μ=⎪⎭⎫ ⎝⎛--∙12N n N n σ=)(55.6414244*250000元=--∙例题:某电子元件厂,生产某型号晶体管,按正常生产试验,产品中属于一级品的占70%,现在从10000件晶体管中,抽取100件进行抽查检验,求一级品率的抽样平均误差? 解:已知:P=0.7 , P(1-P)=0.21在重复抽样的情况下,抽样平均误差为:()np p p -=1μ=%58.410021.0=在不重复抽样的情况下,抽样平均误差为:()⎪⎭⎫⎝⎛-∙-=N n n p p p 11μ=%56.410000*********.0=⎪⎭⎫ ⎝⎛-∙参数估计()()⎪⎪⎩⎪⎪⎨⎧→-==+≤≤是概率度是置信度,极限误差)样本指标总体指标极限误差—(样本指标区间估计:求不高的情况准确程度与可靠程度要点估计:适用于推断的t t F t F P α1例题:已知某车间某产品的合格率在某个置信度下的估计区间是(85%,95%),还已知样本容量为100,求置信度?解:显然p p ∆-=85%,p p ∆+=95%,即p=90%,p ∆=5%p ∆=μ⋅t μpt ∆=⇒=()()67.1100%901%90%51=-∙=-∆np p p ()t F =0.9052即置信度为90.51% ★求置信度,只需要求出t影响抽样数目的因素⎪⎪⎪⎪⎩⎪⎪⎪⎪⎨⎧∆样本单位不重置抽样可以少抽些单位,抽样需要多抽一些样本、在同等条件下,重置单位,则反之值越大,则多抽些样本、概率度则反之单位,的值大可以少抽些样本)、允许误差(极限误差越多,则反之值越大,必要抽样数目、总体标准差4321t x σ例题:某城市组织职工家庭生活抽样调查,职工家庭平均每户每月收入的标准差为11.50元,要求把握程度为95.45%,允许误差为1元,问需抽选多少户? 解:()t F =0.95452=⇒t , 元元,150.11=∆=x σxt n 222∆=σ=()户529150.1142=∙。

第5章抽样推断40页PPT

第5章抽样推断40页PPT
影响抽样误差的主要因素: 1、总体各单位标志值的差异程度。在其他条件不变的情况下, 总体各单位标志值的变异程度愈大,抽样误差也愈大,反之则 愈小。 2、样本的单位数。在其他条件不变的情况下,样本单位数愈 多,抽样误差就愈小,反之则愈大。 3、抽样方法。抽样方法不同,抽样误差也不同。一般说来,重 复抽样的误差比不重复抽样的误差要大。
例 题二:
某厂生产一种新型灯泡共2000只,随机抽出400只 作耐用时间试验,测试结果平均使用寿命为4800小时, 样本标准差为300小时,求抽样推断的平均误差?
解: 则:
已知 N 20 ,n 0 4 00 ,x 0 48 , 0 3 000
x
n
3001(5小)时 400
x
2 1 n
则:样本合格率 pnn130060.98 n 300
p
p 1 p 0 .9 8 0 .0 20 .8( 0% 8 )
n
300
p
p1p1n
n N
0.980.021 300 0.80(6 %) 300 60000
4、抽样调查的组织形式。选择不同的抽样组织形式,也会有 不同的抽样误差。
抽样平均误差
抽样平均误差是抽样平均数或抽样成数的标准差。反映了抽 样平均数与总体平均数抽样,成数与总体成数的平均误差程度。
抽样平均数的 平均误差
x
抽样成数的 平均误差
p
重复抽样 2
nn
p(1 p) n
不重复抽样
2 (1 n )
总体平均数
X
Xf f
总体标准差
(X X)2 f f
总体成数
p N1 N
成数标准差 p P(1P)
将总体N个单位分成性质相反的两组,其中具有某特征

《统计学原理》第5章:抽样推断

《统计学原理》第5章:抽样推断

σ
n )
抽样推断的基本原理
抽样推断的优良标准
设θ 为待估计的总体参数, θ为样本统计量,则 θ的优良标 准为: 1若 E(θ ) =θ ,则称 θ为 θ 的无偏估计量(无偏性)
更有效的估计量(有效性) 2若σθ1 < σθ2,则称θ1为比θ2
3若 越大σθ 越小,则称 θ 为θ 的一致估计量(一 致性)
即中选成分相同但中选顺序不同的视为同一样本
抽样推断的一般问题
抽样组织方式
简单随机抽样 类型抽样 整群抽样 等距抽样 多阶段抽样 多重抽样
抽样推断的一般问题
样本可能数目
按照一定的抽样方法和组织方式,从总体N中抽取n个 单位构成样本,一共可以抽出的不同样本的数量,一般 用M表示. 考虑顺序的不重复抽样 考虑顺序的重复抽样 不考虑顺序的不重复抽样 不考虑顺序的重复抽样
抽样推断的一般问题
全及总体指标:参数 (未知量) 统计推断 样本总体指标:统计量 (已知量)
抽样推断的一般问题
抽样推断的特点 按随机原则抽取样本 运用概率论的理论和方法,用样本指标来推断 总体指标。 推断的误差可以事先计算和控制。
抽样推断的一般问题
抽样推断的应用 无法或 很难进行全面调查而又需要了解 其全面情况时 某些可以采用全面调查的社会经济现象, 也可采用抽样推断。 可用于生产过程的质量控制 进行假设检验
抽样推断的基本原理
抽样推断的优良标准——有效性 中位数的抽样分布
9 8 7 6 5 4 3 2 1 0 -1 45 50 55 60 65 70 75
平均数的抽样 分布
E(x) =
E ( me ) =
e
σx <σm
抽样推断的基本原理

统计学第5章抽样推断

统计学第5章抽样推断
就 是 由 样 本 指 标 直 接 代 替 全 及 指 标 , 不 考 虑
任 何 抽 样 误 差 因 素 。 即 用 x直 接 代 表 X , 用 p 直 接 代 表 P。
例 在 全 部 产 品 中 , 抽 取 100件 进 行 仔 细 检 查 , 得 到 平 均 重 量 x1002克 , 合 格 率 p98% , 我 们 直 接 推 断 全 部 产 品 的 平 均 重 量 X 1002克 , 合 格 率 P 98% 。
(1)
2
n
(1 )
12 2 (1
100
) 1.19 (千克 )
x
n
N
100 10000
(2) 若以概率 95.45%(t 2)保证,该农场 10000 亩小麦的平均
亩产量的可能范围为:
X : x 400 2 1.19 x
X (: 397 .62 ,402.38 ) (3) 若以概率 99.73%(t 3)保证,该农场 10000 亩小麦的平均
在重复抽样情况下:
p (1 p )
p
n
在不重复抽样情况下:
p (1 p ) n
(1 )
p
n
N

某玻璃器皿厂某日生产15000只印花玻璃 杯,现按重复抽样方式从中抽取150只进行 质量检验,结果有147只合格,其余3只为不 合格品,试求这批印花玻璃杯合格率(成数) 的抽样平均误差。
N15000n150
二、区间估计
根据样本指标和抽样误差去推断全及 指标的可能范围,它能说清楚估计的准 确程度和把握程度。
总体平均数和总体成数的估计
X :(x x, x x)
1的概率保证下:x tx
P:(pp, pp)
1的概率保证下: p tp

5 应用统计学(教案)-抽样推断

5 应用统计学(教案)-抽样推断

4、抽样估计的一般步骤
设计抽样方案 抽取样本单位 收集样本资料
整理样本资料
推断总体指标
(1)抽样方案设计的基本准则
随机原则: 确保每个总体单位都有 被抽取的可能。 抽样误差最小: 控制和选择抽样数 目及抽样组织方式 费用最少: 在误差达到一定要求的 条件下,选择费用最少 的方案。
(2)抽样方案设计的主要内容 ① 编制抽样框 抽样框即总体单位的名单。 主要形式: 名单抽样框 区域抽样框 时间表抽样框 编制要求: 应包括全部总体单位 总体单位不应重复 应便于抽样的实施 应尽量利用资料,提高抽 样效果
第五章 抽样推断
基本概念
抽样误差
抽样估计 抽样组织方式
第一节 抽样估计的基本概念
一、抽样估计的意义和一般步骤 1、抽样估计的概念
抽样估计 按随机原则从总体中抽取一部 分单位进行调查,并以调查结 果对总体数量特征作出具有一 定可靠程度的估计与推断,从 而认识总体的一种统计方法。 也是一种收集资料的方法,所以也称为抽 样调查。
另外,分两个以上阶段完成抽取样本的多阶段抽 样,多在总体单位数量多分布广时采用。一般前阶段 采用分层或有关标志排队等距抽样;后阶段采用简单 随机或无关标志排队等距抽样。
④ 确定抽样数目 抽样数目: 即样本容量、样本单位数 大样本:n ≥ 30 小样本:n < 30 抽样数目的确定,与抽样误差、费 用及抽样组织方式有直接的关系。 误差小费用多时抽样数目多,误差 大费用少时抽样数目少;分层抽样除确 定整个样本容量外,还需确定子样本容 量;整群抽样需确定样本群数;多阶段 抽样需确定各阶段抽样数目。
| x - X |≤△ x (在一定概率下) 置信度、概率保证度、 可信度、把握程度,)与△x 是一对矛盾

管理统计学之抽样推断

管理统计学之抽样推断

2021/7/21
管理统计学讲义 游士兵
例5、某产品的耐用时间为1000小时,现 随机抽取10件新工艺条件下的产品作测 试,测得平均耐用时间为1077小时,标 准差为51.97小时,能否认为新工艺条 件下产生的产品明显不同于老产品?
2021/7/21
管理统计学讲义 游士兵
2021/7/21
管理统计学讲义 游士兵
(3)计算举例
例1:某企业生产一批产品20000件,今 随机抽样100件作耐用时间试验,结果 表明:每件样本的平均寿命为3600小 时,所抽样本的标准差为150小时,求 抽样误差。
2021/7/21
管理统计学讲义 游士兵
例2:随机抽取500名某国私人对外投资 者,发现对外投资额在5000万元以上 的人数有80人,求抽样误差。
2021/7/21
管理统计学讲义 游士兵
例3、某公司引进一自动包装线包装大米, 合同规定设计规格为每袋大米10公斤, 标准差为0.6公斤,生产调试后随机抽 取100袋大米平均重量为9.8公斤。问可 靠程度为95%下,该生产线的设计规格 是否符合要求?
2021/7/21
管理统计学讲义 游士兵
例4、取8台新型发动机进行测试,其结 果是使用柴油每公升的运转时间分别为 28、27、31、29、30、27、30、27分 钟。根据设计要求,平均每公升运转应 在30分钟以上。问根据实验结果,在 显著性水平为5%和总体标准差不明确 的条件下,能否说明这种发动机符合设 计要求?
例3:一批食品随机抽查50箱,发现一箱 不合格,求合格率的抽样误差。
2021/7/21
管理统计学讲义 游士兵
三、点估计和区间估计
1、点估计 点估计是直接用样本指标推断总体
指标的一种方法。 点估计的特点是只考虑了样本指标,

第五章 抽样估计

第五章  抽样估计
3.题型:(1)已知 ,求F(t)(2)已知F(t),求区间(实值求 )
步骤: 步骤:
例题1.(题型一)
某乡水道总面积2000亩,从中随机抽取40亩(重复抽样),每亩产量资料如下:
每亩产量(斤)
亩数
x
xf
(x- ) f
400—450
450—500
500—550
550—600
600—650
650—700
1)常用的参数和统计量(指标:平均指标和变异指标)
对于数量标志,计算平均指标和变异指标( )
对于品质标志,计算成数指标(结构相对指标)来表示某种性质的单位数在总体全部单位数中所占的比重。即p=(n1/n),则总体中不具有某种性质的单位数在总体中所占的比重为:q=1-p
如果进行对品质标志是非标志进行赋值,即:定义为“1”和“0”,则有:
(五)抽样估计的置信度
前面我们学习了两种误差,即平均误差和极限误差,这两种误差有着不同的含义。
抽样平均误差反映抽样误差一般水平,是样本资料和总体之间所有离差值的一个平均数。极限误差指进行抽样在统计工作前设立的一个误差最大值。二者的关系是 ( )用抽样误差概率度来表示的。
我们客观地承认,只要进行抽样调查,必然存在误差,并且根据经验或工作要求,我们可以设置一个误差最大值,但要使抽样调查结果一定符合误差在极限误差范围内,却并非能够实现。所以要保证误差不超过一定范围的,只能给一定程度的概率保证程度。抽样估计置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。
如:t=1 F(t)=P=68.27%查《正态分布概率分t=2 F(t)=F(2)=P=95.45%布表》
t=3 F(t)=F(3)=P=99.73%
t=1.64 F(t)=90%

第五章抽样检验

第五章抽样检验
1、用方案(n︱Ac,Re)对一批不合格品率为p的产品实施计 件检验,试计算接收概率L( p)
(提示:二项分布) 2、用方案(n︱Ac,Re)对一批单位产品不合格数为p的产品
实施计点检验,试计算接收概率L( p) (提示:泊淞分布)
第五章抽样检验
三、计数调整型抽样检验标准 《计数抽样检验程序第1部分:按接受质量限
第五章抽样检验
二、抽样检验原理
1 批质量的描述 2 抽样方案及其类型 3 抽样特性曲线 (OC曲线 ) 4 抽样方案的确定 5 思考题
第五章抽样检验
3 抽样特性曲线 (OC曲线 )
1、 OC曲线 ?设有一批产品N=8,其中不合格品数M=4,抽样方案(4︱2,3),请
问:该批产品经过抽样检验后被判为合格的可能性(或概率L(P=50%))有 多大? 2、OC曲线的影响因素
第五章抽样检验
5、镇江稳润光电公司发光二极管入库抽样检验案例
①确定产品质量特性要求、不合格分类及相应的批质量要求(次抽样) ④组成交验批N(本例N 取10000) ⑤检索GB/T2828获得抽样检验计划 ⑥执行抽样检验计划 备注: GB/T2828.1的表10给出了各字码所对应的一次抽样方案OC曲线
L(p)及其数值表,这些图表也可用于与等效的二次或五次抽样方案。 当然我们也可以用二项分布或帕淞分布进行计算。
第五章抽样检验
GB/T2828.1的OC曲线L(p)及其数值表
•本例查到的“光电参数”抽样方案(200︱1,2)OC曲线特 殊数值表如下:
• 注: GB/T2828.1中各方案的 L(p=AQL)设计在85%~98%之 间
所抽取的样本要能够代表总体,样本的质量特性指标在统计学意义上要能够反 映总体的质量特性指标 ?怎样才能使抽样具备代表性?

统计学5章

统计学5章
在重复简单随机抽样时,样本平均数的抽样分布
有数学期望值 E ( x ) = a a 代表全及总体平均数) (
设总体变量有 N 个:X1,X2,… , XN,则
样本容量为 n:x1 , x2 , … , xn , 则:
X1 X 2 X N X= N
x1 x2 xn x = n
∵ ∴ =
2 x
x1, x2,…, xn相互独立
1 n2 E x1 X


2
E x2 X


2
E xn X
2


2
E ( xi X )( x j X ) i j
=
1 n2 1 n2
E ( x X )2 E x X 1 2 E X X
对于属性总体来说则有如下对应样本指标: 设样本总体 n 个单位中有 n1 个单位具有某种属性, n0 个单位不具有某种属性,且n1 +n0 = n 。则:
n1 p n n0 n n1 q 1 p n n
样本标准差
s
p1 p
(二)参数和统计量
(三)样本容量与样本个数
样本容量是指一个样本所包含的单位数,用 n 来 表示。一般地讲,样本单位数达到或超过30个的样本 称为大样本,而在30个以下称为小样本。 样本个数又称样本可能数目,是指从全及总体中
二、抽样推断的几个基本概念
抽样推断的几个基本概念(见图5-1)。
图5-1 抽样推断的几个基本概念
(一) 总体和样本
在抽样推断中面临两个不同的总体,即 全及总体和样本总体(见图5-2)。
图5-2 全及总体和样本总体关系示意
(一) 总体和样本

统计学第五章抽样推断

统计学第五章抽样推断

统计学第五章抽样推断二、单项选择题1、对总体的数量特征进行抽样估计的前提是抽样必须遵循(B)。

A.大量性B.随机性C.可靠性D.准确性2、一般认为大样本的样本单位数至少要大于(A)。

A.30B.50C.100D.2003、抽样平均误差是指(D)。

A.抽中样本的样本指标与总体指标的实际误差B.抽中样本的样本指标与总体指标的误差范围C.所有可能样本的抽样误差的算术平均数D.所有可能样本的样本指标的标准差4、在其它条件相同的情况下,重复抽样的抽样误差(A)不重复抽样的抽样误差。

A.大于B.小于C.总是等于D.通常小于或等于5、在其它条件不变的情况下,要使抽样误差减少1/3,样本单位数必须增加(D)。

A.1/3B.1.25倍C.3倍D.9倍6、从产品生产线上每隔10分钟抽取一件产品进行质量检验。

推断全天产品的合格率时,其抽样平均误差常常是按(C)的误差公式近似计算的。

A.简单随机抽样B.整群抽样C.等距抽样D.类型抽样7、通常使样本单位在总体中分布最不均匀的抽样组织方式是(B)。

A.简单随机抽样B.整群抽样C.分层抽样D.等距抽样9、抽样平均误差和极限误差的关系是(D)A抽样平均误差大于极限误差B抽样平均误差等于极限误差C抽样平均误差小于极限误差D抽样平均误差大于、等于、小于极限误差都可能10、抽样平均误差的实质是(D)A、总体标准差B、样本标准差C、抽样误差的标准差D、全部可能样本平均数的标准差三、多项选择题C、可以计算抽样误差D、以概率论和数理统计学为理论基础2、影响抽样平均误差大小的因素有(ABCD)。

A、总体各单位标志值的差异程度B、抽样数目C、样本各单位标志值的差异程度D、抽样组织方式E、抽样推断的把握程度3、影响必要的抽样数目的因素有(BCDE)。

A、总体各单位标志值的差异程度B、样本各单位标志值的差异程度C、抽样方法和抽样组织方式D、抽样推断的把握程度E、允许误差4、计算抽样平均误差时,由于总体方差是未知的,通常有下列代替方法(ACE)。

第五章抽样推断ppt课件

第五章抽样推断ppt课件

在99.73%概率保证程度下,估计该厂全部灯泡平均耐用时间 在919~933.8小时之间。
⑵ p=0.4%
p1p0.00 0.4 990 6 .2% 8
p
n
500
概率保证程度为0.6827时,t=1
1 0.28 %
p
p
p 0 . 4 % 0 . 2 % 0 . 8 1 % p 2 0 . , 4 % 0 . 2 % 0 . 8 6 %
第五章 参数估计
本章学习目的与要求 第一节 抽样分布 第二节 抽样误差 第三节 抽样估计方法 第四节 抽样组织设计
下一页 前往本节首页
本章学习目的与要求
目的: 学习目的在于提供一套利用抽样资料来估计总体数量特征的方法。
要求: ⒈明确抽样调查的概念、特点、作用; ⒉了解抽样误差的影响要素; ⒊掌握抽样平均误差的计算方法; ⒋掌握抽样估计方法与样本容量确定的方法; ⒌了解类型抽样、等距抽样、整群抽样的含义、特点 与适用场所。
2.不反复抽样的条件下
抽样平 :x均 n X 2 ((N N 误 1 n )); 差 N 很 当大时 x 近 n X 2(1 似 N n) 为
式中,N为总体单位数;n为样本容量;σX2 为总体方差,普通情况下是未 知,可用样本方差替代 σx 2
成数的抽样平:均 p 误np2(差 (NN1n));当 N很大时近 p似 nP 2(1为 N n)
〔1〕估计值 〔2〕抽样误差范围 〔3〕概率保证程度
上一页 下一页 前往本节首页
〔二〕总体平均数(成数)的区间估计

xx X xx ,

或Xxx ,xx
式 其中,Δx tμx 为极限误差
pp P pp,
或P pp, pp

【统计学概论】抽样推断

【统计学概论】抽样推断

每包重量(克) 149以下 149—150
150—151 151以上
包数 10 20 50 20
(1)以99.73%的概率保证估计这批茶叶平均每包重量的 可能范围
(2)以同样的概率保证估计这批茶叶包装的合格率的可 能范围
• 三必要抽样数目的确定
• (一)影响抽样数目的因素

影响抽样数目的因素有:
(一)总体和样本
总体:调查研究的事物或现象的全体,所包含 的单位数用“N”表示。
样本:从总体中所抽取的部分个体所构成的小 的总体,当中所包含的单位数用“n”
表 示,称为“样本容量”。 样本可分为: 大样本 小样本
(二)全及指标与样本指标 (参数与统计量)
1、全及指标:说明全及总体的综合数量 特征,是唯一的,又称为“参数”。
尺度,用“ ”。
2、公式:
(1)重复抽样条件下:
(2)不重复抽样条件下:
五、抽样极限(允许)误差
1、概念:是在一定的概率保证下,用样本 指标估计全及指标时允许出现的
最 大误差,用“△”表示.
2、计算公式: 根据置信度(即可靠性,F(t)=1-α),
查正态概率分布表,查得对应的概率度t。 (在总体方差未知的情况下)
例3:P94
例4 P95
例5 P96
三、抽样误差
1、概念:是在遵循随机原则的条件下,用 样本指标来代表全及指标所不可避免 的误差。就是统计误差中的随机误差
抽样误差=样本指标 -全及指标 2、影响因素:
①抽取单位数n的多少 ②被研究标志的变异程度 ③抽样方法 ④抽样组织方式
四、抽样平均误差
1、概念:是所有可能组成的样本的抽样误 差的平均数,反映样本指标与全及指标的 平均误差程度,是衡量样本代表性大小的
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
M Nn
考虑顺序的不重复抽样的样本可能数目:
M PNn (NN!n)!
*
不考虑顺序的重复抽样的可能样本数目:
M
CNn
n 1
(N n 1)! n!(N 1)!
不考虑顺序的不重复抽样的可能样本数目:
客观现象中常 见的
M
CNn
N! n(! N n)!
*
4.参数和统计量 参数:根据总体中各单位的变量值计算的、反映总体 数量特征的特征值。主要有总体均值、成数或比例、方 差。
一个任 意分布 的总体
当样本容量足 够大时(n > 30) ,样本均 值的抽样分布 逐渐趋于正态 分布
x
X*
X 的分布趋于正态分布的过程
*
样本均值的抽样分布与总体分布的关系
总体分布
正态分布
样本均值的抽样分布
正态分布
非正态分布
大样本
小样本
正态分布
非正态分布
*
(二)样本成数(比例)的抽样分布
总体(或样本)中具有某种属性的单位与全部单位总数
将所有可能样本的样本均值根据其取值形成概率分
布,即可得到样本均值的抽样分布,它是推断总体均值 的理论基础。
*
【例】设一个总体,总体单位数N=4。4 个单位某一标 志值的取值分别为x1=1、x2=2、x3=3 、x4=4 。总体的 均值、方差及分布如下:
总体分布
.3
.2
.1 0
1
234
均值和方差
N
n
大数定律已经证明了:样本平均数和样本成数都满 足一致性:
lim p x X 1
nN
lim p p P 1
nN
*
5.3.3 区间估计
1、定义:在点估计的基础上,指出总体参数的上限和 下限,即指出总体参数可能存在的区间范围,并指出总 体参数落在这一区间的置信水平。
P{ˆ ˆ } 1
x
n
' x
1• 1
4n 2 n 2
n
2 2
n
2
80% • 2
1 0.64
2 • 2
1.56n
n 1.56(倍) n
*
5.3 参数估计
5.3.1 抽样推断的内容 5.3.2 点估计 5.3.3 区间估计
*
5.3.1 抽样推断的内容
1、参数估计 依据所获得的样本数据,对总体的数量特征进行估计的推断方 法称为参数估计,即根据样本统计量来估计总体参数。 参数估计包括的内容:如确定估计值,确定估计的优良标准; 确定估计值和被估计参数之间的误差范围以及在一定误差范围内 所作推断的可靠性程度等。 2、假设检验 先对总体的数量特征作某种假设,再根据样本数据对所作假设 进行检验。 假设检验包括的内容:确定原假设与备择假设;选择检验统计 量;确定显著性水平;做出决策。
ˆ 无偏 2
A
有偏
B
ˆ 1
总体参数
E(x) X E( p) P
ˆ
*
有效性:对同一总体参数的两个无偏估计量,有更小 标准差的估计量更有效。
P(ˆ) ˆ的1 抽样分布 B
1 比 2 更有效
A
ˆ2 的抽样分布
ˆ
*
一致性:随着样本容量的增大,估计量的值越来越 接近被估计的总体参数。
lim p 1
*
5.1.2 抽样推断的基本范畴
1.抽样框和抽样单位 (1)总体和样本 总体也称母体,是所要研究的全部单位组成的整体。 一般用N表示总体包括的总体单位数。 样本又称子样,它是从总体中随机抽取出来的一部分 单位组成的整体。一般用n表示样本包括的总体单位数。 作为推断对象的总体是确定的,而且是唯一的;作为 观察对象的样本不是确定的,也不是唯一的。
E(x)
E[
n
xi i1 ]
n
1 n
n i 1
E(xi )
1 .nX n
X
n
V
(x
)
V[
xi
i 1
n
]
1 n2
n i 1
V
(xi )
1 n2
n 2
2
n
x
2
nn
*
P(x) 总体分布
.3 P ( X ) 抽样分布
.3
.2
.2
.1
.1
0 1
23
X= 2.5 σ2 =1.25
x0
4
1.0 1.5 2.0 2.5 3.0 3.5 4.0
之比:
不同性别的人数与全部人数之比
合格品(或不合格品) 与全部产品总数之比
总体比例表示为 P N0 或 1 P N1
N
N
样本比例表示为
p n0 或 1 p n1
n
n
*
样本比例的抽样分布
容量相同的所有可能样本的样本比例的概率分布,当
样本容量很大时,样本比例的抽样分布可用正态分布
近似。
样本比例的数学期望:E( p) P
*
3.样本容量和样本可能数目 样本容量:一个样本所包含的总体单位数,用n表示 ,当样本容量大于等于30时称为大样本,小于30时称为 小样本。 样本可能数目:指按一定抽样方法和一定样本容量 从总体中抽取样本时,所有可能的样本个数,一般用M 表示。
*
样本可能数目的计算
考虑顺序的重复抽样的样本可能数目:
*
(2)抽样框: 抽样框是包括全部总体单位的框架,以此代表总体,用 来从中抽取样本单位,具体表现形式有总体单位(或其集 合)的名单或目录、地图、时间等。 (3)抽样单位: 抽样单位是构成抽样框的基本要素,它可以是总体单位 也可以是总体单位的集合。
*
2.重复抽样和不重复抽样 重复抽样,也叫回置抽样/放回抽样,是指从总体的 N个单位中抽取一个容量为n的样本,每次抽出一个单位 后,再将其放回总体中参加下一次抽取,这样连续抽n次 即得到一个样本 。 不重复抽样,也叫不回置抽样/不放回抽样,是指抽 中单位不再放回总体中,下一个样本单位只能从余下的 抽样单位中抽取。
x
n
x
xf f
xp p
S 2 (xi x )2 (xi x )2 fi
n
fi
*
5.1.3 抽样分布 (sampling distribution)
样本统计量的概率分布; 随机变量是样本统计量:
样本均值, 样本比例,样本方差等
结果来自容量相同的所有可能样本; 提供了样本统计量的分布特征,是进行推断的
1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
样本均值的抽样分布
*
2.样本均值的数字特征
E(x) x 1.0 1.5 ... 4.0 2.5 X
M
16
x 2
(x X )2 M
(1.0 2.5)2 ... (4.0 2.5)2
2
0.625
16
n
*
证明:
x
2
nn
p
(2)不重复抽样条件下
2
n
P(1 P ) n
x
2 Nn
() n N 1
p
P(1 P) N n n N 1
*
在总体单位数很大的情况下,可近似表示为:
x
2 (Nn)
nN
2 (1 n )
nN
p
P(1 P )(1 n )
n
N
*
抽样推断的标准误差
(standard error)
3,2
3,3
3,4
4
4,1
4,2
4,3
4,4
*
计算出各样本的均值,并给出样本均值的抽样分布:
16个样本的均值(x)
第一个 观察值
第二个观察值
1
2
3
4
1
1.0 1.5 2.0 2.5
2
1.5 2.0 2.5 3.0
3
2.0 2.5 3.0 3.5
4
2.5 3.0 3.5 4.0
.3 P (x ) .2 .1 0
样本比例的方差
重复抽样:
2 P
P(1 n
P)
不重复抽样:
2 P
P(1 n
P)
N N
n 1
*
棣莫弗-拉普拉斯:X n~b(n, p), 0 p 1,则
lim
n
P
X
n np npq
x
1
2
x t2
e 2 dt.
定理表明,当n充分大时,二项分布可用正态 分布来近似。
*
5.2 抽样误差
*
5.1.1 抽样推断的概念和特点
1、概念
抽样推断是在抽样调查的基础上,根据样本的情况来推断总体特 征的一种统计分析方法。
2、抽样推断的特点
按照随机原则抽取样本单位(样品); 根据对样本的调查对总体做出推断; 抽样误差可以事先计算并加以控制。
3、抽样推断的适用场合
无法进行全面调查时; 进行全面调查有困难或不必要时;
5.2.1 抽样误差 5.2.2 抽样平均误差
*
5.2.1 抽样误差
1、概念 抽样误差是指由于随机抽样的偶然因素使样本单位不足 以代表总体单位,而引起的样本统计量和总体参数之间
的绝对离差。( x X , p P )
2、影响因素 总体单位标志值的离散程度; 样本容量的大小(n); 抽样方法(重复抽样/不重复抽样); 抽样调查的组织方式(简单随机抽样/分层抽样/等距 抽样/整群抽样)。
*
5.2.2 抽样平均误差(标准误)
1、所有可能样本统计量与总体参数的平均离差。 2、理论计算公式为:
(x X )2
x
M
上式可以变换为:
p
相关文档
最新文档