第五章 参数估计
第5章--抽样分布与参数估计教案资料
(5)
(5.5)
(6)
(6.5)
(7)
(7.5)
(8)
(8.5)
(9)
9
9,1
9,2
9,3
9,4
9,5
9,6
9,7
9,8
9,9
9,10
(5)
(5.5)
(6)
(6.5)
(7)
(7.5)
(8)
(8.5)
(9)
(9.5)
10
10,1
10,2
10,3
10,4
10,5
10,6
10,7
10,8
10,9
10,10
数是 ,标准差是 ,从这个总体中抽出一 个容量是 n 的样本,则样本平均数 X 也服从 正态分布,其平均数 E( X ) 仍为 ,其标准
差为 。 X 5-19
从正态分布的再生定理可以看出,只要总体 变量服从正态分布,则从中抽取的样本,不管n 是多少,样本平均数都服从正态分布。但是在 客观实际中,总体并非都是正态分布。对于从 非正态分布的总体中抽取的样本平均数的分布 问题,需要由中心极限定理来解决。
第5章--抽样分布与参数估计
第一节 抽样的基本概念与数学原理
一、有关抽样的基本概念 二、大数定理与中心极限定理
5-2
一、有关抽样的基本概念
(一)样本容量与样本个数 1.样本容量。样本是从总体中抽出的部分
单位的集合,这个集合的大小称为样本容量, 一般用n表示,它表明一个样本中所包含的单 位数。
lim
n
1 n
p
n
i 1
X
i
1
(5.5)
5-17
大数定理表明:尽管个别现象受偶然因 素影响,有各自不同的表现。但是,对总体 的大量观察后进行平均,就能使偶然因素的 影响相互抵消,消除由个别偶然因素引起的 极端性影响,从而使总体平均数稳定下来, 反映出事物变化的一般规律。
第五章 参数估计
1
X 2 t n1 n2 2
2
2 Sp
n1
n2
X
1
X 2 z
2
2 S12 S 2 n1 n2
2 Sp
2 2 n1 1S1 n2 1S 2
n1 n2 2
20
例题:
分别在城市1和城市2中随机抽取n1=400, n2=500的职工进行调查,经计算两城市职工的 平均月收入及标准差分别为X1=1650元,
22
思考题:
一个研究机构做了一项调查,以确定稳定的吸 烟者每周在香烟上的消费额。他们抽取49位固 定的吸烟者,发现均值为20元,标准差5元。
1.总体均值的点估计是多少?
2.总体均值μ的95%置信区间是什么?
23
思考题解答:
1.总体均值的点估计是20元。
2.总体均值μ的95%置信区间: 随机变量X表示每周香烟消费额,由题意可知,X=20, S=5,1-α=0.95,α=0.05;n=49 属于大样本,σ 未知以S估计。总体均值μ的95%置信区间为
P z Z z 1 2 2
P L U 1
X P z z 1 2 2 n
Step3:将上面等式进行等价变换即可。
P L U 1
第五章 参数估计
第五章 参数估计
利用样本数据对总体特征进行推断,通常在以下 两种情况下进行:
当总体分布类型已知(如:正态),根据样本数据对 总体分布的未知参数进行估计或检验。参数估 计或参数检验。(如:μ或σ为何?) 当总体分布类型未知或知道很少,根据样本数据 对总体的未知分布的形状或特征进行推断。非参 数检验。(如:是否正态分布?是否随机?)
统计学
s n
还可以进一步推断相应总量指标的区间范围。 还可以进一步推断相应总量指标的区间范围。
2、总体比率的区间估计 、
由定理知:在大样本下, 由定理知:在大样本下,样本比率的分 1 布趋近于 N ( P, P(1 − P)) n 给定置信度 1 − α ,查正态表的 Zα , 2 样本比例的抽样极限误差为
2 2 2 2
~ F (n1 − 1, n2 − 1)
得方差比 σ 12 / σ 22 的置信度为1 − α 的置信区间为
1 s12 s12 ( 2 , 2 s2 Fα ( n1 − 1, n2 − 1) s2 F
2 1−
1 ) α ( n1 − 1, n2 − 1)
2
例题:见书 页例11 例题:见书150页例 页例 练习:研究由机器A和机器 生产的钢管的内径, 和机器B生产的钢管的内径 练习:研究由机器 和机器 生产的钢管的内径, 随机抽取A生产的管子 生产的管子18只 测得样本方差0.34 随机抽取 生产的管子 只,测得样本方差 平方毫米,抽取B生产的管子 生产的管子13只 平方毫米,抽取B生产的管子13只,测得样本 方差0.29平方毫米。设两样本相互独立,且设 平方毫米。 方差 平方毫米 设两样本相互独立, 由A、B生产的管子内径分别服从正态分布 、 生产的管子内径分别服从正态分布 2 2 N ( µ1 ,σ 1 ), N ( µ 2 ,σ 2 ) µ i ,σ i 均未知。 均未知。 这里的 试求方差比的置信度为0.90的置信区间。 的置信区间。 试求方差比的置信度为 的置信区间
s 小样本) n (小样本)
综述: 综述:总体均值的置信度为 1 − α 的置信区间 表示为: 表示为:x − ∆ x ≤ µ ≤ x + ∆ x 其中: 其中: σ s ∆ ≈ Zα 大样本下: 大样本下: x = Z α σ ( x) = Z α
卫生统计学七版 第五章参数估计基础电子教案
P0.05
第三节 总体均数及总体概率的估计
一、参数估计的基础理论
参数估计区 点间 估估 计计
对总体参数估计 称的 为范 置围 信区C间( I , co用 nfidenicneterv)al
表示,其置信1度 )为,(一般取置95信 %,度即为取 为0.05,此区
间的较小值称为 限置 ,信 较下 大值称为 限置 。信 一上 般进行双 区侧 间的估计。
卫生统计学七版 第五ຫໍສະໝຸດ 参数估 计基础第一节 抽样分布与抽样误差
一、样本均数的抽样分布与抽样误差
……
x15 .55 1 sx0.9617
样本均数的标准差越,大抽样误差就越大
样本均数的标准差称标为准误
x
n
sx
s n
sx称为标准误估计值,简也称标准误
标准误与标准差成正比 ,与样本含量成反比
标准误越大,抽样误差越大。
2、正态近似法
当已知时X: u
n
当未知但n足够大时X:u0.05
s n
X1.96 s n
或:X1.96s X
例5-3(P95) 某医生于2000年在某市随机抽取90名 19岁的健康男大学生,测量了他们的身高,得样本均数 为172.2cm,标准差为4.5cm,试估计该市2000年19岁健 康男性大学生平均身高的95%置信区间 。
对任意分布,在样本含量足够大时,其样本均数的分布都 近似正态分布,且样本均数的均数等于原分布的均数。
二、样本频率的抽样分布与抽样误差
总体率的标准误:
p
(1 )
n
率的标准误的估计值:
sp
p(1 p) n
标准误大抽样误差就大。
第二节 t分布
一、t分布的概念
第五章 t检验 3参数估计 PPT课件
参数估计 - 区间估计
由于估计量是随机变量,所以一般都带有一 定的随机误差,点估计仅仅给出了参数的一 个估计值,有时候还需要了解这种估计结果 的可靠程度。 用区间的的形式给出未知参数的变化范围, 并赋予一定的概率保证,这便构成了区间估 计的基本思想。
6
参数估计 - 区间估计
设总体X的分布中含有未知参数θ
x
x
~ N(0,1)
标准正态分 布两尾概率 分位点
P(u
x
x
u ) 1
P( x u x x u x ) 1
9
参数估计 - 区间估计
正态总体平均数的区间估计当 2未知 Nhomakorabeax
x
~ N(0,1)
2
(n 1) s
2
确定置信区间的步骤 计算样本平均数 x ; 确定置信水平,一般用 1-α=0.95或0.99, 通过查表可确定分位数; 求出标准误 x ,(σ总体标准差,n n 样本数)。
8
参数估计 - 区间估计
当 2已知
正态总体平均数的区 间估计
x ~ N ( , )
n
2
P( u x x u x ) 1
(5-16)
(5-17)
ˆ 为样本百分数, S 为样本百分数标准误, S 的计算公 其中, P ˆ ˆ P P
式为:
SP ˆ ˆ (1 P ˆ) P n
(5-18)
14
【例 5.10】
调查某地 1500 头奶牛,患结核病的有 150 头,求
该地区奶牛结核病患病率的 95%、99%置信区间。
3
参数估计 - 点估计
第5章抽样调查及参数估计(练习题)
第五章抽样调查及参数估计5.1 抽样与抽样分布5.2 参数估计的基本方法5.3 总体均值的区间估计5.4 总体比例的区间估计5.5 样本容量的确定一、简答题1.什么是抽样推断?用样本指标估计总体指标应该满足哪三个标准才能被认为是优良的估计?2.什么是抽样误差,影响抽样误差的主要因素有哪些?3.简述概率抽样的五种方式二、填空题1.抽样推断是在随机抽样的基础上,利用样本资料计算样本指标,并据以推算总体数量特征的一种统计分析方法。
2.从全部总体单位中随机抽选样本单位的方法有两种,即重复抽样和不重复抽样。
3.常用的抽样组织形式有简单随机抽样、类型抽样、等距抽样、整群抽样等四种。
4.影响抽样误差大小的因素有总体各单位标志值的差异程度、抽样单位数的多少、抽样方法和抽样调查的组织形式。
5.总体参数区间估计必须具备估计值、概率保证程度或概率度、抽样极限误差等三个要素。
6.从总体单位数为N的总体中抽取容量为n的样本,在重复抽样和不重复抽样条件下,可能的样本个数分别是______________和_____________。
7.简单随机_抽样是最基本的抽样组织方式,也是其他复杂抽样设计的基础。
8.影响样本容量的主要因素包括总体各单位标志变异程度_、__允许的极限误差Δ的大小、_抽样方法_、抽样方式、抽样推断的可靠程度F(t)的大小等。
三、选择题1.抽样调查需要遵守的基本原则是( B )。
A.准确性原则 B.随机性原则 C.代表性原则 D.可靠性原则2.抽样调查的主要目的是( A )。
A.用样本指标推断总体指标 B.用总体指标推断样本指标C.弥补普查资料的不足 D.节约经费开支3.抽样平均误差反映了样本指标与总体指标之间的( B )。
A.实际误差 B.实际误差的平均数C.可能的误差范围 D.实际的误差范围4.对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进行检验,这种抽查方式是( D )。
A.简单随机抽样 B.类型抽样 C.等距抽样 D.整群抽样5.在其他情况一定的情况下,样本单位数与抽样误差之间的关系是( B )。
第5章 参数估计
猎物射击,结果该猎物身中一弹,你认为谁打中的可能
性最大? 根据经验而断:老猎人打中猎物的可能性最大. 极大似然估计法的思想就是对固定的样本值,选
择待估参数的估计值使“样本取样本值”[离散型]或 “样
本取值落在样本值附近”[连续型] 的概率最大。
(2、极大似然估计的求法
单参数情形
根据总体分 布律写出似 然函数:换x 为xi
来得到待估参数θ 的极大似然估计值(驻点);
③ 、必要时,参照极大似然估计值写出极大似然
估计量.
【例6】求服从二项分布B(m,p)的总体X未知参数 p的极大似然估计量。 〖解〗单参数,离散型。 因为总体 X
~ B(m, p),
x m x
其分布律为
m x
f ( x; p) C p (1 p)
下面分离散型与连续型总体来讨论. 设离散型总体X的分布律
P{X x} p( x; )
( )
形式已知,θ 为待估参数. X 1 , X 2 ,..., X n 为来自总体X的
样本, x1 , x2 ,..., xn 为其样本值,则 X 1 , X 2 ,..., X n 的联合分
布律为:
用其观察值
ˆ( X , X ,..., X ), 1 2 n
——θ 的估计量
ˆ( x , x ,..., x ) 1 2 n
——θ 的估计值
来估计未知参数θ .
今后,不再区分估计量和估计值而统称为θ 的估计,
ˆ . 均记为
二、构造估计量的两种方法
1、矩估计法 理论根据:样本矩(的连续函数)依概率收敛于总
因为X~N(μ ,σ 2),所以X总体的概率密度为
2 1 (x ) 2 f ( x; , ) exp ( R, 0) 2 2 2
第五章参数估计和假设检验PPT课件
抽样
X ~ N(, 2)
n,S2
则 (n 1)S 2 / 2 ~ 2 (n 1)
当 n 30, 2分布趋近于正态分布
若X ~ x2 (n 1) 则 Z 2 2 2(n 1)
两个样本方差之比的抽样分布
从两个正态总体中分别独立抽样所得到的两个样本方 差之比的抽样分布。
抽样
X1
~
N
(
1
,
2 1
极大似然估计是根据样本的似然函数对总体参数进行 估计的一种方法 。
其实质就是根据样本观测值发生的可能性达到最大这 一原则来选取未知参数的估计量θ,其理论依据就是 概率最大的事件最可能出现。
区间估计
估计未知参数所在的可能的区间。 P(ˆL<<ˆU ) 1
评价准则
一般形式
置信度 精确度
(ˆ △)<<(ˆ △) 或 ˆ △
2
2
2
n
Z
2
2
Pq
△
2 pˆ
Z
2
PqN
n
2
N
△
2 pˆ
Z
2
Pq
2
假设检验
基本思想 检验规则 检验步骤 常见的假设检验 方差分析
基本思想
•小概率原理:如果对总体的某种假设是真实的,那么不利于 或不能支持这一假设的事件A(小概率事件) 在一次试验中几乎不可能发生的;要是在一次 试验中A竟然发生了,就有理由怀疑该假设的 真实性,拒绝这一假设。
参数的区间估计
待估计参数
已知条件
置信区间 ˆ △
总体均值 (μ)
正态总体,σ2已知 正态总体,σ2未知
非正态总体,n≥30
X Z / n
2
第五章 参数估计与假设检验的SPSS过程 实验
实验:参数估计与假设检验的SPSS过程
一、实验目的与要求
1.熟悉区间估计的概念与操作方法
2.熟练掌握T检验的SPSS操作
3.学会利用T检验方法解决身边的实际问题
4. 学会对运行结果进行统计分析说明。
二、实验原理
1.参数估计的基本原理
参数估计就是利用样本信息去估计未知的总体参数,基本原理包括极大似然原理及最大二乘估计原理等。
2.假设检验的基本原理
假设检验的基本思路是先对总体特征做出某种假设,然后利用样本提供的信息去验证前面提出的假设是否成立。
如果样本数据不能充分证明和支持假设的
成立,则在一定的概率条件下,应拒绝该假设;反之,如果样本数据不能充分证
明和支持假设是不成立的,则不能推翻原假设。
小概率事件原理是假设检验的基
本原理。
三、实验内容与步骤
分析某班级学生的高考数学成绩是否存在性别上的差异。
(显著性水平为0.01)
数据如表所示:
某班级学生的高考数学成绩
性别数学成绩
男(n=18)85 89 75 58 86 80 78 76 84 89 99 95 82 87 60 85 75 80
女(n=12)92 96 86 83 78 87 70 65 70 65 70 78 72 56
(1)对题目的分析:
(2)数据组织:
(3) 主要设置步骤:
(4)主要结果及分析:。
第五章 参数估计
二、填空题
1.参数估计主要有_____________________和区间估计两种方法。
答案:点估计
2.好的估计量应符合_____________________和有效性这两个标准。
答案:无偏性
3.抽取一个容量为25的随机样本,其均值为 =36,标准差S=5,总体均均值μ的99%的置信区间为_____________________。(保留两位有效数字)
A.对T1,T2的观测值t1,t2,必有θ∈(T1,T2) B.θ以α的概率落入区间(T1,T2) C.区间(T1,T2)以1-α的概率包含θ
D.θ的数学期望E(θ)必属于(T1,T2)E.无正确选项
答案:C
33.设X与Y服从正态分布,X~N(μ,42),Y~N(μ,52);记p1=P{X≤μ-4},p2=P{Y≥μ+5},则()
答案:A
18.通过矩估计法求出的参数估计量()
A.是唯一的B.是无偏差估计量C.不一定唯一D.不唯一但是无偏差估计量
E.无正确选项
答案:C
19.置信水平1-α表达了置信区间的()
A.准确性B.精确性C.显著性D.可靠性E.无正确选项
答案:D
20.当样本量一定时,置信区间的长度()
A.随着α的提高而变长B.随着置信水平1-α的降低而变长C.与置信水平1-α无关
E.无正确选项
答案:B
30.设X1,X2,…,Xn是取自正态总体X的一个样本,不是无偏估计量的是( )
A. B. C. D. E.无正确选项
答案:B
31.设X1,X2是取自总体X~N(μ,σ2)的一个样本,μ的无偏估计量中最有效的是( )
A. B. C. D.
E.无正确选项
第5章抽样分布与参数估计
第5章抽样分布与参数估计在统计学中,抽样分布与参数估计是重要的概念。
抽样分布是指从总体中随机抽取样本,计算样本统计量,然后将这些统计量进行分布的过程。
参数估计是通过样本数据对总体参数进行估计的方法。
首先,我们来了解抽样分布。
在统计学中,我们通常很难直接获得总体数据,因为总体数据往往很大,难以收集。
因此,我们采用抽样的方式来获取样本数据,并通过样本数据来推断总体特征。
抽样分布是指在重复抽取样本的过程中得到的统计量的分布。
抽样分布的中心趋于总体参数,而抽样分布的形状可以通过中心极限定理进行描述。
中心极限定理认为,当样本数量足够大时,样本均值的抽样分布近似服从正态分布,且均值等于总体均值。
这对于统计推断和参数估计具有重要意义。
其次,我们来了解参数估计的概念及其方法。
参数估计是指根据样本数据对总体参数进行估计的统计方法。
常见的参数包括总体均值、总体方差等。
参数估计可以分为点估计和区间估计两种方法。
点估计是指通过样本数据计算得到的单个数值来估计总体参数。
常用的点估计方法包括最大似然估计和矩估计。
最大似然估计是基于样本的观测值选择使得观测值出现的概率最大的参数值作为估计值的方法。
矩估计是通过样本矩与总体矩的对应关系来估计总体参数的方法。
区间估计是指对总体参数给出一个区间估计值,该区间包含了真实参数值的概率。
常用的区间估计方法包括置信区间估计和预测区间估计。
置信区间估计是通过样本数据计算得到的一个区间,可以包含真实参数值的概率。
置信区间的置信水平是指在多次重复抽样中,这个区间包含了真实参数值的概率。
预测区间估计是在给定自变量取值的情况下,通过样本数据对应的因变量的取值的一个区间估计。
总之,抽样分布与参数估计是统计学中重要的概念和方法。
通过抽样分布可以了解样本统计量的分布情况,而参数估计可以通过样本数据对总体参数进行估计。
这些概念和方法对于数据分析和决策具有重要的实际应用价值。
bvn第五章 总体参数估计
◎第五章参数估计※一、单一总体的参数估计※●(一)估计的含义●估计:人人都做过。
如:✓上课时,你会估计一下老师提问你的概率有多大?✓当你去公司应聘时,会估计你被录用的可能性是多少?✓推销员年初时要估计今年超额完成任务的概率有多大?◎估计量:用来估计总体参数的样本统计量。
如:算术平均数、中位数、标准差、方差等。
●估计的可能性与科学性:数理统计证明,一个“优良”的样本统计量应具备以下特征:(1)、无偏性。
样本估计量的期望值应等于总体参数。
无系统偏差。
(2)、有效性。
与离散度相联系。
在多个无偏估计量中,方差最小的估计量最有效。
(3)、一致性。
随着样本容量的增加,可以使估计量越来越靠近总体参数。
(4)、充分性。
估计量能够充分利用有关信息,中位数和众数不具备这一点。
※估计的类型包括:1、 点估计:只有一个取值。
就是总体平均数μ的点估计值。
2、区间估计:给出取值范围(值域)。
见PPT▲两种估计类型哪一种更科学?※ 区间估计的优点在于:它在给出估计区间时,还可以给予一个“可信程度”。
例如:销售经理想估计一下明年的出口总值,甲估计是53万美元,乙估计是50—56万美元之间,并可以确切地说“有95%的把握”。
显然后者的可信程度大于前者。
那么,50—56万美元之间的范围是如何计算的?“有95%的把握”是什么意思?【引例】:某食品进出口公司向东南亚出口一批花生制品,管理人员从中抽取50包作为样本,计算其平均数为250克。
另外,合同规定总体标准差为6克。
如果问这批花生制品的平均重量,可用样本平均数作为总体平均数的最佳估计量:250克。
但这是远远不够的,在许多时候,管理人员还想了解“这个估计值的平均误差是多少?”“总体平均数可能落入样本平均数上、下多大范围内?”“ 这个估计值的可靠程度是多少?”〖1〗由于n=50,根据中心极限定理可作图: n=50,σ=6〖2〗抽样平均误差:8487.0506===n x σσ〖3〗若用250克这个估计值估计总体平均数,其平均误差为0.8487。
卫生统计学七版 第五章参数估计基础
二、总体均数及总体概率的区间估计
(一)总体均数的置信区间
1、t 分布法
当 未知且 n 较小时,估计双侧置信 区间:
(X
-t
,
s X
,
X
t ,
s X
)
可简写为:
X
t ,
s X
或X t,
s n
总体均数的95%双侧置信区间为:X
t0.05,
s X
例5-2(P95) 已知某地27名健康成年男子血红蛋白 含量的均数为125g/L,标准差为15g/L,试估计该地健康 成年男子血红蛋白平均含量的95%和99%置信区间 。
二项分布 n 31 X 25 n X 6 查附表6,得7 37 改错
该药物治疗脑血管梗塞有效概率的95%置信区间为 63%~93%。
2、正态近似法 适用范围:np>5,且n(1-p)> 5
例5-6(P96) 用某种仪器检查已确诊的乳腺癌患者 120名,检出乳腺癌患者94例,检出率为78.3%,试估计该 仪器乳腺癌总体检出率的95%置信区间。 np 1200.783 93.96 n(1 p) 1200.217 26.04
第三节 总体均数及总体概率的估计
一、参数估计的基础理论
参数估计区 点间 估估 计计
对总体参数估计的范围称为置信区间,用CI(confidence interval)
表示,其置信度为(1 ),一般取置信度为95%,即取为0.05,此区
间的较小值称为置信下限,较大值称为置信上限。一般进行双侧置信区 间的估计。
第五章 参数估计基础
公共卫生学院 邹焰
定量资料
统计描述等级资料(有序分类资 料)
参数估计与非参数估计
i=1,2,…M
所后来验概率
P(
|
X
i)
P( X i | ).P() P( X i | )P()d(贝叶斯公式)
因为N个样本是独立抽取旳,所以上式能够写成
N
P( | X i) a P(X k | ).P()
k 1
其中 a
1 P( X i | )P()d 为百分比因子,只与x有关,与μ无关
1 (X
2
k
1)
0
N
k 1
2
log P(X k
| i)
N
[
k 1
1 2 2
( X k 1)2 ]
2
2 2
0
1
1
1 N
N k 1
Xk
即学习样本旳算术平均
2
2 1
1 N
N k 1
Xk
2
样本方差
• 讨论: 1.正态总体均值旳最大似然估计即为学习样本旳算术平均 2.正态总体方差旳最大似然估计与样本旳方差不同,当N较 大旳时候,两者旳差别不大。
若PN(x)收敛于P(x)应满足三个条件:
①
lim
N
V
N
0
,当N↑时,VN↓,N→∞,VN→0
这时虽然样本数多,但因为VN↓,落入VN内旳样本KN
也减小,所以空间变化才反应出来
②
lim K N
N
,N ↑ ,kN ↑ ,N与KN同相变化
③
lim
N
KN N
0
,KN旳变化远不大于N旳变化。
所以尽管
∴
1 N 2
N 2
1
2 0
N
N 2
1
2
第五章统计推断:参数估计
2 2 (n 1) 0 ) 39.364 .025(24
45
【例】根据以往 的生产统计,某 种产品的合格率 约为 90% ,现要 求边际误差为 5%,在求95%的 置信区间时,应 抽取多少个产品 作为样本?
应抽取的样本容量为
n0
n0 0.05 N
n0 n n0
n0 n n0 1 N
53
2016年4月28日星期四
2016年4月28日星期四
112.5 102.6 100.0 116.6 136.8
101.0 107.5 123.5 95.4 102.8
103.0 95.0 102.0 97.8 101.5
102.0 108.8 101.6 108.6 98.4
100.5 115.6 102.2 105.0 93.3
【例】已知某种灯泡的寿命服从正态分布,现从一批灯泡中 随机抽取 16 只,测得其使用寿命 ( 小时 ) 如下。建立该批灯泡 平均使用寿命95%的置信区间
1510 1450 1480 1460
1520 1480 1490 1460
1480 1510 1530 1470
1500 1520 1510 1470
【例】一家食品生产企业以生产袋装食品为主,现从某 天生产的一批食品中随机抽取了 25袋,测得每袋重量如 下表7所示。已知产品重量的分布服从正态分布。以95% 的置信水平建立该种食品重量方差的置信区间
第五章 参数估计
例如:从A、B、C、D四个单位中,抽出两个单位构成 一个样本,问可能组成的样本数目是多少?
AA AB AC AD
重复抽样
Nn = 42 =16 (个样本)
BA
CA DA
BB
CB DB
BC
CC DC
BD
CD DD
不重复抽样
N(N-1)(N-2)……. 4×3 = 12(个样本)
抽样推断的理论基础 大数 定律 如果独立随机变量总体存在有限的平均数和方差,则 大数定律揭示样本容量同推断结果之间的内在联系。随着 对于充分大的样本可以近乎100%的概率,期望样本平均数 样本容量n的增加,抽样平均数有接近于总体平均数的趋势。 与总体平均数的绝对离差为任意小。计和假设检验两 方面。 • 1.参数估计:参数估计是依据所获得的样本 观察资料,对所研究现象总体数量特征进 行估计。 • 2.假设检验:(第六章)
• 统计方法
描述统计
推断统计
参数估计
假设检验
抽样推断的应用
1、对无限总体全面情况的了解,必须采用抽样推断。 2、对破坏性或消耗性检查,必须采用抽样调查。 3、对某些可以但事实上不必或不可能进行全面调查的 现象总体,可以采用抽样推断获取相关资料。 4、抽样调查可以对全面调查得来的资料进行验证,并 据以进行补充和修改。
指样本单位的抽取不受主观因素及
其他系统性因素的影响,每个总体
单位都有均等的被抽中机会
随机抽样的目的
随机抽样的目的是使样本与总体同分布。
抽样推断的特点
(1)抽样推断是由部分推断总体的一种认识 方法。 (2)抽样推断是建立在随机取样的基础上的。 (3)抽样推断运用概率估计的方法。 (4)抽样推断的误差可以事先计算并加以控 制。
第五章 参数估计
第五章参数估计一、单项选择题1、在计算必要的样本容量时,若比率方差未知,则可选择()进行计算。
(分数:5分;难度:易)A、p=0.23∙B、p=0.5∙C、p=1∙D、p为任意值答错了参考答案:B你的解答:2、在简单随机重复抽样情况下,若允许误差为原来的,则样本容量()。
(分数:5分;难度:易)A、扩大为原来的3倍∙B、扩大为原来的倍∙C、扩大为原来的倍∙D、扩大为原来的2.25倍答错了参考答案:D你的解答:3、随着样本容量的增大,点估计的值越来越接近被估总体的参数。
这是()的体现。
(分数:5分;难度:易)A、有效性∙∙B、相合性∙C、无偏性∙D、相关性答错了参考答案:B你的解答:4、总体均值的置信区间由两部分组成:()(分数:5分;难度:易)A、点估计值和允许误差∙B、点估计值和误差∙C、点估计值和概率∙D、点估计值和方差答错了参考答案:A你的解答:二、判断题1、参数估计就是用样本统计量估计总体参数。
(分数:5分;难度:易)正确不正确答错了参考答案:正确你的解答:2、在参数估计中样本统计量是未知的。
(分数:5分;难度:易)正确不正确答错了参考答案:不正确你的解答:3、在参数估计中总体参数是随机变量。
(分数:5分;难度:易)正确不正确答错了参考答案:不正确你的解答:4、点估计就是用样本估计量的值直接作为总体参数的估计值。
(分数:5分;难度:易)正确不正确答错了参考答案:正确你的解答:5、置信水平愈高,置信区间就愈扩大。
(分数:5分;难度:易)正确不正确答错了参考答案:正确你的解答:6、样本容量和总体方差的大小成反比。
(分数:5分;难度:易)正确不正确答错了参考答案:不正确你的解答:7、我们可以改变总体方差的大小来确定样本容量。
(分数:5分;难度:易)正确不正确答错了参考答案:不正确你的解答:8、参数估计可以分为点估计和区间估计。
(分数:5分;难度:易)正确不正确答错了参考答案:正确你的解答:三、计算题1、某服装厂对当月生产的20 000件衬衫进行质量检查,结果在抽查的200件衬衫中有10件是不合格品,要求:(1)以95.45%置信水平推算该产品合格率范围。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4. 某地随机抽取100辆卡车,它们每年平均行驶14500例,样本标准差是2400里。求某地卡车平均每年行驶里程的区间估计,取置信系数为0.99。
5. 从某批灯泡中取5只作寿命试验,其寿命(以小时计)入下:1050,1100,1120,1250,1280。又设灯泡寿命服从正态分布,求其置信系数为0.95的置信下限。
10. 在习题8.3的2种,我们希望以置信系数0.98使样本比例与母体比例间的误差在1%之内,需要多大的样本呢?
11. 根据以往的经验,船运大量玻璃器皿,损坏率不超过5%。现在估计船中的损坏率,要求估计与真值间不超过1%,且置信系数为0.90,那么要取多大的样本验收可满足上述要求?
4当可靠度大于0.6827时,抽样极限误差( )
①大于抽样平均误差 ②小于平均误差
③等于抽样平均误差 ④与抽样平均误差的大小关系依样本容量而定
5.抽样调查所必须遵循的基本原则是( )。
①准确性原则 ②随机性原则 ③可靠性原则 ④灵活性原则
10.某地有2万亩稻田,根据上年资料得知其中平均亩产的标准差为50公斤,若以95.45%的概率保证平均亩产的误差不超过10公斤,应抽选( )亩地作为样本进行抽样调查。
①100 ②250 ③500 ④1000
二、多项选择题
1.抽样调查的特点有( )
7.在抽样推断中,抽样误差是( )
①可以避免的 ②可避免且可控制
③不可且无法控制 ④不可避免但可控制
8.在其他条件不变的情况下,抽样单位数越多,则( )
①系统误差越大 ②系统误差越小
4.区间估计中总体指标所在范围( )
①是一个可能范围 ②是绝对可靠的范围
③不是绝对可靠的范围 ④是有一定把握程度的范围
⑤是毫无把握的范围
5.估计量选择的优良标准主要有( )。
①无偏性 ②无差性 ③有效性 ④高效性 ⑤一致性
③系统性误差 ④ ①②③都错
3.抽样调查和重点调查的主要区别是( )
①选取调查单位的方式不同 ②调查的目的不同
③调查的单位不同 ④两种调查没有本质区别
第五章 参数估计
一、单项选择题
1.抽样调查的目的在于( )
①了解总体的基本情况 ②用样本指标推断总体指标
③对样本进行全面调查 ④了解样本的基本情况
2.抽样调查所特有的误差是( )
①由于样本的随机性而产生的误差 ②登记误差
2. 某商店每100元投资每天的利润率是一随机变量,它服从正态分布。下面给出了五天的利润率:-0.2,0.1,0.8,-0.6,0.9。
① 假设方差是0.1,求平均利润率的区间估计(置信系数为0.95);
② 假设方差未知,求平均利润率的区间估计(置信系数为0.95)。
3. 油桶内的油量是一随机变量,服从正态分布,其标准差为3加仑。随机独立地抽取36桶,发现平均每桶102加仑,求油桶内平均油量的区间估计。取置信系数为0.99。
①按随机原则抽取样本单位 ②把握程度大小
③以样本指标推断总体指标 ④抽样误差可以计算和控制
⑤以上都对
2.抽样调查适用于下列哪些场合( )
①不宜进行全面调查而又要了解全面情况 ②工业产品质量检验
6.总体参数的区间估计必须同时具备估计值、抽样误差范围和概率保证程度三个要素,其中抽样误差范围决定估计的 ( )。
①可靠性 ②准确性 ③精确性 ④显著性
当总体单位不很多且各单位间差异较小时宜采用( )
①类型抽样 ②纯随机抽样 ③整群抽样 ④两阶段抽样
② 是否有足够的理由说明新方案比原方案好?
8. 某厂对职工的出勤率进行统计。从早班职工中随机地抽取50人,其中一年全勤的有40人,从中班职工中随机地抽取40人,其中一年全勤的有35人,求早、中班职工全勤比例之差(置信系数为0.95)的区间估计。
9. 某省公路维修部门要了解每辆卡车在一星期内行驶的平均里程,并决定估计与真值间误差不能超过15里,且置信系数为0.95。从以往积累的资料中发现标准差是120里。为了达到上述要求,应取多大的样本?
------------------
③调查项目多、时效性强 ④只需了解一部分单位的情况
⑤适用于任何调查
3.确定样本容量时应考虑的因素有( )
①极限误差大小 ②估计的可靠性
③取样方式 ④被研究标志变异程度
6. 某市随机抽取1000个家庭。发现有228家拥有彩色电视机。据此作出该市家庭拥有彩电的比例的区间估计,取置信系数为0.98。
7. 某溶液在配制过程中,若用原方案,成功地概率是70%。现设计一种新方案,在40次试验中有34次是成功的,试求:
① 新方案中配制成功地概率的点估计及置信系数为0.95的区间估计。
三、判断题
1、样本容量是指从一个总体中可能抽取的样本个数。( )
2、抽样平均误差就是抽样极限误差,是在一定的概率保证程度下允许产生的估计误差的最大范围。( )
3、重点调查与抽样调查的目的是一致的,即都是通过对部分单位的调查,来达到对总体数量特征的认识。( )
4、用简单随机重复抽样方法选取样本单位,如果要使抽样平均误差降低50%,则样本容量需要扩大到原来的2倍。( )
四、计算题
1. 随机抽查5炉铁水,其含碳量分别为:4.28,4.40,4.35,4.42,4.37,并由累计资料知道含碳量服从,试在置信系数0.95下求的区间估计。
③抽样误差越大 ④抽样误差越小
9.假定10亿人口大国和100万人口小国的居民年龄变异程度相同,现在各自用重复抽样方法抽取本国的1‰人口设计者,则抽样误差( )
①两者相等 ②前者大于后者
③前者小于后者 ④不能确定