第五章参数估计作业
第五章活页习题(1)其他人答案
1第五章 参数估计1.一农场种植苹果用于生产果冻,假设苹果的甜度服从正态分布2(,)N μσ。
随机抽取30个苹果测量其甜度,结果存放在数据ex5_1中。
如需要,保留两位小数(下同)。
(1)用t 统计量计算苹果平均甜度μ的99%置信区间。
(2)将该样本看作大样本,用z 统计量计算苹果平均甜度μ的99%置信区间。
2.X 和Y 分别表示下肢瘫痪和正常成年男子的血液容量(单位ml )。
假设X 服从21(,)N μσ,Y 服从22(,)N μσ。
某医院在1天中对X 做了7次观测,对Y 做了10次观测。
在一周内对X 做了38次观测,对Y 做了31次观测。
数据保存在ex5_2中。
(1)根据1天的资料计算12μμ-的90%置信区间。
2(2)根据1周的资料计算12μμ-的90%置信区间。
3.某学校欲对学生每月消费支出进行调查,从200个班级中随机抽取20个班级作为样本。
(1)登记这20个班级全体同学的月消费支出,数据保存在ex5_3_1。
以95%的置信水平推断学生的平均月消费支出。
(2)在被抽中的每个班级中随机选取30人进行登记,数据保存在ex5_3_2。
以95%的置信水平推断学生平均月消费支出。
34.在一项政治选举中,某候选人在选民中随机调查发现,350名投票者中有200人支持他。
求全部选民中支持他的选民所占比重的置信水平为90%的置信区间。
5.某企业对一批数量为5000件的产品进行质量检验。
过去几次同类调查所得的产品合格率分别为93%、95%和96%。
(1)为了使合格率的误差不超过3%,若利用重复抽样,在99.73%的置信水平下应抽查多少件产品?45(2)为了使合格率的误差不超过3%,若利用不重复抽样,在99.73%的置信水平下应抽查多少件产品?6.数据ex5_6中存放着从某公司所有职工中随机抽取的412人的月工资收入资料。
(1)被调查职工的月平均工资是()元。
A.2198.2 B.2541.1 C.2847.5 D.2961.5(2)被调查职工月工资收入的标准差是()元。
统计第五章练习题
统计第五章练习题部门: xxx时间: xxx整理范文,仅供参考,可下载自行编辑第五章参数估计<一)单项选择题(在下列备选答案中,只有一个是正确的,请将其顺序号填入括号内>1.在抽样推断中,必须遵循( >抽取样本。
①随意原则②随机原则③可比原则④对等原则2.抽样调查的主要目的在于( >。
①计算和控制抽样误差②了解全及总体单位的情况③用样本来推断总体④对调查单位作深入的研究b5E2RGbCAP3.抽样误差是指< )。
①计算过程中产生的误差②调查中产生的登记性误差③调查中产生的系统性误差④随机性的代表性误差4.在抽样调查中( >。
①既有登记误差,也有代表性误差②既无登记误差,也无代表性误差③只有登记误差,没有代表性误差④没有登记误差,只有代表性误差5.在抽样调查中,无法避免的误差是( >。
①登记误差②系统性误差③计算误差④抽样误差6.能够事先加以计算和控制的误差是( >。
①抽样误差②登记误差③系统性误差④测量误差7.抽样平均误差反映了样本指标与总体指标之间的( >。
①可能误差范围②平均误差程度③实际误差④实际误差的绝对值8.抽样平均误差的实质是( >。
①总体标准差②全部样本指标的平均差③全部样本指标的标准差④全部样本指标的标志变异系数p1EanqFDPw9.在同等条件下,重复抽样与不重复抽样相比较,其抽样平均误差( >。
①前者小于后者②前者大于后者③两者相等④无法确定哪一个大10.在其他条件保持不变的情况下,抽样平均误差( >。
①随着抽样数目的增加而加大②随着抽样数目的增加而减小③随着抽样数目的减少而减小④不会随抽样数目的改变而变动DXDiTa9E3d11.允许误差反映了样本指标与总体指标之间的( >。
①抽样误差的平均数②抽样误差的标准差③抽样误差的可靠程度④抽样误差的可能范围12.极限误差与抽样平均误差数值之间的关系为( >。
第五章 区间估计课后练习题目
第五章 区间估计课后练习题目
• 3.一农场种植葡萄以生产果冻,假设葡萄的
甜度为 N(,,2) 服从正态分布 ,从27卡车葡萄
中,随机的抽取样本,每辆车取一个,然后测 量甜度,结果如下: • 16.0 15.2 12.0 16.9 14.4 16.3 15.6 12.9 15.3 • 15.8 15.5 12.5 14.5 14.9 15.1 16.0 12.5 14.3 • 15.4 13.0 12.6 14.9 15.1 15.3 12.4 17.2 14.8 • (1) 求葡萄平均甜度μ 的95%置信区间 • (2)求葡萄平均甜度μ 的给出置信下限的置信水 平为95%的单侧置信区间。
第五章 区间估计课后练习题目
• 4.X 和 Y 分别表示下肢瘫痪和正常成年男 子的血液容量,单位ml,假设 X 服从N(1, 2)
• Y 服从 N(2, 2)对X 做了7次观测,结果是1612, 1352,1456, 1222,1560,1456,1924, 对Y 做了10次观测,1082,1300,1092, 1040,910,1248,1092,1040,1092, 1288。求1 2的95%置信区间。
第五章 区间估计课后练习题目
• 8.某企业对一批产品进行质量检验,这批 产品的总数为5000件,过去几次同类调查 所得的产品合格率为93%、95%和96%,为 了使合格率的允许误差不超过3%,在 99.73%的概率下应抽查多少件产品?
第五章 区间估计课后练习题目
• 9.在一项政治选举中,一位候选人在选民 中随机地做了一次调查,结果是351名投票 者中有185人支持他,求全部选民中支持他 的选民所占比重的95%的近似置信区间。
第五章 参数估计
1
X 2 t n1 n2 2
2
2 Sp
n1
n2
X
1
X 2 z
2
2 S12 S 2 n1 n2
2 Sp
2 2 n1 1S1 n2 1S 2
n1 n2 2
20
例题:
分别在城市1和城市2中随机抽取n1=400, n2=500的职工进行调查,经计算两城市职工的 平均月收入及标准差分别为X1=1650元,
22
思考题:
一个研究机构做了一项调查,以确定稳定的吸 烟者每周在香烟上的消费额。他们抽取49位固 定的吸烟者,发现均值为20元,标准差5元。
1.总体均值的点估计是多少?
2.总体均值μ的95%置信区间是什么?
23
思考题解答:
1.总体均值的点估计是20元。
2.总体均值μ的95%置信区间: 随机变量X表示每周香烟消费额,由题意可知,X=20, S=5,1-α=0.95,α=0.05;n=49 属于大样本,σ 未知以S估计。总体均值μ的95%置信区间为
P z Z z 1 2 2
P L U 1
X P z z 1 2 2 n
Step3:将上面等式进行等价变换即可。
P L U 1
第五章 参数估计
第五章 参数估计
利用样本数据对总体特征进行推断,通常在以下 两种情况下进行:
当总体分布类型已知(如:正态),根据样本数据对 总体分布的未知参数进行估计或检验。参数估 计或参数检验。(如:μ或σ为何?) 当总体分布类型未知或知道很少,根据样本数据 对总体的未知分布的形状或特征进行推断。非参 数检验。(如:是否正态分布?是否随机?)
国开作业实用卫生统计学-第五章 参数估计 自测练习07参考(含答案)
题目:从某地随机抽取10名7岁男童,测得其平均收缩压为90mmHg,标准差为10mmHg,则7岁男童的收缩压的总体均数的95%的置信区间为()
选项A:)
选项A:p接近于1或0时
选项B:样本率不太大时
选项C:样本例数足够大
选项D:np和n(1-p)大于5时
答案:np和n(1-p)大于5时
题目:随机抽取北京8岁男童100名作样本,测得其平就能出生体重为3.20kg,标准差为0.5kg。
则总体均数95%置信区间的公式是()
选项A:)
选项A:是?( C )
选项A:假设检验
选项B:统计描述
选项C:区间估计
选项D:点估计
答案:点估计
题目:以下哪个是标准差的符号?()
选项A:б2
选项B:或 s
答案:б 或 s
题目:评价某人的某项指标是否正常,所用的范围是± Za/2 sp
选项A:对
选项B:错
答案:对
题目:率的标准误的大小表明了从同一总体随机抽样时,样本率与总体率之间的差别大小选项A:对
选项B:错
答案:对
题目:率的标准误越小,说明此次率的抽样误差越小
选项A:对
选项B:错
答案:对
题目:率的标准误用符号sp
选项A:对
选项B:错
答案:对。
卫生统计学七版 第五章参数估计基础电子教案
P0.05
第三节 总体均数及总体概率的估计
一、参数估计的基础理论
参数估计区 点间 估估 计计
对总体参数估计 称的 为范 置围 信区C间( I , co用 nfidenicneterv)al
表示,其置信1度 )为,(一般取置95信 %,度即为取 为0.05,此区
间的较小值称为 限置 ,信 较下 大值称为 限置 。信 一上 般进行双 区侧 间的估计。
卫生统计学七版 第五ຫໍສະໝຸດ 参数估 计基础第一节 抽样分布与抽样误差
一、样本均数的抽样分布与抽样误差
……
x15 .55 1 sx0.9617
样本均数的标准差越,大抽样误差就越大
样本均数的标准差称标为准误
x
n
sx
s n
sx称为标准误估计值,简也称标准误
标准误与标准差成正比 ,与样本含量成反比
标准误越大,抽样误差越大。
2、正态近似法
当已知时X: u
n
当未知但n足够大时X:u0.05
s n
X1.96 s n
或:X1.96s X
例5-3(P95) 某医生于2000年在某市随机抽取90名 19岁的健康男大学生,测量了他们的身高,得样本均数 为172.2cm,标准差为4.5cm,试估计该市2000年19岁健 康男性大学生平均身高的95%置信区间 。
对任意分布,在样本含量足够大时,其样本均数的分布都 近似正态分布,且样本均数的均数等于原分布的均数。
二、样本频率的抽样分布与抽样误差
总体率的标准误:
p
(1 )
n
率的标准误的估计值:
sp
p(1 p) n
标准误大抽样误差就大。
第二节 t分布
一、t分布的概念
应用统计-第05章-参数估计
χ 1-α / 2
χα / 2
2
χ2
第 五 章
27
5.2.3 总体方差的区间估计 总体方差σ2在(1-α)置信水平下的置信区间为:
(n − 1) s 2
2 χα / 2
≤σ 2 ≤
(n − 1) s 2
χ12−α / 2
例5.5
应 用 统 计 第 五 章
28
根据例5.1的数据,以95%的置信水平建立该种食品 重量方差的置信区间。 解:根据样本数据计算的样本标准差为:
(单位:周岁)
36 31 47 44 48 45 44 33 24 40 50 32
试确立投保人年龄90%的置信区间。
应 用 统 计 第 五 章
16
解:已知,n=36,1-α =90%,zα/2=1.645。由 于总体方差未知,但为大样本,可用样本方 差来求总体方差。 根据样本数据计算的样本均值和标准差如下:
10
5.1.3 评价估计量的标准 无偏性(unbiasedness) 无偏性是指估计量抽样分布的数学期望等 于被估计的总体参数。 有效性(effciency) 一个无偏的估计量并不意味着它非常接近 被估计的参数,它还必须与总体参数的离 散程度比较小。对同一总体参数的两个无 偏点估计量,标准差越小的估计量越有效。 相合性(consistency) 相合性是指随着样本容量的增大,点估计 量的值越来越接近被估总体的参数。
o μ – 2.58σx μ – 1.96σx μ – 1.65σx μ
μ + 1.65σx μ + 1.96σx μ + 2.58σx
x
90%的样本 95%的样本 99%的样本
应 用 统 计 第 五 章
8
统计学贾俊平-第五章-参数估计-练习题答案
0.058375,s0.005846, F ?2.464484, F1
0.405764
所以,方差比的置信区间为
4.051926,24.61011
5.10已知置信水平
95%,Z
/2
E1.96,120,E
20
所以,n
z
~Er
138.3,取n=139。
5.11已知
n1n2
n, E 5,112,
215,置信水平1
95%,Z
/2
1.96
所以,n
Z
2 2
1 2
256.7,取
E
n=57。
5.12已知置信水平1
95%,n1
n2n,E=0.05,取1
20.5
Z111212
所以
768.32,取n=769
12的置信区间为八01门2
(2)置信水平195%,
P1P2
0.1 1.96, 0.00096一0.00084
0.0168,0.1832
c
D
S
SI
0- 241609
S1A2
0. 058375
1S2
F0.076457
0- 005846
N
2. 464424
0-405764
1
2置信区间
5.9
Excel得,$0.241609, S20.076457, s;
统计学(第四版)贾俊平 第五章 参数估计 练习题答案
5.1(答案精确到小数点后两位)
(1)已知:n=49,15,
样本均值的标准误差X二=15荷2.14
(2)
已知:置信水平:1
95%,Z2
1.96,
(3)
计量经济学第五章课后作业
1:(1)因为22()i i f X X =,所以取221i iW X =,用2i W 乘给定模型两端,得 312322221i i iii i i Y X u X X X X βββ=+++ 上述模型的随机误差项的方差为一固定常数,即22221()()i i i iu Var Var u X X σ==(2)根据加权最小二乘法,可得修正异方差后的参数估计式为***12233ˆˆˆY X X βββ=--()()()()()()()***2****22232322322*2*2**2223223ˆii i i i i i i i i i i i i i i i i W y x W x W y x W x x W x W x W x x β-=-∑∑∑∑∑∑∑()()()()()()()***2****23222222332*2*2**2223223ˆii i i i i i i i i i i ii ii i iW y x W x W y x W x x WxWxWx xβ-=-∑∑∑∑∑∑∑其中22232***23222,,i iiii i iiiW X W XW Y X X Y WWW ===∑∑∑∑∑∑******222333i i i i i x X X x X X y Y Y =-=-=-2、Dependent Variable: Y Method: Least Squares Date: 11/18/12 Time: 20:59 Sample: 1901 1960 Included observations: 60Variable Coefficient Std. Error t-Statistic Prob. C 9.367844 3.633066 2.578495 0.0125 X0.6368910.01987132.051060.0000 R-squared0.946557 Mean dependent var 119.6667 Adjusted R-squared 0.945636 S.D. dependent var 38.68984 S.E. of regression 9.020984 Akaike info criterion 7.269749 Sum squared resid 4719.933 Schwarz criterion 7.339561 Log likelihood -216.0925 F-statistic 1027.271 Durbin-Watson stat1.630558 Prob(F-statistic)0.000000(1)根据eviws 输出结果,该模型样本回归估计式的书写形式为22ˆ9.347522+0.637069t= (2.569104) (32.00881)R =0.946423 R =0.945500 F=1024.564 DW=1.790431i iY X =(2)首先,用Goldfeld-Quandt 法进行检验。
统计学习题05
2.下面哪些是影响必要样本容量的因素()。
A.总体各单位标志变异程度B.允许的极限误差大小
C.推断的可靠程度D.抽样方法和抽样组织方式
E.样本均值和样本统计量
答案:ABCD
3.评价估计量是否优良的常用标准有( )。
A.无偏性B.有效性
C.准确性D.一致性
E.随机性
答案:ABC
4.点估计( )。
[参考答案]
28.306
2.现有一大批种子,为了估计其发芽率,随机抽取400粒进行发芽试验。结果有15粒每发芽。试以90%的置信度估计这批种子的发芽率。
[参考答案]
[ 0.95 , 0.97 ]
3.设总体X服从参数 的泊松分布,其概率分布率为 ,
x=0,1,2,……试求参数 的极大似然估计量及矩估计量。
A.求每晚睡眠时间总体均值的点估计。
B.假定总体是正态分布,求总体均值的点估计的95%置信区间。
[参考答案]
A.6.86,B.[6.54 , 7.18]
5.在某地方选举进行以前展开的民意测验表明,在随机抽取的121名居民中有65名支持某候选人,试求该候选人支持率的信赖区间。( =5%)
[参考答案]
0.54-0.089=0.451
答案:C
21.已知σ2的1-α置信区间为,该区间也可表示为()。
(D)以上答案都不正确
答案:B
二、多项选择题
1.在区间估计中,如果其他条件保持不变,置信度与精确度之间存在下列关系( )。
A.前者愈低,后者也愈低B. 前者愈高,后者也愈高
C. 前者愈低,后者愈高D.前者愈高,后者愈低
E. 两者呈相反方向变化
3.在进行参数估计时,我们并不是直接用一个个的具体样本之来估计、推断总体参数,而是根据样本构造出一些特定的量,用这些特定量来估计总体参数,这些根据样本构造的特定量就称为样本统计量。在估计过程中,我们把用来推估总体参数的样本统计量称为估计量。
统计学各章习题及答案
统计学习题目录第一章绪论 _________________________________________________ 2第二章数据的收集与整理 _____________________________________ 4第三章统计表与统计图 _______________________________________ 6第四章数据的描述性分析 _____________________________________ 8第五章参数估计 ____________________________________________ 12第六章假设检验 ____________________________________________ 16第七章方差分析 ____________________________________________ 20第八章非参数检验 __________________________________________ 23第九章相关与回归分析 ______________________________________ 26第十章多元统计分析 ________________________________________ 30第十一章时间序列分析 ______________________________________ 34第十二章指数 ______________________________________________ 37第十三章统计决策 __________________________________________ 41第十四章统计质量管理 ______________________________________ 44第一章绪论习题一、单项选择题1。
推断统计学研究(D)。
A.统计数据收集的方法B.数据加工处理的方法C.统计数据显示的方法D.如何根据样本数据去推断总体数量特征的方法2。
参数估计作业范文
参数估计作业范文参数估计是统计学中一个重要的概念,它用于通过样本数据来估计总体参数。
在实际应用中,参数估计经常用于确定总体的均值、方差、比例等参数。
本文将以总体均值的参数估计为例,介绍参数估计的原理、方法以及应用。
首先,参数估计的原理是根据样本数据来推断总体参数。
总体均值的参数估计使用样本均值作为总体均值的估计值。
样本均值通常是样本中所有观测值的平均数,用数学符号表示为x̄。
根据大数定律,当样本容量趋于无穷大时,样本均值趋于总体均值。
因此,样本均值是总体均值的一个无偏估计。
其次,参数估计的方法有点估计和区间估计。
点估计是通过一个数值来估计总体参数。
在总体均值的参数估计中,样本均值是一个无偏的点估计。
然而,点估计没有体现估计的准确性。
为了评估估计的准确性,需要引入区间估计。
区间估计是用一个区间来估计总体参数,常用的区间估计方法有置信区间估计和预测区间估计。
在总体均值的参数估计中,常用的是置信区间估计。
置信区间是用来表示估计值的准确性的,它表示参数估计值位于一些区间内的概率。
一般地,置信区间可以表示为样本均值加减一个标准误差的乘积,即x̄±zα/2σ/√n。
其中,x̄是样本均值,zα/2是正态分布的分位数,σ是总体标准差,n是样本容量。
最后,参数估计在实际应用中具有广泛的应用。
例如,在医学研究中,可以通过参数估计来估计其中一种药物的有效性,确定合适的剂量;在市场调研中,可以通过参数估计来估计其中一种产品的受欢迎程度,制定市场策略;在质量控制中,可以通过参数估计来估计产品的质量水平,改进生产过程。
综上所述,参数估计是统计学中一个重要的概念,它通过样本数据来估计总体参数。
参数估计的原理是根据样本数据来推断总体参数,常用的方法有点估计和区间估计。
参数估计在实际应用中具有广泛的应用,可以用于估计总体的均值、方差、比例等参数。
通过参数估计,我们可以更好地理解总体的特征,并作出正确的决策和推断。
总结一下,参数估计是在统计学中,通过样本数据来估计总体参数的方法。
第5章抽样调查及参数估计(练习题)
第五章抽样调查及参数估计5.1 抽样与抽样分布5.2 参数估计的基本方法5.3 总体均值的区间估计5.4 总体比例的区间估计5.5 样本容量的确定一、简答题1.什么是抽样推断?用样本指标估计总体指标应该满足哪三个标准才能被认为是优良的估计?2.什么是抽样误差,影响抽样误差的主要因素有哪些?3.简述概率抽样的五种方式二、填空题1.抽样推断是在随机抽样的基础上,利用样本资料计算样本指标,并据以推算总体数量特征的一种统计分析方法。
2.从全部总体单位中随机抽选样本单位的方法有两种,即重复抽样和不重复抽样。
3.常用的抽样组织形式有简单随机抽样、类型抽样、等距抽样、整群抽样等四种。
4.影响抽样误差大小的因素有总体各单位标志值的差异程度、抽样单位数的多少、抽样方法和抽样调查的组织形式。
5.总体参数区间估计必须具备估计值、概率保证程度或概率度、抽样极限误差等三个要素。
6.从总体单位数为N的总体中抽取容量为n的样本,在重复抽样和不重复抽样条件下,可能的样本个数分别是______________和_____________。
7.简单随机_抽样是最基本的抽样组织方式,也是其他复杂抽样设计的基础。
8.影响样本容量的主要因素包括总体各单位标志变异程度_、__允许的极限误差Δ的大小、_抽样方法_、抽样方式、抽样推断的可靠程度F(t)的大小等。
三、选择题1.抽样调查需要遵守的基本原则是( B )。
A.准确性原则 B.随机性原则 C.代表性原则 D.可靠性原则2.抽样调查的主要目的是( A )。
A.用样本指标推断总体指标 B.用总体指标推断样本指标C.弥补普查资料的不足 D.节约经费开支3.抽样平均误差反映了样本指标与总体指标之间的( B )。
A.实际误差 B.实际误差的平均数C.可能的误差范围 D.实际的误差范围4.对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进行检验,这种抽查方式是( D )。
A.简单随机抽样 B.类型抽样 C.等距抽样 D.整群抽样5.在其他情况一定的情况下,样本单位数与抽样误差之间的关系是( B )。
第5章 参数估计
猎物射击,结果该猎物身中一弹,你认为谁打中的可能
性最大? 根据经验而断:老猎人打中猎物的可能性最大. 极大似然估计法的思想就是对固定的样本值,选
择待估参数的估计值使“样本取样本值”[离散型]或 “样
本取值落在样本值附近”[连续型] 的概率最大。
(2、极大似然估计的求法
单参数情形
根据总体分 布律写出似 然函数:换x 为xi
来得到待估参数θ 的极大似然估计值(驻点);
③ 、必要时,参照极大似然估计值写出极大似然
估计量.
【例6】求服从二项分布B(m,p)的总体X未知参数 p的极大似然估计量。 〖解〗单参数,离散型。 因为总体 X
~ B(m, p),
x m x
其分布律为
m x
f ( x; p) C p (1 p)
下面分离散型与连续型总体来讨论. 设离散型总体X的分布律
P{X x} p( x; )
( )
形式已知,θ 为待估参数. X 1 , X 2 ,..., X n 为来自总体X的
样本, x1 , x2 ,..., xn 为其样本值,则 X 1 , X 2 ,..., X n 的联合分
布律为:
用其观察值
ˆ( X , X ,..., X ), 1 2 n
——θ 的估计量
ˆ( x , x ,..., x ) 1 2 n
——θ 的估计值
来估计未知参数θ .
今后,不再区分估计量和估计值而统称为θ 的估计,
ˆ . 均记为
二、构造估计量的两种方法
1、矩估计法 理论根据:样本矩(的连续函数)依概率收敛于总
因为X~N(μ ,σ 2),所以X总体的概率密度为
2 1 (x ) 2 f ( x; , ) exp ( R, 0) 2 2 2
第五章 参数估计与假设检验的SPSS过程 实验
实验:参数估计与假设检验的SPSS过程
一、实验目的与要求
1.熟悉区间估计的概念与操作方法
2.熟练掌握T检验的SPSS操作
3.学会利用T检验方法解决身边的实际问题
4. 学会对运行结果进行统计分析说明。
二、实验原理
1.参数估计的基本原理
参数估计就是利用样本信息去估计未知的总体参数,基本原理包括极大似然原理及最大二乘估计原理等。
2.假设检验的基本原理
假设检验的基本思路是先对总体特征做出某种假设,然后利用样本提供的信息去验证前面提出的假设是否成立。
如果样本数据不能充分证明和支持假设的
成立,则在一定的概率条件下,应拒绝该假设;反之,如果样本数据不能充分证
明和支持假设是不成立的,则不能推翻原假设。
小概率事件原理是假设检验的基
本原理。
三、实验内容与步骤
分析某班级学生的高考数学成绩是否存在性别上的差异。
(显著性水平为0.01)
数据如表所示:
某班级学生的高考数学成绩
性别数学成绩
男(n=18)85 89 75 58 86 80 78 76 84 89 99 95 82 87 60 85 75 80
女(n=12)92 96 86 83 78 87 70 65 70 65 70 78 72 56
(1)对题目的分析:
(2)数据组织:
(3) 主要设置步骤:
(4)主要结果及分析:。
第五章 参数估计
二、填空题
1.参数估计主要有_____________________和区间估计两种方法。
答案:点估计
2.好的估计量应符合_____________________和有效性这两个标准。
答案:无偏性
3.抽取一个容量为25的随机样本,其均值为 =36,标准差S=5,总体均均值μ的99%的置信区间为_____________________。(保留两位有效数字)
A.对T1,T2的观测值t1,t2,必有θ∈(T1,T2) B.θ以α的概率落入区间(T1,T2) C.区间(T1,T2)以1-α的概率包含θ
D.θ的数学期望E(θ)必属于(T1,T2)E.无正确选项
答案:C
33.设X与Y服从正态分布,X~N(μ,42),Y~N(μ,52);记p1=P{X≤μ-4},p2=P{Y≥μ+5},则()
答案:A
18.通过矩估计法求出的参数估计量()
A.是唯一的B.是无偏差估计量C.不一定唯一D.不唯一但是无偏差估计量
E.无正确选项
答案:C
19.置信水平1-α表达了置信区间的()
A.准确性B.精确性C.显著性D.可靠性E.无正确选项
答案:D
20.当样本量一定时,置信区间的长度()
A.随着α的提高而变长B.随着置信水平1-α的降低而变长C.与置信水平1-α无关
E.无正确选项
答案:B
30.设X1,X2,…,Xn是取自正态总体X的一个样本,不是无偏估计量的是( )
A. B. C. D. E.无正确选项
答案:B
31.设X1,X2是取自总体X~N(μ,σ2)的一个样本,μ的无偏估计量中最有效的是( )
A. B. C. D.
E.无正确选项
卫生统计学七版 第五章参数估计基础
二、总体均数及总体概率的区间估计
(一)总体均数的置信区间
1、t 分布法
当 未知且 n 较小时,估计双侧置信 区间:
(X
-t
,
s X
,
X
t ,
s X
)
可简写为:
X
t ,
s X
或X t,
s n
总体均数的95%双侧置信区间为:X
t0.05,
s X
例5-2(P95) 已知某地27名健康成年男子血红蛋白 含量的均数为125g/L,标准差为15g/L,试估计该地健康 成年男子血红蛋白平均含量的95%和99%置信区间 。
二项分布 n 31 X 25 n X 6 查附表6,得7 37 改错
该药物治疗脑血管梗塞有效概率的95%置信区间为 63%~93%。
2、正态近似法 适用范围:np>5,且n(1-p)> 5
例5-6(P96) 用某种仪器检查已确诊的乳腺癌患者 120名,检出乳腺癌患者94例,检出率为78.3%,试估计该 仪器乳腺癌总体检出率的95%置信区间。 np 1200.783 93.96 n(1 p) 1200.217 26.04
第三节 总体均数及总体概率的估计
一、参数估计的基础理论
参数估计区 点间 估估 计计
对总体参数估计的范围称为置信区间,用CI(confidence interval)
表示,其置信度为(1 ),一般取置信度为95%,即取为0.05,此区
间的较小值称为置信下限,较大值称为置信上限。一般进行双侧置信区 间的估计。
第五章 参数估计基础
公共卫生学院 邹焰
定量资料
统计描述等级资料(有序分类资 料)
统计学第五章 参数估计作业
ˆq ˆ ˆq ˆ p p ˆ Z ,p ] 2 n n
0.2 0.8 0.2 0.8 [0.2- 1.96 ,0.2 1.96 ] 400 400 [0.2- 0.0392,0.2 0.0392] [0.16,0.24 ]
3、 解 : 1 0.95,
2
2 ( Z ) 1 0.025 0.975 Z 1.96
2
0.025
代入置信区间公式: S S [ x - Z , x Z ] 2 2 n n 5 5 [4.5 - 1.96 ,4.5 1.96 ] 100 100 [4.5 0.98,4.5 0.98] [3.52,5.48]
作业:
1、设x1,x2,x3为简单随机抽样的3个观测值.如果采用如下不等权的平均值:
2 2 1 x ' x1 x2 x3 5 5 5
作为总体均值的点估计值,试说明它将比采用等权的平均值:
1 1 1 x x1 x2 x3 3 3 3
作为总体均值的点估计值要差.(提示:用点估计值衡量标准来讨论) 2、某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成 的一个随机样本,他们到单位的距离(单位:km)分别是:10,3,14,8,6,9,12,11, 7,5,10,15,9,16,13,2.求职工上班 从家里到单位平均距离在95%的置信区间? 3、根据某大学100名学生的抽样调查,每月平均用于购买书籍的费用为4.5元, 标准差为5元,求大学生每月用于购买书籍费用的区间估计(置信度为95%)?
2 2 1 1、 解:D ( x ' ) D ( x1 x2 x3 ) 5 5 5 4 4 1 D( x1 ) D ( x2 ) D( x3 ) 25 25 25 9 D( x) 25 1 1 1 D ( x ) D ( x1 x2 x3 ) 3 3 3 1 1 1 D ( x1 ) D ( x2 ) D ( x3 ) 9 9 9 1 D( x) 3 D ( x ' ) D ( x ),即以等权的平均值作为 总体均值 的点估计值效果要好于 不等权的平均值 .
第五章 参数估计
第五章参数估计一、单项选择题1、在计算必要的样本容量时,若比率方差未知,则可选择()进行计算。
(分数:5分;难度:易)A、p=0.23∙B、p=0.5∙C、p=1∙D、p为任意值答错了参考答案:B你的解答:2、在简单随机重复抽样情况下,若允许误差为原来的,则样本容量()。
(分数:5分;难度:易)A、扩大为原来的3倍∙B、扩大为原来的倍∙C、扩大为原来的倍∙D、扩大为原来的2.25倍答错了参考答案:D你的解答:3、随着样本容量的增大,点估计的值越来越接近被估总体的参数。
这是()的体现。
(分数:5分;难度:易)A、有效性∙∙B、相合性∙C、无偏性∙D、相关性答错了参考答案:B你的解答:4、总体均值的置信区间由两部分组成:()(分数:5分;难度:易)A、点估计值和允许误差∙B、点估计值和误差∙C、点估计值和概率∙D、点估计值和方差答错了参考答案:A你的解答:二、判断题1、参数估计就是用样本统计量估计总体参数。
(分数:5分;难度:易)正确不正确答错了参考答案:正确你的解答:2、在参数估计中样本统计量是未知的。
(分数:5分;难度:易)正确不正确答错了参考答案:不正确你的解答:3、在参数估计中总体参数是随机变量。
(分数:5分;难度:易)正确不正确答错了参考答案:不正确你的解答:4、点估计就是用样本估计量的值直接作为总体参数的估计值。
(分数:5分;难度:易)正确不正确答错了参考答案:正确你的解答:5、置信水平愈高,置信区间就愈扩大。
(分数:5分;难度:易)正确不正确答错了参考答案:正确你的解答:6、样本容量和总体方差的大小成反比。
(分数:5分;难度:易)正确不正确答错了参考答案:不正确你的解答:7、我们可以改变总体方差的大小来确定样本容量。
(分数:5分;难度:易)正确不正确答错了参考答案:不正确你的解答:8、参数估计可以分为点估计和区间估计。
(分数:5分;难度:易)正确不正确答错了参考答案:正确你的解答:三、计算题1、某服装厂对当月生产的20 000件衬衫进行质量检查,结果在抽查的200件衬衫中有10件是不合格品,要求:(1)以95.45%置信水平推算该产品合格率范围。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
区间估计参数说明1、从变量窗口中认识各个变量的含义2、在已编辑好的数据中按Analyze――Descriptive Statistics――Explore,在弹出的窗口中,左边的上部是各个变量名,右边分为三个部分,第一个是因变量窗口,即Dependent框。
第二个是分组变量窗口,即Factor。
比如我们将班上的学生体重做分析,即体重为因变量窗口,性别为分组变量窗口。
第三个为选择标识变量,当我们要寻找奇异值,即数值相对较大或者较小的值时,需要对数据标上标签,通常为序号。
则要使用该变量值标识各观测值。
3、左边的下部,是Display栏,它分为三个选项:both:输出图形以及描述统计量,此为系统默认。
Statistics:只输出描述统计量。
Plots:只输出图形。
左边的下部也有三个选项,首先看Statistics,弹出的对话框有四个复选框,第一个为Descriptives,选中它即要求输出基本描述统计量。
选择此项将输出平均数、中位数、众数、标准误、方差、极值、峰度、偏度等等。
在Confidence intervals for mean均值的置信区间。
在参数中键入不同的置信区间,可以得到不同的区间范围。
常用的有90%、95%、99%。
M-estimators为集中趋势的最大似然比的稳健估计,此项不要求掌握。
Outliers 要求输出五个最大、最小值。
Percentiles 要求输出百分位数。
其次是Plots框,它分为三个部分,第一个为Boxplot 选择框,它要求作出各组因变量的并列箱图。
第一项是:因变量按因素水平分组,各组因变量生成并列箱图,可以比较不同水平上的分布情况;第二项是:所有因变量生成一个并列箱图,可在同一水平上比较各因变量值的分布。
第二个部分是Descriptive,包括茎叶图和直方图两种,我们选择直方图。
下面的Normality plots with tests复选项,输出正态概率与离散正态概率图。
Spread vs level with levene test 栏是方差齐次检验结果,不要求掌握。
Option按钮,展开后有三个选项,分别表示在分析过程中,剔除带有缺失值的观测量(Exclude cases listwies)在分析中剔除中,不仅剔除缺失值还剔除那些与缺失值有成对关系的观测值(Exclude case pairwise)。
分组变量中的缺失值将被单独分为一组。
输出频数表时也包括缺失值组,但将标定出分组变量的缺失值(Report values)。
Levene检验:检验两个样本的数据是否具有相等方差时,虽然可以采用多种检测方法,但是多数都是基于数据必须服从正态分布这一假设,否则就失去数据检验的意义。
Levene检验则较少依赖于正态性的假设,因而,它是等方差性检验的特别有效的方法。
Spread-level(幅度-水平)检验:幅度-水平图,是指框图的高度与各变量的水平或均值之间的关系。
正态性检验:1、图示法:偏态图:可以描绘这些点偏离直线的实际偏差,这种偏离直线的偏差则构成了偏态图。
如果样本来自正态总体,这些点应该分布在一条过原点的水平线上,且没有任何模式;如果有一个明显的模式,则意味着总体并非正态分布。
正态概率图:对于正态概率图,每个观察值与其来自正态分布中的期望值组成数据点,这些数据点多数应落在一条直线上。
2、显著性水平检验法:Shapiro-wilks检验:当均值与方差均未知而必须从数据中估计时使用。
Lilliefors正态检验法:当显著性水平significance<0.05时,固然可以拒绝正态假设。
但是,当样本规模比较大时,任何拟合度的检验,几乎都认为有理由拒绝原假设。
因此难以找到一个服从正态分布的数据。
所以,对于大规模的样本数据,不仅要考察观察值的显著性水平,而且还必须考察其对正态分布的实际偏离程度。
平稳估计量如果我们对数据来源的总体做出某个假定,则将会求出更好的分布位置的估计量,这种估计量称为平稳(或稳健)估计量。
二、修正均值:1、修正均值由于均值受极值影响很大,因此,可以通过去掉一些远离主体数据的极值,进而获得一个分布位置的简单而平稳的估计量。
修正均值的优点:与中位数法一样,此法生成的统计量也不受极值的影响。
与中位数不同的是:它并非仅仅基于位于中央的单一值(奇数)或两个数值(偶数),而是基于位于中央的多个数值。
中位数可作为一个50%的修正平均值。
高于或低于中位数的各占半数的数据将被忽略。
总之,调整后的均值比中位数可更好的描述数据。
M估计修正平均值,是把个案分为两组,一组用来计算均值,另一组则作为比较,然后观测两组频次,并分别赋予其权重1和0,最后计算其加权平均数。
另一种折中的方法,是把极值包括在计算之内,而赋予一个权重较小的。
这种方法可以借助M估计或采用广义极大似然度估计。
所有常用的M估计在赋予权重的时候,观察值离分布中心越远,权重就越小,反之亦然。
常见的M估计有4种:Huber的M估计量、Hampel的M估计量、Tukey的M估计量、Andrew的M估计量。
区间估计作业1Lisa Rae Bock在1994年开办了一家Bock投资服务公司(Bock Investment Services,BIS),旨在给南加利福尼亚货币市场提供咨询服务和指导。
为了给其目前的客户提供更好的服务并吸引新客户,她每周做一次简讯。
为了更好地反映每周对基金管理者电话调查的结果,Lisa正在考虑向简讯中增加一项内容。
为了对提供这种服务的可能性进行调查,以便确定在简讯中包含哪些信息,Lisa选取了45种货币市场基金组成一个简单随机样本,部分数据如下表所示,它们报告了基金的资产、最近7天和最近30天的获益率。
在给基金管理者打电话以获取更多的信息之前,Lisa决定先对已搜集的数据做一些初步分析。
表:Bock投资服务公司问题中所用的数据货币市场基金资产(百万美元)过去7日的获益率(%)过去30日的获益率(%)AmcoreAlger Arch MM/Trust BT Instit Treas Benchmark DirBradfordCapital cash Cash Mgt TrustComposite Cowen StandbyCorlandDeclarationDreyfusElfunFFB Cash Federated Master Fidelity CashFlex-fundFortis Franklin Money Freedom cash Galaxy Money Government Cash Hanover Cash Heritage Cash Infinity/Alpha John Hancock Landmark FundsLiquid cash Mardet Watch Merrill LynchMoney103.9156.7496.5197.82755.4707.61.72707.8122.8694.7217.338.44832.881.7506.2738.713272.8172.8105.6996.81079.0801.4409.4794.31008.353.6226.4481.3388.910.627005.6113.44.104.794.174.374.543.884.294.144.034.253.572.674.014.514.174.414.514.603.873.974.074.113.834.324.083.993.934.284.614.134.244.224.084.734.134.324.473.834.224.043.914.193.512.613.894.414.114.344.424.483.853.924.013.963.824.234.003.913.874.264.644.054.184.20NCC Funds Nationwide Overland Pierpont Money Portico Money Prudential MoneyMart Reserve Primary Schwab Money Smith Barney CashStagecoach Strong Money Transamerica Cash United Cash Woodword Money517.3 291.5 1991.7 161.6 6835.1 1408.0 10531.0 2947.6 1502.2 470.2 175.5 323.7 1330.0 4.22 4.26 4.50 4.28 4.20 3.91 4.16 4.16 4.18 4.37 4.20 3.96 4.24 4.14 4.17 4.40 4.20 4.16 3.86 4.07 4.12 4.13 4.29 4.19 3.89 4.21资料来源:Barron’s ,October 3,19941. 用适当的描述统计量汇总货币市场基金的资产和获益率数据。
2. 求货币市场基金总体的资产均值、最近7天的获益率和最近30天的获益率的95%置信区间估计。
并对该区间估计做出管理上的解释。
3. 从Lisa 该如何在其每周的简讯中使用这些信息的角度上看,你的统计结果能说明什么?4. 为了向客户提供最有用的信息,你建议Lisa 还需要搜集一些其它什么信息? 区间估计作业2谢尔工业公司拟采用一项计算机辅助程序来培训公司的维修支援掌握及其维修的操作,以减少培训工人所需要的时间。
为了评价这种培训方法,生产经理需要对这种程序所需要的平均根据上述资料建立置信度为95%的总体均值的区间估计。
(假定培训时间总体服从正态分布)。
区间估计作业3斯泰特怀特保险公司每年都需对人寿保险单进行审查,现公司抽取36个寿保人作为一个简单随即样本,得到关于、投保人年龄、保费数量、保险单的现金值、残废补偿选择等项目的资料。
为了便于研究,某位经理要求了解寿险投保人总体平均年龄的90%的区间估计。
区间估计作业4为估计两种方法组装产品所需时间的差异,分别对两种不同的组装方法各随机安排12名工人,每个工人组装一件产品所需的时间(分钟)下如表。
假定两种方法组装产品的时间服从正态分布,且方差相等。
试以95%的置信水平建立两种方法组装产品所需平均时间差值的置区间估计作业5沿用前例。
假定第一种方法随机安排12名工人,第二种方法随机安排名工人,即n1=12,n2=8,所得的有关数据如表。
假定两种方法组装产品的时间服从正态分布,且方差不相等。
以95%的置信水平建立两种方法组装产品所需平均时间差值的置信区间。