【2018年整理】第七章 专家系统习题解答精品资料
统计学原理 第七章课后习题及答案
第七章 相关和回归一、单项选择题1.相关关系中,用于判断两个变量之间相关关系类型的图形是( )。
(1)直方图 (2)散点图 (3)次数分布多边形图 (4)累计频率曲线图 2.两个相关变量呈反方向变化,则其相关系数r( )。
(1)小于0 (2)大于0 (3)等于0 (4)等于13.在正态分布条件下,以2yx S (提示:yx S 为估计标准误差)为距离作平行于回归直线的两条直线,在这两条平行直线中,包括的观察值的数目大约为全部观察值的( )。
(1)68.27% (2)90.11% (3)95.45% (4)99.73% 4.合理施肥量与农作物亩产量之间的关系是( )。
(1)函数关系 (2)单向因果关系 (3)互为因果关系 (4)严格的依存关系 5.相关关系是指变量之间( )。
(1)严格的关系 (2)不严格的关系(3)任意两个变量之间关系 (4)有内在关系的但不严格的数量依存关系 6.已知变量X 与y 之间的关系,如下图所示:其相关系数计算出来放在四个备选答案之中,它是( )。
(1)0.29 (2)-0.88 (3)1.03 (4)0.997.如果变量z 和变量Y 之间的相关系数为-1,这说明两个变量之间是( )。
(1)低度相关关系 (2)完全相关关系 (3)高度相关关系 (4)完全不相关 8.若已知2()x x -∑是2()y y -∑的2倍,()()x x y y --∑是2()y y -∑的1.2倍,则相关系数r=( )。
(1)21.2 2(3)0.92 (4)0.65 9.当两个相关变量之问只有配合一条回归直线的可能,那么这两个变量之间的关系是( )。
(1)明显因果关系 (2)自身相关关系(3)完全相关关系 (4)不存在明显因果关系而存在相互联系 10.在计算相关系数之前,首先应对两个变量进行( )。
(1)定性分析 (2)定量分析 (3)回归分析 (4)因素分析 11.用来说明因变量估计值代表性高低的分析指标是( )。
概率论与数理统计(经管类)第七章课后习题答案word-推荐下载
似然函数为������(������) =
������
������ = ∏1������������
������������������(������) = (∑������������)������������������ ‒ ������������ ‒ ������������(������1!������2!⋯������������!)
������������������
∑1
������ =
) = ������(������������),
������(������������)
������������ ������ ‒ ������������
=
������
1
(������������
������������������
∑1
������ =
������ = 1
令
������ ������������������(������) ������ ������
解得
=
∑ ������������
������ ������2 =‒ ������
∑ ������������
������ = 1
������
+
������
=
������������
1
3. 设总体������~������(������,1), ‒ ∞ < ������ < ∞,(������1,������2,������3)为其样品.试证下述三个估计量:
(1) ������1 = 15������1 + 130������2 + 12������3;
(2) ������2 = 13������1 + 14������2 + 152������3;
概率论与数理统计第七章习题答案
解:(1)已知ξ ~N (µ, σ 2 ),取统计量U = ξ − µ ,则有U ~ N (0,1),于给定的置信概率1−α ,
n
σ/ n
可求出uα
+ (4 − 0.8)2 ×1] = 0.831.
14.设ξ1,ξ2,……,ξn是取自总体ξ的一个样本,n ≥ 2,ξ ~ B(1, p),其中p为未知,0 < p < 1, 求证:
(1)ξ12是p的无偏估计; (2)ξ12不是p2的无偏估计;
(3) ξ1ξ2是p2的无偏估计。
证明:(1)Eξ
2 1
tα /2 (4) = 2.78, S = 11.937, n = 5代入(*),求得µ的置信区间为(1244.185,1273.815).
20.假定到某地旅游的一个游客的消费额ξ~N (µ,σ 2 ),且σ = 500元,今要对 该地每一个游客的平均消费额µ进行估计,为了能以不小于95%的置信概率 确信这估计的绝对误差小于50元,问至少需要随机调查多少个游客?
乐山师范学院化学学院
1.设总体ξ 有分布律
第七章 参数估计部分习题答案
ξ
−1
0
2
p
2θ
θ
1-3θ
其中 0 < θ < 1 为待估参数,求θ 的矩估计。 3
解:总体一阶矩为Eξ = (−1) × 2θ + 0×θ + 2× (1− 3θ ) = −8θ + 2.
用样本一阶矩代替总体一阶矩得ξ = -8θˆ + 2,则θˆ = 1 (2 − ξ ). 8
应用多元统计分析课后习题答案详解北大高惠璇(第七章习题解答)
精品课件 14
第七章 主成分分析
精品课件 15
第七章 主成分分析
7-9
精品课件 16
第七章 主成分分析
精品课件 17
第七章 主成分分析
7-10
精品课件 18
第七章 主成分分析
77--1112
精品课件 19
应用多元统计分析
第七章习题解答
第七章 主成分分析
试从7-Σ1和相关阵R设出X发=(求X1出, 总X2)体′主的成协分方,差阵14 1040,
并加以比较. 解:
精品课件 2
第七章 主成分分析
精品课件 3
第七章 主成分分析
精品课件 4
第七章 主成分分析
其7中-ρ2 为X1和X2的设相X=关(X系1,数X(2)ρ′>~0)N.2(0,Σ),协方1差1Σ=
解:
精品课件 11
第七章 主成分分析
7-7 设4维随机向量X的协差阵是
2
12
13 14
12 2
14 13
13 14 2
12
14 Βιβλιοθήκη 1312 2,
其中 1 21 31,421 4 21.3
试求X的主成分.
精品课件 12
第七章 主成分分析
解:
精品课件 13
第七章 主成分分析
第七章 主成分分析
解:
1
精品课件 8
第七章 主成分分析
7-4
等概率密度
设总体X=(X1,…,Xp)′~Np(μ,Σ) (Σ>0),
椭球为
(X-μ)′Σ-1(X-
μ)=C解2(:C为常数).
试问椭球的主轴方向是什么?
精品课件 9
第七章 主成分分析
概率论与数理统计第七章课后习题及参考答案
易得ˆ
max
1in
X
i
,ˆ
的密度函数为
p(x)
n(x
) n 1
1
,0
x
,
0, 其他.
7
则 E(ˆ)
xp(x)d x
0
xn
x
n1 n1
1
dx
n n 1
,
可知 的最大似然估计量不是无偏的.
12.设从均值为 ,方差为 2 0 的总体中,分别抽取容量为 n1 ,n2 的两独立样
本.X1 和 X 2 分别是两样本的样本均值.试证对于任意常数 a ,b ( a b 1),
X
1
2
3
P
2
2 (1 )
(1 )2
其中, ( 0 1 )为未知数.已知取得了样本值 x1 1, x2 2 , x3 1 ,求 的矩估计值和最大似然估计值.
(2) 设 X1 , X 2 ,…, X n 是来自参数为 的泊松分布总体的一个样本,试求
的矩估计量和极大似然估计量.
解:(1) 因为 E( X ) 1 2 2 2 (1 ) 3(1 )2 3 2 ,
x c x( 1)d x c
c
c
x
d
x
c 1
,
令
E(X
)
X
,即
X
c 1
,得
的矩估计量为
1
ˆ X . X c
从而 的矩估计量值为 4.设总体 X 的概率密度为
ˆ x . x c
f
(x)
6x(
3
x)
,
x
c,
0, 其他.
X1 , X 2 ,…, X n 是来自总体 X 的一个样本. (1) 求 的矩估计量ˆ ;
最新应用回归分析-第7章课后习题参考答案
第7章 岭回归思考与练习参考答案7.1 岭回归估计是在什么情况下提出的?答:当自变量间存在复共线性时,|X’X |≈0,回归系数估计的方差就很大, 估计值就很不稳定,为解决多重共线性,并使回归得到合理的结果,70年代提出了岭回归(Ridge Regression,简记为RR)。
7.2岭回归的定义及统计思想是什么?答:岭回归法就是以引入偏误为代价减小参数估计量的方差的一种回归方法,其统计思想是对于(X ’X )-1为奇异时,给X’X 加上一个正常数矩阵D, 那么X’X+D接近奇异的程度就会比X ′X 接近奇异的程度小得多,从而完成回归。
但是这样的回归必定丢失了信息,不满足blue 。
但这样的代价有时是值得的,因为这样可以获得与专业知识相一致的结果。
7.3 选择岭参数k 有哪几种方法?答:最优k 是依赖于未知参数β和2σ的,几种常见的选择方法是: ○1岭迹法:选择0k 的点能使各岭估计基本稳定,岭估计符号合理,回归系数没有不合乎经济意义的绝对值,且残差平方和增大不太多; ○2方差扩大因子法:11()()()c k X X kI X X X X kI --'''=++,其对角线元()jj c k 是岭估计的方差扩大因子。
要让()10jj c k ≤;○3残差平方和:满足()SSE k cSSE <成立的最大的k 值。
7.4 用岭回归方法选择自变量应遵循哪些基本原则? 答:岭回归选择变量通常的原则是:1. 在岭回归的计算中,我们通常假定涉及矩阵已经中心化和标准化了,这样可以直接比较标准化岭回归系数的大小。
我们可以剔除掉标准化岭回归系数比较稳定且绝对值很小的自变量;2. 当k 值较小时,标准化岭回归系数的绝对值并不很小,但是不稳定,随着k 的增加迅速趋近于零。
像这样岭回归系数不稳定、震动趋于零的自变量,我们也可以予以剔除;3. 去掉标准化岭回归系数很不稳定的自变量。
如果有若干个岭回归系数不稳定,究竟去掉几个,去掉那几个,要根据去掉某个变量后重新进行岭回归分析的效果来确定。
文献信息检索第7章习题与答案.docx
第7章特种文献信息资源检索1.简述标准的特点及其分类,重点了解中国标准的分类及标准编号。
答:标准文献不同于一般的技术文献,主要特点是:(1)有独立的文献体制和固定的标准代号。
(2)具有法律性质,有一定的约束力,有生效、未生效、试行和失效之分。
(3)动态性强,随国民经济和科技发展的不断补充、修订和更新。
(4)一件标准只解决一个问题,文字简练。
(5)不同级别的标准有不同的实施范围。
(6)标准文献交叉重复,相互引用。
从企业标准到国家标准直到国际标准并不意味着级别上升,在制定标准时往往相互引用。
(7)标准文献的检索主要通过标准编号、行业分类、发布单位构成的标准目录等。
标准的分类:(1)按使用范围和适用地区分:国际标准、区域标准、国家标准、行业标准、企业标准。
(2)按成熟程度分:强制性标准、推荐性标准、试行标准、(3)按标准内容分:基础标准、产品标准、工艺装备标准、原材料标准、方法标准。
中国标准的分类:《中华人民共和国标准化法》规定我国标准分为4级,即国家标准、部颁(行业、专业)标准、地方标准和企业标准。
标准编号:(1)国家标准编号为:标准代号+标准序号+标准年代。
强制性标准编号的代号为“GB”,推荐性标准的代号为“GB/T” o(2)行业标准编号为:行业标准代号+行业标准顺序号+年代。
行业标准代号由两个汉语拼音字母组成。
(3)地方标准编号为:地方标准代号+地方标准顺序号+年代。
(4)企业标准编号为:企业标准代码Q+企业隶属行政区域代号+企业代号+顺序号+ 年代。
2.我国专利有哪几种类型?专利必须具备的三个基本条件是什么?答:我国专利分三类:发明专利、实用新型专利和外观设计专利。
专利必须具备的三个基本条件:新颖性、创造性和实用性。
3・国内外学位论文分别有哪些查找途径(6个)?答:国外学位论文可通过:世界著名的学位论文全文库PQDTo国内学位论文可通过:1)万方学位论文数据库;2)CNKI博硕士学位论文数据库;3)国家科技图书文献屮心;4)中国科技论文在线网;5)中国民商法律网学位论文检索;6)访问各高等院校图书馆的站点。
统计基础课件习题的答案第七章-文档资料
S yx
y
2
a y b xy nm
估计标准误差越小,估计值的代表性越强, 用回归方程估计或预测的结果越准确。
可线性化的曲线回归
1.指数曲线模型
ˆ abx y
转化为直线回归模型
ˆ A Bx Y
2.幂函数曲线模型
ˆ ax b y
3.根据相关的方向划分,分为正相关和负相关。 正相关是指当自变量的值增加或减少时,因变量 的值也随之增加或减少。 负相关是指当自变量的值增加或减少时,因变量 的值反而减少或增加。
4.根据自变量的多少划分,分为单相关和复相关。
单相关又称一元相关,自变量的个数只有一个。 复相关又称多元相关,自变量有两个或两个以上。
四、相关关系的判断
1.定性分析。在进行相关分析之前,首先对客观现象之间是否存在相关 关系,以及有何种相关关系做出判断,这是定性分析。 2.简单相关表和相关图。相关表是将总体中各单位的原始资料或整理资 料不经任何分组,只将一个变量的变量值按由小到大顺序列表排列, 另一个变量值与其一一对应,并按相应的变量值顺序排列形成的统计 表。 相关图也叫散点图或相关点图,相关图上的横座标代表自变量x, 纵座标代表因变量y。把观察所得的有关资料,依次以相关点标在图上 ,从相关点在图象上的分布及趋势,可以掌握变量之间的相关关系的 状况。 3.分组相关表。是把原始的相关资料加以分组,排列在一张表格上,用 以观察现象之间相关关系的表格。依分组标志的多少分为单变量分组 相关表和双变量分组相关表两种。单变量分组相关表是按一个变量进 行分组,求出各组内另一个变量的次数和取值的平均数,列表表示变 量之间关系的方法。双变量分组相关表是对自变量和因变量都进行分 组而编制的相关表。
概率论与数理统计(理工类,第四版)吴赣昌主编课后习题答案第七章
写在前面:由于答案是一个个复制到word中,比较耗时耗力,故下载收取5分,希望需要的朋友给予理解和支持!PS:网上有一些没经我同意就将我的答案整合、转换成pdf,放在文库里的,虽然是免费的,但是窃取了我的劳动成果,希望有心的朋友支持我一下,下载我的原版答案。
第七章假设检验7.1 假设检验的基本概念习题1样本容量n确定后,在一个假设检验中,给定显著水平为α,设此第二类错误的概率为β,则必有(). (A)α+β=1;(B)α+β>1;(C)α+β<1;(D)α+β<2.解答:应选(D).当样本容量n确定后,α,β不能同时都很小,即α变小时,β变大;而β变小时,α变大.理论上,自然希望犯这两类错误的概率都很小,但α,β的大小关系不能确定,并且这两类错误不能同时发生,即α=1且β=1不会发生,故选(D).习题2设总体X∼N(μ,σ2),其中σ2已知,若要检验μ,需用统计量U=X¯-μ0σ/n.(1)若对单边检验,统计假设为H0:μ=μ0(μ0已知),H1:μ>μ0,则拒绝区间为;(2)若单边假设为H0:μ=μ0,H1:μ<μ0,则拒绝区间为(给定显著性水平为α,样本均值为X¯,样本容量为n,且可记u1-α为标准正态分布的(1-α)分位数).解答:应填(1)U>u1-α;(2)U<uα.由单侧检验及拒绝的概念即可得到.习题3如何理解假设检验所作出的“拒绝原假设H0”和“接受原假设H0”的判断?解答:拒绝H0是有说服力的,接受H0是没有充分说服力的. 因为假设检验的方法是概率性质的反证法,作为反证法就是必然要“推出矛盾”,才能得出“拒绝H0”的结论,这是有说服力的,如果“推不出矛盾”,这时只能说“目前还找不到拒绝H0的充分理由”,因此“不拒绝H0”或“接受H0”,这并没有肯定H0一定成立. 由于样本观察值是随机的,因此拒绝H0,不意味着H0是假的,接受H0也不意味着H0是真的,都存在着错误决策的可能.当原假设H0为真,而作出了拒绝H0的判断,这类决策错误称为第一类错误,又叫弃真错误,显然犯这类错误的概率为前述的小概率α:α=P(拒绝H0|H0为真);而原假设H0不真,却作出接受H0的判断,称这类错误为第二类错误,又称取伪错误,它发生的概率β为β=P(接受H0|H0不真).习题4犯第一类错误的概率α与犯第二类错误的概率β之间有何关系?解答:一般来说,当样本容量固定时,若减少犯一类错误的概率,则犯另一类错误的概率往往会增大.要它们同时减少,只有增加样本容量n.在实际问题中,总是控制犯第一类错误的概率α而使犯第二类错误的概率尽可能小.α的大小视具体实际问题而定,通常取α=0.05,0.005等值.习题5在假设检验中,如何理解指定的显著水平α?解答:我们希望所作的检验犯两类错误的概率尽可能都小,但实际上这是不可能的. 当样本容量n固定时,一般地,减少犯其中一个错误的概率就会增加犯另一个错误的概率. 因此,通常的作法是只要求犯第一类错误的概率不大于指定的显著水平α,因而根据小概率原理,最终结论为拒绝H0较为可靠,而最终判断力接受H0则不大可靠,其原因是不知道犯第二类错误的概率β究竟有多少,且α小,β就大,所以通常用“H0相容”,“不拒绝H0”等词语来代替“接受H0”,而“不拒绝H0”还包含有再进一步作抽样检验的意思.习题6在假设检验中,如何确定原假设H0和备择假设H1?解答:在实际中,通常把那些需要着重考虑的假设视为原假设H0,而与之对应的假设视为备择假设H1.(1)如果问题是要决定新方案是否比原方案好,往往将原方案取假设,而将新方案取为备择假设;(2)若提出一个假设,检验的目的仅仅是为了判断这个假设是否成立,这时直接取此假设为原假设H0即可.习题7假设检验的基本步骤有哪些?解答:根据反证法的思想和小概率原理,可将假设检验的步骤归纳如下:(1)根据问题的要求,提出原理假设H0和备择假设H1.(2)根据检验对象,构造检验统计量T(X1,X2,⋯,Xn),使当H0为真时,T有确定的分布.(3)由给定的显著水平α,查统计量T所服从的分布表,定出临界值λ,使P(∣T∣>λ)=α,或P(T>λ1)=P(T<λ2)=α/2,从而求出H0的拒绝域:∣T∣>λ或T>λ1,T<λ2.(4)由样本观察值计算统计量T的观察值t.(5)作出判断,将t的值与临界值比较大小作出结论:当t∈拒绝域量时,则拒绝H0,否则,不拒绝H0,即认为在显著水平α下,H0与实际情况差异不显著.习题8假设检验与区间估计有何异同?解答:假设检验与区间估计的提法虽不同,但解决问题的途径是相通的. 参数θ的置信水平为1-α的置信区间对应于双边假设检验在显著性水平α下的接受域;参数θ的置信水平为1-α的单侧置信区对应于单边假设检验在显著性水平α下的接受域.在总体的分布已知的条件下,假设检验与区间估计是从不同的角度回答同一个问题. 假设检验是判别原假设H0是否成立,而区间估计解决的是“多少”(或范围),前者是定性的,后者是定量的.习题9某天开工时,需检验自动包装工作是否正常. 根据以往的经验,其装包的质量在正常情况下服从正态分布N(100,1.52)(单位:kg).现抽测了9包,其质量为:99.3,98.7,100.5,101.2,98.3,99.7,99.5,102.0,100.5.问这天包装机工作是否正常?将这一问题化为假设检验问题. 写出假设检验的步骤(α=0.05).解答:(1)提出假设检验问题H0:μ=100,H1:μ≠100;(2)选取检验统计量U:U=X¯-1001.59,H0成立时, U∼N(0,1);(3)α=0.05,uα/2=1.96,拒绝域W={∣u∣>1.96};(4)x¯≈99.97,∣u∣=0.06.因∣u∣<uα/2=1.96,故接受H0,认为包装机工作正常.习题10设总体X∼N(μ,1),X1,X2,⋯,Xn是取自X的样本. 对于假设检验H0:μ=0,H1:μ≠0,取显著水平α,拒绝域为W={∣u∣>uα/2},其中u=nX¯,求:(1)当H0成立时, 犯第一类错误的概率α0;(2)当H0不成立时(若μ≠0),犯第二类错误的概率β.解答:(1)X∼N(μ,1),X¯∼N(μ,1/n),故nX¯=u∼N(0,1).α0=P{∣u∣>uα/2∣μ=0}=1-P{-uα/2≤u≤uα/2}=1-[Φ(uα/2)-Φ(-uα/2)]=1-[(1-α2)-α2]=α,即犯第一类错误的概率是显著水平α.(2)当H0不成立,即μ≠0时,犯第二类错误的概率为β=P{∣u∣≤uα/2∣E(X)=μ}=P{-uα/2≤u≤uα/2∣E(X)=μ}=P{-uα/2≤nX¯≤uα/2∣E(X)=μ}=P{-uα/2-nμ≤n(X¯-μ)≤uα/2-nμ∣E(X)=μ}=Φ(uα/2-nμ)-Φ(-uα/2-nμ).注1当μ→+∞或μ→-∞时,β→0.由此可见,当实际均值μ偏离原假设较大时,犯第二类错误的概率很小,检验效果较好.注2当μ≠0但接近于0时,β≈1-α.因α很小,故犯第二类错误的概率很大,检验效果较差.7.2 单正态总体的假设检验习题1已知某炼铁厂铁水含碳量服从正态分布N(4.55,0.1082).现在测定了9炉铁水,其平均含碳量为4.484.如果估计方差没有变化,可否认为现在生产的铁水平均含碳量仍为4.55(α=0.05)?解答:本问题是在α=0.05下检验假设H0:μ=4.55,H1:μ≠4.55.由于σ2=0.1082已知,所以可选取统计量U=X¯-4.550.108/9,在H0成立的条件下,U∼N(0,1),且此检验问题的拒绝域为∣U∣=∣X¯-4.550.108/9∣>uα/2,这里u=4.484-4.550.108/9≈-1.833,uα/2=1.96.显然∣u∣=1.833<1.96=uα/2.说明U没有落在拒绝域中,从而接受H0,即认为现在生产之铁水平均含碳量仍为4.55.习题2要求一种元件平均使用寿命不得低于1000小时,生产者从一批这种元件中随机抽取25件,测得其寿命的平均值为950小时. 已知该种元件寿命服从标准差为σ=100小时的正态分布,试在显著性水平α=0.05下确定这批元件是否合格?设总体均值为μ,μ未知,即需检验假设H0:μ≥1000,H1:μ<1000.解答:检验假设H0:μ≥1000,H1:μ<1000.这是单边假设检验问题. 由于方差σ2=0.05,故用u检验法. 对于显著性水平α=0.05,拒绝域为W={X¯-1000σ/n<-uα.查标准正态分布表,得u0.05=1.645.又知n=25,x¯=950,故可计算出x¯-1000σ/n=950-1000100/25=-2.5.因为-2.5<-1.645,故在α=0.05下拒绝H0,认为这批元件不合格.习题3打包机装糖入包,每包标准重为100kg.每天开工后,要检验所装糖包的总体期望值是否合乎标准(100kg).某日开工后,测得9包糖重如下(单位:kg):99.398.7100.5101.298.399.799.5102.1100.5打包机装糖的包得服从正态分布,问该天打包机工作是否正常(α=0.05)?解答:本问题是在α=0.05下检验假设H0:μ=100,H1:μ≠100.由于σ2未知,所以可选取统计量T=X¯-100S/n,在H0成立的条件下,T∼t(n-1),且此检验问题的拒绝域为∣T∣=∣X¯-100S/n∣>tα/2(n-1),这里t=x¯-100s/n≈99.978-1001.2122/9≈-0.0544,t0.025(8)=2.306.显然∣t∣=0.0544<2.306=t0.025(8),即t未落在拒绝域中,从而接受H0,即可以认为该天打包工作正常.习题4机器包装食盐,假设每袋盐的净重服从正态分布,规定每袋标准含量为500g,标准差不得超过10g.某天开工后,随机抽取9袋,测得净重如下(单位:g):497,507,510,475,515,484,488,524,491,试在显著性水平α=0.05下检验假设:H0:μ=500,H1:μ≠500.解答:x¯=499,s≈16.031,n=9,t=(x¯-μ0)sn=499-50016.0319=-0.1871,α=0.05,t0.025(8)=2.306.因∣t∣<t0.025(8),故接受H0,认为该天每袋平均质量可视为500g.习题5从清凉饮料自动售货机,随机抽样36杯,其平均含量为219(mL),标准差为14.2mL,在α=0.05的显著性水平下,试检验假设:H0:μ=μ0=222,H1:μ<μ0=222.解答:设总体X∼N(μ,σ2),X代表自动售货机售出的清凉饮料含量,检验假设H0:μ=μ0=222(mL),H1:μ<222(mL).由α=0.05,n=36,查表得t0.05(36-1)=1.6896,拒绝域为W={t=x¯-μ0s/n<-tα(n-1).计算t值并判断:t=219-22214.2/36≈-1.27>-1.6896,习题6某种导线的电阻服从正态分布N(μ,0.0052).今从新生产的一批导线中抽取9根,测其电阻,得s=0.008Ω,对于α=0.05,能否认为这批导线电阻的标准差仍为0.005?解答:本问题是在α=0.05下检验假设H0:σ2=0.0052,H1:σ2≠0.0052.选取统计量χ2=n-1σ2S2,在H0成立的条件下,χ2∼χ2(n-1),且此检验问题的拒绝域为χ2>χα/22(n-1)或χ2<χ1-α/22(n-1).这里χ2=9-10.0052s2=80.0052×0.0082=20.48,χ0.9752(8)=2.18,χ0.0252(8)=17.5.显然χ2落在拒绝域中,从而拒绝H0,即不能认为这批导线电阻的标准差仍为0.005.习题7某厂生产的铜丝,要求其折断力的方差不超过16N2.今从某日生产的铜丝中随机抽取容量为9的样本,测得其折断力如下(单位:N):289,286,285,286,285,284,285,286,298,292设总体服从正态分布,问该日生产的铜线的折断力的方差是否符合标准(α=0.05)?解答:检验问题为H0:σ2≤16,H1:σ2>16,n=9,s2≈20.3611,χ2=8×s216≈10.181,α=0.05,χ0.052(8)=15.507.因χ2<χ0.052(8)=15.507,故接受H0,可认为铜丝的折断力的方差不超过16N2.习题8过去经验显示,高三学生完成标准考试的时间为一正态变量,其标准差为6min.若随机样本为20位学生,其标准差为s=4.51,试在显著性水平α=0.05下,检验假设:H0:σ≥6,H1:σ<6.解答:H0:σ≥6,H1:σ<6.α=0.05,n-1=19,s=4.51,χ0.952(19)=10.117.拒绝域为W={χ2<10.117}.计算χ2值χ2=(20-1)×4.51262≈10.74.因为10.74>10.117,故接受H0,认为σ≥6.习题9测定某种溶液中的水分,它的10个测定值给出s=0.037%,设测定值总体服从正态分布,σ2为总体方差,σ2未知,试在α=0.05水平下检验假设:H0:σ≥0.04%,H1:σ<0.04%.解答:在α=0.05下,拒绝域为W={(n-1)S2σ02<χ1-α2(9).查χ2分布表得χ0.952(9)=3.325.计算得(n-1)s2σ02=(10-1)×(0.037\per)2(0.04\per)2≈7.7006>3.325,未落入拒绝域,故接受H0.sw=(5-1)×(1.971)2+(4-1)×(1.167)25+4-2≈1.674.查表得t0.005(7)=1.895.算得t=2.86-2.075-01.67415+14≈0.699<1.895.因为0.699<1.895,故不拒绝H0,认为此药无效.习题3据现在的推测,矮个子的人比高个子的人寿命要长一些.下面给出美国31个自然死亡的总统的寿命,将他们分为矮个子与高个子2类,列表如下:矮个子总统8579679080高个子总统6853637088746466606078716790737177725778675663648365假设2个寿命总体均服从正态分布且方差相等,试问这些数据是否符合上述推陈出推测(α=0.05)?解答:设μ1,μ2分别为矮个子与高个子总统的平均寿命,则检验问题为H0:μ1≤μ2,H1:μ1>μ2,n1=5,x¯=80.2,s1≈8.585,n2=26,y¯≈69.15,s2≈9.315,sw=4×8.5852+9.315229≈9.218,n1n2n1+n2≈2.048,t=(80.2-69.15)9.218×2.048≈2.455,α=0.05,t0.05(29)=1.6991,因t>t0.05(29)=1.6991,故拒绝H0,认为矮个子总统的寿命比高个子总统寿命长.习题4在20世纪70年代后期人们发现,酿造啤酒时,在麦芽干燥过程中形成致癌物质亚硝基二甲胺(NDMA).到了20世纪80年代初期,人们开发了一种新的麦芽干燥过程,下面给出了分别在新、老两种过程中形成的NDMA含量(以10亿份中的份数计):故拒绝H0,认为新、老过程中形成的NDMA平均含量差大于2.习题5有两台车床生产同一种型号的滚珠. 根据过去的经验,可以认为这两台车床生产的滚珠的直径都服从正态分布. 现要比较两台车床所生产滚珠的直径的方差,分别抽出8个和9个样品,测得滚珠的直径如下(单位:mm).甲车床xi:15.014.515.215.514.815.115.214.8乙车床yi:15.215.014.815.215.015.014.815.114.8问乙车床产品的方差是否比甲车床的小(α=0.05)?解答:以X,Y分别表示甲,乙二车床产品直径.X∼N(μ1,σ12),Y∼N(μ2,σ22),X,Y独立. 检验假设H0:σ12=σ22,H1:σ22<σ22.用F检验法, 在H0成立时F=S12S22∼F(n1-1,n2-1).由已知数据算得x¯≈15.01,y¯≈14.99,s12≈0.0955,s22≈0.0261,n1=8,n2=9,α=0.05.拒绝域为Rα={F>Fα(n1-1,n2-1)}.查F分布表得F0.05(8-1,9-1)=3.50.计算F值F=s12/s22=0.0955/0.0261≈3.66.因为3.66>3.50,故应否定H0,即认为乙车床产品的直径的方差比甲车床的小.习题6某灯泡厂采用一项新工艺的前后,分别抽取10个灯泡进行寿命试验. 计算得到:采用新工艺前灯泡寿命的样本均值为2460小时. 样本标准差为56小时;采用新工艺后灯泡寿命的样本均值为2550小时,样本标准差为48小时. 设灯泡的寿命服从正态分布,是否可以认为采用新工艺后灯泡的平均寿命有显著提高(α=0.01)?解答:(1)检验假设H0:σ12=σ22,H1:σ12≠σ22.应选取检验统计量F=S12/S22,若H0真, 则F∼F(m-1,n-1);对于给定的检验水平α=0.01,查自由度为(9,9)的F分布表得F0.005(9,9)=6.54;已知m=n=10,s1=56,s2=48,由此得统计量F的观察值为F=562/482≈1.36;因为F<F0.005(9,9),所以接受原假设H0,即可认为这两个总体的方差无显著差异.(2)检验假设H0′:μ1=μ2,H1′:μ1<μ2.按上述关于双总体方差的假设检验的结论知这两个总体的方差未知但相等,σ12=σ22,所以应选取检验统计量:T=X¯-Y¯(m-1)S12+(n-1)S22m+n-2(1m+1n),若H0′真,则T∼t(m+n-2);对给定的检验水平α=0.01,查自由度为m+n-2=18的t分布表得临界值计算t值t=z¯-0sz/n=-0.1-00.141/5≈-1.59>-2.776,故接受H0:μz=0,即在α=0.05下,认为两种分析方法所得的均值结果相同.7.4 关于一般总体数学期望的假设检验习题1设两总体X,Y分别服从泊松分布P(λ1),P(λ2),给定显著性水平α,试设计一个检验统计量,使之能确定检验H0:λ1=λ2,H1:λ1≠λ2的拒绝域,并说明设计的理论依据.解答:因非正态总体,故宜用大样统计,设X¯=1n1∑i=1n1Xi,S12=1n1-1∑i=1n1(Xi-X¯)2;Y¯=1n2∑i=1n2Yi,S22=1n2-1∑i=1n2(Yi-Y¯)2.\because(X¯-Y¯)-(λ1-λ2)S12n1+S22n2→N(0,1)∴可选用样本函数u=(X¯-Y¯)-(λ1-λ2)S12n1+S22n2作为拒绝域的检验统计量.习题2设某段高速公路上汽车限制速度为104.6km/h,现检验n=85辆汽车的样本,测出平均车速为x¯=106.7km/h,已知总体标准差为σ=13.4km/h,但不知总体是否服从正态分布. 在显著性水平α=0.05下,试检验高速公路上的汽车是否比限制速度104.6km/h显著地快?解答:设高速公路上的车速为随机变量X,近似有X∼N(μ,σ2),σ=13.4km/h,要检验假设H0:μ=μ0=104.6,H1:μ>104.6.α=0.05,n=85,uα=u0.05=1.645.拒绝域W={u=x¯-μ0σ/n>uα.由x¯=106.7,σ=13.4,μ0=104.6,n=85得u=106.7-104.613.4/85≈1.44<1.645.因为1.44<1.645,所以接受H0,即要α=0.05显著性水平下,没有明显的证据说明汽车行驶快于限制速度.习题3某药品广告上声称该药品对某种疾病和治愈率为90%,一家医院对该种药品临床使用120例,治愈85人,问该药品广告是否真实(α=0.02)?解答:设该药品对某种疾病的治愈率为p,随机变量X为X={1,临床者使用该药品治愈0,反之则X∼b(1,p),问题该归结为检验假设:H0:p=0.9,H1:p≠0.9.由于n=120足够大,可以用u检验法,所给样值(x1,x2,⋯,x120)中有85个1,35个0,所以x¯=1120∑i=1120xi=1120∑i=1851=85120≈0.71,又p0=0.9,以之代入统计量U得U的观察值为∣u∣=∣0.71-0.9∣0.9×0.1120=6.94>u0.01=2.33,故拒绝H0,即认为该药品不真实.习题4一位中学校长在报纸上看到这样的报道:“这一城市的初中学生平均每周看8小时电视.”她认为她所领导的学校,学生看电视时间明显小于该数字. 为此,她向她的学校的100名初中学生作了调查,得知平均每周看电视的时间x¯=6.5小时,样本标准差为s=2小时,问是否可以认为这位校长的看法是对的(α=0.05)?解答:检验假设H0:μ=8,H1:μ<8.由于n=100,所以T=X¯-μS/n近似服从N(0,1)分布,α=0.05,u0.05=1.645.又知x¯=6.5,s=2,故计算得t=6.5-82/100=-7.5,否定域W={X¯-8S/n<-u0.05.因为-7.5<-1.645,故否定H0,认为这位校长的看法是对的.习题5已知某种电子元件的使用寿命X(h)服从指数分布e(λ),抽查100个元件,得样本均值x¯=950(h),能否认为参数λ=0.001(α=0.05)?解答:由题意知X∼e(λ),E(X)=1/λ,D(X)=1/λ2,故当n充分大时u=x¯-1/λ1nλ=(x¯-1λ)λn=(λx¯-1)n(0,1).现在检验问题为H0:λ=0.001,H1:λ≠0.001,样本值u=(0.001×950-1)×100=0.5,α=0.05,u0.025=1.96.因∣u∣<u0.025=1.96,故接受H0,即可认为参数λ=0.001(即元件平均合适用寿命为1000h).习题6某产品的次品率为0.17,现对此产品进行新工艺试验,从中抽取400检查,发现次品56件,能否认为这项新工艺显著地影响产品质量(α=0.05)?解答:检验问题为H0:p=0.17,H1:p≠0.17,由题意知⌢p=mn=56400=0.14,u=(⌢p-p0)p0q0n=0.14-0.170.17×0.83×400≈-1.597,α=0.05,u0.025=1.96.因∣u∣<u0.025=1.96,故接受H0,即认为新工艺没有显著地影响产品质量.习题7某厂生产了一大批产品,按规定次品率p≤0.05才能出厂,否则不能出厂,现从产品中随机抽查50件,发现有4件次品,问该批产品能否出厂(α=0.05)?解答:问题归结为在α=0.05下,检验假设H0:p≤0.05,H1:p>0.05.这是一个单侧检验问题,用u检验法,H0的拒绝域为U=X¯-p0p0(1-p0)n>uα.已知n=50,p0=0.05,x¯=450=0.08,代入U的表达式得u=0.08-0.050.05×0.9550≈0.97<uα=u0.05=1.645,故接受H0,即认为这批产品可以出厂.习题8从选区A中抽取300名选民的选票,从选区B中抽取200名选民的选票,在这两组选票中,分别有168票和96票支持所提候选人,试在显著水平α=0.05下,检验两个选区之间对候选人的支持是否存在差异. 解答:这是两个比率的比较问题,待检假设为H0:p1=p2,H1:p1≠p2.由题设知n=300,μn=168,m=200,μm=96,p1=168320=0.56,p2=96200=0.48,p=μn+μmm+n=264500=0.528.U0∼=p1-p2p(1-p)(1n+1m)=0.56-0.480.528×0.472×1120≈1.755,由P{∣U∼∣>1.96}=α=0.05,得拒绝域∣U∼∣>1.96,因为U0∼=1.755<1.96,故接受H0,即两个选区之间无显著差异.7.5 分布拟合检验Ai k概率pi npi频数fi(fi-npi)2(fi-npi)2npiA001/108085250.3125A111/108093169 2.1125A221/108084160.2A331/10807910.0125A441/10807840.05A551/108069121 1.5125A661/108074360.45A771/10807181 1.0125A881/108091121 1.5125A991/108076160.2∑18007.375由于当H0为真时,χ2=∑i=0k(fi-npi)2npi∼χ2(k-1-r),且此检验问题的拒绝域为χ2≥χα2(k-1-r).这里χ2=7.375,查表知χ0.052(10-1-0)=χ0.052(9)=16.9,显然χ2=7.375<16.9=χ0.052(9),即χ2未落在拒绝域中,所以接受H0,即认为这个正20面体是由均匀材料制面的.习题2根据观察到的数据疵点数0 1 2 3 4 5 6频数fi 14 27 26 20 7 3 3检验整批零件上的疵点数是否服从泊松分布(α=0.05).解答:设X表示整批零件上的疵点数,则本问题是在α=0.05下检验假设H0:P{X=i}=λie-λi!,i=0,1,2,⋯.由于在H0中参数λ未具体给出,所以先估计λ的值. 由极大似然估计法得λ=x¯=1100(0×14+1×27+2×26+3×20+4×7+5×3+6×3)=2.将试验的所有可能结果分为7个互不相容的事件A0,A1,⋯,A7, 当H0成立时,P{X=i}有估计值p0=P{X=0}=e-2≈0.135335,p1=P{X=1}=2e-2≈0.27067,p2=P{X=2}=2e2≈0.270671,p3=P{X=3}≈0.180447,p4=P{X=4}=2/3e-2≈0.090224,p5=P{X=5}=4/15e-2≈0.036089, p6=P{X=6}=4/45e-2≈0.0120298. 列表如下:Ai k 概率pi npi 频数fi (fi-npi)2 (fi-npi)2npiA0 A1 A2 A3 A4 A5 A6 0 1 2 3 4 5 6 0.1353350.270671 0.270671 0.180447 0.090224 0.036089 0.0120298 13.5335 27.0671 27.0672 18.0447 9.02243.60891.2029813.83428 14 27 26 2073313 0.2176 0.0045 1.1387 3.8232 0.6960 0.01608 0.000166 0.04207 0.2118740.050310∑1000.3205当H0为真时,χ2=∑i=0k(fi-npi)2npi ∼χ2(k-1-r),且此检验问题的拒绝域为χ2≥χα2(k-1-r), 这里χ2=0.3205, 查表知χ0.052(5-1-1)=χ0.052(3)=7.815. 显然 χ2=0.3205<7.815=χ0.052(3).即χ2未落在拒绝域中,接受H0, 故可认为整批零件上的疵点数服从泊松分布.习题3检查了一本书的100页,记录各页中印刷错误的个数,其结果为错误个数fi0 1 2 3 4 5 6 ≥7含fi 个错误的页数 36 40 19 2 0 2 1 0问能否认为一页的印刷错误个数服从泊松分布(取α=0.05)? 解答:检验假设H0: 一页的印刷错误个数X 服从泊松分布, P{X=i}=λie -λi!,i=0,1,2,⋯.H0 不成立. 先估计未知参数λλ=x¯=1/100(0×36+1×40+2×19+3×2+4×0+5×2+6×1)=1. 在H0成立下pi =P {X=i}=(λ)ie-λi!=e-1i!,i=0,1,2,⋯. 用χ2检验法χ2=∑i =1k(fi-npi )2npi ∼χ2(k -r-1). 本题中r=1, 其中fi 为频数. H0的拒绝域为 Rα={χ2>χα2(k -r-1)}. 列表计算如下:n=100, 对每个{X=i}计算pi ,npi ,fi-npi ,(fi-npi )2/(npi )(i=1,2,⋯,7). 要求每一个npi ≥5.计算χ2值χ2=0.0170+0.2801+0.0202+1.1423=1.4596.习题6下表记录了2880个婴儿的出生时刻:试问婴儿的出生时刻是否服从均匀分布U[0,24](显著性水平α=0.05)?解答:原假设H0:F0(x), 由F0(x)算得pi=F0(i)-F0(i-1)=124,npi=2880×124=120 (i=1,2,⋯,24),于是χ2=∑i=124(fi-npi)2npi≈40.47,对α=0.05, 自由度n-1=23, 查χ2-分布表,得χα2(n-1)=35.17,因为χ2=40.47>35.17, 所以拒绝H0, 即可以认为婴儿出生时刻不服从均匀分布U[0,24].总习题解答习题1下面列出的是某工厂随机选取的20只部件的装配时间(min):9.8,10.4,10.6,9.6,9.7,9.9,10.9,11.1,9.6,10.2,10.3,9.6,9.9,11.2,10.6,9.8,10.5,10.1,10.5,9.7.设装配时间的总体服从正态分布N(μ,σ2),μ,σ2均未知,是否可以认为装配时间的均值显著地大于10(取α=0.05)?解答:检验假设H0:μ≤μ0=10,H1:μ>10.已知n=20,α=0.05,由数据算得x¯=10.2,s≈0.5099.因σ2未知,故用t检验法,拒绝域为W={X¯-μ0S/n>tα(n-1).计算得x¯-μ0s/n=10.2-100.5099/20≈1.7541.查t分布表得t0.05(19)=1.7291.因为1.7541>1.7291,故拒绝H0,可以认为装配时间的均值显著地大于10.习题2某地早稻收割根据长势估计平均亩产为310kg,收割时,随机抽取了10块,测出每块的实际亩产量为x1,x2,⋯,x10,计算得x¯=110∑i=110xi=320.如果已知早稻亩产量X服从正态分布N(μ,144),显著性水平α=0.05,试问所估产量是否正确?解答:这是一个正态分布总体,方差已知,对期望的假设检验问题,如果估计正确,则应有μ=310,因此我们先将问题表示成两个假设:①H0:μ=310,H1:μ≠310.接下来就要分析样本值来确定是接受H0,还是接受H1.当H0为真时,统计量②U=X¯-31012/10∼N(0,1),从而有③P{∣U∣>1.96}=0.05,拒绝域为(-∞,-1.96)∪(1.96,+∞).④计算U0=∣320-310∣12/n≈2.64>1.96,即拒绝H0,也就是有理由不相信H0是真的,故认为估产310kg不正确.习题3设某次考试的考生成绩服从正态分布,从中随机地抽取36位考生的成绩,算得平均成绩为66.5分,样本标准差为15分,问在显著水平0.05下,是否可认为这次考试全体考生的平均成绩为70分?并给出检验过程.(1)设这次考试全体考生的平均成绩X∼N(μ,σ2),则待检验假设H0:μ=70,备择假设H1:μ≠70;(2)在H0成立条件下选择统计量T=X¯-μ0S/n∼t(n-1);(3)在显著性水平0.05下,查t分布表,找出临界值tα/2(n-1)=t0.025(35)=2.0301,则拒绝域为(-∞,-2.0301)∪(2.0301,+∞);(4)计算t=∣66.5-70∣15/36=1.4∈(-2.0301,2.0301),故接受H0,因此可认为这次考试全体考生的平均成绩为70分.习题4设有来自正态总体的容量为100的样本,样本均值x¯=2.7,μ,σ2均未知,而∑i=1n(xi-x¯)2=225,在α=0.05水平下,检验下列假设(1)H0:μ=3,H1:μ≠3;(2)H0:σ2=2.5,H1:σ2≠2.5.解答:(1)由题意知n=100,x¯=2.7,s=199×225≈1.508,t=(2.7-3)1.508×100≈-1.9894,α=0.05,t0.025(99)≈t0.025(100)=1.984.因∣t∣=1.9894>t0.025(99)=1.984,故拒绝H0,即认为μ≠3.(2)由题意知χ2=∑i=1n(x1-x¯)22.5=2252.5=90,α=0.05,χ0.0252(99)≈χ0.0252(100)=129.56,χ0.9752(99)≈χ0.9752(100)=74.22,因χ0.9752(99)<χ2=90<χ0.0252(99),故接受H0,即可以认为σ2=2.5.习题5设某大学的男生体重X为正态总体,X∼N(μ,σ2),欲检验假设:H0:μ=68kg,H1:μ>68kg.已知σ=5,取显著性水平α=0.05,若当真正均值为69kg时,犯第二类错误的概率不超过β=0.05,求所需样本大小.解答:由第一类、第二类错误及分位数的定义,易于证明:对于某个给定的δ>0(∣μ-μ0∣≥δ),样本容量n应满足:n≥(uα+uβ)2σ2δ2.因为α=β=0.05,故uα=uβ=1.645,对其对立假设μ=69而言,取δ=1,则n=(uα+uβ)2σ2δ2=(1.645+1.645)2×251≈270.6,故取n=271.某装置的平均工作温度据制造厂家称不高于190∘C.今从一个由16台装置构成的随机样本测得工作温度的平均值和标准差分别为195∘C和8∘C,根据这些数据能否说明平均工作温度比制造厂所说的要高?(设α=0.05,并假设工作温度近似服从正态分布.)解答:设X为工作温度,则X∼N(μ,σ2).①待检假设H0:μ≤190,备择假设H1:μ>190;②在H0成立条件下,选择统计量T=X¯-μ0S/n≈t(n-1);③在显著性水平0.05下,查t分布表,找出临界值tα(n-1)=t0.05(15)=1.75,拒绝域为(1.75,+∞);④计算t=X¯-μ0S/n=195-1908/16=2.5>1.75,所以否定原假设H0,说明平均工作温度比制造厂所说的要高.习题7电工器材厂生产一批保险丝,抽取10根试验其熔断时间,结果为42657578715957685455假设熔断时间服从正态分布,能否认为整批保险丝的熔断时间的方差不大于80(α=0.05)?解答:①待检假设H0:σ2≤80,备择假设H1:σ2>80;②在H0成立时,选取统计量χ2=(n-1)S2σ02∼χ2(n-1);③由α=0.05,n-1=9,查χ2分布表,χα2(n-1)=χ0.052(9)=16.919;④计算样本值:x¯=110(42+65+75+78+71+59+57+68+54+55)=62.4,s2=19∑i=110(xi-x¯)2≈121.8,χ2=9×121.880≈13.7∈(0,16.919).故接受原假设H0即在α=0.05下,可认为整批保险丝的熔断时间的方差不大于80.习题8某系学生可以被允许选修3学分有实验物理课和4学分无实验物理课,11名学生选3学分的课,考试平均分数为85分,标准差为4.7分;17名学生选4学分的课,考试平均分数为79分,标准差为6.1分. 假定两总体近似服从方差相同的正态分布,试在显著性水平α=0.05下检验实验课程是否能使平均分数增加8分?解答:设有实验的课程考分X1∼N(μ1,σ12),无实验的课程考分X2∼N(μ2-σ22).假定σ12=σ22=σ2未知,检验假设H0:μ1-μ2=8,H1:μ1-μ2≠8.由题意知,选用t检验统计量,则拒绝域为W={∣x1¯-x2¯-(μ1-μ2)sw1n1+1n2∣>tα/2(n1+n2-2),其中sw2=(n1-1)s12+(n2-1)s22n1+n2-2.由x1¯=85,x2¯=79,n1=11,n2=17,s1=4.7,s2=6.1,算出sw=(11-1)×4.72+(17-1)×6.1211+17-2≈5.603.从而算出t值为t=85-79-85.603111+117≈-0.92,由α=0.05,查表得t0.025(11+17-2)=t0.025(25)=2.056,因为∣t∣=0.92<2.056,故接受H0,认为μ1-μ2=8.习题9某校从经常参加体育锻炼的男生中随机地选出50名,测得平均身高174.34厘米;从不经常参加体育锻炼的男生中随机地选50名,测得平均身高172.42厘米. 统计资料表明两种男生的身高都服从正态分布,其标准差分别为5.35厘米和6.11厘米,问该校经常参加锻炼的男生是否比不常参加锻炼的男生平均身高要高些(α=0.05)?解答:设X,Y分别表示常锻炼和不常锻炼男生的身高,由题设X∼N(μ1,5.352),Y∼N(μ2,6.112).①待检假设H0:μ1≤μ2,备择假设H1:μ1>μ2;②选取统计量U=X¯-Y¯σ12n+σ22m∼(H0成立)N(0,1);③对于α=0.05,查标准正态分布表,uα=u0.05=1.64;则拒绝域为(1.64,+∞);④计算u=174.34-172.425.35250+6.11250≈1.67>1.64,故否定原假设H0,即表明经常体育锻炼的男生平均身高比不经常体育锻炼的男生平均身高高些.习题10在漂白工艺中要改变温度对针织品断裂强力的影响,在两种不同温度下分别作了8次试验,测得断裂强力的数据如下(单位:kg):70∘C:20.818.819.820.921.519.521.021.280∘C:17.720.320.018.819.020.120.219.1判断两种温度下的强力有无差别(断裂强力可认为服从正态分布α=0.05)?解答:(1)本问题是在α=0.05下检验假设μ1=μ2,为此需要先检验σ12=σ22是否成立.H01:σ12=σ22,H11:σ12≠σ22.选取统计量F=S12S22,在H01成立的条件下,F∼F(n1-1,n2-1),且此检验问题的拒绝域为F>Fα/2(n1-1,n2-1)或F<F1-α/2(n1-1,n2-1).这里F=s12s22≈0.90550.8286≈1.0928,F0.025(7,7)=4.99,F0.975(7,7)=1F0.025(7,7)=14.99≈0.2004.显然F0.975(7,7)=0.2004<1.0928<4.99=F0.025(7,7).说明F未落在拒绝域中,从而接受H01,即认为两温度下的强力的方差没有显著变化,亦即σ12=σ22. (2)再检验假设H0ʹ:μ1=μ2,H0ʹ:μ1≠μ2,在H0ʹ成立的条件下,T=X1¯-X2¯(n1-1)S12+(n2-1)S22n1+n2-21n1+1n2∼t(n1+n2-2),且此检验问题的拒绝域为∣T∣>tα/2(n1+n2-2),这里T≈20.4-19.47×0.9055+7×0.82868+8-218+18≈2.148,显然∣T∣=2.148>2.145=t0.025(14).说明T落在拒绝域中,从而拒绝H0,即认为两种温度下的断裂强力有显著差别.习题11一出租车公司欲检验装配哪一种轮胎省油,以12部装有Ⅰ型轮胎的车辆进行预定的测试. 在不变换驾驶员的情况下,将这12部车辆换装Ⅱ型轮并重复测试,其汽油耗量如下表所示(单位:km/L).汽车编号i123456789101112Ⅰ型胎(xi)4.24.76.67.06.74.55.76.07.44.96.15.2Ⅱ型胎(yi)4.14.96.26.96.84.45.75.86.94.76.04.9假定两总体均服从正态分布,试在α=0.025的显著性水平下,检验安装Ⅰ型轮胎是否要双安装Ⅱ型轮胎省油?解答:设两种轮胎汽油消耗量之差为随机变量D,则取值为zi=xi-yi=0.1,-0.2,0.4,0.1,-0.1,0.1,0,0.2,0.5,0.2,0.1,0.3.设Z∼N(μz,σz2),σz2未知. 若消耗油相同,则μz=0;若Ⅰ型比Ⅱ型轮胎省油,则μz>0,于是检验假设H0:μz=0,H1:μz>0.由题意知z¯≈0.142,s≈0.198,n-1=12-1=11.α=0.025,查t分布表得t0.025(11)=2.201.所以,拒绝域为W={t>2.201}.由于样本值t=z¯-0s/n=0.142-00.198/12≈2.48>2.201,故拒绝H0:μz=0,即说明Ⅰ型轮胎省油.习题12有两台机器生产金属部件,分别在两台机器所生产的部件中各取一容量n1=60,n2=40的样本,测得部件重量(以kg计)的样本方差分别为s12=15.46,s22=9.66. 设两样本相互独立,两总体分别服从分布N(μ1,σ12),N(μ2,σ22).μi,σi2(i=1,2)均未知,试在α=0.05水平下检验假设H0:σ12≤σ22,H1:σ12>σ22.解答:在α=0.05下,检验假设H0:σ12≤σ22,H1:σ12>σ22,经计算p=1100×10(45+2×17+3×4+4×1+5×1)=1/10,故检验假设为H0:X∼B(10,1/10),即pi=P{X=i}=C10i(1/10)i(9/10)10-i,i=0,1,2,⋯,10.为了使npi≥5,将xi≥3合并,于是k=4,r=1.计算χ2的观察值,计算结果如下表:[200,300) [300,+∞)435843.466.9-0.4-8.90.0041.184∑300300 1.8631其中理论概率pi=p{ti≤T≤ti+1}=∫titi+1f(t)dt(i=1,2,3),p4=1-∑i=13pi,例如p1=P{T<100}=∫01000.005e-0.005tdt=1-e-0.5≈0.393.由k=4,未知参数个数r=0,查表知χα2(k-r-1)=χ0.052(3)=7.815.因χ2=1.8631<χ0.052(3)=7.815.故接受H0,即可认为灯泡的寿命服从该指数分布.习题16关于正态总体X∼N(μ,1)的数学期望有如下二者必居其一的假设,H0:μ=0,H1:μ=1.考虑检验规则:当X¯≥0.98时否定假设H0接受H1,其中X¯=(X1+⋯+X4)/4,而X1,⋯,X4是来自总体X的简单随机样本,试求检验的两类错误概率α和β.解答:易见,在假设“H0:μ=0”成立的条件下,X¯∼N(0,1/4),2X¯∼N(0,1);在假设“H1:μ=1”成立的条件下,X¯∼N(1,1/4),2(X¯-1)∼N(0,1).因此,由定义得α=P{X¯≥0.98∣μ=0}=P{2X¯≥1.96∣μ=0}=0.025,β=P{X¯<0.98∣μ=1}=P{2(X¯-1)<-0.04∣μ=1}=0.4840.习题17考察某城市购买A公司牛奶的比例,作假设H0:p=0.6,H1:p<0.6,随机抽取50个家属,设x为其中购买A公司牛奶的家庭数,拒绝域W={x≤24}.(1)H0成立时,求第一类错误的α;(2)H1成立且p=0.4时,求第二类错误的β(0.4);又当p=0.5时,求第二类错误的β(0.5).解答:由定义知(1)α=P{x≤24∣p=0.6}=Φ(24-50×0.650×0.6×0.4)≈Φ(-1.73)=1-Φ(1.73)=1-0.9528=0.0418.(2)β(0.4)=P{x>24∣p=0.4}=1-Φ(24-50×0.450×0.4×0.6)≈1-Φ(1.15)=1-0.8749=0.1251;。
ISO45001:2018第7章至第10章 练习题
ISO45001:2018第7章至第10章练习题您的姓名:[填空题] *_________________________________您的电话: [填空题] *_________________________________您的班级: [单选题] *○一班○二班○三班○四班○五班○六班○七班○八班○九班○十班○十一班○十二班1. 对公司的职业健康安全管理体系审核可以不包括() [单选题] *A 公司产品的安全特性(正确答案)B 公司外出业务员的工作活动C 公司职工食堂D 公司借用的设备2. 及时、准确的职业病统计信息是职业健康管理决策的重要依据,最常用的职业病调查统计方法是() [单选题] *A 普查B 典型调查C 抽样调查(正确答案)D 重点调查3. 依据风险管理原理,控制措施的有效性是指() [单选题] *A 对危险源所采取的控制措施将其风险控制在了可接受状态(正确答案)B 对危险源所采取的控制措施将其风险控制在了不可接受状态C 对危险源所采取的控制措施将其风险消除D 对危险源所采取的控制措施将其风险控制在了最低状态4. 应急管理部2号令:《生产安全事故应急预案管理办法》生产经营单位应当制定本单位的应急预案演练计划,根据本单位的事故风险特点,每年至少组织一次综合应急预案演练或者专项应急预案演练和组织()现场处置方案演练。
[单选题] *A 一次B 三次C 二次(正确答案)D 四次5. 依据GB/T45001-2020标准,组织应策划、实施、控制并保持满足职业健康安全管理体系要求以及实施条款()所确定的措施所需的过程 [单选题] *A 6(正确答案)B 6.1.4C 6.2.2D 6.16. GB/T45001-2020标准强调了()的协商和参与。
[单选题] *A 管理者B 工作人员C 非管理类工作人员(正确答案)D 承包方7. 某企业发生了一起火灾事故,事故原因是由于车间新安装的空调机冷凝水导致电气线路短路造成的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七章专家系统7.1.答:(1)专家系统的定义费根鲍姆(E.A.Feigenbaum):“专家系统是一种智能的计算机程序,它运用知识和推理步骤来解决只有专家才能解决的复杂问题”专家系统是基于知识的系统,用于在某种特定的领域中运用领域专家多年积累的经验和专门知识,求解需要专家才能解决的困难问题保存和大面积推广各种专家的宝贵知识博采众长比人类专家更可靠,更灵活(2)专家系统的特点①具有专家水平的专门知识专家系统中的知识按其在问题求解中的作用可分为三个层次:数据级、知识库级和控制级数据级知识(动态数据):具体问题所提供的初始事实及在问题求解过程中所产生的中间结论、最终结论数据级知识通常存放于数据库中知识库级知识:专家的知识,这一类知识是构成专家系统的基础一个系统性能高低取决于这种知识质量和数量控制级知识(元知识):关于如何运用前两种知识的知识在问题求解中的搜索策略、推理方法②能进行有效的推理推理机构——能根据用户提供的已知事实,通过运用知识库中的知识,进行有效的推理,以实现问题的求解。
专家系统的核心是知识库和推理机③具有启发性除能利用大量专业知识外,还必须利用经验判断知识来对求解问题作出多个假设(依据某些条件选定一个假设,使推理继续进行)④能根据不确定(不精确)的知识进行推理综合利用模糊的信息和知识进行推理,得出结论⑤具有灵活性知识库与推理机相互独立,使系统易于扩充,具有较大的灵活性⑥具有透明性一般有解释机构,所以具有较好的透明性解释机构向用户解释推理过程,回答“Why?”、“How?”等问题⑦具有交互性一般都为交互式系统,具有较好的人机界面一方面它需要与领域专家或知识工程师进行对话以获取知识;另一方面它也需要不断地从用户处获得所需的已知事实并回答询问。
7.2.答:专家系统的一般结构人机接口、推理机、知识库、动态数据库、知识获取机构、解释机构专人机接口解释机构知识获取机构知识库推理机数据库用户领域专家知识工程师家系统核心知识库:主要用来存放领域专家提供的专门知识(1) 知识表达方法的选择(最多的三种表示方法是产生式规则、框架和语义网络) ① 充分表示领域知识 ② 能充分、有效地进行推理 ③ 便于对知识的组织、维护与管理 ④ 便于理解与实现(2) 知识库管理冗余和矛盾一致性和完整性安全性 推理机模拟领域专家的思维过程,控制并执行对问题的求解能根据当前已知的事实,利用知识库中的知识,按一定的推理方法和控制策略进行推理,直到得出相应的结论为止推理机包括推理方法和控制策略两部分推理方法有精确推理和不精确推理(已在推理章节介绍) 控制策略主要指推理方向控制及推理规则选择策略 推理有正向推理、反向推理和正反向混合推理推理策略一般还与搜索策略有关(已在推理章节介绍)推理机性能/构造与知识的表示方法有关,但与知识的内容无关 保证推理机与知识库的独立性,提高灵活性知识获取机构“瓶颈”,是建造和设计专家系统的关键基本任务是为专家系统获取知识,建立起健全、完善、有效的知识库,以满足求解领域问题的需要要对知识进行一致性、完整性检测 人机接口专家系统与领域专家、知识工程师、一般用户间进行交互的界面,由一组程序及相应的硬件组成,用于完成输入输出工作更新、完善、扩充知识库;推理过程中人机交互;结束时显示结果 内部表示形式与外部表示形式的转换数据库又称“黑板”、“综合数据库”或“动态数据库”,主要用于存放用户提供的初始事实、问题描述及系统运行过程中得到的中间结果、最终结果等信息数据库是推理机不可缺少的工作场地,同时由于它可记录推理过程中的各种有关信息,又为解释机构提供了回答用户咨询的依据(需相应的数据库管理程序)解释机构:回答用户提出的问题,解释系统的推理过程,使系统对用户透明7.3答:(1) 传统程序是依据某一确定的算法和数据结构来求解某一确定的问题,而专家系统是依据知识和推理来求解问题,这是专家系统与传统程序的最大区别。
传统程序= 数据结构+ 算法专家系统= 知识+ 推理(2) 传统程序把关于问题求解的知识隐含于程序中,而专家系统则将知识与运用知识的过程即推理机分离。
(使专家系统具有更大的灵活性,使系统易于修改)(3) 从处理对象来看,传统程序主要是面向数值计算和数据处理,而专家系统则面向符号处理。
传统程序处理的数据多是精确的,对数据的检索是基于模式的布尔匹配,而专家系统处理的数据和知识大多是不精确的、模糊的,知识的模式匹配也多是不精确的。
(4) 传统程序一般不具有解释功能,而专家系统一般具有解释机构,可对自己的行为作出解释。
(5) 传统程序因为是根据算法来求解问题,所以每次都能产生正确的答案,而专家系统则像人类专家那样工作,通常产生正确的答案,但有时也会产生错误的答案(这也是专家系统存在的问题之一)。
专家系统有能力从错误中吸取教训,改进对某一工作的问题求解能力。
(6) 从系统的体系结构来看,传统程序与专家系统具有不同的结构。
7.4答:可行性分析:威特曼(Watermam)从三方面研究如何选择适合专家系统开发的问题(1)什么情况下开发专家系统是可能的? (满足!)①问题的求解主要依靠经验性知识,而不需要大量运用常识性知识②存在真正的领域专家,这也是开发专家系统最重要的要求之一专家必须能够描述和解释他们用于解决领域问题的方法③一般某领域中有多个专家,他们应该对领域答案的选择和精确度有基本一致的看法④任务易,有明确的开发目标,且任务能被很好地理解(2)什么情况下开发专家系统是合理的?(之一!)①问题的求解能带来较高的经济效益②人类专家奇缺,但又十分需要,且十分昂贵③人类专家经验不断丢失④危险场合需要专门知识(3)什么情况下开发专家系统是合适的?(特征!)①本质——问题本质上必须能很自然地通过符号操作和符号结构来进行求解,且问题求解时需要使用启发式知识,需要使用经验规则才能得到答案②复杂性——问题不是太容易且较为重要③范围——问题需要有适当的范围。
选择适当的范围是专家系统的关键,一般有两个原则:一是所选任务的大小可驾驭;二是任务要有实用价值。
7.5答:专家系统的设计原则(1)专门任务领域大小(2)专家合作反复磋商,团结协作(3)原型设计从“最小系统”到“扩充式”开发(4)用户参与充实、完善知识库(5)辅助工具提高设计效率(6)知识库与推理机分离体现特征,灵活专家系统的开发步骤知识工程比软件工程更强调渐进性、扩充性(1) 问题识别阶段——知识工程师和专家确定问题的重要特点,抓住问题各主要方面的特征① 确定人员和任务② 问题识别:描述问题的特征及相应的知识结构,明确问题的类型和范围③ 确定资源:确定知识源、时间、计算设备以及经费等资源 ④ 确定目标:确定问题求解的目标(2) 概念化阶段——主要任务是揭示描述问题所需的关键概念、关系和控制机制,子任务、策略和有关问题求解的约束 ① 什么类型的数据有用,数据之间的关系如何? ② 问题求解时包括哪些过程,这些过程中有哪些约束? ③ 问题是如何划分成子问题的? ④ 信息流是什么?哪些信息是由用户提供的,哪些信息是应当导出的? ⑤ 问题求解的策略是什么?(3)形式化阶段——把概念化阶段概括出来的关键概念、子问题和信息流特征形式化地表示出来 (究竟采用什么形式,要根据问题的性质选择适当的专家系统构造工具或适当的系统框架)三个主要的因素是: 假设空间 基本的过程模型 数据 形式化阶段假设空间① 把概念描述成结构化的对象,还是处理成基本的实体?② 概念之间的因果关系或时空关系是否重要,是否应当显式地表示出来? ③ 假设空间是否有限?④ 假设空间是由预先确定的类型组成的,还是由某种过程生成的? ⑤ 是否应考虑假设的层次性?⑥ 是否有与最终假设和中间假设相关的不确定性或其它的判定性因素? ⑦ 是否考虑不同的抽象级别? 形式化阶段基本的过程模型找到可以用于产生解答的基本过程模型是形式化知识的重要一步 过程模型包括行为的和数学的模型 (如果专家使用一个简单的行为模型,对它进行分析,就能产生很多重要的概念和关系) (数学模型可以提供附加的问题求解信息,或用于检查知识库中因果关系的一致性) 形式化阶段数据的性质重新完善问题识别 概念化 形式化 实现 测试重新描述重新设计需求概念结构规则①数据是不足的、充足的还是冗余的?②数据是否有不确定性?③对数据的解释是否依赖于出现的次序?④获取数据的代价是多少?⑤数据是如何得到的?⑥数据的可靠性和精确性如何?⑦数据是一致的和完整的吗?(4)实现阶段把形式化知识变成计算机的软体,即要实现知识库、推理机、人机接口和解释系统(知识的一致性和相容性)推理机应能模拟领域专家求解问题的思维过程和控制策略必须很快地实现(实现原型系统的目的之一是检查开发早期阶段的设计是否有效)(5)测试阶段通过运行实例评价原型系统以及用于实现它的表达形式,从而发现知识库和推理机制的缺陷性能不佳的因素:①输入输出特性,即数据获取与结论表示方面存在缺陷例如,提问难于理解、含义模糊,使得存在错误或不充分的数据进入系统;结论过多或者太少,没有适当地组织和排序,或者详细的程度不适当②推理规则有错误、不一致或不完备③控制策略问题,不是按专家采用的“自然顺序”解决问题测试的主要内容:①可靠性——通过实例的求解,检查系统所得出的结论是否与已知结论一致②知识的一致性——向知识库输入一些不一致、冗余等有缺陷的知识,检查是否可检测出来检查是否会给出不应给出的答案检测获取知识的正确性(如有某些自动获取知识功能)③运行效率——知识查询及推理方面的运行效率,找出薄弱环节及求解方法与策略方面的问题④解释能力——一是检测能回答哪些问题,是否达到了要求;二是检测回答问题的质量(说服力)⑤人机交互的便利性7.6答:专家系统种类解决的问题解释根据感知数据推理情况描述诊断根据观察结果推断系统是否有故障预测推导给定情况可能产生的后果设计根据给定要求进行相应的设计规划设计动作控制控制整个系统的行为监督比较观察结果和期望结果修理执行计划来实现规定的补救措施教学诊断、调整、修改学生行为调试建议故障的补救措施(1) 解释型专家系统能根据感知数据,经过分析、推理,从而给出相应解释。
(必须能处理不完全、甚至受到干扰的信息,给出一致且正确的解释)代表性:DENDRAL(化学结构说明)、PROSPECTOR(地质解释)等(2) 诊断型专家系统能根据取得的现象、数据或事实推断出系统是否有故障,并能找出产生故障的原因,给出排除故障的方案(目前开发、应用得最多的一类)代表性:PUFF(肺功能诊断系统)、PIP(肾脏病诊断系统)、DART(计算机硬件故障诊断系统)等(3) 预测型专家系统能根据过去和现在信息(数据和经验)来推断可能发生和出现的情况(天气预报、市场预测、人口预测等)(4) 设计型专家系统能根据给定要求进行相应的设计(工程设计、电路设计、服装设计)代表性:XCON(计算机系统配置系统)、KBVLSI(VLSI电路设计专家系统)等(5) 规划型专家系统能按给定目标拟定总体规划、行动计划、运筹优化等(机器人动作控制、军事规划、城市规划等)代表性:NOAH(机器人规划系统)、SECS(帮助化学家制定有机合成规划的专家系统)、TATR(帮助空军制订攻击敌方机场计划的专家系统)等(6) 控制型专家系统能根据具体情况,控制整个系统的行为代表性:YES/MVS(帮助监控和控制MVS操作系统)(7) 监督型专家系统能完成实时的监测任务,并根据监测到的现象作出相应的分析和处理代表性:REACTOR(帮助操作人员检测和处理核反应堆事故)(8) 修理型专家系统能根据故障的特点制订纠错方案,并能实施该方案排除故障,当制订的方案失效或部分失效时,能及时采取相应的补救措施(9) 教学型专家系统能根据学生学习过程中所产生的问题进行分析、评价、找出错误原因,有针对性地确定教学内容或采取其它有效的教学手段代表性:GUIDON(讲授有关细菌感染性疾病方面的医学知识)(10) 调试型专家系统能根据相应的标准检测被测试对象存在的错误,并能从多种纠错方案中选出适用于当前情况的最佳方案,排除错误专家系统的应用领域已扩展到数学、物理、化学、医学、地质、气象、农业、法律、教育、交通运输、机械、艺术以及计算机科学本身,甚至渗透到政治、经济、军事等重大决策部门,产生了巨大的社会效益和经济效益,同时也促进了人工智能基本理论和基本技术的发展。