北京化工大学数理统计---两类错误 势函数共30页

合集下载

数理统计第4章答案资料

数理统计第4章答案资料

数理统计第四章习题答案1.为了对一元方差分析表作简化计算,对测定值玄作变换打其中b、c是常数,且bHO。

试用凡表示组内离差和组间离差,并用它们表示F的值。

解:母体子样子样平均X]] , X l2, •••, x州X2x X — X 八21,A 22,>八2旳•••• • •X 心.X":X"_ ]叫 1 %一儿=—工bg _ c) = _ 丫b% _ bc = b( Xj _ c) n i J-I n i J-I_ i ’①& r n' —y = -工Rg—c)= 一工力州-bc = b(X-c) n r-i j-1 ,l r-i ;-l— 1 - — 1 -X i =c + - V/ X =c + — y b H 0b • b */•__ _ y i _ i _S厂工竹(疋-X)~》q(c +沙-c-汀r-1 r-I DD令s;=i>庙-弼"S1-1令S£=l±(y厂亦"理J-!)2r 1 — 1 -电=b£n-r n一r—1 7T —F = — = ^ = F fS E右石S;2、有四个厂生产1.5伏的3号干电池。

现从每个工厂产品中各取一子样,测量苴寿命得到数值如下:问四个厂干电池寿命有无显著差异(Q = 5%) ?解:假设丹0 : M = “2 = “3 = “4H\:m“2血从不全为零r = 4 n x =5 n2 = 4 ® =5 n4 =6 n = 20 X = 24.52经il査表得九os (3,16) = 3.24I 如"4745<耘(3,⑹故接受即可认为四个干电池寿命无显箸差异。

3、抽查某地区三所小学五年级男学生的身髙,得数拯如下:试问该地区三所小学五年级男学生的平均身高是否有显著差异(a = 5%)? 解:假设H°:“=“2=“3H\ :丛“2 “3不全相等r = 3 n A=n2=n3=6 X = 140.9278仏(2」5) = 3・68F = 4.373 >3.68 = ^(2,15)二拒绝H()故可认为该地区三所小学五年级男生平均身髙有显著差异。

02197--概率论与数理统计(二)

02197--概率论与数理统计(二)

02197--概率论与数理统计(二)[单项选择题]1.设分别为随机变量的分布函数,为使是某一随机变量的分布函数,在下列给定的各组值中应取(A、)。

2.设是随机变量,其分布函数分别为,为使是某一随机变量的分布函数,在下列给定的各组数值中应取(C、)3.设随机变量的概率分布为且满足,则的相关系数为(A、0)4.设A、B、C为三个事件,P(AB)>0且P(C|AB)=1,则有(C、P(C)≥P (A)+P(B)-1)5.设x?,x?,··· ···,x?为正态总体N(μ,4)的一个样本,表示样本均值,则μ的置信度为1-α的置信区间为(D、)6.设总体X服从正态分布N(μ,σ2),X?,X?,··· ···,X n是来自X 的样本,则σ2的最大似然估计为( A、 )7.设是未知参数的一个估计量,若,则是的( D.有偏估计 )8.在对单个正态总体均值的假设检验中,当总体方差已知时,选用( B、u检验法)9.若X~t(n)那么χ2~(A、F(1,n))10.对于事件A,B,下列命题正确的是(D、)11.设X~N(μ,σ2),那么当σ增大时,P{|X-μ|<σ}=(C、不变)12.已知随机变量X的密度函数f(x)=(λ>0,A为常数),则概率P{λ<X<λ+a}(a>0)的值(C、与λ无关,随a的增大而增大)13.设随机事件A与B互不相容,且P(A)>0,P(B)>0,则 (D、)。

14.设 X1, X2为来自总体N(μ, 1) 的一个简单随机样本, 则下列估计量中μ的无偏估计量中最有效的是 ( A、设随机变量X的概率密度为f(x),则f(x)一定满足【C、】16.设随机变量X与Y的方差分别是25和16,协方差为8,则相关系数ρXY=【C、】17.已知随机变量与相互独立,且它们在区间[-1,3]和[2,4]上服从均匀分布,则【A、3】18.若X,Y相互独立,则下列正确的是【C、】设X~N(0,1), Y~N(μ,σ2), 则Y与X之间的关系是【A、】设A, B为随机事件, A错误!未找到引用源.B,(B、)A,B,C是任意事件,在下列各式中,不成立的是(B、(A∪B)-A=B)设随机变量且相互独立,根据切比雪夫不等式有(D、≥5/12)设A,B,C为三个事件,且A,B相互独立,则以下结论中不正确的是(D、)设离散型随机变量X和Y的联合概率分布为,若X,Y独立,则α,β的值为(A、)设总体X的数学期望为μ,X?,X?,··· ···,X n为来自X的样本,则下列结论中正确的是(A、X?是μ的无偏估计量)已知是来自总体的样本,则下列是统计量的是(B、)设X,Y是相互独立的两个随机变量,它们的分布函数分别为F x(x),F y(y),则Z = max {X,Y} 的分布函数是(C、)对于任意两个随机变量X和Y,若E(XY)=E(X)-E(Y),则(B、D(X+Y)=D(X)+D(Y) ) 设A,B为任二事件,则(D、)设Φ(x)是标准正态分布函数,则Φ(0)= 【B、】设随机变量X与Y相互独立,且P{X≤1}=1/4,P{Y≤1}=1/3,则P{X≤1,Y≤1}=【C、】设随机事件A与B互不相容,且, ,则【D、】设A和B相互独立,,,则【B、】袋中有5个白球和3个黑球,从中任取两个,则取到的两个球是白球的概率是【A、】下列关于“统计量”的描述中,不正确的是【C、统计量表达式中不含有参数】设A,B为随机事件,则下列说法正确的是【B、】设随机变量X的取值范围是[-1,1],以下函数可以作为X的概率密度的是【C、】已知随机变量X的分布函数为C、7/12设随机变量X服从参数为的指数分布,则下列各项中正确的是(D、)设二维随机变量(X, Y)的概率密度为,则常数c=(A、)将一枚硬币重复郑n次,以X和Y分别表示正面向上和反面向上的次数,则X 与Y的相关系数等于(A、-1)是来自总体X~N(0,1)的一部分样本,设:,则Z/Y~(D、F(8,8))X?,X?独立,且分布率为(i=1,2),那么下列结论正确的是(C、P{X?=X?}=1/2)下列二无函数中,( B、) 可以作为连续型随机变量的联合概率密度。

数理统计课件14-2

数理统计课件14-2

H 01 : 1 2 3 4 0 ; H 02 : 1 2 3 4 0,
H 03 : ij 0,
2 k 1 2
i 1 , 2 , , 4 ; j 1 , 2 , , 4 .
S 21 x21k 148,
k 1 2 k 1 2 2
S1 x1 j 179.7, S2 x2 j 154.8,
j 1 3 j 1 3 3
S1 xi1 243.2, S2 xi 2 239.4,
i 1 4 i 1ቤተ መጻሕፍቲ ባይዱ4
4
S3 x3 j 170.2, S4 x4 j 182.7,
S11 x11k 144,
每 格 和
S12 x12 k 145, S 22 x22 k 150,
S13 x13k 148, S23 x23k 155,
S14 x14 k 152,
k 1
k 1 2
k 1 2
S24 x24 k 148,
B2
56.2 54.1 70.9 58.2
B3
65.3 51.6 39.2 48.7
A1 A2
A3 A4
问在水平0.05下,不同燃料、不同推 进器分别对火箭射程有无显著影响?
解例1 由题设 r 4, s 3, 作假设
H 01 : 1 2 3 4 0 ; H 02 : 1 2 3 0.
j 1 k 1 j 1 k 1 4 2 j 1 k 1 4 2
i 1 k 1 4 2
i 1 k 1 4 2
i 1 k 1 4 2
i 1 k 1
所有数据总和 S 数据平方总和 SS

茆诗松《概率论与数理统计教程》(第2版)笔记和课后习题(含考研真题)详解-第1章 随机事件与概率【圣

茆诗松《概率论与数理统计教程》(第2版)笔记和课后习题(含考研真题)详解-第1章 随机事件与概率【圣

③对立事件一定是互不相容的事件,即 A∩B=∅.但互不相容的事件不一定是对立事件.
_
④A-B 可以记为 AB.
7.事件的运算性质
5 / 85
圣才电子书

(1)交换律
十万种考研考证电子书、题库视频学习平台
A∪B=B∪A,AB=BA
(2)结合律
(A∪B)∪C=A∪(B∪C)
n r 1
次所得的组合,此种重复组合总数为
r
,这里的 r 也允许大于 n.
上述四种排列组合及其总数计算公式在使用中要注意识别有序与无序、重复与不重复.
3.确定概率的频率方法 (1)确定概率的频率方法 在大量重复试验中,用频率的稳定值去获得概率的一种方法,其基本思想是: ①与考察事件 A 有关的随机现象可大量重复进行.
4.随机变量 定义:表示随机现象结果的变量,常用大写字母 X,Y,Z 表示. 注意:很多事件都用随机变量表示时,应写明随机变量的含义.在同一个随机现象中, 不同的设置可获得不同的随机变量,如何设置可按需要进行.
5.事件间的关系 假设在同一个样本空间 Ω(即同一个随机现象)中进行.事件间的关系与集合间关系
2.排列与组合公式 排列与组合都是计算“从 n 个元素中任取 r 个元素”的取法总数公式. 区别:组合公式是不讲究取出元素间的次序,否则用排列公式.而所谓讲究元素间的次 序,可以从实际问题中得以辨别,例如两个人相互握手是不讲次序的;而两个人排队是讲次 序的,因为“甲右乙左”与“乙右甲左”是两件事.
7 / 85
_
1-1-5),或用概率论的语言说“A 不发生”,即A=Ω-A.
_
图 1-1-5 A 的对立事件A
注意:
_
_
①对立事件是相互的,即 A 的对立事件是A,而A的对立事件是 A.必然事件 Ω 与不可

北方工业大学 概率论与数理统计电子课件:第四章随机变量的数字特征

北方工业大学 概率论与数理统计电子课件:第四章随机变量的数字特征

x0
0
x0
规定:使用寿命在500小时以下为废品,产值为0元;在500到1000小时
之间为次品,产值为10元;在1000到1500小时之间为二等品,产值为
30元;1500小时以上为一等品,产值为40元,求该种产品的平均产值. 分析:平均产值即为产值的数学期望,所以,先求产值的概率分布.
解:设Y表示产值,Y取值为0,10,30,40,
)
,不妨设a>0,
EY
=
yfY ( y)dy
1 y
a
y f X ( a )dy
a
y a
yy f X ( a )d ( a )
令 y z a
a zf X (z)dz=aEX
3.随机变量函数的数学期望:
定理4.1.1:设X是随机变量,Y=g(X),且E(g(X))存在,则;
(1)若X为离散型,P{X=xn}=pn,n=1,2,...,有 E( g( X )) g( xn ) pn
xf ( x)dx
b
x
1
dx
a ba
1 1 x2 b a b ba 2 a 2
数学期望反映了连续型随机变量的平均取值.
2.数学期望的性质:
(1)E(c)=c;
(2)E(aX)=aE(X);
(3)E(X+Y)=EX+EY (4) 若X与Y是独立的,则E(XY)=EXEY
证明:(2) 离散型 X
解: X的取值为0,1, 2, 3 P{X=0}=1/2
X的概率分布为 X01 2 3
P{X=1}=1/2×1/2=1/4
P 1/2 1/4 1/8 1/8
P{X=2}=1/2×1/2×1/2=1/8 (2)E[1/(X+1)]=1×1/2

北航数理统计第二次数理统计大作业 判别分析

北航数理统计第二次数理统计大作业 判别分析

数理统计大作业(二)全国各省发展程度的聚类分析及判别分析指导教师院系名称材料科学与工程院学号学生姓名2015 年 12 月21 日目录全国各省发展程度的聚类分析及判别分析 (1)摘要: (1)引言 (1)1实验方案 (2)1.1数据统计 (2)1.2聚类分析 (3)1.3判别分析 (4)2结果分析与讨论 (5)2.1聚类分析结果 (5)2.2聚类分析结果分析: (8)2.3判别分析结果 (9)2.4 Fisher判别结果分析: (11)参考文献: (16)全国各省发展程度的聚类分析及判别分析摘要:利用SPSS软件对全国31个省、直辖市、自治区(浙江、安徽、甘肃除外)的主要经济指标进行多种聚类分析,分析选择最佳聚类类数,并对浙江、湖南、甘肃进行类型判别分析。

通过这两个方法对全国各省进行发展分类。

本文选取了7项社会发展指标作为决定发展程度的影响因素,其中经济因素为主要因素,同时评估城镇化率和人口素质因素。

各项数据均来自2014年国家统计年鉴。

分析结果表明:北京市和上海市和天津市为同一类;江苏省和山东省和广东省为同一类型;河北、湖北、河南、湖南、四川、辽宁为同一类;其余的为另一类。

关键词:聚类分析、判别分析、发展引言聚类分析是根据研究对象的特征对研究对象进行分类的多元统计分析技术的总称。

它直接比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同的类。

系统聚类分析又称集群分析,是聚类分析中应用最广的一种方法,它根据样本的多指标(变量)、多个观察数据,定量地确定样品、指标之间存在的相似性或亲疏关系,并据此连结这些样品或指标,归成大小类群,构成分类树状图或冰柱图。

判别分析是根据多种因素(指标)对事物的影响来实现对事物的分类,从而对事物进行判别分类的统计方法。

判别分析适用于已经掌握了历史上分类的每一个类别的若干样品,希望根据这些历史的经验(样品),总结出分类的规律性(判别函数)来指导未来的分类。

医药数理统计习题答案解析

医药数理统计习题答案解析

第一章数据的描述和整理一、学习目的和要求1. 掌握数据的类型及特性;2.掌握定性和定量数据的整理步骤、显示方法;3.掌握描述数据分布的集中趋势、离散程度和分布形状的常用统计量;4.能理解并熟练掌握样本均值、样本方差的计算;5.了解统计图形和统计表的表示及意义;6. 了解用Excel软件进行统计作图、频数分布表与直方图生成、统计量的计算。

二、内容提要(一)数据的分类(二)常用统计量1、描述集中趋势的统计量2、描述离散程度的统计量3、描述分布形状的统计量* 在分组数据公式中,m i , f i 分别为各组的组中值和观察值出现的频数。

三、综合例题解析例1.证明:各数据观察值与其均值之差的平方和(称为离差平方和)最小,即对任意常数C ,有2211()()n ni ii i x x x C ==-≤-∑∑ 证一:设 21()()ni i f C x C ==-∑由函数极值的求法,对上式求导数,得11()2()22, ()2 n ni i i i f C x C x nC f C n =='''=--=-+=∑∑令 f '(C )=0,得唯一驻点11= ni i C x x n ==∑由于()20f x n ''=>,故当C x =时f (C )y 有最小值,其最小值为21()()ni i f x x x ==-∑。

证二:因为对任意常数C 有22222211111222212()()(2)2(2)()0nn n n nii iii i i i i i ni i xx x C x nx x C x nC nx C x nC n x Cx C n x C ======---=---+=-+-=--+=--≤∑∑∑∑∑∑故有2211()()nni ii i x x x C ==-≤-∑∑。

四、习题一解答1.在某药合成过程中,测得的转化率(%)如下:94.3 92.8 92.7 92.6 93.3 92.9 91.8 92.4 93.4 92.6 92.2 93.0 92.9 92.2 92.4 92.2 92.8 92.4 93.9 92.0 93.5 93.6 93.0 93.0 93.4 94.2 92.8 93.2 92.2 91.8 92.5 93.6 93.9 92.4 91.8 93.8 93.6 92.1 92.0 90.8 (1)取组距为0.5,最低组下限为90.5,试作出频数分布表; (2)作频数直方图和频率折线图;(3)根据频数分布表的分组数据,计算样本均值和样本标准差。

北京中石油《化工系统工程》

北京中石油《化工系统工程》

中国石油大学(北京)远程教育学院期末考试《化工系统工程》学习中心:_石家庄_姓名:_郭永亮学号: 955171 _关于课程考试违规作弊的说明1、提交文件中涉嫌抄袭内容(包括抄袭网上、书籍、报刊杂志及其他已有论文),带有明显外校标记,不符合学院要求或学生本人情况,或存在查明出处的内容或其他可疑字样者,判为抄袭,成绩为“0”。

2、两人或两人以上答题内容或用语有50%以上相同者判为雷同,成绩为“0”。

3、所提交试卷或材料没有对老师题目进行作答或提交内容与该课程要求完全不相干者,认定为“白卷”或“错卷”,成绩为“0”。

一、填空题(每空2分,共30分)1.在一个绝热封闭体系中,投入了9种已知质量的化合物,这些物质在其中发生了4个化学反应,产生了3种新化合物。

当系统稳定下来后,生成了2个液相层、1个气相,要确定系统的状态需要(2)个变量?2.一股已知条件的工艺物流(组分数为20),进入带进料阀和换热盘管的气液分离器进行气液分离,有哪些手段能够影响分离器的操作效果(调节阀开度),(调整换热判盘管温度)。

3.某设计院进行一个常规精馏塔的设计,设计师需要考虑的设计变量有(2)个。

4.过程系统节点相邻矩阵中流股汇集单元的特征是:(列有多个非零元素)。

5.某节点相邻矩阵A经过运算得到A⨯A、A⨯A⨯A两个新的矩阵,将A、A⨯A、A⨯A⨯A三个矩阵布尔相加后得到可及矩阵A*,其中元素值a25=a52=1、a27=a72=1、a57=1、a75=1,则说明:(节点3与5组成一个简单回路、节点3与7组成一个简单回路,且这两个回路构成复合回路)。

6.采用序贯模块模拟法进行流程计算时,最佳断裂流股要保证相关子系统中所有回路(被切断)。

7.由描述过程系统结构的原始索引矩阵I运用乘幂法则通过比较与替代获得了新的矩阵J=I2,其中,出现了4个相同的节点对{3-3}、{5-5}、{8-8}、{9-9},则说明:(这4个节点构成两个简单回路,但目前的信息还无法判断具体组合信息)。

概率论与数理统计学习指导书勘误表

概率论与数理统计学习指导书勘误表

第4页倒数第9行 将“……是基本事件的概率的可能性”改为“….是基本事件的概率的等可能性”第7页的第6行和第8行的公式中的“A μ”和“A μ”及“S μ”分别改为“()A μ”和“()A μ”及“()S μ”。

第10页中倒数第11行中“(3!12!)(4!4!4!4!)⨯”改为“(3!12!)(4!4!4!)⨯”第13页倒数第3行“贝叶斯公式可得”改为“由贝叶斯公式可得” 第14页第11行“概率均为…”改为“概率为…”,将例1-14中附图的数字改标为如下图的形式第15页中例1-16和第16页中例1-17中的“A μ”和“S μ”分别改为“()A μ”和“()S μ” 第16页中倒数第10行和第13行中的“()P AB ”均改为“()P AB ”第16页中最后一行中将“…生日同在各个月份…”改为“…生日在各个月份…” 第19页中第17行中的“()()()()A B A B A B A B ++++”改为 “()()()()A B A B A B A B ”第19页中倒数第9行中将“()()A B AB Ω- ”改为“()()A B S AB - ” 第20页中倒数第10行中的“(B )()AC B ”改为“(B )()AC B ” 第20页中倒数第9行中的“则()( )P AB =”改为“则()( )P AB =” 第21页第6行中将“()()P AB P AB =”改为“()()P AB P AB =” 第25页第15行中将“{}()(1),0,1,2,,kkn kk k n kn n n P k P X k C p p C p q k n --===-== ”改为“{}()(1),0,1,2,,kkn kn n P k P X k C p p k n -===-= ”第25页第19行中将“lim (),0,1,2,,!kn n P k e k n k λλ-→∞== ”改为lim ()lim (1),0,1,2,!kkk n kn n nn n n P k C p p e k k λλ--→∞→∞=-==第28页倒数第3行中将“0, 0(), 011, 1x Y g X x x x ≤⎧⎪==<≤⎨⎪>⎩”改为“0, 0(), 011, 1x y g x x x x ≤⎧⎪==<≤⎨⎪>⎩”第34页中倒数第10行中将“…第一路线较短…”改为“…第一条路线较短…”第36页第12行中将“…应选择第二条路线.”改为“…应选择第一条路线.” 第37页第9行中将“{}(1), 1,2,k P Y k p p k ==-= ”改为 “{}(1), 0,1,2,k P Y k p p k ==-= ”第40页中倒数第5行中公式中的“⨯”号改为“⋅”号第45页第8行中将“…独立性及不相关性的概念,了解这两个概念间的联系与区别,”改为“…独立性的概念,”第63页第14行中将“2231(60060), 010,150001()(20), 1020,150000, .Z z z z z f z z z ⎧-+≤<⎪⎪⎪=-≤<⎨⎪⎪⎪⎩其它”改为 “2331(60060), 010,150001()(20), 1020,150000, .Z z z z z f z z z ⎧-+≤<⎪⎪⎪=-≤<⎨⎪⎪⎪⎩其它” 第63页中倒数第4行将“}222)|y x y a +≤,如图3-7所示. 显然有(,)(,)GSf x y dxdy f x y dxdy ≤⎰⎰⎰⎰”改为“}222)|2y x y a +≤,如右图3-7.因为(,)0,,,f x y x y >-∞<<+∞显然有(,)(,)GSf x y dxdy f x y dxdy <⎰⎰⎰⎰,” 第64页第5行中将“22221x aa aedx e ---⎛⎫=-⎪⎪⎭⎰”改为“22221x aa aedx e ---⎛⎫<-⎪⎪⎭”第64页第722x aaedx --=⎰22x aaedx --<⎰第64页倒数第2行中将“220, 01,02()(,)30, X xy x dy x y f x f x y dy +∞-∞⎧⎛⎫+<<<<⎪ ⎪==⎝⎭⎨⎪⎩⎰⎰其它.” 改为“220, 01,()(,)30, X xy x dy x f x f x y dy +∞-∞⎧⎛⎫+<<⎪ ⎪==⎝⎭⎨⎪⎩⎰⎰其它.” 第67页第9行中将“…222cos 2222sin 12x y r x r Z y r ed erdr θπσσθθπσ+=--=⋅=⎰⎰”改为“…22cos 222sin12r x r zy r d erdr θπσθθπσ=-=⋅=⎰⎰”第67页第10行中将“22222220()12z r zr red e σσ--=--=-+⎰”改为“222222220()12r z zred e σσσ--=--=-+⎰”第67页第12行中将“2222'222()(1)z z Z z f z ee r σσ--=-+=”改为“2222222()(1)z z Z z f z ee σσσ--'=-+=”第67页第14行中将“2222, 0,()0, z Z z e z f z r σ-⎧⎪≥=⎨⎪⎩其他.”改为“2222, 0,()0, z Z z e z f z σσ-⎧⎪≥=⎨⎪⎩其他.”第69页倒数第4行中将“()f S ”改为“()f s ”第71页将第5行中“…关判断X 和Y 是…”改为“…并判断X 和Y 是…”第76页将第9行中“[(())][(())] (,1,2,,)ij i i j j E X E X X E X i j n σ=--= ”改为 “[(())(())] (,1,2,,)ij i i j j E X E X X E X i j n σ=--= ” 第83页将第14行中“1,X Y X Y μμσσ--==”改为“11,X Y X Y μμσσ--==”第88页倒数第5行中将“2()i i D X σ=i α(1,i =”改为“2()i i D X σ=,i α(1,i =”第89页第2行中将“22111()n n nn i i i i i i i i i D X D X ααασ===⎡⎤==⎢⎥⎣⎦∑∑∑”改为“222111()n n ni i i i i i i i i D X D X ααασ===⎡⎤==⎢⎥⎣⎦∑∑∑”第89页第4行中将“2121(,,,)nn n i i i f αααασ==∑ ”改为“22121(,,,)nn i ii f αααασ==∑ ”第89页第10行中将“2111ni iλσ==-∑”改为“2112ni iλσ==-∑”第90页第15行中将“{}11nkk n P X k ===∑∑”改为“{}11kk n P X k ∞===∑∑”第91页第5行中将“1()()1f x dx f x dx ∞-∞==⎰⎰”改为“120()()132a bf x dx ax bx c dx c ∞-∞=++=++=⎰⎰” 第92页倒数第5行中将“111{2,1}0{2}{1}428P X Y P X P =-==≠=-==⨯=”改为 “111{2,1}0{2}{1}428P X Y P X P Y =-==≠=-==⨯=” 第94页第21行中将“有奖购物问题”改为“有奖购物的应对策略”第98页第8行中将“22lim ()lim n t i x n n n X n F x P x e dt μ--∞→∞→∞⎧⎫-⎪⎪⎪=≤=⎬⎪⎪⎪⎩⎭∑⎰”改为“22lim ()lim n t i xn n n X n F x P x e dt μ--∞→∞→∞⎧⎫-⎪⎪⎪=≤=⎬⎪⎪⎪⎩⎭∑”第104页第5行中将“P X⎧=>⎨⎩”改为“P => ”第106页倒数第16行中将“计算同时用电户…”改为“同时用电户…” 第116页第1行中将“211~(0,),n n n X X N n σ++-”改为“211~(0,),n n n X X N nσ++-” 第128页倒数第9行中将“(1,)X B p -”改为“~(1,)X B p ” 第129页例7-5中将所有的“2u α”全部都改为“2z α”第133页第12行中将“12(1)(,,....,),n n x x x αα=+⋅ ”改为“12(1)(....),n n x x x αα=+⋅ ”第133页中第13行中将“1ln(,,)n x x α+ ”改为“1ln()n x x α+ ”第133页倒数第3行中将“1ˆmax{}i i nx θ≤≤=”改为“1ˆmin{}ii nx θ≤≤=” 第134页倒数第7,8,9,10行中的“1E θ∧,2E θ∧,3E θ∧,4E θ∧”分别改为“1ˆE θ,2ˆE θ,3ˆE θ,4ˆE θ” 第135页第7行中将“E θ∧,D θ∧”分别改为“ˆE θ,ˆD θ” 第135页第15行中将“⨯”号改为点乘号“⋅”第135页倒数第8行中将“12Y aX bX =+”改为“12Y aX bX =+”第135页倒数第6行中将“1EX μ=, 2EX μ=”改为“1EX μ=, μ=2X E ” 第135页倒数第4行中将“12Y aX bX =+”改为“21X b X a Y +=”第149页中将第6,7行中每个数字后的“次/min ”全部去掉第159页倒数第9行中将“此时拒绝域为”改为“此时接受域为”第163页第6行中将“问是否可以推论安装…”改为“问是否可以推断安装…” 第164页第11行中将“…有小一部分…”改为“…有一小部分…” 第178页倒数第4行中将“11n ≥”改为“171n ≥” 第179页第5行中将“(1)(D )”改为“(1)(B )” 第182页第10行中将“(5)1”改为“(5)12” 第184页倒数第10行中将“2ˆln X μ=矩”改为“2ˆln X μ=矩”。

第4讲-差分方法2

第4讲-差分方法2

例: 假设格式形式如下
u j
u a1u j 3 a2u j 1 a3u j 1 a4u j a5u j 1 a6u j 2 x j
如果要求其有5阶精度,则通过Taylor展开可得到6个方程,6个系数可直接解出。 我们要求其有4阶精度(当然3阶,2阶也可),于是Taylor展开只能提供5个方程。 6个未知数(a1-a6), 5个方程; 有1个自由参数。 调整这个自由参数,使得kr,ki 曲线最为理想。 如何调整? 1) 可以人工调整,观察kr,ki曲线,选取满意的。 2)可自动调整,设立一个优化目标函数。 例如 * : * ki ( * ) 0.05 调整自由参数,使得该目标函数取最大值。 思路:牺牲精度,提高分辨率
方法2: 数值计算
假设已有求差分的子程序(黑箱,已知是线性的) Step 1)选取计算域[0,2], 计算网格(例如64,128) Step 2)给定波数 k, 生成函数值 Step 3) 调用差分子程序,得到导数值 Step 4) 通过Fourier反变换,得到谱:
~
uj
x
线性 黑箱
v j xu j
半离散分析: 假设时间推进是精确的,仅 分析空间离散带来的误差(难度小、常用) 全离散分析: 同时分析时、空离散的误差 (难度大)
x [0,2 ], periodic
boundary
精确解: 差分格式:
f ( x, t ) eik ( x ct ) e ikct eikx
f j t c x f j 0 (1)
kr (3 4 cos cos 2 ) / 2 , ki (4 sin sin 2 ) / 2
Copyright by Li Xinliang

北京化工大学数理统计---两类错误势函数

北京化工大学数理统计---两类错误势函数
② 在①的检验中犯取伪错误的概 率 是多少?(设 的真值 为495)
③ 若同时控制犯两类错误的概率,
使 , 都小于5 %, 样本容量 n ?
解 ① 设每袋重量 X ~ N ( 500, 252 )
H0 : 500 ; H1 : 500
拒绝域
U
X 0 / n

n
0
(1

0
)

n (z1 z )0 1 0
所以 n (z1 z1 ) | 1 0 |
例6 袋装味精由自动生产线包装,每
袋标准重量 500g,标准差为25g.质检 员在同一天生产的味精中任抽 100袋 检验,平均袋重495g.
① 在显著性水平 0.05下,该 天的产品能否投放市场?
记为
x g( ) P ( W ), 0 1
犯两类错误的概率都是参数 的函数,并
可由势函数算得,即:
P xW , g( ) P x W ,
即:
g
(
)

1
( ), ( ),
H0ture H1ture
0 1
在检验均值时样本容量 n 满足如下公式:
n (z1 z1 ) /
n

(
z1
2

z1
)
/

单边检验 双边检验
其中 表示

| 0 |
由前边的计算已知
z1
z

n
0
(1 0 ) 即
n (z1 z )0 1 0
z1
z
P(接受H0 H0 伪)


P

(2021年整理)概率论与数理统计(经管类)综合试题1-5_(课程代码_4183)

(2021年整理)概率论与数理统计(经管类)综合试题1-5_(课程代码_4183)

(完整)概率论与数理统计(经管类)综合试题1-5_(课程代码_4183) 编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望((完整)概率论与数理统计(经管类)综合试题1-5_(课程代码_4183))的内容能够给您的工作和学习带来便利。

同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。

本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为(完整)概率论与数理统计(经管类)综合试题1-5_(课程代码_4183)的全部内容。

Ⅱ、综合测试题概率论与数理统计(经管类)综合试题一(课程代码 4183)一、单项选择题(本大题共10小题,每小题2分,共20分)在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内。

错选、多选或未选均无分。

1.下列选项正确的是 ( B ).A 。

AB A B +=+ B.()A B B A B +-=-C 。

(A-B )+B =A D. AB AB =2。

设()0,()0P A P B >>,则下列各式中正确的是 ( D )。

A 。

P (A -B )=P (A )-P (B ) B.P (AB )=P (A )P (B )C. P (A +B )=P (A )+P (B )D. P (A +B )=P (A )+P (B )-P (AB )3。

同时抛掷3枚硬币,则至多有1枚硬币正面向上的概率是 ( D )。

A. 18B. 16C. 14D. 124.一套五卷选集随机地放到书架上,则从左到右或从右到左卷号恰为1,2,3,4,5顺序的概率为 ( B )。

A.1120 B. 160 C. 15 D. 125。

设随机事件A ,B 满足B A ⊂,则下列选项正确的是 ( A )。

清华大学杨虎应用数理统计课后习题参考答案2课后习题答案

清华大学杨虎应用数理统计课后习题参考答案2课后习题答案

习题三1 正常情况下,某炼铁炉的铁水含碳量2(4.55,0.108)X N .现在测试了5炉铁水,其含碳量分别为4.28,4.40,4.42,4.35,4.37. 如果方差没有改变,问总体的均值有无显著变化?如果总体均值没有改变,问总体方差是否有显著变化(0.05α=)?解 由题意知 2~(4.55,0.108),5,0.05X N n α==,1/20.975 1.96u u α-==,设立统计原假设 0010:,:H H μμμμ=≠ 拒绝域为{}00K x c μ=->,临界值1/21.960.108/0.0947c u α-==⋅=,由于 0 4.364 4.550.186x c μ-=-=>,所以拒绝0H ,总体的均值有显著性变化.设立统计原假设 22220010:,:H H σσσσ=≠ 由于0μμ=,所以当0.05α=时22220.0250.97511()0.03694,(5)0.83,(5)12.83,ni i S X n μχχ==-===∑ 2210.02520.975(5)/50.166,(5)/5 2.567c c χχ====拒绝域为 {}222200201//K sc s c σσ=>< 或 由于22/ 3.167 2.567S σ=> ,所以拒绝0H ,总体的方差有显著性变化. 2 一种电子元件,要求其寿命不得低于1000h .现抽测25件,得其均值为x =950h .已知该种元件寿命2(100,)X N σ ,问这批元件是否合格(0.05α=)?解 由题意知 2(100,)X N σ ,设立统计原假设0010:,:,100.0.05.H H μμμμσα≥<==拒绝域为 {}00K x c μ=-> 临界值为0.050.0532.9c u u =⋅=⋅=-由于 050x c μ-=-<,所以拒绝0H ,元件不合格.3 某食品厂用自动装罐机装罐头食品,每罐标准重量为500g ,现从某天生产的罐头中随机抽测9罐,其重量分别为510,505,498,503,492,502,497,506,495(g ),假定罐头重量服从正态分布. 问 (1)机器工作是否正常(0.05α=)? 2)能否认为这批罐头重量的方差为5.52(0.05α=)?解 (1)设X 表示罐头的重量(单位:g). 由题意知2(,)X N μσ ,μ已知 设立统计原假设 0010:500,:H H μμμμ==≠,拒绝域 {}00K x c μ=-> 当0.05α=时,2500.89,34.5, 5.8737x s s ===临界值 12(1) 4.5149c t n α-=-⋅=,由于00.8889x c μ-=<,所以接受0H ,机器工作正常.(2)设X 表示罐头的重量(单位:g). 由题意知2(,)X N μσ ,σ已知设立统计原假设 222220010: 5.5,:H H σσσσ==≠ 拒绝域为 {}{}222200102K s c s c σσ=<> 当α=0.05时,可得2220.0250.97512500.89,34.5,(5) 2.7,(5)19.02,0.3, 2.11x s c c χχ======由于22001.0138sK σ=∈ ,所以接受0H ,可以认为方差为25.5.4 某部门对当前市场的鸡蛋价格情况进行调查,抽查某市20个集市上鸡蛋的平均售价为3.399(元/500克),标准差为0.269(元/500克).已知往年的平均售价一直稳定在 3.25(元/500克)左右, 问该市当前的鸡蛋售价是否明显高于往年?(0.05α=)解 设X 表示市场鸡蛋的价格(单位:元/克),由题意知2(,)X N μσ 设立统计原假设 0010: 3.25,:H H μμμμ==>, 拒绝域为 {}00K x c μ=->当α=0.05时,13.399,0.269,20,0.0992x n c ασμ-====⋅=临界值由于0 3.399 3.250.149.x c μ-=-=>所以拒绝0H ,当前的鸡蛋售价明显高于往年.5 已知某厂生产的维尼纶纤度2(,0.048)X N μ ,某日抽测8根纤维,其纤度分别为1.32,1.41,1.55,1.36,1.40,1.50,1.44,1.39,问这天生产的维尼纶纤度的方差2σ是否明显变大了(0.05α=)?解 由题意知 2(,0.048)X N μ ,0.05α=设立统计原假设 2222220010:0.048,:0.048H H σσσσ==>=拒绝域为{}2200K s c σ=>, 当0.05α=时,2220.950.951.4213,0.0055,(7)14.07,(7)7 2.0096x s c χχ=====由于220 2.3988s c σ=>,所以拒绝0H ,认为强度的方差明显变大.6 某种电子元件,要求平均寿命不得低于2000h ,标准差不得超过130h .现从一批该种元件中抽取25只,测得寿命均值1950h ,标准差148h s =.设元件寿命服从正态分布,试在显著水平 α=0.05下, 确定这批元件是否合格.解 设X 表示电子元件的平均寿命(单位:h ),由题意知2(,)X N μσ 设立统计原假设 0010:=2000H <H μμμμ≥,: 拒绝域为 {}00K x c μ=-<当0.05α=时,1950,148,(1)50.64x s c t n α===-=-临界值由于 050x c μ-=->,所以接受0H ,即这批电子元件的寿命是合格的. 7 设n X X X ,...,,21为来自总体(,4)X N μ 的样本,已知对统计假01:1;: 2.5H H μμ== 的拒绝域为0K {}2>=X .1)当9=n 时,求犯两类错的概率α与β;2)证明:当n →∞时,α→0,β→0.解 (1)由题意知 {}010~(,4),:1;: 2.5,2,9.X N H H K X n μμμ===>= 犯第一类错误的概率为()21 1.51(1.5)0.0668.X P X P αμ⎫=>==>==-Φ=⎪⎭犯第二类错误的概率为()2 2.50.75(0.75)1(0.75)0.2266.X P X P βμ⎫=≤==≤=-⎪⎭=Φ-=-Φ=(2)若0:1H μ=成立,则(1,4)X N}{}{00000()=11)n P H H P X c P X c nc αμμσ=≥+=-<+=-Φ否定成立 当n →∞时,0)1ncσΦ→,所以0()n n α→→∞同理 }{0010=<+=+c )/)()=0()n P X c n βμμμσΦ-→Φ-∞→∞ 8 设需要对某一正态总体,4()N μ的均值进行假设检验H 0:μ= 15,H 1:μ< 15 取检验水平α=0.05,试写出检验H 0的统计量和拒绝域.若要求当H 1中的μ=13时犯第二类错误的概率不超过β=0.05,估计所需的样本容量n .解 由题意知 (,4)X N μ ,σ已知, 设立统计原假设 01:15,:15H H μμ=< 则拒绝域为}{015K X c =-<,其中临界值0.05c μ=⋅=-犯第二类错误的概率1513130.05P X P Xβ⎛⎫⎛⎫=->==->≤⎪⎭⎝⎝即1.65)0.95Φ≥, 化简得23.311n≥≈.9 设nXXX,...,,21为来自总体X~2(,)Nμσ的样本,2σ为已知, 对假设:0011:;:H Hμμμμ==其中01μμ≠,试证明:22011212()()nαβσμμμμ--=+⋅-解(1)10>μμ当时,由题意知00110:;:;H Hμμμμμ==>犯第一,二类错误分别为,αβ,则有001(|)P X c c uααμμμ-=>+=⇒=011100(|))XP X c P uαβμμμμμ-=≤+==≤=⇒()()220 11111120010 u u u u n u u ββααβαβσμμμ------=-=+==+-(2)10μμ≤当时由题意知00110:,:H Hμμμμμ==≤,犯第一,二类错误分别为,αβ,则有00(|)P X c c uααμμμ=<+=⇒=()()01100220 1111120010 (|))XP X c P uu u u u n u uαβααβαββμμμμμσμμ-----=≥+==≥+=⇒=++==+-10设171,...,XX为总体2(0,)X Nσ样本,对假设:2201:9,: 2.905H Hσσ==的拒绝域为}{24.93K s=<. 求犯第Ⅰ类错误的概率α和犯第Ⅱ类错的概率β.解由题意知2(0,)X Nσ,222~().nsnχσ统计假设为2201:9,: 2.905H Hσσ==. 拒绝域为}{24.93K s=<则犯第一,二类错误的概率,αβ分别是()()22222221717417174497.3040.0259999171744 3.319120.48810.750.253.319 3.319s s P s P P s P s P ασβσ⎛⎫⎛⎫⨯⨯=<==<=<== ⎪ ⎪⎝⎭⎝⎭⎛⎫⨯=<==-<==-= ⎪⎝⎭11 设总体是密度函数是1,01(;)0,x x f x θθθ-<<=⎧⎨⎩其他 统计假设 01:1,:2H H θθ==.现从总体中抽取样本21,X X ,拒绝域2134ΚX X =≤⎧⎫⎨⎬⎩⎭,求:两类错误的概率,αβ解 由题意知010213:1;:2,, 2.4H H K X n X θθ⎧⎫===≤=⎨⎬⎩⎭当12121,0,11(;1) 1.~(0,1),(,)0,x x f x X U f x x θ<<⎧===⎨⎩时,其他此时 212121231431(,)0.250.75ln 0.75.4x x P X f x x dx dx X αθ≤⎛⎫=≤===+⎪⎝⎭⎰⎰当1212122,014,0,12(;2).(,)0,0,x x x x x x f x f x x θ<<<<⎧⎧===⎨⎨⎩⎩时,其他其他 此时 21212123143992(,)ln 0.75.4168x x P X f x x dx dx X βθ>⎛⎫=>===+⎪⎝⎭⎰⎰12 设总体2(,)X N μσ ,根据假设检验的基本原理,对统计假设:00110:,:()()H H μμμμμσ==>已知;0010:,:H H μμμμσ≥<(未知),试分析其拒绝域.解 由题意知 2(,)X N μσ ,当00110:,:()H H μμμμμ==>成立时()01X P X c P αμμμ=->==>=-Φ{}1100,u c u K X c ααμ--===->所以拒绝域为 }{00K X c μ=->当0010:,:H H μμμμ≥<成立时00()()X P X c P X c P αμμμμ⎛⎛⎫⎫=-<≥≥-<=<=Φ}{00,c K X c ααμμμ===-<所以拒绝域为}{00K X c μ=-<13 设总体2(,)X N μσ 根据假设检验的基本原理,对统计假设: (1)22220010:,:()H H σσσσμ=>已知;(2)22220010:,:()H H σσσσμ≤>未知试分析其拒绝域.解 由题意知 2~(,)X N μσ(1)假设统计假设为 22220010:=,:>H H σσσσ 其中μ已知 当0H 成立时,拒绝域形式为 2020=>s K c σ⎧⎫⎪⎨⎬⎪⎭⎩由 222220=(n)ns ns χσσ ,可得220=>nsP nc ασ⎧⎫⎪⎨⎬⎪⎭⎩所以 21-=()nc n αχ,由此可得拒绝域形式为2201-201=>()sK n n αχσ⎧⎫⎪⎨⎬⎪⎭⎩ (2)假设统计假设为 22220010:<,:>H H σσσσ 其中μ未知当0H 成立时,选择拒绝域为 2020=>s K c σ⎧⎫⎪⎨⎬⎪⎭⎩,由222(-1)(1)n s n χσ- 得 ()()()()222201111n s n s P n c P n c ασσ⎧⎫⎧⎫--⎪⎪⎪⎪=>-≤>-⎨⎬⎨⎬⎪⎪⎪⎪⎩⎭⎩⎭所以21(1)(1)n c n αχ--=-,由此可得拒绝域形式为2201-201=>(1)1s K n n αχσ⎧⎫⎪-⎨⎬-⎪⎭⎩14 从甲、乙两煤矿各取若干样品,得其含灰率(%)为,甲:24.3, 20.8, 23.7, 21.3,17.4, 乙:18.2, 16.9, 20.2, 16.7 .假定含灰率均服从正态分布且2212=σσ,问甲、乙两煤矿的含灰率有无显著差异 (=0.05α)?解 由题意知 2212(,),Y (,)X N N μσμσ设统计假设为 012112:=;:H H μμμμ≠ 其中12=5,=4n n 当=0.05α时1/2122.3238,(2) 2.3646w s t n n α-==+-=临界值1-12=(+2) 3.6861w c t n n s α-⋅= 拒绝域为}{0 3.6861K x y c =->=而 03.5,,.x y c H -=<接受认为没有差别15 设甲、乙两种零件彼此可以代替,但乙零件比甲零件制造简单,造价也低.经过试验获得它们的抗拉强度分别为(单位:kg/cm 2):甲:88,87,92,90,91 乙:89,89,90,84,88假定两种零件的抗拉强度都服从正态分布,且21σ =22σ.问甲种零件的抗拉强度是否比乙种的高(=0.05α)?解 由题意知 2212(,),Y (,)X N N μσμσ设统计假设为 012112:=;:H H μμμμ≠,其中12=5,=5n n 当=0.05α时122.2136,(2) 1.86,w s t n n α==+-=-临界值1-212=(+2) 2.2136w c t n n s α-⋅= 拒绝域为}{0 2.2136K x y c =->=而 1.6x y c -=<,所以接受0H ,认为甲的抗拉强度比乙的要高.16 甲、乙两车床生产同一种零件.现从这两车床产生的产品中分别抽取8个和9个,测得其外径(单位:mm )为:甲:15.0,14.5,15.2,15.5,14.8,15.1,15.2,14.8 乙:15.2,15.0,14.8,15.2,15.0,15.0,14.8,15.1,14.8假定其外径都服从正态分布,问乙车床的加工精度是否比甲车床的高(=0.05α)?解 由题意知 2212(,),Y (,)X N N μσμσ设统计假设为 2222012112:;:H H σσσσ≥<,其中12=8,=9n n 当=0.05α时 220.0955,0.0261x y s s ==,临界值 12(1,1)0.2684c F n n α=--=拒绝域为202x ys K c s ⎧⎫⎪⎪=<⎨⎬⎪⎪⎭⎩,而22 3.6588x y s F c s ==>,接受0H ,认为乙的精度高.17 要比较甲、乙两种轮胎的耐磨性,现从甲、乙两种轮胎中各取8个,各取一个组成一对,再随机选取8架飞机,将8对轮胎磨损量(单位:mg )数据列表如下:试问这两种轮胎的耐磨性有无显著差异?(=0.05α). 假定甲、乙两种轮胎的磨损量分别满足2212(,),Y (,)X N N μσμσ 且两个样本相互独立. 解 由题意知 2212(,),Y (,)X N N μσμσ设统计假设为 012112:=;:H H μμμμ≠,其中12===8n n n 当=0.05α时,令()221/211,320,102200,319.69,(1) 2.36461n ZZ i Z X Y z s z z s t n n α-==-==-==-=-∑ 拒绝域为}{0K z c =>,临界值1-2=(1)2138Z c t n s α-⋅= 而320z c =<,所以接受0H ,认为两种轮胎耐磨性无显著差异.18 设总体2212(,),Y (,)X N N μσμσ , 由两总体分别抽取样本 X :4.4,4.0,2.0,4.8 Y :6.0,1.0,3.2,0.41)能否认为12μμ= (=0.05α)? 2)能否认为2212σσ= (=0.05α)?解 (1) 由题意知 2212(,),Y (,)X N N μσμσ 设统计假设为 012112:=;:H H μμμμ≠,其中12==4=n n n令Z X Y =-,则有22111.15,()9.02331nzi z s z z n ===-=-∑, 当=0.05α时,1-2=(1) 3.1824c t n α-=,1-=(1)/ 4.78Z c t n s α-⋅= 拒绝域为}{0K z c =>,而 1.15z c =<,所以012,.H μμ=接受认为 (2) 由题意知 2212(,),Y (,)X N N μσμσ设统计假设为 2222220111:=;:H H σσσσ≠,其中12==4=n n n 其中221.5467, 6.4367x y s s ==,拒绝域为2201222>x x yy s s K c c s s ⎧⎫⎪⎪=<⎨⎬⎪⎪⎭⎩或临界值 1/21221212(1,1)0.0648,(1,1)15.4392c F n n c F n n αα-=--==--= 而22201220.2403,,.X Ys F H s σσ===接受认为19 从过去几年收集的大量记录发现,某种癌症用外科方法治疗只有2%的治愈率.一个主张化学疗法的医生认为他的非外科方法比外科方法更有效.为了用实验数据证 实他的看法,他用他的方法治疗200个癌症病人,其中有6个治好了.这个医生断 言这种样本中的3%治愈率足够证实他的看法.(1)试用假设检验方法检验这个医生的看法;(2)如果该医生实际得到了4.5%治愈率,问检验将证实化学疗法比外科方法更有效的概率是多少?解 (1) 记每个病人的治愈情况为X ,则有(1,) X B p设统计假设为 0010:=0.02;:0.02H p p H p p >≤=,其中200,0.05n α==拒绝域为}{00K x p c =-<,临界值10.0163c αμ-==而 000.01,,0.02.x p c H p -=<>拒绝不能认为(2) 不犯第二类错误的概率101 4.5%P X u p p αβ-⎧⎫⎪⎪-=>=⎨⎬⎪⎪⎭⎩由(1,) X B p ,可得 (1),p p EX p DX n-== 由中心极限定理得1 4.5%10.72X P p β⎧⎫⎪-=>=⎬⎪⎭=-Φ= 20 在某公路上,50min 之间,观察每15s 内通过的汽车数,得下表通过的汽车数量0 1 2 3 4 ≥5次数f92 68 28 11 1 0问能否认为通过的汽车辆数服从泊松分布(=0.10α)?解 设统计假设为 0010:()(),()(),200.0.10H F x F x H F x F x n α====4001ˆ,0.805.j j H X j n λν====∑若成立 记 ˆ1,2,3,4ˆ(),!j j j p P x j e j λλ-==-=则有ˆ0.8050102143243500.8050.4471,0.805*0.3599,*0.144920.8050.805*0.0389,*0.0078,10.0014,34j j p e e p p p p p p p p p p λ--=============-=∑检验统计量的值为()2522210.9500 2.1596(1)(4)9.848,~(),0.805.j j n j jnp m r np H X P ανχχχλλ-=-==<--===∑不拒绝认为且21 对某厂生产的汽缸螺栓口径进行100次抽样检验,测得100数据分组列表如下:组限10.93~10.9510.95~10.9710.97~10.9910.99~11.01频数 582034 组限 11.01~11.0311.03~11.0511.05~11.0711.07~11.09 频数1766 4试对螺栓的口径X 的分布做假设检验(=0.05α).解 设X 表示螺栓的口径,2(,)X N μσ ,分布函数为()F x ,统计假设为0010:()(),:()()H F x F x H F x F x =≠,其中100,0.05,2n r α===在0H 成立的情况下,计算得88221111ˆˆ11.0024,()0.00101888j j j j i i X x v x v μσμ====⋅==-⋅=∑∑ 由ˆ11.0024(0,1)ˆ0.00319X X N μσ--= 得0810.9311.002411.0911.00242.2689,, 2.74520.003190.00319x x --==-==所以110887()()0.0386,,()()0.0140p x x p x x =Φ-Φ==Φ-Φ=检验统计量的值为2822210.951()13.825(1)(5)11.07j j nj jv np m r np αχχχ-=-==>--==∑由此应该20,~(,).H X N μσ拒绝不能认为22 检查产品质量时,每次抽取10个产品检验,共抽取100次,得下表: 次品数0 1 2 3 4 5 6 7 8 9 10 频数 35 40 18 5 1 1 0 0 0 0 0 问次品数是否服从二项分布(=0.05α)?解 设X 表示抽取的次品数,2(,)X N μσ ,分布函数为()F x ,统计假设为0010:()(),:()()H F x F x H F x F x =≠,其中10,0.05n α==在0H 成立的情况下,01ˆNj j X pjv N N ===∑ 计算得001011922801011021033710100103101010(1),0,1,,10;ˆˆˆ(1)0.3487,(1)0.3874,(1)0.1937ˆˆ(1)0.0574,(1)10,jj N j j N p C p p j p C p p p C p p p C p p p C p p p C p p--=-==-==-==-==-==-= 检验统计量的值为0020()21022210.9505.1295(1)(9)16.92j j n j jnp m r np ανχχχ-=-==<--==∑因此0,~(10,0.1).H X B 不拒绝认为23 请71人比较A 、B 两种型号电视机的画面好坏,认为A 好的有23人,认为B 好的有45人,拿不定主意的有3人,是否可以认为B 的画面比A 的好(=0.10α)?解 设X 表示A 种型号电视机的画面要好些,Y 表示B 中型号电视机画面要好些分布函数分别为()X F x ,()Y F x ,统计假设为 01:()(),:()(),10,100.0.05X Y X Y H F x F x H F x F x N n α=≠===由题意知++=23=45,=+n n n n n --, 检验统计量 ,min()s n n +-=而23(68)25s s α=<=,所以0,.H B 拒绝认为的画面好24 为比较两车间(生产同一种产品)的产品某项指标的波动情况,各依次抽取12个产品进行测量,得下表 甲1.13 1.26 1.16 1.41 0.86 1.39 1.21 1.22 1.20 0.62 1.18 1.34 乙1.21 1.31 0.99 1.59 1.41 1.48 1.31 1.12 1.60 1.38 1.60 1.84问这两车间所生产的产品的该项指标分布是否相同(=0.05α)?解 设,X Y 分别表示甲乙两车间所生产产品的指标分布,分布函数分别()X F x ()Y F x ,统计假设为01:()(),:()(),.0.05,12,X Y X Y H F x F x H F x F x n m α=≠===检验统计量为秩和T ,易知T 的样本值为112T =且(150,300)T N 拒绝域为012K u u α-⎧⎫⎪=>⎨⎬⎪⎭⎩而0.9752.194 1.96u u =>=,所以0,.H 拒绝认为指标分布不相同25问两班组的劳动生产率是否相同(α=0.05)?解 设,X Y 分别表示两个组的劳动生产率,分布函数分别为(),X F x ()Y F x ,统计假设为01:()(),:()(),.0.05,9,9X Y X Y H F x F x H F x F x n m α=≠===检验统计量为秩和T ,易知T 的样本值为73T = 拒绝域形式为}{01212,<K T t T t t t =<> 其中而12(9,9)=66,(9,9)105t t =,因此T K ∈, 所以0,.H 接受认为劳动生产率相同26 观观察得两样本值如下:Ⅰ 2.36 3.14 7.52 3.48 2.76 5.43 6.54 7.41 Ⅱ 4.38 4.25 6.54 3.28 7.21 6.54 问这两样本是否来自同一总体(α=0.05)?解 设,X Y 分别表示Ⅰ,Ⅱ两个样本,分布函数分别是(),X F x ()Y F x ,统计假设为01:()(),:()(),.0.05,6,8,X Y X Y H F x F x H F x F x n m α=≠===检验统计量为秩和T ,易知T 的样本值为49T = 拒绝域形式为}{01212,<K T t T t t t =<> 其中而12(6,8)=32,(6,8)58t t =,因此0T K ∈, 所以0,.H 接受认为来自同一总体 27 某种动物配偶的后代按体格的属性分为三类,各类的数目是:10,53,46,按照某种遗传模型其比率之比应为:22)1(:)1(2:p p p p --,问数据与模型是否相符(05.0=α)?解 设体格的属性为样本X ,由题意知(2,1)X B p - 其密度函数为()f x ,其中22(,)(1)0,1,2xxx f x p C p p x -=-=统计假设为0010:()(),:()()H F x F x H F x F x =≠似然函数为222211(1)(1)i iii nnx x x x n nxnxi i L C pp pp C--===-=-∏∏解得最大似然统计量为 ˆ12x p=- 则 220ˆˆ 1.330.1121pp === 1ˆˆˆ2(1)0.4454p p p =-= 22ˆˆ(1)0.4424p p =-= 拒绝域为}{2201(1)K m r αχχ-=>--而 ()21022210.950ˆ0.9134(1)(9) 3.8414ˆj j n j j np m r npανχχχ-=-==<--==∑所以0,.H 不拒绝认为与模型相符28 在某地区的人口调查中发现:15729245个男人中有3497个是聋哑人.16799031个女人中有3072个是聋哑人.试检验“聋哑人与性别无关”的假设(05.0=α).解 设X 表示男人中聋哑人的个数,Y 表示女人中聋哑人的个数,其分布函数分别表示为()X F x ,()Y F x . 统计假设为01:(,)()(),:(,)()()X Y X Y H F x y F x F x H F x y F x F x =≠拒绝域为}{2201(1)K m r αχχ-=>--而21022210.950ˆ()62.64(1)(1) 3.84ˆj j n j j v np m r np αχχχ-=-==>--==∑所以0,.H 拒绝认为聋哑与性别相关 29 下表为某药治疗感冒效果的联列表:试问该药疗效是否与年龄有关(α=0.05)?解 设X 表示该药的疗效与年龄有关,Y 表示该药的疗效与年龄无关,其分布函数分别表示为(),X F x ()Y F x . 统计假设为01:(,)()(),:(,)()(),3,3,0.05,X Y X Y H F x y F x F x H F x y F x F x r s α=≠===拒绝域为}{2201(1)K m r αχχ-=>--而 ()21022210.950ˆ13.59(1)(4)9.488ˆj j n j j npm r npανχχχ-=-==>--==∑所以0,.H 拒绝认为疗效与年龄相关30 某电子仪器厂与协作的电容器厂商定,当电容器厂提供的产品批的不合格率不超过3%时以高于95%的概率接受,当不合格率超过12%时,将以低于10%的概率接受.试为验收者制订验收抽样方案.解 由题意知,010.03,0.12,0.05,0.1p p αβ====代入式子 01()1()L p L p αβ=-⎧⎨=⎩()L p选用式子()(L P X d P U φ=≤=≤≈计算求得 66,4n d ==,于是抽查方案是:抽查66件产品,如果抽得的不合格产品4X ≤,则接受这批产品,否则拒绝这批产品.31 假设一批产品的质量指标2(,)X N μσ (2σ已知),要求质量指标值越小越好.试给出检验抽样方案(,n c )的计算公式.若2σ未知,又如何确定检验抽样方案(,n c )?若质量高时指质量指标在一个区间时,又如何确定检验抽样方案(,n c )?解 (1) 解方程组01()1()L L μαμβ=-⎧⎨=⎩ 得 ()201u u n αβσμμ⎛⎫+⎪= ⎪-⎝⎭10u u c u u αβαβμμ+=+ (2) 若2σ未知,用*2M 估计2σ,从而得出公式()2*201u u M n αβμμ⎛⎫+⎪= ⎪-⎝⎭10u u c u u αβαβμμ+=+习题四1 下表数据是退火温度x (C 0)对黄铜延性η效应的试验结果,η是以延伸率计算的,且设为正态变量,求η对x 的样本线性回归方程.x (C 0)300 400 500 600 700 800 y (%)40 50 55 60 67 70解 利用回归系数的最小二估计:101ˆˆˆxyxx l l y x βββ⎧=⎪⎨⎪=-⎩其中2211,n nxy i i xx i i i l x y nxy l x nx ===-=-∑∑ 代入样本数据得到:10ˆˆ0.0589,24.6286ββ==样本线性回归方程为:ˆ24.62860.0589y x =+ 2 证明线性回归函数中(1)回归系数1β的置信水平为α-1的置信区间为11ˆˆ(2)n β-±-; (2)回归系数0β的置信水平为α-1的置信区间为0ˆ(2)n βσ-±-.证 (1) 由于211ˆ,xx N l σββ⎛⎫ ⎪⎝⎭()0,1N 222(2)E S n χσ- 又因为:,()222ˆ2(2)n n σχσ-- 故 所以()2t n - 易知 {}11ˆ1p c ββα-<=-,1P α<=-⎪⎭⎩其中()122n α--c所以1β的置信水平为α-1的置信区间为11ˆˆ(2)n β-±- (2) 由0ˆβ~2201(,())xxnx N l βσ+,得()0,1N ,()222ˆ2(2)n n σχσ-- ,0ˆβ与2ˆσ相互独立, 所以:()2T t n ==-根据11221(2)(2)P T t n P t n ααα--⎫⎪⎛⎫⎪-=<-=<- ⎪⎪⎝⎭⎪⎪⎭()()0001122ˆˆ22P n n ααβββ--⎛⎫ ⎪ ⎪=-<<- ⎪ ⎪ ⎪⎝⎭得到0β的置信度为1α-的置信区间()012ˆ2n αβ--.3 某河流溶解氧浓度(以百万分之一计)随着水向下游流动时间加长而下降.现测得8组数据如下表所示.求溶解氧浓度对流动时间的样本线性回归方程,并以α=0.05对回归显著性作检验.流动时间t (天)0.5 1.0 1.6 1.8 2.6 3.2 3.8 4.7 溶解氧浓度(百万分之一)0.28 0.29 0.29 0.18 0.17 0.18 0.10 0.12解 利用101ˆˆˆtyttl l y t βββ⎧=⎪⎨⎪=-⎩其中2211,n nty i i tt i i i l t y nty l t nt ===-=-∑∑ 代入样本数据得到: 10ˆˆ0.0472,0.3145ββ=-= 所以,样本线性回归方程为:ˆ0.31450.0472yt =- 拒绝域形式为:{}21ˆc β> ()20.95ˆ1,6,0.0058ttF c c l σ==>而21ˆ0.0022β=,所以回归模型不显著. 4 假设X 是一可控制变量,Y 是一随机变量,服从正态分布.现在不同的X 值下分别对Y 进行观测,得如下数据i x0.25 0.37 0.44 0.55 0.60 0.62 0.68 0.70 0.73 i y 2.57 2.31 2.12 1.92 1.75 1.71 1.60 1.51 1.50 i x0.75 0.82 0.84 0.87 0.88 0.90 0.95 1.00 i y1.41 1.33 1.31 1.25 1.20 1.19 1.15 1.00(1)假设X 与Y 有线性相关关系,求Y 对X 样本回归直线方程,并求2σ=DY 的无偏估计;(2)求回归系数210σββ、、的置信度为95%的置信区间; (3)检验Y 和X 之间的线性关系是否显著(=0.05α); (4)求Y 置信度为95%的预测区间;(5)为了把Y 的观测值限制在)68.1,08.1(,需把x 的值限制在什么范围?(=0.05α)解 (1) 利用101ˆˆˆxyxx l l y x βββ⎧=⎪⎨⎪=-⎩其中2211,n nxy i i xx i i i l x y nxy l x nx ===-=-∑∑计算得10ˆˆ2.0698, 3.0332ββ=-= 所以,样本线性回归方程为:ˆ 3.0332 2.0698y x =-,22ˆ0.002015ES σ==(2) 根据第二题,1β的置信区间为()112ˆˆ2n αβ-±-,代入值计算得到: ()1 2.1825, 1.9571β∈--,0β的置信区间为()02ˆ2n αβσ-±-,代入数值计算得到:()0 2.95069,3.1160β∈.(3) 根据F 检验法,其拒绝域形式为 }{201ˆK c β=>而 12ˆ(2),xxc tn l ασ-=- 显然10K β∈,所以Y 和X 之间具有显著的线性关系.(4)()221(0,(1))xxx x y N l nσ-++ ,()21()1(0,1)xxx x s x N l n -=++ 令222ˆˆ(2)((2)n n t n σχσ---则有1122ˆˆ((2),(2))y yt n yt n αα--∈--(5) 根据(4)的结论,令22ˆˆ1.68 1.08yyαα--+=-=,解得 (0.7802,0.8172)x ∈5 证明对一元线性回归系数0ˆβ,1ˆβ相互独立的充分必要条件是0=x . 证 ""⇒()()()()()010011111ˆˆˆˆˆˆcov ,E y x ββββββββββ=--=---2110111101ˆˆˆˆ()E y x y x βββββββββ=---++2211011101ˆy xE y x ββββββββ=---++ ()2211ˆx E ββ=-- 222221111ˆˆˆ()xxE D E l σββββ=+=+若要()01ˆˆcov ,0ββ=,那么0x =.反之显然也成立,命题的证.6 设n 组观测值),...,2,1)(,(n i y x i i =之间有关系式:i i i i x x y εεββ,+-+=)(10~),...,2,1)(,0(2n i N =σ(其中∑==ni i x n x 11),且n εεε,...,,21相互独立.(1) 求系数10,ββ的最小二乘估计量10ˆ,ˆββ; (2) 证明∑∑∑===-+-=-ni i ni i i ni i y y y y y y 121212)ˆ()ˆ()(,其中∑==ni i y n y 11 (3) 求10ˆ,ˆββ的分布. 解 (1) 最小化残差平方和:2201[()]Ei i S y x x ββ=---∑01ββ求,的偏导数[][]220101012()02()()0E Ei i i i i S S y x x y x x x x ββββββ∂∂=----==-----=∂∂∑∑, 01ˆˆ,xyxxl y l ββ==得到: (2) 易知()()()22221111ˆˆˆˆˆˆ()()2()nnnniiiiiii i i i i i i i y y y yy y y y yy y y y y ====-=-+-=-+-+--∑∑∑∑ 其中01ˆˆˆ()()xyi i i xxl yx x y x x l ββ=+-=+-,将其代入上式可得 1ˆˆ()()0niiii y yy y =--=∑ 所以,∑∑∑===-+-=-ni i n i i i ni iy y yy y y121212)ˆ()ˆ()( (3) 20ˆ~(0,),iN y εσβ= ,200ˆ~(,)N nσββ∴同理,易得211ˆ~(,)xxN l σββ∴7 某矿脉中13个相邻样本点处某种金属的含量Y 与样本点对原点的距离X 有如下观测值 i x 2 3 4 5 7 8 10 i y 106.42 108.20 109.58 109.50 110.00 109.93 110.49 ix 11 14 15 16 18 19 i y 110.59 110.60 110.90 110.76 111.00 111.20分别按(1)x b a y +=;(2)x b a y ln +=;(3)xba y +=. 建立Y对X 的回归方程,并用相关系数221TES S R -=指出其中哪一种相关最大.解 (1)令v y a bv ==+,根据最小二乘法得到,正规方程:101ˆˆˆvy vv l l y vβββ⎧=⎪⎨⎪=-⎩,最后得到10ˆˆ1.1947,106.3013ββ==所以:样本线性回归方程为:ˆ106.3013y=+10.8861R = (2) 令ln ,v x y a bv ==+101ˆˆˆvyvv l l y vβββ⎧=⎪⎨⎪=-⎩,得到10ˆˆ1.714,106.3147ββ==所以:样本线性回归方程为:ˆ106.3147 1.714ln y x =+,20.9367R = (3) 令1,v y a bv x==+ 101ˆˆˆvy vv l l y vβββ⎧=⎪⎨⎪=-⎩,得到10ˆˆ111.4875,9.833ββ==- 所以:样本线性回归方程为:ˆ111.48759.833yx =-,30.987R = 综上,123R R R <<,所以第三种模型所表示的X Y 与的相关性最大. 8 设线性模型⎪⎩⎪⎨⎧++=+-=+=3213221211122εββεββεβy y y其中i ε~),0(2σN (1,2,3.i =)且相互独立,试求1β、2β的LS 估计.解 令()()1231212310,,,21,(,),,,12T TT Y y y y X βββεεεε⎡⎤⎢⎥==-==⎢⎥⎢⎥⎣⎦则线性模型可转化为 Y X βε=+ 根据 222TTTTES Y X Y Y Y X X X ββββ=-=-+, 令 20ES β∂=∂可得 ()1ˆT T X X X Y β-=即 112322311ˆˆ(23),(2)66Y Y Y Y Y ββ=++=--+ 9 养猪场为估算猪的毛重,随机抽测了14头猪的身长1x (cm),肚围2x (cm)与体重y (kg),得数据如下表所示,试求一个22110x b x b b y ++=型的经验公式.解由多元线性模型得:()2140,Y X I βεεσ=+⎧⎪⎨=⎪⎩()()()0121212,,,,,,T T Tn n Y y y y ββββεεεε===()114149145581516215271159621627416971ˆ172741787918084190851929419891110395T T X X X X Y β-⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦代入数值得到:12ˆ15.93840.52230.4738yx x =-++ 同样得到:12ˆ15.93840.52230.4738yx x =-++ 10 某种商品的需求量y ,消费者的平均收入1x 和商品价格2x 的统计数据如下表所示.试求y 对1x 、2x 的线性回归方程.1i x 1000600 1200 500 300 400 1300 1100 1300 300 2i x 5 7 6 6 8 7 5 4 3 9 i y100 75 80 70 50 65 90 100 110 60解 建立回归模型201122=+++(0,)Y x x N βββεεσ 其中根据2()=0E S ββ∂∂,可求得β的LS 估计为 -1ˆ=(X X)T T X Y β代入x ,得0=111.6918,β 1=0.0143,β 2=7.1882,β-则回归方程为:12ˆ111.69180.01437.1882yx x =+- 11 设n 组观测值),...,2,1)(,(n i y x i i =之间有如下关系:i i i i i x x y εεβββ,+++=2210~),...,2,1)(,0(2n i N =σ,且n εεε,...,,21相互独立.(1)求系数21,,βββ的最小二乘估计量210ˆ,ˆ,ˆβββ; (2)设n i x x y i i i ,...,2,1,ˆˆˆˆ2210=++=βββ,∑==n i i y n y 11,证明:∑∑∑===-+-=-ni i ni i i ni i y y y y y y 121212)ˆ()ˆ()(解 (1) ()()()0121212,,,,,,T T Tn n Y y y y ββββεεεε===1222211111Tn n X x x x x x x ⎛⎫ ⎪= ⎪⎪⎝⎭()1ˆT T X X X Y β-= (2)()()()22221111ˆˆˆˆˆˆ()()2()nnnniiiiiii i i i i i i i y y y yy y y y yy y y y y ====-=-+-=-+-+--∑∑∑∑()()11ˆˆˆˆ()0nT T i i i i x x x x y yy y β-==--=∑其中:y=x ,将其代入,得到 ()22211ˆˆ()()nni i i i i i y y y yy y ==∴-=-+-∑∑ 12(1)求形如2210x b x b b y ++=的回归方程;(2)对上述回归方程的显著性作检验; (3)求当x =5.5时Y 的估计值.解 (1) 令212,x x x x ==,求得回归方程为:2ˆ 3.4167 2.72620.3905yx x =+- (2) 拒绝域形式为:{}21ˆc β> ()20.9521ˆ1,6ˆxxF c l σβ=>而,所以回归方程具有显著性 (3) 将 5.5x =代入回归方程,得到ˆ 6.5982y= 13 设y 和变量12,x x 有形为ε++=2211x b x b y ,2(0,)N εσ 的回归方程模型,试用最小二乘法求出12b b 和的估计.解 令 ()()()121212,,,,,TTTn Y y y y βββεεε===1112121222Tn n x x x X x x x ⎛⎫= ⎪⎝⎭残差平方和为 222T T T T E S Y X Y Y Y X X X ββββ=-=-+令 20E S β∂=∂,得到 112ˆ(,)()T T T X X X Y βββ-==.。

数理统计CH方差分析0000

数理统计CH方差分析0000

2020/1/20
王玉顺:数理统计06_方差分析
8
6 方差分析
(3)多个独立正态总体均值相等检验 犯第一类错误的概率
同理,a个独立正态总体均值相等假设 等价于m个均值差假设同时成立:
H0 : 1 2
H01 : 1 2 0

a

H
02
:
1

3

0

a
m


2
nj
或N


j
,
2
nj

x

1 n
a j 1
nj i 1
xij
~
N


,
2
n

其中

1 n
a
njj
j 1
推论样本均值的概率分布
2020/1/20
王玉顺:数理统计06_方差分析
24
6.1 单向分组数据方差分析
两种统计假设等价
(4)单向分组数据统计假设
j j
xij j ij j +ij

ij
~
N (0,
2)

j 1,2,
,a;i 1,2,
,nj
推论xij ~ N ( j , 2 )或xij ~ N ( j , 2)
2020/1/20
王玉顺:数理统计06_方差分析
22
j 1
j 1
j 1
2020/1/20
王玉顺:数理统计06_方差分析
23
6.1 单向分组数据方差分析
(3)单向分组数据统计模型
xij j ij j ij xij ~ N j , 2

北京化工大学2012-2013(1)高等数理统计试卷

北京化工大学2012-2013(1)高等数理统计试卷

北京化工大学2012-2013(1)《高等数理统计》试卷1. Let n X X X ,,,21 be iid random samples with pdf given by: 1)|(-=θθθx x f for 10<<x , where 0>θ is the parameter.(1) Find the method of moment estimator (MME) for θ and denote it by θ~.(2) Find the maximum likelihood estimator (MLE) of θ and denote it by 1ˆθ. Find the MLE of θ1 and denote it by 2ˆθ. (3) Calculate the Cramer-Rao Lower Bound for the variance of any unbiased estimator of θ1. (4) Is 2ˆθ unbiased estimator of θ1? If 2ˆθ is unbiased estimator of θ1, is it the uniformly minimum variance estimator (UMVUE) of θ1? Justify your answer. 2. Let n X X X ,,,21 be iid with pdf θθθ<<=x x f 0,/1)|(.(1) Prove that i n i n X X ≤≤=1)(max a complete sufficient statistics for the parameter θ.(2) Based on )(n X , find the uniformly minimum variance estimator (UMVUE) of θ.3. Let n X X X ,,,21 be a random sample form a ),(2σθn population, where θ and 2σ are unknown. We are interested in testing 00:θθ=H versus 01:θθ≠H ,here 0θ is a specified value of θ.(1) Show that the test that rejects 0H whenn S t X n /22/,10αθ->- is a test of size α, where 2/,1α-n t satisfies /2)t (/2,1αα=≥n-T P with 1~-n t T .(2) Show that the test in part (1) can be derived as a likelihood ratio test (LRT).4. Let n X X X ,,,21 be a random sample form a ),(2σθn population,2σ is known. Consider testing 1:0=θH versus 2:1=θH . Construct a uniformly most powerful (UMP) test with the size of α.。

自考04183概率论与数理统计经管类总结2数理统计部份

自考04183概率论与数理统计经管类总结2数理统计部份

高等教育自学考试辅导《概率论与数理统计(经管类)》第二部份数理统计部份专题一统计量及抽样的散布近几年试题的考点散布和分数散布最高分数分布最低分数分布平均分数分布样本的分布 2 1样本矩 2 1合计4/100 0/100 2/100一、整体与样本:所考察对象的全部称为整体;组成整体的每一个大体元素称为个体。

:从整体中随机抽取n个个体x1,x2…,x n称为整体的一个样本,个数n称为样本容量。

若是整体X的样本x1,x2…,x n知足:(1)x1与X有相同散布,i=1,2,…,n;(2)x1,x2…,x n彼此独立,那么称该样本为简单随机样本,简称样本。

取得简单随机样本的方式称为简单随机抽样方式。

(1)联合散布函数:设整体X的散布函数为F(x),x1,x2…,x n为该整体的一个样本,那么联合散布函数为二、统计量及其散布1.统计量、抽样散布:设x1,x2…,x n为取自某整体的样本,假设样本函数T=T(x1,x2…,x n)不含任何未知参数,那么称T为统计量;统计量的散布称为抽样散布。

:设x1,x2…,x n为取自某整体X的样本,(2)样本均值的性质:①若称样本的数据与样本均值的差为偏差,则样本偏差之和为零,即②偏差平方和最小,即对任意常数C,函数时取得最小值.(5)样本矩(7)正态分布的抽样分布A.应用于小样本的三种统计量的分布的为自由度为n的X2散布的α分位点.求法:反查X 2散布表.[答疑编号1]答案:D[答疑编号2]答案:[答疑编号3]答案:B [答疑编号4]答案:1 [答疑编号5]答案:B [答疑编号6]解析:故填20. [答疑编号7]答案:n解析:[答疑编号8]答案:解析:此题考核正态散布的叠加原理和x2-散布的概念。

根据课本P82,例题3-28的结果,若X~N(0,1),Y~N(0,1),且X与Y彼此独立,那么X+Y~N(0+0,1+1)=N(0,2)。

此题,已知X1、X2、X3、X4为来自整体X~N(0,1)的样本,因此X1、X2、X3、X4彼此独立且服从同散布N(0,1),那么X1+X2~N(0,2),X3+X4~N(0,2);从而,,那么以下选项中正确的选项是()[答疑编号9]答案:A解析:本题考察课本p140,4.一些重要结论。

数理统计学,应用统计学必考名词解释,简答题总结

数理统计学,应用统计学必考名词解释,简答题总结

数理统计学,应用统计学必考名词解释,简答题总结第一篇:数理统计学,应用统计学必考名词解释,简答题总结数理统计课程复习内容高淼林整理1、名词解释和简答题简单随机样本: 是指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。

统计量 : 统计理论中用来对数据进行分析、检验的变量。

抽样分布: 样本统计量的概率分布。

χ2分布: 设X1,X2,......Xn相互独立, 都服从标准正态分布N(0,1), 则称随机变量χ2=X1平方+X2平方+......+Xn平方所服从的分布为自由度为 n 的χ2分布。

t分布:设X1服从标准正态分布N(0,1),X2服从为n的χ2分布,且X1、X2相互独立,则称变量t=X1/(X2/n的结果开根号)所服从的分布为自由度为n的t分布。

F分布: 设X1服从自由度为m的χ2分布,X2服从自由度为n的χ2分布,且X1、X2相互独立,则称变量F=(X1/m)/(X2/n)所服从的分布为F分布,其中第一自由度为m,第二自由度为n点估计:又称定值估计,就是用实际样本指标数值作为总体参数的估计值区间估计: 参数估计的一种形式。

通过从总体中抽取的样本,根据一定的正确度与精确度的要求,构造出适当的区间,以作为总体的分布参数(或参数的函数)的真值所在范围的估计置信度: 特定个体对待特定命题真实性相信的程度无偏性:估计值在待估参数的真值附近摆动,对待估参数的真值无偏倚有效性:一种基于业务性能的可用性。

指完成策划的活动和达到策划结果的程度一致性: 校准曲线接近规定特性曲线时的吻合程度假设检验:据一定假设条件由样本推断总体的一种方法显著水平:估计总体参数落在某一区间内,可能犯错误的概率为显著性水第一类错误:进行统计假设检验时,错误地拒绝原假设(也称零假设)H0的错误。

第二类错误:为在进行假设检验时,原假设不正确而接受原假设的错误原假设:研究者想收集证据予以反对的假设备择假设:研究者想收集证据予以支持的假设工序能力指数:表示工序能力对设计的产品规范的保证程度。

概率论与数理统计11-2节

概率论与数理统计11-2节
(1)重复性:试验可以在相同的条件下重复进行。 (2)明确性:每次试验的可能结果不止一个,并且 能事先明确试验的所有可能结果。 (3)随机性:进行某一次试验之前,不能确定哪 个结果会发生。
概率论与数理统计11-2节
第一节 样本空间与随机事件
例如:
E1:从一付扑克牌中任取一张, 观察是哪张牌。
E2:观察在某段时间接到的电 话次数。
思考 下列式子对吗?
ABAB
正确
A B A B A B A B正确
AB
AB
AB
概率论与数理统计11-2节
7、完备事件组
如果n个事件A1,A2,…,An互不相容,并且它们
的和是必然事件,称这n个事件构成一个完备事件组。

AiAj (ij, i,j1,2 ,,n)
n
Ai
i1
即每次试验中必然发生且仅能 发生其中的一个事件
第一章 随机事件及概率
(本章共五节) 第一节 样本空间与随机事件 第二节 事件的频率与概率 第三节 古典概型与几何概型 第四节 条件概率 第五节 随机事件的独立性
概率论与数理统计11-2节
先给出随机试验的概念 对随机现象进行的实验或观察称为随机试验(简
称试验)。用字母E表示。 随机试验有下列三个特性:
解:Ω={1,2,3,4,5,6}; A={1,3,5}; B={1,2,3,4}; C={2,4}; A+B={1,2,3,4,5}; A-B={5}; AB={1,3}; AC=φ;C-A={2,4};
AB1,2,3,4,6
概率论与数理统计11-2节
例:(单项选择题)若A表示“甲产品畅销、
乙产品滞销”,则
ababbaab?baababab记号?样本空间必然事件全集?不可能事件空集?基本事件?为样本点单点集?事件子集a的对立事件a的补集a?b事件a含于事件ba是b的子集概率论集合论aa?b事件a含于事件ba是b的子集aba与b是相等事件a与b是相等集合a?ba与b的和事件a与b的并集a?ba与b的积事件a与b的交集aba与b的差事件a与b的差集a?b?a与b为互不相容事件互斥a与b是分离的本节介绍概率的五个定义

数理统计分析

数理统计分析

判别分析:1.选择analyse classify discriminant 打开判别分析的主对话框。

2.把组变量或分类变量(只能指定一个)放在grouping variable.点开define range,定义组变量的取值范围,最少有两个水平值。

把建立判别函数的变量放入自变量栏independent(必须是数值形变量)。

3.有两种建立判别模型的方法:●使用所选择的全部自变量建立判别模型(enter independent together)(默认) ●采用逐步判别方法(use stepwise methord),根据自变量对判别贡献的大小选择建立判别模型。

4.包含5个子对话框:●select 选择样本●statistics 选择描述统计量和函数系数●method 选择逐步判别分析方法●classify 定义判别分组参数和选择输出结果●save 保存新变量举例:数据见《鸢尾花练习》, 其中收集了三种鸢尾花(1刚毛鸢尾花、2变色鸢尾花和3佛吉尼亚鸢尾花),观测了三种鸢尾花的花瓣、花萼的长、宽数据,共有150个测量数据。

以前120个数据为训练样本,判别后三十个数据的所属类别。

步骤:1.数据整理:把数据导入spss2.analyse classify discriminant 。

g 放在grouping variable, define ranges 输入1、3,v1v2v3v4放入自变量栏independent。

选择enter independent together3. statistics 中选择描述统计量mean,函数系数中选择fisher’s、unstandardized。

continue4.save全选5.其他用默认值ok输出结果:表1 Analysis Case Processing Summary(数据信息)Analysis Case Processing SummaryUnweighted Cases N PercentValid 120 80.0Excluded Missing or30 20.0out-of-range groupcodesAt least one missing0 .0discriminatingvariableBoth missing or out-of-range group codes and at least one missing discriminating variable 0 .0Total30 20.0 Total 150100.0表2 Group Statistics (各组均值及标准差)g Mean Std. DeviationValid N (listwise)UnweightedWeighted1V1 50.075 3.69614040.000V2 34.450 3.727640 40.000 V3 14.575 1.8521 40 40.000 V42.475 1.1544 40 40.000 2V1 59.100 5.1331 40 40.000 V2 27.625 3.2635 40 40.000 V3 42.475 4.9458 4040.000 V413.325 2.1169 40 40.000 3V1 66.350 7.2768 40 40.000 V2 30.150 3.3554 40 40.000 V3 54.950 5.3635 40 40.000 V420.100 2.8084 40 40.000 TotalV1 58.508 8.6695 120 120.000 V2 30.742 4.4429 120 120.000 V3 37.333 17.4892 120 120.000 V411.9677.5914120120.000表3 Eigenvalues (特征值)表4 Wilks' Lambda (函数的显著性检验)表5 Standardized Canonical Discriminant Function Coefficients (标准化的典型判别函数系数)表6 Structure Matrix(变量和判别函数之间的相关矩阵)Variables ordered by absolute size of correlation within function.* Largest absolute correlation between each variable and any discriminant function 表7Functions at Group Centroids(各组判别函数值的组心)表8 Canonical Discriminant Function Coefficients(未标准化的典型函数系数)表9 Prior Probabilities for Groups(各组先验概率)表10 Classification Function Coefficients(fisher判别函数系数)表11 生成新的数据文件V1 v2 v3 v4 g dis-1 dis1-1 dis2-2 dis1-2 dis2-2 dis3-250 33 14 2 1 1 -7.34966 -.18464 1.00000 .00000 .00000 46 36 10 2 1 1 -8.41480 .76809 1.00000 .00000 .0000048 31 16 2 1 1 -6.50445 -.78297 1.00000 .00000 .0000049 36 14 1 1 1 -8.12923 .22522 1.00000 .00000 .00000 44 32 13 2 1 1 -7.02527 -.34572 1.00000 .00000 .00000 51 38 16 2 1 1 -7.91602 .76190 1.00000 .00000 .0000050 30 16 2 1 1 -6.43868 -.99622 1.00000 .00000 .0000051 38 19 4 1 1 -6.74408 1.02219 1.00000 .00000 .0000049 30 14 2 1 1 -6.76069 -.84585 1.00000 .00000 .0000050 36 14 2 1 1 -7.88268 .47350 1.00000 .00000 .00000 55 35 13 2 1 1 -8.17373 .34619 1.00000 .00000 .00000 44 30 13 2 1 1 -6.66992 -.78448 1.00000 .00000 .00000 47 32 16 2 1 1 -6.62618 -.56666 1.00000 .00000 .00000 50 32 12 2 1 1 -7.54994 -.25059 1.00000 .00000 .00000 43 30 11 1 1 1 -7.29443 -.87934 1.00000 .00000 .00000 ……63 33 60 25 . 3 7.57359 1.96633 .00000 .00000 1.00000 71 30 59 21 . 3 6.26002 .42859 .00000 .00005 .99995 63 29 58 18 . 3 5.78881 -.47429 .00000 .00089 .99911 77 26 69 23 . 3 9.12981 -.70725 .00000 .00000 1.00000 74 28 61 19 . 3 6.22047 -.64484 .00000 .00024 .99976 73 29 63 18 . 3 6.17421 -.82718 .00000 .00036 .99964 65 30 58 22 . 3 6.70924 .73210 .00000 .00001 .99999 64 27 53 19 . 3 5.44581 -.28118 .00000 .00236 .9976457 25 50 20 . 3 5.92837 -.26606 .00000 .00042 .9995858 28 51 24 . 3 6.73839 1.29931 .00000 .00000 1.00000 55 25 40 13 . 2 2.03296 -1.22157 .00000 .99931 .00069 68 28 48 14 . 2 2.58693 -.89203 .00000 .99255 .00745 57 30 42 12 . 2 1.10815 -.51717 .00000 .99994 .00006 66 29 46 13 . 2 1.84070 -.77058 .00000 .99938 .00062 55 24 37 10 . 2 .73619 -1.94645 .00000 1.00000 .00000 67 31 47 15 . 2 2.22338 .08498 .00000 .99284 .00716 56 30 41 13 . 2 1.27762 -.19831 .00000 .99983 .00017 64 29 43 13 . 2 1.38566 -.54657 .00000 .99984 .00016 61 29 47 14 . 2 2.61193 -.61742 .00000 .98848 .01152 55 23 40 13 . 2 2.38831 -1.66033 .00000 .99862 .00138 45 23 13 3 . 1 -5.17965 -2.07186 1.00000 .00000 .0000051 38 15 3 . 1 -7.80249 1.08384 1.00000 .00000 .0000052 35 15 2 . 1 -7.62793 .18355 1.00000 .00000 .00000 50 34 15 2 . 1 -7.33835 -.04197 1.00000 .00000 .00000 46 31 15 2 . 1 -6.58153 -.71240 1.00000 .00000 .0000050 35 13 3 . 1 -7.59148 .57606 1.00000 .00000 .0000051 35 14 3 . 1 -7.45845 .50241 1.00000 .00000 .0000048 34 16 2 . 1 -7.03748 -.12483 1.00000 .00000 .0000054 34 17 2 . 1 -7.18419 -.18313 1.00000 .00000 .0000053 37 15 2 . 1 -8.03922 .62538 1.00000 .00000 .00000结果说明:表1 显示基本数据信息,150个样本参加判别分析,120个是训练样本,30个时待判样本。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档