中国矿业大学周圣武概率论与数理统计
2017-2018概率论与数理统计期末试题(A)答案
第1页(共3页)中国矿业大学(北京) 2017-2018 学年 第1 学期《概率论与数理统计》试卷( A 卷)答案和评分标准一、填空题(每小题3分,共30分)1、设,A B 为两个事件,()0.4,()0.8,()0.5P A P B P AB ===,则(|)P B A =____0.75__________ 2、设随机变量X 在(3,3)-上服从均匀分布,关于t 的方程24420t Xt X +++=有实根的概率为______21_________ 3、设随机变量X 的概率密度函数为)(x f X ,则随机变量X e Y 3=的概率密度函数为=)(y f Y _____⎪⎩⎪⎨⎧+∞<<⎪⎭⎫ ⎝⎛其他,00,13ln y y y f X ___________4、如果随机变量X 在)10,0(上服从均匀分布,现在对X 进行4次独立重复观测,至少有3次观测值大于5的概率为____516__________ 5、设随机变量X 服从参数为(0)λλ>的泊松分布,且[(1)(2)]1E X X --=,则λ=______1_________6、设随机变量,X Y 相互独立,且都服从参数2θ=的指数分布,则{max{,}2}P X Y ≤=_____12(1)e --_________7、设随机变量X 的方差为2.5,由切比雪夫不等式估计概率{|()|7.5P X E X -≥≤____245_______ 8、设总体2~(,)X N μσ,12,,,n X X X 是该总体X 的一个样本,1211()n i i i c X X -+=-∑为2σ的无偏估计,则c =_______)1(21-n ___________9、设随机变量X 和Y 相互独立,且都服从正态分布2(0,3)N ,而129,,X X X 和129,,,Y Y Y 分别来自正态总体X 和Y 的简单随机样本,则统计量Y服从____)9(t ________分布10、设总体),(~2σμN X ,抽取容量16n =的样本n x x x ,,,21 ,经计算得均值,2.5=x 样本标准方差2=s ,则未知参数μ的置信度为0.95的置信区间为_____)266.6,134.4(____________二、(10分)设工厂A 和工厂B 的产品次品率分别为1%和2%.现从A 和B 的产品分别占60%和40%的一批产品中随机抽取一件,发现是次品,求该次品属于工厂A 生产的概率.解:设事件A 表示产品来自工厂A ,事件B 表示产品来自工厂B ,事件C 表示抽取到的产品是次品,则%1)|(=A C P ,%2)|(=B C P ,%60)(=A P ,%40)(=B P 5分从而73%2%40%1%60%1%60)|()()|()()|()()|(=∙+∙∙=+=B C P B P A C P A P A C P A P C A P 5分第2页(共3页)三、(12分)学生完成一道作业的时间X 是一个随机变量,单位为小时.它的概率密度函数为21,0()20,cx x x f x ⎧+≤≤⎪=⎨⎪⎩其他(1)确定常数c ;(2)写出X 的分布函数;(3)试求出在20分钟以内完成一道作业的概率.解:(1)由概率密度函数的性质()122011()248c f x dx cx x dx +∞-∞==+=+⎰⎰ 解得21c = 4分(2)由2121,0()20,x x x f x ⎧+≤≤⎪=⎨⎪⎩其他,则()2230001()()217022112xxx x F x f t dt t t dt x x x -∞⎧<⎪⎪⎪==+=+≤≤⎨⎪⎪>⎪⎩⎰⎰ 4分 (3)1117()()3354P X F ≤==4分 四、(10分)设,X Y 是两个相互独立的随机变量,其概率密度函数分别是1,01()0,X x f x ≤≤⎧=⎨⎩其他 ,0()0,y Y e y f y -⎧>=⎨⎩其他 求随机变量Z X Y =+的概率密度函数.解:由卷积公式()()()X Y X Y f z f x f z x dx +∞+-∞=-⎰3分易知仅当010x z x ≤≤⎧⎨->⎩ 即 01x x z≤≤⎧⎨<⎩时被积函数不为零 2分()01()00,0()011zz x X Y z x z f z e dx z e dx z --+--⎧<⎪⎪=≤<⎨⎪⎪≥⎩⎰⎰ 3分即0,0()101(1)1zX Y z z f z ez e e z -+-<⎧⎪=-≤<⎨⎪-≥⎩2分 五、(10分)设(Y X ,)具有概率密度为26,01,01(,),0,xy x y f x y ⎧<<<<=⎨⎩其它 (1)求边缘概率密度(),()X Y f x f y ,并判断,X Y 是否独立; (2) 求条件概率密度)(y x f YX.解:(1)1206201()(,)0X xy dy x x f x f x y dy +∞-∞⎧=<<⎪==⎨⎪⎩⎰⎰其他12206301()(,)0Y xy dx y y f y f x y dx +∞-∞⎧=<<⎪==⎨⎪⎩⎰⎰其他 显然,(,)()()X Y f x y f x f y =,所以,X Y 相互独立 6分(2)当10<<y 时,⎩⎨⎧<<==取其他值x x x y f y x f y x f Y Y X ,010,2)(),()( 4分第3页(共3页)六、(10分)设二维随机变量),(Y X 的联合概率密度函数为⎩⎨⎧<<<=其他,010,3),(x y x y x f (1)求随机变量),(Y X 的协方差cov(,)X Y ; (2)求随机变量),(Y X 的相关系数. 解:(1)⎰⎰⎰⎰⎰+∞∞-+∞∞-====103233),()(1040210dx x ydy x dx dxdy y x xyf XY E x4333),()(1030210====⎰⎰⎰⎰⎰+∞∞-+∞∞-dx x dy x dx dy y x xf dx X E x83233),()(103010====⎰⎰⎰⎰⎰+∞∞-+∞∞-dx x dy xy dx dy y x yf dx Y E x则3cov(,)=()()()160X Y E XY E X E Y -= 5分(2)5333),()(104031022====⎰⎰⎰⎰⎰+∞∞-+∞∞-dx x dy x dx dy y x f x dx X E x513),()(104021022====⎰⎰⎰⎰⎰+∞∞-+∞∞-dx x dy xy dx dy y x f y dx Y E x8034353)()()(222=⎪⎭⎫ ⎝⎛-=-=X E X E X D320198351)()()(222=⎪⎭⎫ ⎝⎛-=-=Y E Y E Y D 193)()(),(==Y D X D Y X Cov ρ 5分 七、(8分)一个复杂的系统由100个相互独立起作用的部件所组成,在整个运行期间每个部件损坏的概率为0.10,为了使整个系统起作用,至少必须84个部件正常工作,求整个系统起作用的概率.解:设X 表示正常工作的部件个数,则~(100,0.9)X B ,由棣莫弗-拉普拉斯定理,近似服从(0,1)N 分布, 4分则()()908490(84)1(84)11220.977233X P X P X P --⎛⎫≥=-<=-<≈-Φ-=Φ= ⎪⎝⎭4分八、(10分)设总体X 的概率密度函数为23,0,(,)0,.x e x f x x θθθ-⎧>⎪=⎨⎪⎩其他其中θ为未知参数且大于零,12,,,n X X X 为来自总体X 的简单随机样本,(1)求θ的矩估计量;(2)求θ的最大似然估计量.解:(1)由于22320()xxx E X xe dx e dx e d x x x θθθθθθθθ---+∞+∞+∞⎛⎫===-= ⎪⎝⎭⎰⎰⎰, 令X θ=,解得θ的矩估计量为11=ni i X X n θ==∑ 5分(2)似然函数为2311,0(1,2,,)()(,)0,.i n xni i i ii e x i n L f x x θθθθ-==⎧>=⎪==⎨⎪⎩∏∏其他当0(1,2,,)i x i n >=时,()L θ=231inx i iexθθ-=∏,两边取对数31ln ()2ln ln ni i i L x x θθθ=⎡⎤=--⎢⎥⎣⎦∑令11ln ()21210n n i i i i d L n d x x θθθθ==⎡⎤=-=-=⎢⎥⎣⎦∑∑,解得θ的最大似然估计量为12=1ni inX θ=∑ 5分第4页(共3页)。
中国矿业大学周圣武概率论与数理统计5第五章-大数定律与中心极限定理PPT课件
可知,当 n时,有
1 n
ni1
Xi
P E(X1)a
因此我们可取 n 次测量值 x1,x2, ,xn的算术平均值
5
请注意 :
Xn依概率收敛于a,意味着对任意给定的0,
当n充分大时,事件Xna的概率很大,接近于 1; 并不排除事件Xna的发生,而只是说他发生的
可能性很小 . 依概率收敛比中 高的 等普 数通 学意义下
弱些,它具有定 某性 种 . 不确
6
命题 (切比雪夫Chebyshev不等式)
设随机变量X 的数学期望 E (X )和 方 差 D ( X ) 2
n
其部分和 X i 在什么条件下以正态分布为极限 i1
分布。
3
第一节 大数定律
第五章
一、 切比雪夫Chebyshev不等式 二、几个常见的大数定律
4
定义1 设随机变量序列 X1,X2, ,Xn,如果存
在常数 a ,使得对于任意 0 有:
ln i m P{X |na|}1
则称 X n 依概率收敛于a ,记为 Xn Pa.
存在,则对任意 0, 不等式
P{|XE(X)|}D(X 2 )
或 P{|XE(X)|}1D (X 2)成立,
则称此式为切比雪夫不等式。
证明 设 X 为连续性(离散型类似),其密度为 f ( x )
7
则 P {|XE (X)|} f(x)dx |xE (X)|
|xE(X)|[xE 2(X)]2 f(x)dx
又由于各次试验相互独立,所以
X1,X2, ,Xn独立同分布, 则由辛钦大数定律可得
lim P{n| Ap|}1
n n
17
例3 如何测量某一未知的物理量a ,使得误差较小?
中国矿业大学 概率论与数理统计
(5) A, B 与C 全不发生
(A BC )
(6) A, B 与C不全发生
( ABC)
(7) A, B 与C 至少有两个发生
(ABC A BC AB C ABC )
17
例2 以A表示“甲种产品畅销,乙种产品滞销”,则为 (A) 甲滞销,乙畅销 (B) 甲乙两种产品均畅销
(C) 甲种产品畅销 (D) 甲滞销或乙畅销
;
推广:
;
15
注:事件的一些关系式
①设
,则
,
,
, ②
③
16
例1. 设A,B,C 表示三个事件, 试表示下列事件
(1) A 发生, B 与C 不发生
(AB C )
(2) A 与B 发生, C 不发生 (3) A, B 与C 都发生 (4) A, B 与C 至少有一个发生
( ABC ) ( ABC ) (A B C)
事件B包含事件A
A发生必然导致B发生 A与B相等,
记为 A=B。
11
②事件的和 称为A和B的和事件
表示A与B中至少有一个发生,即: A与B中至少有一个发生时, 发生。
12
③ห้องสมุดไป่ตู้件的积
且
A与B的积事件
表示事件A和B同时发生, 即: 当且仅当A与B同时发生时, 发生。通常简记为AB。
A B
13
④事件的差 但
二、概率的公理化定义
重点掌握利用关系式计算概率
20
一个事件在某次试验中的出现具有偶然性,但在大 量重复试验中随机事件的出现呈现一定的数量规律, 频率这一概念近似反映了这个数量规律。
一、频率
1. 定义1 设 E, S, A为E中某一事件,在相同条件进行
概率论与数理统计-中国矿业大学教务部
课程编号:0701106710PTMS《概率论与数理统计》(Probability and Statistics)课程教学大纲48学时 3学分一、课程的性质、目的及任务本课程是工科各专业的主要基础课之一,其目的在于使学生掌握处理随机现象的基本思想、基本理论和基本方法,提高学生的数学素质与科学思维能力,培养学生解决实际问题的能力。
二、适用专业工科、管理各专业三、先修课程高等数学线性代数四、课程的基本要求理解随机性、随机事件以及概率等基本概念。
理解随机变量及其分布,掌握离散型及连续型随机变量的特点,掌握正态分布、二项分布等几种常见分布。
理解随机变量的数字特征,掌握随机变量的数学期望、方差、协方差、相关系数等数字特征的基本性质和计算。
理解大数定律和中心极限定理,会利用隶莫佛一拉普拉斯定理解决有关问题。
理解样本、统计量等概念,熟悉正态总体的常见样本函数的分布定理。
掌握点估计、假设检验的基本原理与方法。
五、课程的教学内容1.概率论的基本基本概念:随机事件,事件间的关系及运算,古典概型,概率的性质。
条件概率,全概率公式与贝叶斯公式,事件的独立性。
2.随机变量及其分布:一维随机变量,分布函数,分布律,密度函数,常见分布。
3.多维随机变量及其分布:联合分布,边际分布,条件分布;随机变量的独立性,随机变量函数的分布。
4.随机变量的数字特征:数学期望,方差,协方差,相关系数,矩。
5.大数定律与中心极限定理:切比雪夫大数定律,贝努利大数定律,独立同分布的极限定理,隶莫佛—拉普拉斯极限定理。
6.抽样分布:数理统计基本思想,总体,样本统计量;样本的数字特征及其分布;抽样分布定理。
7.参数估计:矩估计,极大似然估计;估计量的评选标准;区间估计。
8.假设检验:正态总体均值的假设检验,正态总体方差的假设检验。
七、主要参考书1.周圣武,周长新,李金玉,概率论与数理统计(第二版),中国矿业大学出版社,2007。
2.盛骤,概率论与数理统计,高等教育出版社,2003。
中国矿业大学周圣武概率论与数理统计_图文
定义2 设 都是参数θ的无偏估计量,若有
则称
有效。
例:160页,例7、例8
定义3 设
为参数θ的估计量,
若对于任意θ∈Θ,当
则称
的一致估计量。
例:由大数定律知
一致性说明:对于大样本,由一次抽样得到的估 计量 的值可作θ的近似值
例5 设 X1, X2, …, Xn 是取自总体 X 的一个样本,
⑴ 验证
试求θ的极大似然估计值。 解
极大似然估计的不变性
练习
1.设总体X在
上服从均匀分布,
X1 , X 2 ,L X n是来自X的样本,试求 q 的矩估计量
和最大似然估计.
2.设X1,X2,…Xn是取自总体X的一个样本
其中 >0, 求 的极大似然估计.
课堂练习
P156:5,6
作业
P178:1,2,5,6
Fisher
最大似然法的基本思想:
问题:请推断兔子 是谁打中的?
例6 袋中放有白球和黑球共4个,今进行3次有放回 抽样,每次抽取1个,结果抽得2次白球1次黑球,试 估计袋中白球个数。 解 设袋中白球个数为m,
X为3次抽样中抽得的白球数,则
当袋中白球数m分别为1,2,3时, p对应的值分别为1/4,2/4,3/4, X对应的分布律见下表
中国矿业大学周圣武概率论与数理统计_图文 .ppt
第七章 参数估计
§7.1 点估计 §7.2 估计量的评选标准 §7.3 区间估计 §7.4 单个正态总体参数的区间估计 §7.4 两个正态总体参数的区间估计
统计推断
矩估计 点估计 最大似然估计
参数估计
最小二乘估计
区间估计
参数假设检验
假设检验 非参数假设检验
中国矿业大学(北京)《概率论与数理统计》-课件 频率与概率 ,等可能概型(古典概型)
于是 P(B A) P(B) P( A).
又因 P(B A) 0, 故 P( A) P(B).
(4) 对于任一事件 A, P( A) 1. 证明 A S P( A) P(S) 1,
故 P( A) 1. (5) 设 A 是 A的对立事件, 则 P( A) 1 P( A). 证明 因为 A A S, A A , P(S) 1,
2. 概率的主要性质 (1) 0 P(A) 1, P(S) 1, P() 0; (2) P( A) 1 P( A); (3) P( A B) P( A) P(B) P( AB); (4) 设 A, B 为两个事件,且 A B,则 P( A) P(B), P( A B) P( A) P(B).
25
处波动较小
0.50
247 0.494
2 0.2
24 0.48 251 0.502
0.4
18 0.36 26波2 动0最.52小4
0.8
27 0.54 258 0.516
从上述数据可得
(1) 频率有随机波动性,即对于同样的 n, 所得的 f 不一定相同;
(2) 抛硬币次数 n 较小时, 频率 f 的随机波动幅 度较大, 但随 n 的增大 , 频率 f 呈现出稳定性.即 当 n 逐渐增大时频率 f 总是在 0.5 附近摆动, 且 逐渐稳定于 0.5.
P( A)
k n
A 包含的基本事件数 S中基本事件的总数
.
3.计算公式推导
设试验 E 的样本空间为S={e1,e2,...,en},由于 在试验中每个基本事件发生的可能性相同, 即有
P({e1})=P({e2})=...=P({en}). 又由于基本事件是两两互不相容的, 于是
1 P(S)
中国矿业大学数学-学位授权点自我评估总结报告
附件3学位授权点自我评估总结报告学位授予单位授权学科授权级别2015 年8 月29 日编写说明一、本报告是学位授权点经过自我评估的全面总结,分为两个个部分:学位授权点基本情况和持续改进计划。
二、封面中单位代码按照《高等学校和科研机构学位与研究生管理信息标准》(国务院学位委员会办公室编,2004年3月北京大学出版社出版)中教育部《高等学校代码》(包括高等学校与科研机构)填写;学位授权点的学科名称及代码按照国务院学位委员会和教育部2011年印发的《学位授予和人才培养学科目录》填写,只有二级学科学位授权点的,授权学科名称及代码按照国务院学位委员会和原国家教育委员会1997年颁布的《授予博士、硕士学位和培养研究生的学科、专业目录》填写;同时获得博士、硕士学位授权的学科,授权级别选“博士”;只获得硕士学位授权的学科,授权级别选“硕士”。
三、本报告采取写实性描述,能用数据定量描述的,不得定性描述。
定量数据除总量外,尽可能用师均、生均或比例描述。
报告中所描述的内容和数据应确属本学位点,必须真实、准确,有据可查。
四、本报告的各项内容须是本学位点近5年来的情况,统计时间以本报告撰写时间为截止时间,往前推算5年为起始时间。
五、除特别注明的兼职导师外,本报告所涉及的师资均指目前人事关系隶属本单位的专职人员(同一人员原则上不得在不同学术学位点重复填写)。
六、本报告中所涉及的成果(论文、专著、专利、科研奖励、教学成果奖励等)应是署名本单位,且同一人员的同一成果不得在不同学术学位点重复填写。
引进人员在调入本学位点之前署名其他单位所获得的成果不填写、不统计。
七、涉及国家机密的内容一律按国家有关保密规定进行脱密处理后编写。
八、本报告正文使用四号宋体,字数不超过8000字,纸张限用A4。
一、学位授权点基本情况中国矿业大学和中国矿业大学(北京)是教育部直属重点高校、国家“211工程”和“985优势学科创新平台项目”建设高校,教育部与江苏省人民政府、国家安全生产监督管理总局共建高校。
中国矿业大学 2006数理统计考试真题
数 理 统 计时间:120分钟 2006-12-24一、简要回答下列问题(本大题共2小题,每小题6分,共12分)1.12,,,n X X X 是来自正态总体()2,N μσ的样本,其中参数μ和2σ均未知,对于参数μ的置信度为1α-的置信区间,试问当α减少时该置信区间的长度如何变化?2.基于小概率事件原理的显著性假设检验不免可能会犯两类错误:α:第一类错误 β:第二类错误(1)解释这两类错误;(2)说明α和β如何相互影响以及样本容量n 对它们的影响。
二、(12分)设12,,,n X X X 是正态总体2~(,)X N μσ的样本, 1.试问2211()nii Xμσ=-∑服从什么分布(指明自由度)?2.证明12X X +和12X X -相互独立;3.假定0μ=,求212212()()X X X X +-的分布。
三、(12分)设总体X 服从(0,1)上的均匀分布,12,,,n X X X 是来自总体X 的一个样本,最小顺序统计量(1)12min(,,,)n X X X X = , 1.求随机变量(1)X 的概率密度;2.设12,,,n Y Y Y 是来自总体(1)X 的一个样本,求样本方差2211()1ni i S Y Y n ==--∑的期望。
四、(12分)设总体X 的概率密度为.,,0,)()(其它θθ≥⎩⎨⎧=--x e x f xθ是未知参数,n X X X ,,,21 是来自X 的样本,1.求θ的矩估计量1θ∧;2.求θ的最大似然估计量2θ∧;3.1θ∧和2θ∧是不是θ的无偏估计量(说明原因)?五、(12分)假设某种产品来自甲、乙两个厂家,为考查产品性能的差异,现从甲乙两厂产品中分别抽取了8件和9件产品,测其性能指标X 得到两组数据,经对其作相应运算得2110.190,0.006,x s == 2220.238,0.008x s ==假设测定结果服从正态分布()()2~,1,2i iX i μσ=,2.求12μμ-的置信度为90%的置信区间,并从置信区间和假设检验的关系角度分析甲乙两厂生产产品的性能指标有无显著差异。
概率统计中“伽马分布”的教学研究及探讨
概率统计中“伽马分布”的教学研究及探讨作者:张艳,周圣武,韩苗,索新丽来源:《教育教学论坛》 2014年第2期张艳,周圣武,韩苗,索新丽(中国矿业大学理学院,江苏徐州221116)摘要:讨论了伽马分布的性质,给出伽马分布的三个特例及中心极限定理形式,并利用极限分布,得到n充分大时x2(n)分布和n阶爱尔朗分布的上α分位点的近似计算公式.最后,应用伽马分布给出了指数分布参数的置信区间并给出了应用实例。
关键词:伽马分布;性质;极限分布;上分位数中图分类号:O211.1 文献标志码:A 文章编号:1674-9324(2014)02-0057-02一、引言伽马分布是概率统计中一类重要的分布,它和指数分布、x2分布、爱尔朗(Erlang)分布等一些常见的重要分布都有着密切的联系。
张永利[1]通过伽马分布的可加性得到了构造卡方分布和均匀分布的方法,本文将通过对伽马分布的特征函数进行研究,从特征函数出发,推导伽马分布关于尺度参数的可加性,研究伽马分布及其三个特例的数字特征,以及强度为λ的泊松流的第n个事件出现时所需要时间长度的分布问题,应用伽马分布推导指数分布参数的区间估计形式,并给出应用实例。
定义1.1[2] 若随机变量X具有概率密度伽马分布的概率密度f(x)是单峰函数,当α>1时,f(x)在x=(α-1)/β处达到最大值,在α<1时,纵轴为f(x)的渐近线。
二、伽马分布的特例设X~祝(α,β),当α,β取某些特殊值时,伽马分布可变为一些常见的分布.(1)当α=1,β=λ时,即X~(1,λ),由祝(1)=1可知X的概率密度为表明X服从参数为λ的指数分布,可见指数分布是伽马分布的一个特例。
这也是自由度为n的x2分布随机变量的概率密度,所以X~x2(n),由此可见x2分布也是伽马分布的一个特例。
(3)当α=n,β=λ时,即祝(n,λ),由祝(n)=(n-1)!可得此分布称为参数为n和λ的爱尔朗(Erlang)分布[4]。
2011回归分析
3.指数曲线:
取对数得 ln y ln a bx 令 y ' ln y, a ' ln a
y ' a ' bx
4.倒指数曲线:
取对数得 ln y ln a b x
令 y ' ln y, a ' ln a, x ' 1 x
y ' a ' bx '
5.对数曲线:
令 x ' ln x
ˆ 2 0.0432,
t 44.0348 2.5706
=>拒绝
即认为线性回归显著
(2)F 检验
定理6 当
时,
S回 S残
检验假设
选取统计量
对给定的显著性水平
H0 的拒绝域为
F
(n 2)S回 S残
F (1, n 2)
5.回归系数的区间估计
ˆ1
~
N
1,
2
Lxx
ˆ1 1 ~ N (0,1) 2 Lxx
yˆ 33.73 0.516x
如果
与随机变量y之间存在相关关系,
——解释变量 y ——被解释变量
ε——其它随机因素的影响,通常假设 ε是不可
观测的随机误差,它是一个随机变量.
多元线性回归模型
多元线性回归方程
■一元线性回归
一元线性回归模型
y 0 1x
一元线性回归方程
通常假定
yˆ ˆ0 ˆ1x ~ N(0, 2 )
y 0.10 0.14 0.23 0.37 0.59 0.79 1.00 1.12 1.19 1.25 1.29
(1)求出经验回归曲线方程; (2)对回归曲线的显著性进行检验.
解 (1)由
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
用它的观察值 (x1,x2, ,xn) 作为θ的
近似值。
(X1,X2, ,Xn)称为θ的估计量,
(x1,x2, ,xn) 称为θ的估计值。
1.矩估计法
由英国统计学家K.皮尔逊提出.
理论依据:辛钦大数定律
设随机变量序列X1 , X2 , … 独立同分布,
Xi
ˆ 2 n 1 S 2
n
例3 设总体X ~ U ( a ,b ),a ,b 未 知 , X 1 ,X 2 ,X n
为X 的一个样本,求 a , b 的矩估计量。
aˆ X
3 n
n i1
(Xi
X)2
bˆX
3n n i1
(Xi
X)2
例4 设 X1,X2 ,Xn为X 的一个样本,求X 的数
学期望 和方差2的矩估计量。
E ( X i k ) E ( X k ) k ,i 1 ,2 , ,n
辛钦大数定律
Ak
1 n
n i1
Xik
Pk
矩估计的基本思想:令
Akk k1,2,
⑴若X为连续型随机变量,设概率密度为
f(x ,1 , ,s ), 1 , ,s 未 知
令
A1
1
A2
2
A s s
其中 X1, ,Xn 为X的样本,
X为3次抽样中抽得的白球数,则
X~b3,p, p m/ 4
当袋中白球数m分别为1,2,3时, p对应的值分别为1/4,2/4,3/4,
X对应的分布律见下表
袋中白 球数m p
抽到白球数x x=0 x=1 x=2 x=3
1
1/4
2
2/4
3
3/4
袋中白 球数m p
抽到白球数x x=0 x=1 x=2 x=3
第一节 点 估 计
一 、点估计问题的一般提法 二 、矩估计法 三 、最大似然估计法
第七章
点估计问题的提出
设 总 体 X 的 分 布 函 数 为 F(x;θ), θ 为 待 估 计 参 数 , X1,X2,…,Xn是X的样本, x1, x2,…, xn是相应样本值。
Question:如何利用这些信息估计参数θ?
Ak
1 n
n i1
X
k i
k E (X k) x kf(x ,1 , ,s)d x
解出 ˆ i g i( X 1 ,X 2 , ,X n ),i 1 ,2 , ,s
称为θ的矩估计量。
例1 设总体X 的概率密度为
(1)x, 0x1 其中 1
f(x) 0,
其它 是未知参数,
X1,X2,…,Xn是取自X 的样本,求参数α的矩估计量.
ˆ(x1, ,xn) 称为θ的最大似然估计值。
具体算法:
令
n
Lpxi,
i1
两边取对数
n
lnLlnpxi,
令
i1
dlnL 0
d
ˆg(x1, ,xn)
例7 设X1,X2,…Xn是取自总体 X~b(1, p) 的一个 样本,求参数p的最大似然估计值。
pˆ
1 n
n i1
xi
x
例8 设 X1, X2, …, Xn 是取自总体 X 的一个样本,
且具有数学期望 E (X i),i 1 ,2 ,
则对任意ε>0,有
lni m P1nin1
Xi
1
K.皮尔逊 辛钦
命题 若总体X 的 k 阶矩 E(Xk) k 存在,
X1,X2, ,Xn为X的样本,则
Ak
1 n
n i1
Xik
P k
证 X1,X2, ,Xn 独立、 同分布
X1k,X2 k, ,Xn k 独立、 同分布
axi b,
0,
others.
所以 am in (x1,x2, xn) bm ax(x1,x2, xn)
所以 L(a,b)(b 1a)n(m inb 1m axa)n
则要使得 L ( a , b ) 取最大值 am in (x1,x2, xn) bm ax(x1,x2, xn)
a ˆm in(x1,x2, xn) b ˆm ax(x1,x2, xn)
概率论与数理统计
周圣武 中国矿业大学 理学院
第七章 参数估计
§7.1 点估计 §7.2 估计量的评选标准 §7.3 区间估计 §7.4 单个正态总体参数的区间估计 §7.4 两个正态总体参数的区间估计
统计推断
矩估计
点估计 最大似然估计
参数估计
最小二乘估计
区间估计
参数假设检验 假设检验
非参数假设检验
Answer:θ的矩估计量不存在。
2.最大似然估计法
◆ 1821年,德国数学家高斯提出最大似然 估计法;
◆ 1922年,费歇重新发现了这一方法, 并研究了这种方法的统计性质 。
Gauss
Fisher
例子: 有两外形相同的箱子,各装100个球 甲箱 99个白球 1 个红球 乙箱 1 个白球 99个红球
1
1/4 27/64 27/64 9/64 1/64
2
2/4
3
3/4
袋中白 球数m p
1
1/4
2
2/4
3
3/4
抽到白球数x x=0 x=1 x=2 x=3 27/64 27/64 9/64 1/64 8/64 24/64 24/64 8/64
袋中白 球数m p
1
1/4
2
2/4
3
3/4
抽到白球数x x=0 x=1 x=2 x=3 27/64 27/64 9/64 1/64 8/64 24/64 24/64 8/64 1/64 9/64 27/64 27/64
现从两箱中任取一箱, 并从箱中任取一球, 结果所取得的球是白球.
问: 所取的球来自哪一箱?
答: 甲箱.
最大似然法的基本思想:
问题:请推断兔子 是谁打中的?
例6 袋中放有白球和黑球共4个,今进行3次有放回 抽样,每次抽取1个,结果抽得2次白球1次黑球,试 估计袋中白球个数。 解 设袋中白球个数为m,
ˆ
1 n
n i1
xi
x
ˆ 2
1 n
n i1
(xi
)2
n 1s2 n
例11 设 X1, X2, …, Xn 是取自总体 X 的一个样本,
X~U(a,b),求参数 a , b 的最大似然估计值。
解 f (x;a,b)b1a, axb, 0,, others.
似然函数
1/(ba)n, L(a,b)
e , n
i1
xi 0,
i1,2,
,n
0,
xi 0.
当L() 0时
n
lnL()nlnxi
令
i1
d ln L() 0 d
n
n i1
xi
0
所以 ˆ 1 . x
例10 设 X1, X2, …, Xn 是取自总体 X 的一个样本,
X ~N(,2),求参数 , 2 的最大似然估计值。
解
f(x;,2)
似然函数为
L(,
n
)
f(xi; ,
) e n
1n(xi) i1
i1
其中 xi,i1 ,2, ,n
当 令
xi ln,Li 1 ,12 l2,niLn1,(n x时inln0)Lnnl0n1i n1(xi )
第二个似然方程求不出θ的估计值,观察 ln L n 0 ,表明L是μ的严格递增函数,又
ˆ 1
n
n i1
Xi
X
(2)X为连续型总体 设X的概率密度为f(x,θ), θ未知,
X1,X2, ,Xn为X 的样本,x1,x2, ,xn 为样本值,
则 X1,,Xn 的联合密度为
L()L(x1, ,xn;ˆ)n f ( xi ; ) i 1
称为似然函数
求 ˆ , 使 L (x 1 , ,x n ;ˆ) m a x L (x 1 , ,x n ;)
xi,i1 ,2, ,n,故 m in{x1, ,xn}
当 m in{x1, ,xn}时L 取到最大值
从而参数θ和μ的最大似然估计值分别为
ˆm in{x1, ,xn}
ˆ1 ni n1(xiˆ)xm in{x1, ,xn}
所以参数θ和μ的最大似然估计量分别为
ˆm in {X 1, ,X n} ˆXm in {X 1, ,X n}
A1x11611
27
4
1 E ( X ) 1 2 3 ( 1 2 ) 3 3
令 A1 1,
3 3 7
4
θ的矩估计值为 ˆ 5 12
Question: 设X的概率密度为
fx ; 1 2x2, 0 , x
设 X1, X2,…,Xn为X的样本,求参数θ的矩估计量。
1 e(x2 2)2,x
2
n
L( , 2)
1 e(x2i 2)2
i1 2
ln L (, 2 ) n 2 ln 2 n 2 ln2 2 1 2i n 1 (x i)2
令
lnL
1
2
[n
n i1
xi
]
0
lnL
2
2n2
1
24
n
(xi
i1
)2
0
所以 , 2 的最大似然估计值为
例13 设总体X的分布律为 X 1 2 pk
其中参数 0 未知,现有一组样本值
3
12
1, 1, 1, 3, 2, 1, 3, 2, 2, 1, 2, 2, 3, 1, 1, 2
试求θ的极大似然估计值。
解
n