勤径考研智轩考研数学红宝书2010版--概率论与数理统计(第六章 数理统计的基本概念)
概率论与数理统计 第6章 数理统计基础
【质量控制问题】
某食盐厂用包装机包装的食盐,每袋重量500g, 通常在包装机正常的情况下,袋装食盐的重量X服 从正态分布,均值为500g,标准差为25g.为进行 生产质量控制,他们每天从当天的产品中随机抽 出 30 袋进行严格称重,以检验包装机工作是否正 常.某日,该厂随机抽取30袋盐的重量分别为:
475 500 485 454 504 439 492 501 463 461
464 494 512 451 434 511 513 490 521 514
从这些数据看,包装机的工作正常吗?
449 467 499 484 508 478 479 499 529 480
第6章 数理统计基础
6.1 总体和样本
【数理统计简史】
社会统计学派始于 19 世纪末,首创人物是德国 的克尼斯(K. G. A. Knies),他认为统计学是一 个社会科学,是研究社会现象变动原因和规律性 的实质性科学.各国专家学者在社会经济统计指 标的设定与计算、指数的编制、统计调查的组织 和实施、经济社会发展评价和预测等方面取得了 一系列的重要成果.德国统计学家恩格尔 (C.L.E.Engel,1821-1896)提出的“恩格尔”系 数,美国经济学家库兹涅茨和英国经济学家斯通 等人研究的国民收入和国内生产总值的核算方法 等,都是伟大的贡献.
则X1,X2,X3,X4的联合概率密度为:
f ( x1 , x2 , x3 , x4 ) f ( x1 ) f ( x2 ) f ( x3 ) f ( x4 )
2 xi 16e i 1 , xi 0, i 1,2,3,4 其它 0,
4
6.1.2 样本与抽样
6.1.2 样本与抽样
【例 6.1】设总体 X服从均值为 1/2 的指数分布, X1, X2,X3,X4为来自X的样本,求X1,X2,X3,X4的 联合概率密度和联合分布函数.
概率论与数理统计第6章(公共数学版)
Xi
1 n (X1
X2
Xn)
S 2
1 n
n i 1
(Xi
X )2
显然
S 2
1 n
n
[
X
2 i
i 1
2Xi
X
(X )2]
1n [
n i1
X
2 i
2X
n i 1
Xi
n( X )2 ]
1 n
n i 1
X
2 i
2X
X
(X )2
S 2
1 n
n i 1
X
2 i
(X )2
16
样本均方差
样本标准差
4
Yi 2
i 1
4
Yi
2
i1 4
4
Yi
2
4
i1 2
32
T 4( X 2) 4 Yi 2 i 1
X 2
4
Yi
2
i1 4
X 2
~ t(4),
4
Yi
2
4
i1 2
即 T 服从自由度为 4 的 t 分布: T ~ t(4). 由 P{| T | t0 } 0.01.
t0 t0.995 (4) 4.6041.
设( X1, X2,, Xn )为来自总体X的一个样本
则( X1, X2,, Xn )为一个随机向量 X为一个随机变量 X1, X2,, Xn相互独立,且具有和总体X同样的分布
样本的同分布性和相互独立性
11
三、统计量 对所研究的对象收集了有关样本的数据
后,还要对数据进行加工和提炼,将样本的有关 信息,利用数学的工具进行加工.
S
S2
(精选)概率与数理统计第六章
常用的统计量的分布为:N (0,1), t 分 布 , 2 分 布 , F 分 布 3)确定拒绝域: 根据小概率原理确定拒绝原假设的区域.
即确定满足 P (拒 绝 H 0|H 0 为 真 )拒绝域W.
4)作出统计推断:计算检验统计量的观测值. 若检验统计量的值落入拒绝域,则拒绝原假设 若检验统计量的值未落入拒绝域,则接受原假设
(2)在原假设 H 0 为真的前提下,确定统计量
UX X30390~N(0,1)
n
25
(3)确定拒绝域 W{Uu0.05}{U1.645}
6.2.2 单个正态总体方差的假设检验
6.1 假设检验的基本概念
例 用某种动物作试验材料,要求动物的平均体重 100g,若 100g 需要再饲养;若 100g则应淘汰.又知动物体重服从正态分布,且由 以往经验知 1.5g ,现从一批待试验的动物中,随机抽取8只,称 得体重(g)为:99.3 98.9 101.5 101.0 99.6 98.7 102.2 100.8
所以
X
~
N
(0,1)
n
6.2.1 单个正态总体均值的假设检验
y 对于给定的显著性水平 ,确定拒绝域W
① H 0 : 0 , H 1 : 0
W{|U|u}
2
2
u
y
2
2
u
2
x
② H 0 : 0 , H 1 : 0
W{Uu}
③ H 0 : 0 , H 1 : 0
W{Uu}
x y
x
6.2.1 单个正态总体均值的假设检验
H0:0100, H1:100
在原假设为真时选统计量
概率论与数理统计第6章
第六章6.4 在例6.2.3 中, 设每箱装n 瓶洗净剂. 若想要n 瓶灌装量的平均阻值与标定值相差不超 过0.3毫升的概率近似为95%, 请问n 至少应该等于多少? 解:因为1)3.0(2)/3.0|/(|)3.0|(|-Φ≈<-=<-n nnX P X P σσμμ依题意有,95.01)3.0(2=-Φn ,即)96.1(975.0)3.0(Φ==Φn于是 96.13.0=n ,解之得 7.42=n 所以n 应至少等于43.6.5 假设某种类型的电阻器的阻值服从均值 μ=200 欧姆, 标准差σ=10 欧姆的分布, 在一个电子线路中使用了25个这样的电阻.(1) 求这25个电阻平均阻值落在199 到202 欧姆之间的概率; (2) 求这25个电阻总阻值不超过5100 欧姆的概率. 解:由抽样分布定理,知nX /σμ-近似服从标准正态分布N (0,1),因此(1) )25/10200199()25/10200202()202199(-Φ--Φ≈≤≤X P)5.0(1)1()5.0()1(Φ+-Φ=-Φ-Φ=5328.06915.018413.0=+-= (2) )204()255100()5100(≤=≤=≤X P X P X n P 9772.0)2()25/10200204(=Φ=-Φ≈6。
8 设总体X ~N (150,252), 现在从中抽取样本大小为25的样本, {140147.5}P X ≤≤。
解: 已知150=μ,25=σ,25=n ,)25/25150140()25/251505.147()5.147140(-Φ--Φ≈≤≤X P)5.0()2()2()5.0(Φ-Φ=-Φ--Φ= 2857.09615.09772.0=-=第六章《样本与统计量》定理、公式、公理小结及补充:。
概率论与数理统计第六章总结
概率论与数理统计第六章总结概率论与数理统计是数理学科中的重要分支,其应用广泛,涉及到许多领域,如工程、物理、自然科学、医学、经济学等等。
第六章主要讲述了离散型随机变量的概率分布、期望值、方差及其应用。
首先我们了解到离散型随机变量是指取值有限或者可以无限但是可以和自然数一一对应的随机变量,即不连续的随机变量。
其中概率分布的概念是很重要的,它告诉我们每种随机变量取值的可能性大小,从而可以计算一些重要的数值。
比如期望值,期望值是随机变量取值的平均值,它可以用概率分布函数计算得到。
期望值可以给我们一个随机变量所处于某个状态的平均位置,或者它对某个事件发生的平均贡献。
方差也是一个非常重要的概念,它是随机变量值与其期望值之差的平方的期望值。
方差表示了随机变量的分布范围,也就是它们取值的变化程度。
方差越大,代表随机变量距离其期望值越远,该随机变量取值的范围也相应较大。
求期望值和方差的过程中有一些公式会显著提高计算效率,比如线性变换的公式、缩放变换的公式、Chebyshev不等式等等。
这些公式的应用有助于简化计算,并且能帮助我们更容易地理解问题。
我们还讨论了一些常见离散型随机变量的概率分布,比如伯努利分布、二项分布、泊松分布等等。
这些分布的出现在实际问题中都有着很重要的意义,比如伯努利分布描述了实验只有两种可能结果的概率分布,比如是/否、头/尾等等。
而二项分布则描述了实验中成功的概率和试验次数的关系,给我们解决实际问题提供了基础。
除了离散型随机变量,我们还可以研究连续型随机变量的概率分布以及相应的数学理论。
这些知识在实际应用中也具有重要意义。
比如在统计财务账目时,需要研究一些连续型随机变量的概率分布,以便预测下一期客户付款时间的分布情况。
又比如在流量预测中,需要研究一些连续型随机变量的概率分布,以便预测某个时间段内的网络流量。
总之,离散型随机变量理论是概率论的核心内容,对于理解整个概率论课程和进行实际应用都有着重要的意义。
概率论与数理统计第六章总结
概率论与数理统计第六章总结一、概述在概率论与数理统计的第六章中,主要介绍了随机变量的概率分布以及常见的概率分布模型。
本章内容是概率论与数理统计的重点和难点之一,对于理解和应用概率统计的基本理论和方法具有重要意义。
二、随机变量的概率分布1. 随机变量及其概率分布的概念•随机变量是对随机试验结果的数值化描述,它的取值不仅依赖于随机试验的结果,还受到机会因素的影响。
•概率分布描述了随机变量可能取值的概率大小。
常用的概率分布有离散型和连续型两种。
2. 离散型随机变量及其概率分布•离散型随机变量的取值是有限或可列的,它的概率分布可以用概率质量函数来描述。
•常见的离散型随机变量包括伯努利随机变量、二项分布、泊松分布等。
3. 连续型随机变量及其概率分布•连续型随机变量的取值是无限的,它的概率分布可以用概率密度函数来描述。
•常见的连续型随机变量包括均匀分布、正态分布等。
三、常见概率分布模型1. 二项分布•二项分布是指在 n 重伯努利试验中,成功的次数服从的概率分布。
其概率质量函数为二项式系数与成功概率的乘积。
•二项分布在实际应用中常用于描述成功次数的分布情况,如抽样调查中的样本中某一特征出现的次数。
2. 泊松分布•泊松分布是定义在非负整数集上的概率分布,它描述了在一段时间或空间内事件发生的次数。
其概率质量函数为事件发生率与时间(或空间)长度的乘积。
•泊松分布常用于描述罕见事件发生的次数,如单位时间内电话呼叫次数、一段时间内事故发生次数等。
3. 正态分布•正态分布是最重要的连续型概率分布模型之一,也称为高斯分布。
它的概率密度函数呈钟形曲线,对称于均值。
•正态分布在实际应用中广泛存在,如身高体重、测量误差、考试成绩等符合正态分布的情况较多。
4. 指数分布•指数分布是定义在非负实数集上的连续型概率分布,它描述了连续时间间隔或空间间隔内事件发生的情况。
其概率密度函数呈指数下降曲线。
•指数分布在实际应用中常用于描述无记忆性随机事件的发生情况,如设备失效时间、极端天气事件的间隔等。
第六章 数理统计的基本概念
第六章 数理统计的基本概念【数学1,3】数理统计是以概率论为理论基础,根据试验或观察得到的数据,来研究随机现象,对研究对象的客观规律性作出种种合理的估计和判断。
概率论中研究的随机变量分布都是假设已知的,进而研究随机变量的性质、特点和规律,而数理统计中研究的随机变量分布是未知或不完全知道的,人们是通过对所研究的随机变量进行重复独立的观察,得到许多观察值,对这些数据进行分析,从而推断随机变量的分布。
一、总体和样本如检测产品的某一项数量指标(如研究100瓦灯泡的寿命)。
需要检测的全体产品称为总体(如60000个100瓦的灯泡,也可以是无限个),记为X ,总体中的每一元素称为样品或个体(如一个100瓦灯泡)。
我们没有必要把全部60000个灯泡都测试,所以,需要从总体(60000个灯泡)中随机抽取n 个样品(如取50个灯泡)组成样本,称为抽样,n 称为样本容量,由于抽取的50各灯泡相对于60000个灯泡很小,故放回与不放回抽样的区别可以忽略,则样本能够看成是n 个相互独立且分布相同的随机变量( 以后简称 “独立同” ),记为()1250, ,, X X X L ,即50维随机变量,称为简单随即样本。
显然,测试前,()1250, ,, X X X L 就是一个50维随机变量,测试完成后,()1250, ,, X X X L 就对应有一组具体值()1250, ,, x x x L ,称为样本观察值,即样本值。
注意()1250, ,, X X X L 是一次所选择的需要测试的灯泡,是随机抽取的,对应于每一次的()1250, ,, X X X L ,而测试样本值()1250, ,, x x x L 是确定的,每次抽取了50个全部测试一次,至于究竟需要抽取多少次,则由测试要求决定。
如抽取样本(12,,,n X X X …)10次,每次就相当于一个50维随机向量,10个随机向量称样本空间,记为W ,一次测试所得的一组样本观察值()12, ,, n x x x L 是W 中的一个样本点,容量为n 的简单随机样本的数字特征及分布就代表了总体的特性,例如,研究50个灯泡的寿命就能代表60000个灯泡这个总体X 的寿命。
概率论与数理统计六七章习题答案
第六章大数定理和中心极限定理一、大纲要求(1)了解契比雪夫不等式;(2)了解辛钦大数定律,伯努利大数定律成立的条件及结论;(3)了解独立同分布的中心极限定理和棣莫佛—拉普拉斯中心极限定理(二项分布以正态分布为极限分布)的条件和结论,并会用相关定理近似计算有关随机事件的概率.二、重点知识结构图三、基本知识1. 马尔科夫不等式若X 为只取非负值的随机变量,则对任意常数0ε>,有{}EXP X εε≥≤.2. 契比雪夫不等式若DX 存在,则{}2DXP X EX εε-≥≤.3. 辛钦大数定律定理 1 设12,,,,n X X X 是独立同分布的随机变量序列,且具有有限的数学期望()a X E n =,则对任意的0ε>,有{}lim 0n n P X a ε→∞-≥=4. 伯努利大数定律定理2 设()p n B X n ,~,其中n=1,2, …,0<p<1 。
则对任意ε>0,有5.独立同分布的中心极限定理定理3 (林德伯格-列维定理) 设12,,,,n X X X 为独立同分布的随机变量,22,,0,i i EX a DX σσ==<<∞则对任意实数x 有12lim )()n n P X X X na x x →∞⎫++-≤=Φ⎬⎭式中, ()x Φ是标准正态分布(0,1)N 的分布函数,即2/2()t x e dt +∞--∞Φ=6. 棣莫佛-拉普拉斯中心极限定理定理3(棣莫佛-拉普拉斯定理) 设12,,,,n X X X 独立同分布,i X 的分布是{}{}1,01,(01)i i P X p P X p p ====-<<则对任意实数x ,有12lim )()n n P X X X np x x →∞⎧⎫⎪++-≤=Φ⎬⎪⎭0lim =⎭⎬⎫⎩⎨⎧≥-∞→εp n X P n n四、典型例题例1 设随机变量X 和Y 的数学期望分别为-2和2,方差分别为1和4,而相关系数为-0.5,则根据契比雪夫不等式{}6_____P X Y +≥≤.解 因为 ()0E X Y E X E Y +=+= ()2c o v (,D X Y D X D Y X Y +=++2DX DY ρ=++ 1420.52=+-⨯⨯= 根据契比雪夫不等式{}2DXP X EX εε-≥≤所以 {}3163612P X Y +≥≤= 例2 某保险公司经多年资料统计表明,在索赔户中被盗户占20%,在随意抽查的100家索赔户中以被盗的索赔户数为随机变量,利用中心极限定理,求被盗的索赔户大于14户且小于30户的概率近似值.[分析]本题的随机变量服从参数100,0.2n p ==的二项分布.如果要精确计算,就要用伯努利二项公式:{}291001001514300.20.8kk k k P X C -=<<=∑.如果求近似值,可用契比雪夫不等式估计.解 由于~(100,0.2)X N ,所以1000.220EX np ==⨯=168.02.0100)1(=⨯⨯=-=p np DX{}1430P X P <<=<<=Φ(2.5)-Φ(-1.5)()927.0)5.1(5.2=-Φ+Φ因此被盗的索赔户大于14户且小于30户的概率近似值为0.927.例3 某车间有200台机床,它们彼此工作独立,开工率都为0.6,工作时耗电都为1kW,问供电所至少给这个车间多少度电,才能以99.9%的概率保证这个车间不会因供电不足而影响生产.解 用X 表示工作的机床台数,则~(200,0.6)X B .设要向车间供电a kW,则有由棣莫佛-拉普拉斯定理得{}P o X a P ⎧⎫<≤=<≤020p q ⎛⎫⎛⎫⎫⎫≈Φ-≈⎪⎪⎪⎪⎪⎪⎭⎭⎭⎭()0.999 3.1≈Φ≥=Φ即3.1≥ 因此120 3.48141a ≥+= 例4 用契比雪夫不等式确定当掷一均匀硬币时,需掷多少次,才能保证使得出现正面的频率在0.4~0.6之间的概率不小于90%,并用正态逼近计算同一个问题.解 设需掷n 次,用n S 表示出现正面的次数,则1~(,)2n S B n ,有契比雪夫不等式得0.40.60.50.1n n S S P P n n ⎧⎫⎧⎫<<=-<⎨⎬⎨⎬⎩⎭⎩⎭211110022110.900.014n n n⨯⨯≥-=-≥ 所以10002504n ≥=. 由棣莫佛-拉普拉斯定理得0.40.6n S P P n ⎧⎫<<=<⎨⎬⎩⎭(((0.2210.90=Φ-Φ-=Φ-≥即(Φ≥0.95,查表得 1.645>,故68n ≥.例5 假设12,,,n X X X 是独立同分布的随机变量,且()k k i a X E =(1,2,3,4)k =,证明当n 充分大时,随机变量211n n i i Z X n ==∑近似服从正态分布,并指出其分布参数.证 由12,,,n X X X 是独立同分布的随机变量序列可知, 22212,,,nX X X 独立同分布,且有()22a X E i =, 2242i DX a a =-2211n n i i EZ EX a n ===∑, 2242211n n i i a a DZ DX n n=-==∑由林德伯格-列维定理可知,对任意x 有⎰∞--∞→=⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧<--x t n n dte x n a a a Z P 22242221lim π即n Z 近似服从正态分布2422(,)a a N a n-. 例6 有一批建筑房屋用的木柱,其中80%的长度超过3m ,现从这批木柱中随机地取出100根,问其中至少有30根短于3m 的概率是多少?解 设10i X ⎧=⎨⎩()31,2,,1003i m i i m = 当所取的第根木柱短于当所取的第根木柱不短于 则()~1,0.2i X B ,记1001i i X X ==∑,则()~100,0.2X B .由棣莫佛-拉普拉斯定理得{}{}30130P X P X ≥=-<1P =-≤()302011 2.50.0062100.4-⎛⎫≈-Φ=-Φ= ⎪⨯⎝⎭例7 假设男婴的出生率为2243,某地区有7000多名产妇,试估计她们的生育情况.[分析] n 重伯努利实验中A 出现的频率nu n依概率收敛于它的概率p ,当n 很大时,有n u np ≈.解 设10i X ⎧=⎨⎩()1,2,,7000i i = 第名产妇生男婴否则显然, 12,,,n X X X 独立同分布且均服从01-分布2243p ⎛⎫= ⎪⎝⎭,1nn i i u X ==∑表示7000名产妇中生男婴的人数,有伯努利大数定理得()2243n u n n →→∞ 由于7000n =已是足够大,因此227000358143n u ≈⨯≈即该地区估计有3581名男婴出生.例8 某电视机厂每月生产10000台电视机,但它的显像管车间的正品率为0.8,为了以0.997的概率保证出厂的电视机都装上正品的显像管,该车间每月应生产多少只显像管?解 设显像管正品数为X ,月总产量为n ,则有()~,0.8X B n ,从而 0.8E X n =, ()n p np DX 16.01=-=为了使电视机都装上正品的显像管,则每月至少生产10000只正品显像管,即所求为{}100000.997P X n ≤<=由棣莫佛-拉普拉斯定理得{}100000.997P X n P ≤<=≤<=即997.05.016.08.016.08.010000=⎭⎬⎫⎩⎨⎧<-≤-n n n X n n P(0.997Φ-Φ=由题意可知,0<,且n 较大,即(1Φ≈,所以0.997Φ=2.75=,故)(1027.14只⨯≈n因此,每月至少要生产41027.1⨯只显像管才能以0.997的概率保证出厂的10000台电视机都能装上正品的显像管.例9 一养鸡场购进1万个良种鸡蛋,已知每个鸡蛋孵化成雏鸡的概率为0.84,每只雏鸡发育成种鸡的概率为0.90,试计算这批鸡蛋得到种鸡不少于7500只的概率.解 设{}k A k =第只鸡蛋孵化成雏鸡, {}k B k =第只鸡蛋育成种鸡,令 ()11,2,,100000k k k B X k B ⎧==⎨⎩ 当发生当不发生 则诸k A 独立同分布,且{}{}{}{}{}{}1k k k k k k k k P X P B P A P B A P A P B A ===+0.840.900.756=⨯+={}{}244.00===k k B P X P显然, 100001kk X X==∑表示10000个鸡蛋育成的种鸡数,则()~10000,0.756X B ,而64.1844244.07560)1(,7560756.010000=⨯=-=⨯=p np np根据棣莫佛-拉普拉斯定理可得()~0,1nkXnpN -=∑于是,所求概率为{}10000756075001k X P X P ⎧⎫-⎪⎪≥=≥≈-Φ⎪⎪⎩⎭∑()1.400.92=Φ= 因此,由这批鸡蛋得到的种鸡不少于7500只的概率为92%.五、课本习题全解6-1 设11nn i i Y X n ==∑,再对n Y 利用契比雪夫不等式:{}12222220n i i n n n n D X DY n P Y EY n n εεεε=→∞⎛⎫ ⎪⎝⎭-≥≤=≤−−−→∑ 故{}n X 服从大数定理. 6-2 设出现7的次数为X ,则有 ()~10000,0.1,1000,900X B E X n p D X === 由棣莫佛-拉普拉斯定理可得{}100096810001696810.14303015X P X P --⎧⎫⎛⎫<=<=-Φ=⎨⎬ ⎪⎩⎭⎝⎭6-3 11,212i i EX DX ==由中心极限定理可知,10110i X -⨯∑,所以101011616110.136i i i i P X P X ==⎧⎫⎧⎫>=-≤=-Φ=-Φ=⎨⎬⎨⎬⎩⎭⎩⎭∑∑6-4 设报各人数为X ,则.100,100==DX EX . 由棣莫佛-拉普拉斯定理可得()0228.021*********}120{=Φ-=⎭⎬⎫⎩⎨⎧-≥-=≥DX EX X P X P6-5 设()11,2,,100000i i X i i ⎧==⎨⎩ 第个人死亡第个人没有死亡,则{}{}10.006,00.994i i P X P X ====总保险费为51210000 1.210⨯=⨯(万元)(1) 当死亡人数在达到51.210/1000120⨯=人时,保险公司无收入.4100.00660,0.1295np =⨯==所以保险公司赚钱概率为)()12100000.129512060P X X X np ⎧⎫⎪++-≤⨯-⎬⎪⎭()7.771=Φ=因而亏本的概率为10P P '=-=.(2)若利润不少于40000,即死亡人数少于80人时,)()12100000.12958060P X X X np ⎧⎫⎪++-≤⨯-⎬⎪⎭()2.590.9952=Φ= 若利润不少于60000,即死亡人数少于60人时,)()12100000.12956060P X X X np ⎧⎫⎪++-≤⨯-⎬⎪⎭()00.5=Φ=若利润不少于80000,即死亡人数少于40人时,)()12100000.12954060P X X X np ⎧⎫⎪++-≤⨯-⎬⎪⎭()2.5920.0048=Φ-=6-6 设总机需备Y 条外线才能有95%的把握保证每个分机外线不必等候,设随机变量()11,2,,2600i i X i i ⎧==⎨⎩ 第架电话分机用外线第架电话分机不用外线,则{}{}10.04,00.96P X P X ====0.04,0.040.00160.0384i i EX DX ==-=由中心极限定理可得16%950384.026004.02602601≈=⎪⎭⎫⎝⎛⨯⨯-Φ=⎭⎬⎫⎩⎨⎧≤∑=Y Y Y X P i i6-7 密度函数为 ()10.50.50x f x -<<⎧=⎨⎩当其他故数学期望为 0.50.50E X x d x -==⎰()0.52220.5112DX EX EX x dx -=-==⎰(1)设i X 为第i 个数的误差,则9973.01)3(251515300130013001=-Φ=⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧≤=⎭⎬⎫⎩⎨⎧≤∑∑∑===i i i i i i DX X P X P30030011151150.0027i i i i P X P X ==⎧⎫⎧⎫>=-≤=⎨⎬⎨⎬⎩⎭⎩⎭∑∑(2)110210.9440.77n i i P X n =⎧⎫≤=Φ-≥⇒≤⎨⎬⎩⎭∑ (3)3001210.99714.855i i Y P X Y Y =⎧⎫⎛⎫≤=Φ-≥⇒≤⎨⎬ ⎪⎝⎭⎩⎭∑6-8 kg kg EX 32105,105--⨯=⨯=σ (1)设i X 为第i 个螺钉的重量,则23100510,5100.05nEX --=⨯⨯⨯=0228.0)2(105.051.51.510011001=Φ-=⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧->-=⎭⎬⎫⎩⎨⎧>∑∑==σn nEX X P X P i i i i(2)设()1.11,2,,5000.1i i Y i i ⎧==⎨⎩ 第个螺钉的重量超过5kg第个螺钉的重量不超过5kg,则33.3)1(4.11=-=p np np9951.0)58.2(33.34.1120)1(450050015001=Φ=⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧->--=⎭⎬⎫⎩⎨⎧⨯<∑∑==p np np Y P Y P i i i i %6-9 设随机变量()11,2,,10000i i X i ⎧==⎨⎩ 第个人按时进入掩体其他,按时进入掩体的人数为Y ,则()1,~10000,0.9ni i Y X Y B ==∑,所以有10000.9900,9000.190EY DY =⨯==⨯=设有k 人按时进入掩体,则916884645.19090095.090900===-=⎪⎪⎭⎫⎝⎛-Φk k k k 或所以至少有884人,至多有916.六、自测题及答案1.设随机变量X 服从(),B n p ,则对区间(),a b ,恒有lim _______.n P a b →∞⎧⎫⎪⎪<≤=⎨⎬⎪⎪⎩⎭2.一大批产品中优质品占一半,现每次抽取一个,看后放回再抽,问在100次抽 取中取到优质品次数不超过45的概率等于_______.3. 129,,X X X 相互独立, ()1,11,2,9i i EX DX i === ,则对任意给定的0ε>,有( ).9922119922111(A)11(B)119(C)91(D)919i i i i i i i i P X P X P X P X εεεεεεεε--==--==⎧⎫⎧⎫-<≥--<≥-⎨⎬⎨⎬⎩⎭⎩⎭⎧⎫⎧⎫-<≥--<≥-⎨⎬⎨⎬⎩⎭⎩⎭∑∑∑∑4.设12,,,,n X X X 为独立随机变量序列,且()1,2,i X i = 服从参数为λ的泊松分布,则有().()()()()111(A)lim (B)0,1(C),(D)n i n ni i n i i n i i X n P x x n X N n X N n n n P X x x λλλ→∞===⎧⎫-⎪⎪⎪≤=Φ⎬⎪⎪⎪⎩⎭⎧⎫≤=Φ⎨⎬⎩⎭∑∑∑∑当充分大的时,近似服从当充分大的时,近似服从当充分大的时,5.设12,,X X 为独立随机变量序列,且服从服从参数为λ的指数分布,则( ).()()()()112211(A)lim (B)lim 1(C)lim (D)lim n n i i i i n n nni i i n n n X X P x x P x x n X n X n P x x P x x n λλλλλλ==→∞→∞=→∞→∞⎧⎫⎧⎫--⎪⎪⎪⎪⎪⎪⎪⎪≤=Φ≤=Φ⎨⎬⎨⎬⎪⎪⎪⎪⎪⎪⎪⎪⎩⎭⎩⎭⎧⎫⎧⎫--⎪⎪⎪⎪⎪⎪⎪≤=Φ≤=Φ⎬⎨⎬⎪⎪⎪⎪⎪⎪⎪⎩⎭⎩⎭∑∑∑∑6.设随机变量12,,,n X X X 相互独立, 12n X X X X =+++ ,根据林德伯格-列维定理,当n 充分大时, X 近似服从正态分布,只要12,,,n X X X ( )(A)(B)(C)(D)有相同的数学期望有相同的方差服从同一指数分布服从同一离散型分布7.某校有1000名学生,每人以80%的概率去图书馆自习,问图书馆至少应设多少个座位,才能以99%的概率保证去上自习的同学都有座位坐?8.某种电子器件的寿命(小时)具有数学期望μ(未知),方差2400σ=.为了估计μ,随机地取n 只这种器件,在时刻0t =投入测试(设测试是相互独立的)直到失败,测得寿命为12,,,nX X X ,以11ni i X X n ==∑作为μ的估计,为了使{}10.95P X μ-<≥,问n 至少为多少?9.利用中心极限定理证明11lim !2i n n n i n e i -→∞=⎡⎤=⎢⎥⎣⎦∑ [答案]1. 由棣莫佛-拉普拉斯定理可得22lim t b a n P a b dt -→∞⎧⎫⎪⎪<≤=⎨⎬⎪⎪⎩⎭⎰2. 令Y 表示100次抽取中取得优质品的次数()11,2,,1000i i X i i ⎧==⎨⎩ 当第次取到优质品当第次没有取到优质品则 ()1001,~100,0.5i i Y X Y B ==∑那么 1000.5,1000.50.E Y D Y =⨯=⨯⨯=由棣莫佛-拉普拉斯定理可得{}504515Y P Y P P -⎧⎫≤=≤=≤-⎨⎬⎩⎭()()11110.84130.1587≈Φ-=-Φ=-=3.由题意可得 99119,9i i i i EX EX DX DX ======∑∑又因为 9211i i DXP X EX εε=⎧⎫-<≥-⎨⎬⎩⎭∑故(D)项正确.4.因为()1,2,i X i = 服从参数为λ的泊松分布,故,i i EX DX λλ==,由林德伯格-列维定理得()lim n i n X n P x x λ→∞⎧⎫-⎪⎪⎪≤=Φ⎬⎪⎪⎪⎩⎭∑ 当n 充分大时,1nii X=∑近似服从(),N n n λλ分布,故C 项正确.5.由题意可知 211,i i EX DX λλ==由林德伯格-列维定理可得()22limntixnX nP x dt xμ-→∞⎧⎫-⎪⎪⎪≤==Φ⎬⎪⎪⎪⎩⎭∑⎰即()l i mninX nP x xλ→∞⎧⎫-⎪⎪⎪≤=Φ⎬⎪⎪⎪⎩⎭∑6.由于林德伯格-列维定理要求12,,,nX X X独立同分布,且具有有限的数学期望与方差.因此C项正确.7.设X表示同时去图书馆上自习的人数,并设图书馆至少有n个座位,才能以99%的概率保证去上自习的同学都有座位,即n满足{}0.99P X n≤≥.因为()~1000,0.8X B,所以{}⎪⎭⎫⎝⎛⨯⨯⨯-Φ-⎪⎭⎫⎝⎛⨯⨯⨯-Φ≈≤2.08.010008.01000`2.08.010008.01000`nnXP8000.9912.65n-⎛⎫=Φ≥⎪⎝⎭查表得8002.3312.65n-≥,故829.5n≥.因此图书馆至少应有830个座位.8.由于12,,,nX X X独立同分布,且2,400i iEX DXμσ===.由林德伯格-列维定理得{}1P X Pμ⎫⎛-<=<≈Φ-Φ⎝⎭⎝⎭21210.95=Φ-=Φ-≥⎝⎭⎝⎭即0.975Φ≥⎝⎭,查表得 1.9620≥,故2400 1.961536.64n≥⨯=.因此n至少为1537.9.设{}n X为独立同服从参数为1的泊松分布的随机变量序列,则1nkkX=∑服从参数为n的泊松分布,因此有101!!k k n n nn nn k k k k n n P X n e e e k k ---===⎧⎫≤==+⎨⎬⎩⎭∑∑∑由林德伯格-列维定理可得()11lim lim 02n k n k n n k X n P X n P →∞→∞=⎧⎫-⎪⎪⎧⎫≤=≤=Φ=⎨⎬⎩⎭⎪⎪⎩⎭∑∑ 所以11lim lim !k n n n n k n n k k n e P X n e k --→∞→∞==⎧⎫⎡⎤⎧⎫=≤-⎨⎨⎬⎬⎢⎥⎩⎭⎣⎦⎩⎭∑∑ 11lim lim 2n n k n n k P X n e -→∞→∞=⎧⎫=≤-=⎨⎬⎩⎭∑第7章数理统计的基础知识一、大纲要求(1)理解总体、简单随机样本、统计量、样本均值、样本方差及样本矩的概念,了解直方图和样本分布函数的意义和作用.(2)了解2χ分布、t分布、F分布的概念和性质,了解分位数的概念并掌握查表计算.(3)了解正态总体的抽样分布.二、重点知识结构图三、基本知识1.总体和个体在数理统计中,把研究对象的全体称为总体或母体,把组成总体的每一个研究对象(元素或单元)称为个体.总体分为有限总体和无限总体.有限总体是指其总体中的成员只有有限个.相应的,无限总体是指其总体中的成员有无限个.2.样本在一个总体中,抽取n 个个体12,,,n X X X ,这n 个个体总称为总体X 的样本或子样, n 称为样本容量.样本特性:① 代表性,样本中的每一个分量()1,2,i X i n = 与总体X 有相同的分布。
概率论与数理统计第六章习题答案
第六章习题6-11、由一致估计的定义,对0ε∀>{}{}{}()1212max ,,,max ,,,n n P X X X P X X X θεεθεθ-<=-+<<+()()F F εθεθ=+--+()0, 0, 01, X x xF x x x θθθ<⎧⎪=≤≤⎨⎪>⎩及(){}()()()()1212max ,,,n n X X X X X X F x F x F x F x F x ==⋅⋅⋅()1F εθ∴+=(){}()12max ,,,1nn x F P X X X εθεθθ⎫⎛-+=<-+≈- ⎪⎝⎭{}()12max ,,,111()nn x P X X X n θεθ⎫⎛∴-<=--→→∞ ⎪⎝⎭2、证明:EX μ=()1111111ni i n n i i i i nn n i i i i i i i i a X E a E X a a a a μμ======⎫⎛⎪ ⎪ ==⋅=⎪ ⎪⎝⎭∑∑∑∑∑∑ 11niii nii a Xa==∴∑∑是μ的无偏估计量3、证明: ()() ()()22D E E θθθ=-()() ()()()2222E D E D θθθθθθ∴=+=+> 2θ∴不是2θ的无偏估计量4、证明:()~X P λEX λ∴=,()()222E X DX EX λλ=+=+()22E X EX λ∴-=,即()22E X X λ-=用样本矩2211n i i A X n ==∑,1A X =代替相应的总体矩()2E X 、EX所以得2λ的无偏估计量: 22111n i i A A X X n λ==-=-∑ 5、()~,X B n p ,EX np ∴=()()()()22222111E X np p n p np n n p EX n n p =-+=+-=+-()()()()222111E X EX E X X p n n n n -⎫⎛∴=-=⎪ --⎝⎭所以用样本矩2211n i i A X n ==∑,1A X =分别代替总体矩()2E X 、EX得2p 的无偏估计量: ()()()222121111ni i i A A p X X n n n n =-==---∑6、()~,1X N m ,()i E X m ∴=,()1i D X =,(1,2)i =()()()11212212121333333E m E X X E X E X m m m ⎫⎛∴=+=+=+= ⎪⎝⎭()()()1121221414153399999D m D X X D X D X ⎫⎛=+=+=+= ⎪⎝⎭同理可得: ()2E m m =, ()258D m =, ()3E m m =, ()212D m =123,,m m m ∴都是m 的无偏估计量,且在 123,,m m m 中, 3m 的方差最小习题6-21、(1)()11cccEX x c xdx cx dx θθθθθθθθ+∞+∞-+-=⋅==-⎰⎰EXEX cθ∴=-,令X EX =X X c θ∴=-为矩估计量,θ的矩估计值为 x x cθ=-,其中11n i i x x n ==∑似然函数为:()()11211,,,;nnn n n ii i i L x x x c xcx θθθθθθθ-+-====∏∏ ,i x c > 对数似然函数:()()()1ln ln ln 1ln nii L n n c x θθθθ==+-+∑求导,并令其为0,得:1ln ln ln 0ni i d L nn c x d θθ==+-=∑ 1ln ln Lnii nx n cθ=∴=-∑,即θ的最大似然估计量为 1ln ln Lnii nXn cθ==-∑(2)21111EX EX x x dx EX θθθθθ-⎫⎛=⋅=⇒= ⎪--⎝⎭⎰ 以X EX =,得: 21X X θ⎫⎛=⎪ -⎝⎭为θ的矩估计量θ的矩估计值为: 21x x θ⎫⎛=⎪ -⎝⎭,其中11ni i x x n ==∑ 而()1121211,,,;n nnn i i i i L x x x x x θθθθθ--==⎫⎛==⎪⎝⎭∏∏ ,01i x ≤≤()()1ln ln 1ln 2nii nL x θθθ=∴=+-∑令1ln 11ln 022ni i d L n x d θθθ==+⋅⋅=∑, 21ln L ni i n x θ=⎫⎛⎪ ⎪ ∴=⎪⎪⎝⎭∑ 所以θ的最大似然估计量 21ln L ni i n x θ=⎫⎛⎪ ⎪ =⎪ ⎪⎝⎭∑ (3)()~,X B m p ,EXEX mp p m∴=⇒=p ∴的矩估计量: 111n i i X p X X m mn m====∑p ∴的矩估计值为: 11n i i p x mn ==∑ 而()()()111211,,,;11nniii i ii i i nnx m x m x x x x n mm i i L x x x p Cpp C pp ==--==∑∑=-=⋅⋅-∏∏ ,0,1,,ix m = ()()()111ln ln ln ln 1i nnn x mi i i i i L p C x p m x p ====+⋅+-⋅-∑∑∑令() 111ln 111101n n n i i L ii i i d L x m x p x x dp p p mn m ====⋅--⋅=⇒==-∑∑∑ p ∴的最大似然估计量为: 1L p X m=2、(1)()01;2EX xf x dx xdx θθθθ+∞-∞===⎰⎰令11n i i EX X X n ===∑,22X X θθ∴=⇒=2X θ∴= (2)由观测的样本值得:6111(0.30.80.270.350.620.55)0.481766i i x x ===+++++≈∑20.9634x θ∴== 3、由1111122EX X θθθθθ+=⨯+⨯++⨯== 21X θ∴=-为θ的矩估计量 4、设p :抽得废品的概率;1p -:抽得正品的概率 引入{1, i i X i =第次抽到废品0,第次抽到正品,1,2,,60i =()1i P X p ∴==,()01i P X p ==-,且i EX p =所以对样本1260,,,X X X 的一个观测值1260,,,x x x由矩估计法得,p 的估计值为: 601141606015ii p x ====∑,即这批产品的废品率为1155、()()2212213132EX θθθθθ=⨯+⨯-+⨯-=-,()1412133x =⨯++=EX x = , 3526x θ-∴==为矩估计值 ()()()()()()()34511223312121i i i L P X x P X x P X x P X x θθθθθθ========⋅⋅-=-∏()()ln ln25ln ln 1L θθθ=++-令() ln 1155016Ld L d θθθθθ=⨯-=⇒=- 6、(1)λ的最大似然估计 LX λ=, ()0LX P X e e λ--∴=== (2)设X :一个扳道员在五年内引起的严重事故的次数()~X P λ∴,122n =得样本均值:5011(044142221394452) 1.123122122r r x r s ==⨯⋅=⨯⨯+⨯+⨯+⨯+⨯+⨯=∑()1.12300.3253x P X e e --∴====习题6-33、从总体中抽取容量为n 的样本12,,,n X X X 由中心极限定理:()~0,1,/X U N n nμσ-=→∞(1)当2σ已知时,近似得到μ的置信度为1α-的置信区间为:22,X u X u n n αασσ⎫⎛-⋅+⋅⎪ ⎝⎭ (2)当2σ未知时,用2σ的无偏点估计2s 代替2σ:~(0,1),/X N n s nμ-→∞于是得到μ的置信度为1α-的置信区间为:22,s s X u X u n n αα⎫⎛-⋅+⋅⎪ ⎝⎭一般要求30n ≥才能使用上述公式,称为大样本区间估计 4、40n = 属于大样本,2,X N n σμ⎫⎛∴⎪ ⎝⎭ 近似μ∴的95%的置信区间近似为:2x u n ασ⎫⎛±⋅⎪ ⎝⎭其中642x =,3σ=,40 6.32n =≈,21.96u α=()23642 1.966420.9340x u n ασ⎫⎛⎫⎛∴±⋅=±⨯≈±⎪ ⎪⎝⎭⎝⎭故μ的95%的置信区间上限为642.93,下限为641.075、100n =属于大样本,2~,X N n σμ⎛⎫∴ ⎪⎝⎭近似μ∴的99%的置信区间近似为:2x u n ασ⎫⎛±⋅⎪ ⎝⎭其中10x =,3σ=,100n =,22.58u α=()()2310 2.58100.7749.226,10.774100x u n ασ⎛⎫⎛⎫∴±⋅=±⨯=±= ⎪ ⎪⎝⎭⎝⎭由此可知最少要准备10.77410000107740()kg ⨯=这种商品,才能以0.99的概率满足要求。
概率论与数理统计PPT课件(共8章)第六章 数理统计的基本概念
代表性
每个样本Xi(i=1,2,…,n)与 总体X具有相同的分布
独立性
各个样本X1,X2,…,Xn的取 值互不影响,即X1,X2,…,Xn是 相互独立的随机变量.
6.1.3 样本的联合分布
若 X1 ,X2 , ,Xn 为总体 X 的一个样本, X 的分布函数为 F(x) ,则 X1 ,X2 , ,Xn
n
n
xi
n xi
p i1 (1 p) i1 ,
概
率
论
与
数 理
6.2
统
计
统计量与抽样分布
6.2.1 统计量
定义 6.2 不含任何未知参数的样本 X1 ,X2 , ,Xn 的连续函数 g(X1 ,X2 , ,Xn )
称为统计量.
下面列出一些常用的统计量.
(1)样本均值
X
1 n
n i1
Xi
(2)样本方差
概
率
论
与
数
理 统 计
数理统计的基本概念
第六章
概
率
论
与
数
理 统
壹 总体与样本
计
贰 统计量与抽样分布
目录
概
率
论
与
数 理
6.1
统
计
总体与样本
总体与个体
6.1.1 总体
在数理统计中,通常把研究对象的全体称为总体,把构 成总体的每个研究对象称为个体.
总体分布
为了便于数学上的处理,我们将总体定义为随机变量, 记作.随机变量的分布称为总体分布.
N
(1
,12
)
与
N
(2
,
2 2
)
的样本,且这两个样本相互独立.设
智轩考研数学红宝书2010精华习题完全解答---概率论与数理统计第1章 随机事件与概率
第一章 随机事件与概率精华习题一、填空题1.已知()()0.4, 0.5P A P C ==,A B Ì,, A C 独立,则()|P A C AB C -+=______。
2.设A ,B 满足11(),(),(|)(|)1,23P A P B P A B P A B ==+=且则()P A B +=_________。
3.4数n 567 1 2((3((C )AD 与B D - (D )A C +与BD [ ] 4.设A ,B ,C 为任意三个事件,则下列事件中一定独立的是(A )()()()()A B A B A B A B ++++与AB (B )A -B 与C(C )AC 与C (D )AB 与B+C [ ]5.设事件A ,B ,C 满足P(AB)=P(A) P(B),0< P(B),P(C)<1,则有(A )P(AB|C)=P(A|C)P(B|C) (B)(|)(|)(|)P A B P A B P C C += (C )(|)(|)(|)P A B P A B P C C += (D )(|)(|)P A B P A B = [ ] 6.下列命题一定正确的是(A )若P(A)=0,则A 为不可能事件(((7((8(9((1. 2(13(1(24.设某人的眼镜第一次落地打破的概率为310,第二次落地打破的概率为410,第三次落地打破的概率为910,求眼镜次落地3次被打破的概率。
5.甲、乙两人轮流射击,先击中目标者为胜。
设甲、乙击中目标的概率分别为,a b 。
甲先射,求甲、乙分别为胜者的概率。
6.玻璃杯成箱出售,每箱20只,假设各箱含0,1,2只残次品的概率分别为:0.8,0.1和0.1。
一顾客欲购买一箱玻璃杯,在购买时,由售货员随意取一箱,而顾客开箱随机地察看4只:若无残次品,则买下该箱玻璃杯,否则退回,试求:(1)顾客买此箱玻璃杯的概率a;(2)在顾客买的此箱玻璃杯中,确实没有残次品的概率b。
概率论 第6章 数理统计的基本知识
100
1.00
12
欧启通主编. 概率论与数理统计. 浙江大学出版社, 2014.2
f x
频率直方图:
o
33.65
33.95 34.25 34.55 34.85 35.15 35.45 35.75 36.05 36.35 36.65
x
直方图大致描述了总体 X 的概率分布.
欧启通主编. 概率论与数理统计. 浙江大学出版社, 2014.2
根据大数定律,可以依据样本来推断总体.
欧启通主编. 概率论与数理统计. 浙江大学出版社, 2014.2
9
6.1.4 频率直方图 作图步骤 : 样本观测值x1 , x2 , x3 ,, xn . (1)确定观测值范围 ; (2)选分点把观测区间分为若干个子区间 ti ; (3)计算样本观测值落在各子区间内的频数 mi 及频率 fi ; (4)在平面直角坐标内以子区间为底,以 作小矩形,构成直方图.
X n xn 发生了.
欧启通主编. 概率论与数理统计. 浙江大学出版社, 2014.2
6
ห้องสมุดไป่ตู้
6.1.3 样本分布函数
样本频率分布表
从总体中抽取容量为 n的样本 X1 , X 2 , X 3 ,, X n , 得观测值 x1 , x2 , x3 ,, xn . 观测值
频 频 数 率
x(1) m1
欧启通主编. 概率论与数理统计. 浙江大学出版社, 2014.2
5
样本具有二重性
(1)设 n次抽样的结果为 X1 , X 2 , , X n , 它们是相互 独立的随机变量,且与总体 X 服从相同的分布;
(2)实际抽样的结果得到的是具体试验数据(样本观
测值) x1 , x2 ,, xn ; 抽样的结果是: n个独立的事件 X1 x1 , X 2 x2 ,,
[学习]概率论与数理统计课件第6章
将样本观测值 x1, x2 , , xn 代入 (X1, X2, , Xn ) , 得到的值 (x1, x2, , xn ) 称为参数的估计值。
点估计(point estimation) :如果构造一个统计量
设总体的分布中含有一个参数,对给定的,如果 由样本(X1,X2,…,Xn)确定两个统计量
1( X1,X2,…,Xn ), 2( X1,X2,…,Xn ), 使得P{1 << 2}=1- ,则称随机区间( 1 , 2 )为 参数的置信度(或置信水平)为1- 的置信区间。
1——置信下限 2——置信上限
几点说明
或 Uk (1,2,
,m )
1 n
n i 1
(Xi
X )k
(k 1, 2,
, m)
得m个方程构成方程组,解得的 1,2, ,m 即为参数 1,2 , ,m的矩估计量,代入样本观测值,即得参数
的矩估计值。
例2 设某总体X的数学期望为EX=,方差DX=2,X1, X2,…,Xn为样本,试求和2的矩估计量。
X
1 n
n i 1
Xi
2
1 n
n i 1
(Xi
X )2
S
2 n
估计值为
x
1 n
n i 1
xi
2
1 n
n i 1
( xi
x )2
例3 设X1,X2,…,Xn为总体X的样本,试求下列总体 分布参数的矩估计量。
(1) X ~ N , 2 (2)X ~ B N, p(N已知)(3)X ~ P()
概率论与数理统计 6
定义3 设X是具有分布函数F的随机变量,若X1, X2, …, Xn是具有同 一分布函数F的、相互独立的随机变量,则称X1, X2, …, Xn为从总体X中 得到的容量为n的简单随机样本,简称样本。它们的观察值x1, x2, …, xn 为样本值,又称为X的n个独立观察值。
基于上述简单随机抽样,我们可以知道,从总体中抽取一个个 体就是对总体X进行一次观察(试验)并记录其结果.若在相同的 条件下对总体X进行n次重复的独立观察,其观察的结果记为X1, X2, …, Xn,则可认为X1, X2, …, Xn相互独立,并与总体X具有同的分 布.一般称其为来自总体X的一个简单随机样本。对于有限总体和 无限总体,都可以通过不放回抽样的方式得到简单随机样本。
X
0
1
P
1-p
p
不同的p反映了总体间的差异.譬如,两个生产同类产品的工厂的产品总体分 布分别如表所示。
X
0
1
P
0.983
0.017
X
0
1
P
0.915
0.085
显然,第一个工厂的产品质量优于第二个工厂。实际中,分布中的不合格 品率是未知的,如何对它进行估计正是数理统计要研究的问题。
二、抽样和样本
定义2 为推断总体分布及各种特征,按一定规则从总体中抽取若干 个体进行试验观察,以获得有关总体的信息,这一抽取过程称为抽样, 所抽取的部分个体称为样本,样本中所包含的个体数目称为样本容量。
如此看来,若不考虑问题的实际背景,总体就是一堆数,这堆 数中有大有小,有的出现的机会多,有的出现的机会少.因此用 一个概率分布去描述和归纳总体是恰当的。
从这个意义上看,总体就是一个概率分布,而其数量指标就是 服从这个分布的随机变量。所以今后说“从总体中抽样”和“从 某分布中抽样”是同一个意思。
大学课件概率论第6章数理统计的基本概念
=
(n
n! k )!(k
1)
[ !
FX
( x)]k 1[1
FX
( x)]nk
fX
( x)x,
故有
f X(k )
(x)
n! (n k)!(k
1)![FX
( x)]k 1[1
FX
( x)]nk
fX
(x).
数理统计中常用的分布除正态分布外,还有 三个非常有用的连续型分布,即
2分布 t 分布 数理统计的三大分布(都是连续型). F分布
2
n 2
1
n 2
x
n 1 x
2 e2
,
0,
x0 x0
其中Gamma函数 Γ(x) 通过下面积分定义
(x) ett x1dt, x 0 0
(x 1) x(x),
(n 1) n!,
(1) 1,
1 2
π
一般的,若X的分布密度函数为
fX
(x)
(
)
x 1ex
0
x0 其他
则称X服从参数为 α>0和λ>0的Γ分布,记为X~ Γ(α, λ)。 Γ分布的数学期望和方差为
1)
[ !
FX
(x)]k1[1 FX
( x)]nk
fX
(x)
其中k 1, 2,..., n. 特别地,有 fX(1) (x) n[1 FX (x)]n1 fX (x), fX(n) (x) n[FX (x)]n1 fX (x).
证明: x(k)落在[x, x x]这个区间的概率近似为
f X(k) (x)x Cn1Cnk11[FX (x)]k1[1 FX (x x)]nk f X (x)x
大学概论论与数理统计课本答案第6章
⋅
1 λ
−
n
=
0 ,得 λ
=
1 n
n
∑ xi
i =1
=
x
,
故λ 的极大似然估计为 λˆ = X ;
(3) L(µ, σ 2 ) = f (x1; µ, σ 2 ) f (x2; µ, σ 2 )" f (xn ; µ, σ 2 )
n
=
1
− (ln x1−µ )2
e 2σ 2
1
− (ln x2 −µ )2
− (ln x−µ )2
e 2σ 2 ,x = 0;其中−∞ < µ < +∞,σ > 0.
2πσ x
n
∑ xi −n 解:(1) L(θ ) = f (x1;θ ) f (x2 ;θ )" f (xn ;θ ) = θ (1 − θ ) x1−1 ⋅θ (1 − θ ) x2 −1 "θ (1 − θ ) xn −1 = θ n (1 − θ )i=1 ,
− µ)2
2
,
n
n
令
∂ ln L(µ, σ 2 ) ∂µ
=
∑ 2(ln xi − µ) ⋅ (−1) − i=1
2σ 2
=
∑ ln xi −
i =1
σ2
nµ
= 0 ,得 µ
=
1 n
n
∑ ln xi
i =1
,
再令
∂ ln L(µ, σ 2 ) ∂σ 2
=−n⋅ 1 2 σ2
+
n
∑ (ln
xi
−
µ)2
i =1
3,
故θ 的矩估计为θˆ = 6X − 3 ;
概率论 第六章数理统计 b
用X表示取到的白球个数
若白球占1 4,则X的分布为
X 0 1 2 3 27 27 9 1 P 64 64 64 64 若白球占3 4,则X的分布为 X 0 1 2 3 1 9 27 27 P 64 64 64 64 可见,当X=0或1时,认为白球占1 4 当X=2或3时,认为白球占3 4 即选择使观察结果概率较大的参数。
注意:不同的样本观 察值,估计值不同
点估计
矩估计 极大似然法估计
矩(原点矩)估计
基本思想:用样本的各阶矩来估计总体的各阶矩
定义 假设总体X的J阶矩存在 ,记为
a j (1 , 2 ,... k ) E( X )
j
j
n
x j ( x;1 , 2 ,... k )dx( X为连续型)
极大似然估计法
基本思想:在试验的诸多可能条件中,应该是 事件A发生的概率为最大的那一种条件
似然函数
如果总体X是连续型随机变量,其概率密度为
( x ;1 , 2 ,.... m ), 其中1 , 2 ,.... m为未知参数,X1,X 2 ...X n
是来自X的样本,称X1,X 2 ...X n的联合概率密度
第六章 数理统计与参数估计
数理统计学
运用概率论的基础知识,对要研究的随机现象进行 多次观察或试验,根据观察或实验得到的数据,对研 究对象的客观规律作出各种合理的估计和推断。
数理统计与参数估计
随即样本与统计量 抽样分布 参数估计
点估计 区间估计
参数估计
概率论与数理统计-第六章
服从什么分布?
F分布 定义:设X ~χ2(m), Y ~χ2(n), X与Y相互 独立,则称随机变量 F=(X/m)/(Y/n) 所服从的分布是自由度为(m,n)的F分布. 记为F~F(m,n)
F分布的概率密度函数图形
F分布
性质1 若X~F(m,n), 则1/X~F(n,m) 性质2 若X ~t(n),则X2~F(1,n)
其中fn(x)为χ2的概率密度,则称点 χα2(n)为 χ2分布关于α的上侧分位点。
抽样分布的分位点2
设α为给定的常数,且0<α<1. 若存在tα (n)使
PT t (n)
t ( n )
f n (t )dt
其中fn(t)为T的概率密度,则称点tα (n)为 t分布关于α的上侧分位点。
统计量的二重性?统计量样本均值?常用统计量样本方差样本均方差或样本标准差s??i?nixnx11??i???nixxns12211exkx的k阶原点矩exexkx的k阶中心矩exx的1阶原点矩dxx的2阶中心矩?常用统计量样本k阶原点矩样本k阶中心矩??i?nkikxna11??i??nkikxxnm11设x1x2
χ2分布
性质1(可加性) Y1 ~χ2(m), Y2 ~χ2(n),Y1与Y2独立, 则Y1 +Y2 ~ χ2(m+n)
性质2(数字特征) 若χ2 ~χ2(n),则 E(χ2)=n,D(χ2)=2n
例1. 设X1,X2, …,Xn是来自正态总体 X~N(μ,σ2)的样本,求随机变量 Y=[(X1- μ)2+ (X2- μ)2+…+ (Xn- μ)2]/σ2 的概率分布。 解:X1,X2,…,Xn相互独立且都服从N(μ,σ2) 分布,令Yi=(Xi- μ)/σ 则Y1,Y2, …,Yn相互独立且Yi ~N(0,1) , 由定义知Y= Y12+Y22+…+Yn2 ~χ2(n)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
139第二篇 数 理 统 计第六章 数理统计的基本概念【数学1,3】2009考试内容 (本大纲为数学1,数学3需要根据大纲作部分增删)总体 个体 简单随机样本 统计量 样本均值 样本方差和样本矩 2c 分布 t 分布 F 分布 分位数 正态总体的常用抽样分布考试要求1. 理解总体、简单随机样本、统计量、样本均值、样本方差及样本矩的概念,其中样本方差定义为2211()1ni i S X X n ==--å 2. 了解2c 的分布、t 分布和F 分布的概念及性质,了解上侧a 分位数的概念并会查表计算。
3. 了解正态总体的常用抽样方法。
本章导读 3大分布8类枢轴量。
一、总体和样本实际工程中,常常需要检测产品的某一个(或多个)数量指标(如研究100瓦灯泡的寿命这一数量指标)。
需要检测产品的全体称为总体(如6000个100瓦的灯泡),一个灯泡的寿命检测数据记为X ;总体中的某一元素称为样品或个体(如一个100瓦灯泡)。
我们不可能把全部6000个灯泡都测试,所以,需要从总体(6000个灯泡)中随机抽取n 个(如取50n =)样品组成样本,称为抽样,n 称为样本容量,并把样本看成是n 个相互独立且具有完全相同分布的随机变量( 以后简称 “独立同” ),记为()1250, ,, X X X L ,称为简单随即样本。
显然,如果测试还没开始,则()1250, ,, X X X L 就是一个50维随机变量,如果测试已经完成,则()1250, ,, X X X L 就对应有一组具体值()1250, ,, x x x L ,称为样本观察值,即样本值。
样本(12,,,n X X X …)每次测试的所有可能值的全体称样本空间,记为W ,一次测试所得的一组样本观察值()12, ,, n x x x L 是W 中的一个样本点,容量为n 的简单随机样本的数字特征及分布就代表了总体的特性,例如,研究50个灯泡的寿命就能代表6000个灯泡的寿命。
注意,若12, ,, n X X X L 相互独立,则()112, ,, n Y f X X X =L 和()212, ,, n Y g X X X =L 也相互独立。
二、样本函数和样本统计量1.统计量 不含任何未知参数的12(, , )n g X X X …函数形式为样本统计量,12(,,,)n g x x x …为相应样本值;含任何未知参数的12(,,)n g X X X …就称为样本函数。
统计量与样本函数一般在测试前后可以相互转化角色。
如把样本观测值()12, ,, n x x x L 按照顺序排列成()()()()12, ,, n x x x L ,其中()()()12n x x x £££L ,记取值为()k x 的样本分量为()k X ,则称()()()12, ,, n X X X L 为顺序统计量。
如最大顺序统计量与最小顺序统计量为:勤径考研论坛140{}()()()()(){}()()()()()112112, , , , 111nn n U X U X X nn n V X V X X U Max X X X F u F u f u nf u F u V Min X X X F v F v f v nf v F u --=Þ=Þ=éùéùëûëû=Þ=--Þ=-éùéùëûëûK K2. 样本矩(也是一种样本函数,注意n 是变量,X 是随机变量)●原点矩:11n k k i i A X n ==å; ●中心矩:11()n k k i i B X X n ==-å3.常用样本函数① 样本均值 11ni i X X n ==å,为样本一阶原点矩。
② 样本方差 2221111()11n n i i i i S X X X nX n n ==éù=-=-êú--ëûåå 注意区别于数字特征中的方差2s ,2s 只是某一个随机变量i X 的方差,而2S 是n 个i X 的联合分布函数的方差。
另外,严格地说,2S 不是矩。
③ 样本标准差S ==④ 二阶样本中心矩 2222211111()n ni i i i n B X X X nX S n n n ==-éù=-=-=êúëûåå 与样本方差2S 是不同的概念。
相应统计量的观察值形式同上。
⑤ 样本函数中的必需记住的数字特征4. 经验(样本)分布函数设样本()12, ,, n X X X L 是取自总体X ,则经验分布函数定义为 【例1】设从总体X 中取容量为3的样本,样本观察值为1,1,2。
试求样本的经验分布函数()3F x 。
解:由经验分布函数的定义可知()30, 12, 1231, 2x F x x x <ìïï=£<íï³ïî。
一般地()()()()()1510, , 1, k k k x x k F x x x x n x x +<ìïï=£<íï³ïî研论坛141评 注 常用的经验分布函数有()2n c、()t n 和()12, F n n 三种抽样分布。
三、三种抽样分布1. ()2n c分布设{}i X 独立同,~(0,1)i X N ,则 221~()nii Z Xn c ==å。
()1可加性 ()()2221212~()n n n n c c c ++++L L()2期望与方差 ()2;E n n c éù=ëû ()22D n n c éù=ëû证明:由于()()~0,10; 1i i i X N E X DX Þ==()()()2224421 1,2,,3i i i x i EX D X EX i n EX x edx +¥--¥=+====L()()()224222211222113122i i i n n i i i i n n i i i i DX EX EX E n E X EX n D n D X DX nc c =====-=-=æöéù===ç÷ëûèøæöéù===ç÷ëûèøåååå ()4上分位点:()2n a c 定义为()2n c 分布的分位点,则()()()()()2222{}n n P n n f x dx a a c c c c a +¥³==ò。
上分位点的特点是对应分布函数图形()2n a c 点的右边面积,对()t n 和()12, F n n 分布有类似的结论。
2. ()t n 分布设{}i X 独立同分布,2~(0,1), ~();i X N Y n X Y c 和独立,则()1 t 分布密度函数当()()(0,1)t n n f x N ®¥Þ®()2 上分位点:()t n a 定义为()t n 分布的分位点,则()(){()}()t t n P t n t n f x dx a a a +¥³==ò()3 性质:T 分布具有对称性, 1()(); 45t n t n n a a -=->时,()t n Z a a »其中Z a 为标准正态分布的下分位点,即 ()(){}0, 1Z P x Z N dx aa a -¥F £==ò3.(), F m n 分布设X 、Y 相互独立,22~(); ~()X m Y n c c ;则 评 注 特别地, 勤径考研论坛142【例2】假定()12, X X 来自正态整体()2~0, X N s 的一个样本,求()()2122124X X P X X éù+<êú-êúëû。
解:()()()2221212~0, ~0, 2; ~0, 2i X N X X N X X N s s s Þ+-()()()()2222~0, 1;~0, 1~1; ~1N N c c Þ ()()()()()222412122220121221~1, 14arctan 2.X X X X F P X X X X p éù++Þ=<==êú--êúëûò ① 上分位点 (,)F n m a 定义为(), F m n 分布的分位点,则 (,){(,)}()F F n m P F F n m f x dx a a a +¥³==ò② 性 质● 证明结论 ()()2~1, tn F n 如下~(0,1),U N 2~()V n c ;~()T t n =22;U T V n= 而 22~(1)U c 时()()22~(1, )~1, T F n t n F n ÞÞ● 证明结论 11(, )(, )F n m F m n a a -=如下: (){}()()()()()()()()()1111~, ~, 111111, 11, , 1 , 1111, , , , X F m n Y F n m XP X F m n P P X F m n X F m n P F n m XP P F n m F n m X F m n X F m n a a a a a a a a a a aa ---=--ìüìüïïïï³=-Þ£=-Þ>=íýíýïïïïîþîþìü¾¾¾¾¾¾¾¾®³=íýîþìüïïìü>=³Þ=íýíýîþïïîþ又根据分位数的定义,而连续分布对一点的概率取值为零,则智轩第10技 8大枢轴量贯穿考研数学数理统计的全部考点,务必理解牢记。