上海大学 计算机 概率论与数理统计A 第8章new分布拟合检验

合集下载

概率论与数理统计第八章2资料

概率论与数理统计第八章2资料
解:有放回地抽取3个球, 若取到0个或1个白球,认为袋中黑球多。 若取到2个或3个白球,认为袋中白球多。
用表示取到的白球个数 若白球占1 4,则的分布为
0 1 2 3 P 27 27 9 1
64 64 64 64 若白球占3 4,则的分布为
0 1 2 3 P 1 9 27 27
64 64 64 64 可见,当=0或1时,认为白球占1 4
解: 0 1 P 1p p E p
若X1,...,
X
为一组样本,则
n
p X
1 n
n i1
Xi
m n
n
其中m Xi表示重复试验中事件发生次数。 i1
即可用事件发生的频率来估计概率。
例3 设总体服从[a, b]上的均匀分布,用矩法 估计a与b
解:设X1,...,Xn为一组样本
由于E a b 2
实际上,是似然函数L的最大值点。
由于lnL与L同时达到最大值
求ln L的最大值点往往更方便。 ln L称为对数似然函数。 若为向量,=(1,...,m )
解方程组
ln L
1 ...
0
ln L 0 m
得到驻点(1,..., m ), 它常常就是最大值点。
例6(选讲) 用最大似然法估计事件发生的概率p 解: 0 1
DX 2 3
3
ai
i1
3
DX ' ai2DXi
3
ai
2
2
3
a
2 i
i1
i1
i1
3 2
ai i1
利用
ai2
a2j
2aia

j
3
ai
2
a1

上海市考研统计学复习资料概率论与数理统计基本概念解析

上海市考研统计学复习资料概率论与数理统计基本概念解析

上海市考研统计学复习资料概率论与数理统计基本概念解析概率论与数理统计是考研统计学中的重要内容,它们是统计学的核心理论,对于统计学专业的学生来说,掌握这些基本概念至关重要。

本文将对概率论与数理统计的基本概念进行解析,帮助考生更好地理解和应用这些内容。

一、概率论基本概念1.随机试验:随机试验是在相同条件下重复进行的实验,每次实验结果可能不同,但结果是确定的。

例如,掷硬币、抽卡片等都属于随机试验。

2.样本空间:样本空间是指随机试验中所有可能结果的集合,用S 表示。

例如,掷一枚硬币的样本空间为S={正面,反面}。

3.事件:事件是样本空间的一个子集,表示某些可能发生的结果。

常用A、B、C等字母表示事件。

例如,掷硬币出现正面的事件记为A={正面}。

4.概率:概率是事件发生的可能性,用P(A)表示。

概率的取值范围是0到1之间,其中,0表示不可能事件,1表示必然事件。

例如,掷硬币出现正面的概率为P(A)=0.5。

二、数理统计基本概念1.总体与样本:总体是指研究的对象的全体,样本是从总体中抽取出来的一部分。

研究对象可以是人群、产品等。

例如,研究一批产品的重量,总体是这批产品的全部重量,样本是从中抽出的数个产品进行称重。

2.参数与统计量:参数是总体的特征的数值度量,统计量是样本的特征的数值度量。

例如,研究一批产品的重量,平均重量是总体的参数,样本的平均重量是统计量。

3.抽样:抽样是从总体中随机选取样本的过程,目的是为了通过样本的研究来推断总体的特征。

抽样方法有很多种,常用的有简单随机抽样、分层抽样等。

4.频数与频率:频数是指某个事件或数值在样本或总体中出现的次数,频率是频数除以样本或总体的大小。

例如,某个班级的学生身高以及相应的出现次数和频率。

三、概率分布与统计分布概率分布是指随机变量在各个取值上的概率。

常见的概率分布有离散概率分布和连续概率分布。

离散概率分布以概率质量函数(PMF)表示,连续概率分布以概率密度函数(PDF)表示。

分布拟合检验(PPT 24)

分布拟合检验(PPT 24)

-0.5
0.0385
A12 0 0.002 0.2
6.2185
其中有些npˆ i 5的组予以适当合并,使得每组均有
npˆ i 5.此处并组后k 8,但因在计算概率时,估计
了一个参数,故c 的自由度为8 1 1 6。 2
因ca (k r 1) c 0.05 (6) 12.592 6.281, 故在水
pˆ i Pˆ{x i} e
i! 4.2
,
i 0,1,.
4.2 i
例如
pˆ 0
Pˆ{x
0}
e 4.2
0.015,
3!
pˆ 3 Pˆ{x 3} e 4.2 0.185,
4.2 3
i0
pˆ12 Pˆ{x 12} 1 pˆ i 0.002. 11
例1 的c2检验计算表
Ai fi pˆ i npi fi npˆ i ( fi npˆ i ) / npˆ i 2
出现的天数 50 31 26 17 10
8
6
6
8
试检验相继两次地震的天数x服从指数分布(a0.05). 解 需检验假设
H0 :
x的概率密度为
0,
x 0.
f
(x)
1
e x
/
,
x
0,
先由极大似然估计法求得的估计为
162
x 2231 13.77.
x为连续型随机变量,将[0, ∞)分为k=9个互不重叠的子区
A0 1 0.015 1.5
-1.8
0.415
A1 5 0.063 6.3
A2 16 0.132 13.2
2.8
0.594
… …… … … … … … … …

概率论与数理统计(茆诗松)第二版课后第八章习题参考答案

概率论与数理统计(茆诗松)第二版课后第八章习题参考答案

σ
r
(2) E( S A ) = (r − 1)σ 2 + m ∑ ai2 ,且当 H0:a 1 = a 2 = … = a r = 0 成立时,
i =1
σ2
SA
~ χ 2 (r − 1) ;
(3)Se 与 SA 相互独立. 证:根据第五章的定理结论知: 设 X1 , X 2 , …, Xn 相互独立且都服从正态分布 N (µ , σ 2 ),记 X =
i =1 j =1 r m
1
σ2

(Y ∑∑ = =
i 1 j 1
r
m
ij
− Yi⋅ ) 2 ~ χ 2 (rm − r ) ,
σ
Se
2
=
1
σ
2
(Y ∑∑ = =
i 1 j 1
r
m
ij
− Yi⋅ ) 2 ~ χ 2 (n − r ) ,即得 E(S e) = (n − r)σ 2;
4
(2) S A = m∑ (Yi⋅ − Y ) 2 = m∑ (ai + ε i⋅ − ε ) 2 = m∑ ai2 + m∑ (ε i⋅ − ε ) 2 + 2m∑ ai (ε i⋅ − ε ) ,
j =1
m
Ti 1 m = ∑ Yij , i = 1, 2, …, r, m m j =1
r r m 1 1 r m 1 r T = ∑ Ti = ∑∑ Yij , Y = T = Y = Yi⋅ , ∑∑ ij r ∑ n rm i =1 j =1 i =1 i =1 j =1 i =1
用 Yi⋅ 作为µ i 的点估计,Y 作为µ 的点估计.又记 ε i⋅ 表示第 i 个总体下随机误差平均值,ε 表示总的随机误 差平均值,即

分布的拟合检验方法分析(ppt 104页)

分布的拟合检验方法分析(ppt 104页)

K
2 n
卡方统计量与2分布
Kn 2
(vijTij)2 Tij
r2
近 似 ~ 服 从2[(c1)(r1)]ck
2
(k
1)
类别 a 1
理论值 np 1
观察值
f1
a 2 …. a k
np 2 …. np k f 2 …. f k
P{Xai}pi
i1,2,3, ,k H0 : pi p(Ai) , i 1,2,...k,

黄色纯系
… 子一代 绿色纯系
子二代
根据他的理论,子二代中, 黄、绿之比 近似为3:1,他的一组观察结果为:黄70,绿27 近似为2.59:1,与理论值相近.
§3.分布拟合检验
检验孟德尔的3:1理论:
提出假设H0: p1=3/4, p2=1/4 这里,n=70+27=97, k=2,
理论频数为: np1=72.75, np2=24.25 实测频数为70,27.
§3.分布拟合检验
需要: 在总体X 的分布未知时,根据来自总体的样本, 检验关于总体分布的假设的一种检验方法。
解 决 这 类 问 题 的 工 具 之 一 是 英 国 统 计 学 家 K .皮 尔 逊
在 1 9 0 0 年 发 表 的 一 篇 文 章 中 提 出 的 2 拟 合 检 验 法 。
χ 2 拟 合 检 验 法 最 初 是 用 于 分 类 数 据 的 有 关 检 验 问 题 的
§3.分布拟合检验
实际中可能遇到这样的情形,总体服从何种理论分布并 完全不知道,要求我们直接对总体分布提出一个假设 。
例如,从1500到1931年的432年间,每年爆发战争 的次数可以看作一个随机变量,椐统计,这432年间共 爆发了299次战争,具体数据如下:

同济概率统计第八章

同济概率统计第八章

§8.2 两种常用的点估计(矩估计和极大似然估计)
一、矩估计 当n较大时可以用频率分布(把它看作是某个随即变量 的函数)的数字特征来估计总体X相对应的数字特征。 频率分布的各阶矩恰是相应的样本矩的观测值。这种估 计方法称为矩法。 定义8.1 设 ( X 1 ,… , X n )是取自总体X的一个样本,记 α k E ( X k ), k = 1, 2, 如果未知参数 θ = ϕ (α1 ,… , α m ) ,那 么,称估计量 θˆ = ϕ ( A1 ,… , Am ) 为θ的矩估计量。
2
无偏估计。比较他们方差的大小。
1 n 2 ˆ σ = ∑ X i 具有无偏性,而样本方差 S 2 也是 σ 2 的 n i =1
2
X 例8.14 设 ( X 1 ,… , X n ) 是取自总体X的一个样本, ~ R (0,θ ) 其中θ未知,θ>0。由例8.11知道,θ的矩估计 2X 是无偏估计,且方差为
P (θ ( X 1 ,… , X n )) ≤ θ ≤ θ ( X 1 ,… , X n ) ≥ 1 − α
其中λ未知,λ>0。由于 1 = E ( X ) = λ ,因此 λ = α1 α 的矩估计为 X 。
设一升水中含有的大肠杆菌个数 X ~ P (λ ) ,其中λ未知, 例8.1(续 ) λ>0。为了检查水消毒设备的效果,从消毒后的水中随机 地抽取了50次,每次1升。化验得到每升水中大肠杆菌个数 如表8.1所示,试估计平均每升水中大肠杆菌个数?
定理8.1 设 ( X 1 ,… , X n )是取自总体X的一个样本,E ( X ) = µ 2 ,µ 和 σ 2 都未知 D( X ) = σ (ⅰ) X 是未知参数 µ 的矩估计;
2 (ⅱ) S n 是未知参数 σ 2 的矩估计, S n 是未知参数 σ 的 矩估计。

分布拟合检验

分布拟合检验

可建立统计假设
1 1 1 1 H 0 : p1 = , p2 = , p3 = , p4 = p5 = 2 4 8 16 依题意n=100,k=5,因此
(ν i − npi ) χ =∑ = 3.2 npi i =1
2 5 2
给定 α = 0.05, 查表 χ 0.95 ( 4) = 9.488 由于 χ < χ 0.95 ( 4)
H 0 : F ( x ) = F0 ( x); H1 : F ( x ) ≠ F0 ( x)
这是分布检验问题,属于非参数假设检验 问题。从解决实际问题的角度来看,在获 得样本 (ξ1,L, ξn ) 的观察值后,应设法找 到一个分布函数,把它作为总体的分布是 与观察值相吻合的。这就是所谓的分布拟 合问题。因此,检验总体分布是否是某一 个确定的分布,也称为分布拟合检验。很 明显,分布拟合问题是难度很大的问题, 2 因为已知的东西太少,下面只介绍 χ 拟合 检验法,但不给出理论证明。
2 2
2
故不能拒绝原假设 H 0 ,即认为黑盒中白球与 黑球的个数相等。
例 根据63年的观察资料,上海每年夏季(5月 至9月)发生的暴雨的天数记录如下:
暴雨 天数
0 4
1 8
2
3
4
5
6 2
7 1
8 1
9 0
年 份 数
14 19 10 4
能否由此表明上海夏季发生暴雨的天数服从泊松 分布? 解:总体 ξ 是上海夏季发生暴雨的天数。待检 验的假设是
ˆ i = F0 ( a i ; θˆ1 , L , θˆr ) − F0 ( a i −1 ; θˆ1 , L , θˆr ) p

ˆi ) (ν i − n p νi =∑ −n χ =∑ ˆi ˆi np i =1 i =1 n p

分布拟合检验-PPT课件

分布拟合检验-PPT课件


i1
(xi x)2
( 0 W 1 )
正态性W检验方法
3、计算样本观测统计量值 4、判断
由于0<W<1,在H0为真时,W接近1,W值过小应拒 绝H0
当 p , 拒 绝 H ; p , 不 能 拒 绝 H 0 0
p PW ( W ) 1 H 0 0
请看SAS实现部分
当 p , 拒 绝 H ; p , 不 能 拒 绝 H 0 0
p P ( ( l k1 ) )
2 2 0
经验分布拟合检验方法
2 拟合优度检验是针对, pF () a F ( a ) , i 1 , 2 , … , l i 0 i 0 i 1
即对各段概率正确性的检验,而经验分布拟合检验 是直接针对H0:F(x)=F0(x)的检验。 理论依据:经验分布函数Fn(x)依概率收敛于分 布函数F(x) 出发点:经验分布函数Fn(x)与原假设中理论 分布函数F0(x)之间的距离。 1、假设
数据的分布拟合检 验与正态性检验
总体分布服从正态分布或总体分布已知 条件下的统计检验,称为参数检验。 但是在数据探索分析中,我们需要拟合的 正是数据的分布。这就要用到非参数假设检 验——分布拟合检验(用于检验样本观测值 是否来自某种给定分布)。 常用的分布拟合检验方法有 2 检验, 经验分布拟合检验法,以及正态性W检验法 。
1、提出假设
H0:F(x)=F0(x),H1:F(x)≠F0(x)
2、构造检验统计量
其中, m i 和 np i 频数 p F a ) 1 0( 1
2 ( m np ) i 2 = i npi i1 分别为第i组的样本频数和理论 l
p F a F a ) ,i 23... , , , l 1 i 0( i) 0( i 1 p 1 F a ) l 0( l 1

概率论与数理统计(经管类)第八章课后习题答案word

概率论与数理统计(经管类)第八章课后习题答案word

习题8.11.某天开工时,需检验自动装包机工作是否正常.根据以往的经验,其装包的重量在正常情况下服从正态分布N(100,1.52)(单位:公斤).现抽测了9包,其重量为:99.3 98.7 100.5 101.2 98.3 99.7 99.5 102.0 100.5问这天包装机工作是否正常?将这一问题化为一个假设检验问题,写出假设检验的步骤,设α=0.05.解: (1)作假设H0:μ=100,H1:μ≠100(2)选取检验统计量u=X−100σ√n⁄(3)查表知μα2=μ0.025=1.96, 拒绝域为|u|=|X−100σ√n⁄|≥1.96(4)由样本观测值有=99.97∴|u|=|X−100σ√n⁄|=|99.97−1001.5√9⁄|=0.06<1.96.不属于拒绝域,所以接受原假设H0,即认为这天包装机工作正常.2.设α,β分别是假设检验中犯第一,第二类错误的概率且H0,H1分别为原假设和备择驾驶,则(1)P{接受H0|H0不真}=β(2)P{拒绝H0|H0真}=α(3)P{拒绝H0|H0不真}=1−β(4)P{接受H0|H0真}=1−α习题8.21.某自动机生产一种铆钉,尺寸误差X~N(μ,1),该机正常工作与否的标志是检验μ=0是否成立.一日抽检容量n=10的样本,测得样本均值X=1.01.试问:在检验水平α=0.05下,该日自动机工作是否正常?解:检验假设H0:μ=μ0=0,H1:μ≠0∵X=1.01,n=10,σ=1∴|u|=|X−μσ√n⁄|=|1.01−01√10⁄|=3.194查表知μα2=μ0.025=1.96,由于|u|=3.194>1.96,故拒绝H0,即该日自动机工作不正常.2.假定考生成绩服从正态分布,在某地一次数学统考中,随机抽取了36位考生的成绩,算的平均成绩为X=66.5分,标准差S=15分,问在显著性水平0.05下,是否可以认为这次考试全体考生的平均成绩为70分?解: 检验假设H0:μ=μ0=70,H1:μ≠70选取检验统计量t =X−μ0S √n⁄−1)拒绝域为|t |=|X−70S √n ⁄≥t α2(n −1)=t 0.025(35)=2.0301将X =66.5,S =15,n =36代入得|t |=1.4<2.0301.故接受H 0.即在显著性水平0.05下, 可以认为这次考试全体考生的平均成绩为70分. 3. 某种产品的重量X~N (12,1)(单位:克).更新设备后,从新生产的产品中,随机地抽取100个,测得样本均值=12.5(克).如果方差没有变化,问设备更新后,产品的平均重量是否有显著变化(α=0.1)? 解: 检验假设H 0:μ=μ0=12,H 1:μ≠12 ∵ =12.5,n =100,σ=1∴|u |=|X −μσ√n⁄|=|12.5−121√100⁄|=5查表知μα2=μ0.05=1.645,由于|u |=5>1.645,故拒绝H 0.即设备更新后,产品的平均重量有显著变化.4. 一种燃料的辛烷等级服从正态分布,其平均等级为98.0,标准差为0.8,现从一批新油中抽25桶,算得样本均值为97.7.假定标准差与原来一样,问新油的辛烷平均等级是否比原燃料平均等级偏低(α=0.05). 解: 检验假设H 0:μ≤μ0=98,H 1:μ>98 ∵ =97.7,n =25,σ=0.8∴|u |=|X −μσ√n⁄|=|97.7−980.8√25⁄|=1.875查表知μα2=μ0.025=1.96,由于|u |=1.875<1.96,故接受H 0.即可以认为新油的辛烷平均等级比原燃料平均等级偏低.5. 从一批灯泡中随机抽取50个,分别测量其寿命,算得其平均值X =1900(小时),标准差S=490(小时).问能否认为这批灯泡的平均寿命为2000(小时)( α=0.01).(用大样本情况下的u 检验) 解: 检验假设H 0:μ=μ0=2000,H 1:μ≠2000 ∵ X =1900,n =50,s =490∴|u |=|X −μs √n⁄|=|1900−2000490√50⁄|=1.44查表知μα2=μ0.005=2.57,由于|u |=1.44<2.57,故接受H 0.即可以认为这批灯泡的平均寿命为2000(小时).6. 某批矿砂的五个样品中镍含量经测定为(%):3.25 3.27 3.24 3.263.24设测定值服从正态分布,问能否认为这批矿砂的镍含量为3.25%(α=0.05). 解: 检验假设H 0:μ=μ0=3.25,H 1:μ≠3.25 选取检验统计量t =X−μ0S √n⁄−1)经计算=3.252,S =0.013 拒绝域为|t |=|X−3.25S √n⁄|≥t α2(n −1)=t 0.025(4)=2.7764将X =66.5,S =15,n =5代入得|t |=0.344<2.7764.故接受H 0. 即可以认为这批矿砂的镍含量为3.25%.7. 有甲,乙两台机床加工同样产品,从这两台机床中随机抽取若干件,测得产品直径(单位:毫米)为:机床甲20.5 19.8 19.7 20.4 20.1 20.0 19.0 19.9 机床乙19.720.8 20.5 19.8 19.4 20.6 19.2 假定两台机床加工的产品直径都服从正态分布,且总体方差相等.问甲,乙两台车床加工的产品直径有无显著差异(α=0.05). 解:检验假设H 0:μ1=μ2,H 1:μ1≠μ2经计算X =19.925,y =20,S 12=1.5157,S 22=2.386∴|t |=|X −y S w √1m +1n|=||19.925−20√7∗1.5157+6∗2.3868+7−2∗√18+17||=0.265查表知t α2(m +n −2)=t 0.025(13)=2.1604,由于|t |=0.265<2.1604,故接受H 0.即甲,乙两台车床加工的产品直径无显著差异.8. 从甲地发送一个信号到乙地.设乙地接受到的信号值是一个服从正态分布N(μ,0.22)的随机变量,其中μ为甲地发送的真实信号值.现甲地重复发送同一信号5次,乙地接受到的信号值为 8.05 8.15 8.2 8.1 8.25 设接收方有理由猜测甲地发送的信号值为8.问能否接受这一猜测? (α=0.05) 解: 检验假设H 0:μ=μ0=8,H 1:μ≠8∵ =8.15,n =5,σ=0.2∴|u |=|X −μσ√n⁄|=|8.15−80.2√5⁄|=1.677查表知μα2=μ0.025=1.96,由于|u |=1.677<1.96,故接受H 0.即可以接受这一猜测. 习题8.31. 某纺织厂生产的某种产品的纤度用X 表示,在稳定生产时,可假定X~N(μ,σ2),其中标准差σ=0.048.现在随机抽取5跟纤维,测得其纤度为 1.32 1.55 1.36 1.40 1.44 试问总体X 的方差有无显著变化. (α=0.1) 解: 检验假设H 0:σ=0.048,H 1:σ≠0.048 检验统计量χ2=(n−1)S 2σ02~χ2(n −1)由α=0.1查表得χα22(n −1)=χ0.052(4)=9.488,χ1−α22(n −1)=χ0.952(4)=0.711于是得出拒绝域为W =(0,0.711)∪(9.488,+∞) 经计算S 2=0.31124代入χ2=(n−1)S 2σ02=4∗0.311240.048=13.51>9.488,故拒绝H 0.即总体X 的方差有显著变化.2. 设有来自正态总体X~N(μ,σ2),容量为100的样本,样本均值X =2.7,μ,σ2均未知,而∑(x i −x)2ni=1=225在α=0.05下,检验下列假设: (1) H 0:μ=3, H 1:μ≠3; (2) H 0:σ2=2.5, H 1:σ2≠2.5. 解: (1) 检验假设H 0:μ=3, H 1:μ≠3∵ X =2.7,n =100,S =√1n −1∑(x i −x)2ni=1=1.508 因此可用大样本情况的u 检验|u |=|X −μs √n⁄|=|2.7−31.508√100⁄|=1.99查表知μα2=μ0.025=1.96,由于|u |=1.99>1.96,故拒绝H 0.(同课后答案有争议)(2)该题无法查到χ0.0252(99)值故省略.(用χ2检验)3. 甲,乙两台机床加工某种零件,零件的直径服从正态分布,总体方差反映了加工精度.为比较两台机床的加工精度有无差别,现从各自加工的零件中分别抽取7件产品和8件产品,测得其直径为X(机床甲)16.2 16.4 15.8 15.5 16.7 15.6 15.8 Y(机床乙)15.9 16.0 16.4 16.1 16.5 15.8 15.7 15.0 问这两台机床的加工精度是否一致? 解:该题无α值,故省略.(用F 检验)4. 对两批同类电子元件的电阻进行测试,各抽6件,测得结果如下(单位:Ω)A 批0.140 0.138 0.143 0.141 0.144 0.137 B 批 0.135 0.140 0.142 0.136 0.138 0.141 已知元件电阻服从正态分布,设σ=0.05,问:(1) 两批电子元件电阻的方差是否相等; (2) 两批元件的平均电阻是否有差异.解: (1)检验假设H 0:σ12=σ22, H 1:σ12≠σ22经计算S 12=0.00272,S 22=0.00282由α=0.05查表得F α2(n 1−1,n 2−1)=F 0.025(5,5)=无法查F 0.025(5,5)对应值,故无法做. 习题8.4某厂使用两种不同的原料生产同一类产品,随机选取使用原料A 生产的产品22件,测得平均质量为X =2.36(kg),样本标准差S x =0.57(kg).取使用原料B 生产的样品24件,测得平均质量为y =2.55(kg),样本标准差S y =0.48(kg).设产品质量服从正态分布,这两个样本相互独立.问能否认为使用B 原料生产的产品平均质量较使用原料A 显著大?(取显著性水平α=0.05).解:检验假设H 0:μA ≥μB , H 0:μA <μB ; 选取检验统计量t =X −y S w √1m +1n+n −1)|t |=|X −y S w √1m +1n|=|2.36−2.55√21∗0.572+23∗0.48244∗√122+124|=1.226查表知t α2(m +n −2)=t 0.025(44)=2.0154,由于|t |=1.226<2.0154,故接受H 0.即使用B 原料生产的产品平均质量于使用原料A 生产的产品平均质量无显著大.自测题8 一、,选择题在假设检验问题中,显著性水平α的意义是 A . A. 在H 0成立的条件下,经检验H 0被拒绝的概率 B. 在H 0成立的条件下,经检验H 0被接受的概率 C. 在H 0不成立的条件下,经检验H 0被拒绝的概率 D. 在H 0不成立的条件下,经检验H 0被接受的概率 二、,填空题1. 设总体X 服从正态分布N (μ,σ2),其中μ未知,x 1,x 2,⋯,x n 为其样本.若假设检验问题为H 0:σ2=1, H 1:σ2≠1,则采用的检验统计量应为 χ2=(n−1)S 21.2. 设某假设检验问题的拒绝域为W,且当原假设H 0成立时,样本值x 1,x 2,⋯,x n 落入W 的概率为0.15,则犯第一类错误的概率为 0.15 .(参考page 169)3. 设样本,x 1,x 2,⋯,x n 来自正态分布N (μ,1),假设检验问题为H 0:μ=0,H 1:μ≠0,则在H 0成立的条件下,对显著性水平α,拒绝域W 应为 |u |>u α,其中u =X √n .(参考page 181表8-4)三、某型号元件的尺寸X 服从正态分布,其均值为3.278cm,标准差为0.002cm.现用一种新工艺生产此类元件,从中随机取9个元件,测量其尺寸,算得均值X =3.2795cm ,问用新工艺生产的元件尺寸均值与以往有无显著差异.(显著发生性水平α=0.05)(附u 0.025=1.96,u 0.05=1.645) 解: 检验假设H 0:μ=μ0=3.278,H 1:μ≠3.278 ∵ X =3.2795,n =9,σ=0.002∴|u |=|X −μσ√n⁄|=|3.2795−3.2780.002√9⁄|=2.25又因μα2=μ0.025=1.96,|u |=2.25>1.96故拒绝H 0,即用新工艺生产的元件尺寸均值与以往有差异.四、用传统工艺加工的某种水果罐头中,每瓶的平均维生素C的含量为19(单位:mg).现改变了加工工艺,抽查了16瓶罐头,测得维生素C的含量的平均值X=20.8,样本标准差S=1.617.假定水果罐头中维生素C的含量服从正态分布.问在使用新工艺后,维生素C的含量是否有显著变化(显著性水平α=0.01)?(附t0.005(15)=2.9467,t0.005(16)=2.9208)解: 检验假设H0:μ=μ0=19,H1:μ≠19∵=20.8,n=16,S=1.617∴|t|=|X−μS√n⁄|=|20.8−191.617√16⁄|=4.453又因tα2(n−1)=t0.005(15)=2.9467,|t|=4.453>2.9467故拒绝H0,即使用新工艺后,维生素C的含量有显著变化.。

概率论-8.4 分布拟合检验

概率论-8.4 分布拟合检验

0
1
2
3
4
5
6
7
含 ni 个错误的页数
36
40
19
2
0
2
1
0
据此数据,问能否认为该书的一页中印刷错误个数服从
泊松分布?( 0.05)
解 按题意需检验假设
H0 : PX
i ie
i!
,( i 0,1, 2,L
).
记 Ai X i ,( i 0,1, 2,L , 6 ), A7 X 7 .
H0 : P( Ai ) pi ; H1 : P( Ai ) pi
n
其中 pi 1 且 pi 为已知.一般地,此类备择假设常常可 i 1
以省略.
2020年4月26日星期日
2
目录
上页
下页
返回
定理 1 若 n 充分大( n 50 ),则当 H0 为真时,统计量
2 r (ni npi )2 近似服从 2 (r 1) 分布.(证明略)
i1
npi
根据上述定理,对于给定的显著性水平 ,可以推 知假设检验的拒绝域为
2
r i1
(ni
npi )2 npi
2 (r 1) .
由此可知,在显著性水平 下,当 2 2 (r 1) 时就
拒绝原假设 H0 ,否则就接受原假设 H0 .这种检验称 2
拟合检验.
2020年4月26日星期日
3
目录
pi
1 5

i 1, 2,L ,5 ,以 Ai 表示事件“病假日在周 i ”,则需要检
验假设
H0
: P( Ai )
1, 5
(i
1, 2,L
,5) .
2020年4月26日星期日

概率论课件分布拟合检验

概率论课件分布拟合检验

其中i=1,2, , k, a0 -; ak ,我们称npi (i 1, 2, k) 为第i个区间上的理论频数;pi为理论频率.
(3)抽取大样本,统计落在各个区间上的个体个数
ni (i 1, 2, , k), 称ni为第i个区间上的实际频数.
(4)选用检验H0的统计量,直观上,如果H0成立, 那么 npi与ni的差别不应该太大,因此可以利用ni与npi之间 的差异来检验H0.能够体现它们的差异大小的统计量 之一是
查表得
02.0(5 5) 11.071,拒绝域为 2 11.071 现 2的值没有落入拒绝域,故接受H0,即可认为这颗骰子
是均匀的.

2 (k

r
1)就拒绝H

0
否则就接受H0.
例1为检验一颗骰子的六个面是否均匀,掷骰子120次, 得到结果如下:
点数 1 2 3 4 5 6 频数ni 21 28 19 24 16 12
试在 =0.05的水平下对他作出检验.
解 一颗骰子的六个面是否均匀就是检验每个面出 现的概率是否都是1/6。即可做假设
H0
:
P{X

k} 1 (k 6 Nhomakorabea 1, 2,..., 6),我们分6组
并计算各组的理论频数120 1 20,从而得到统计量 2的值
6
2 (21 20)2 (28 20)2 (12 20)2 8
20
20
20
由于假设H0中无未知参数,所以r 0,对于 0.05,
5.5 分布拟合检验
前面几节讨论了关于总体分布中未知参数的假设检验, 在这些检验中总体的分布是已知的。然而在许多情况下,并 不知道总体分布的类型,此时需要根据样本提供的信息,对

[理学]上海大学2011级概率论与数理统计第8章

[理学]上海大学2011级概率论与数理统计第8章
我们先来看两个例子
例1:在摇奖之前要先检验摇奖机是否正常,
现让摇奖机摇出200个数,得到如下结果
号码: 0 1 2 3 4 5 6 7 8 9
出现次数:25 18 21 22 17 23 20 16 18 18
问:摇奖机是否正常 这就是分布检验问题。 H 0
:
P{X

i} 1 10
例2:某车间用一台包装机包装糖果,包的袋装糖
推进器的燃烧率是否较以往生产的推进器的燃烧率
有显著的提高?取显著性水平 0.05
五、 假设检验的基本步骤
1、根据实际问题的要求,提出原假设 H0 和备择假设 H1;
2、给定显著水平 和样本容量 n ;
3、确定检验统计量; 4、按 P{拒绝H0 H0为真} 的原则,
并由分位点的定义,求出拒绝域;
§3 双 正态总体的假设检验
一、 两个正态总体均值差的检验
1、
方差
2 1
,
22已知的情形
(1) 双边检验
双边检验问题为:H0 : 1 2 , H1 : 1 2
首先找一个检验统计量, 由第5章知:
(x y) (1 2 ) ~ N 0,1
12
/ n
这时称区域 W 为拒绝域,拒绝域的边界点为临界点。
如上例的拒绝域为 (, Z/2) (Z 2, )
Z /2 为临界点。当
x 0 n
k
时, 称 x与0 有显著差异,
否则称两者差异不显著。
三、单边检验
我们将形如 H0 : 0 , H1 : 0


2 2
n1 n2
且 X , Y 分别是1, 2 的无偏估计,所以当 H0 为真时: (1) (x y) 不应很大;

上海市考研数学复习资料概率论与数理统计重点知识点总结

上海市考研数学复习资料概率论与数理统计重点知识点总结

上海市考研数学复习资料概率论与数理统计重点知识点总结上海市考研数学复习资料 - 概率论与数理统计重点知识点总结概率论与数理统计是考研数学中的一大重要章节,涉及概率、随机变量、概率分布、矩估计等内容。

下面将针对上海市考研数学概率论与数理统计重点知识点进行总结,帮助考生快速回顾和复习。

一、概率基本概念概率指事件发生的可能性大小。

常见的概率运算包括事件的和、积、差运算,以及概率的条件概率、独立性等。

此外,还有全概率公式、贝叶斯公式等重要概率计算工具。

二、随机变量及概率分布随机变量是指在随机试验中代表随机结果的函数。

常见的随机变量包括离散型随机变量和连续型随机变量。

1. 离散型随机变量离散型随机变量以概率质量函数(PMF)表示概率分布。

重要的离散型随机变量包括0-1分布、二项分布、泊松分布等。

其中,二项分布是最常见的离散型分布,常用于描述重复试验中成功次数的概率分布。

2. 连续型随机变量连续型随机变量以概率密度函数(PDF)表示概率分布。

常见的连续型随机变量包括均匀分布、正态分布、指数分布等。

其中,正态分布是最常用的连续型分布,具有对称性和重要的统计性质。

三、大数定律与中心极限定理大数定律指随着试验次数增加,样本均值逐渐收敛于总体均值的现象。

中心极限定理是指当独立随机变量和满足一定条件时,它们的和近似服从正态分布。

1. 大数定律大数定律包括切比雪夫定理、伯努利大数定律和辛钦大数定理。

其中,伯努利大数定律适用于满足一定条件的独立随机变量序列,而辛钦大数定律适用于两两相关但不一定独立的随机变量序列。

2. 中心极限定理中心极限定理包括林德伯格-莱维中心极限定理、棣莫弗-拉普拉斯中心极限定理和中心极限定理的一般形式。

其中,林德伯格-莱维中心极限定理适用于具有相同均值和有限方差的独立随机变量序列。

四、参数估计与假设检验参数估计用于根据样本数据对总体参数进行估计,假设检验用于判断总体参数是否满足某种假设。

1. 参数估计参数估计包括点估计和区间估计。

智轩考研数学红宝书2010版概率论与数理统计(第八章 假设检验)

智轩考研数学红宝书2010版概率论与数理统计(第八章 假设检验)
以做 H0 : m ³ m0 。但不能作原假设 H0 : m ¹ m0 ,也不能做 H0 : m > m0 或 H0 : m < m0 。 若原假设为 H0 : m = m0 ,则备择假设可以是 H1 : m ¹ m0 , H1 : m > m0 或 H1 : m < m0 三种情形都可以;
若原假设是 H0 : m £ m0 ,则备择假设通常是 H1 : m > m0 ;若原假设是 H0 : m ³ m0 ,则备择假设通常是 H1 : m < m0 。
sn



m ³ mo m < mo
Z £ -Za = Z1-a
~ N (0,1)

±Za 2 Za - Za

m = mo m ¹ mo
t ³ ta 2 = -t1-a 2
m
s2
未 m £ mo m > mo
t ³ ta = -t1-a
t = X - mo Sn
n -1
±ta 2 ta

~ t(n -1)
三、正态总体的参数检验的考点
1、单个正态总体(注意等号的分布位置,对单边假设等号一般在原假设上)
检验
条件 参数
Ho
H1
Ho 的拒绝域
选用检验枢轴量 自由度 分位点
m = mo s2
m ¹ mo
Z ³ Za 2 = -Z1-a 2
Z = X - mo
已 m £ mo m > mo
Z ³ Za = -Z1-a
的拒绝域为
æ
öæ
ö
æ
ö
ç è
-¥,
-l1-a 2
÷ ø
È
ç è

《概率论与数理统计》教学课件(共8章)第2章 随机变量及其概率分布

《概率论与数理统计》教学课件(共8章)第2章 随机变量及其概率分布

显然,p1+p2+p3+p4=1。
2.1 离散型随机变量
2.1.2 离散型随机变量的分布律
(2) X为直到取得白球时的取球次数。因为每次取出的黑球仍放回去,所以X的所有可能取值是一
切正整数1, 2, …,n, ….由于是放回抽样,故每次抽球的试验是独立的。由独立事件的概率乘法公式,得
X的分布律:
p1=P{X=1}=25, p2=P{X=2}=35×25=265,
概率论与数理统计
第2章 随机变量及其概率分布
2.1 离散型随机变量 2.2 连续型随机变量 2.3 分布函数 2.4 随机变量函数的分布
2.1 离散型随机变量
2.1.1 随机变量的概念
在第1章中,我们讨论了随机事件及其概率.为了全面研究随机试验的结果,我们引入随机变量这 一十分重要的概念。我们所讨论的随机事件几乎无一例外地可用随机变量来描述,用随机变量描述随 机现象是概率论中最重要的方法。
P{X>6}=P{X=7}+P{X=8}+P{X=9} =C97(0.2)7(0.8)2+C98(0.2)8(0.8)+(0.2)9 ≈0.0003.
这一结果表明,供应6个人的需电量,超负荷的可能性仅为0.03%。也就是说,平均在大约55.6h 中,可能有一分钟超负荷。
2.1 离散型随机变量
2.1.3 几种常见的概率分布律
称X=X(ω)为该试验的一个随机变量。
本书中,用大写字母X, Y, Z, W等表示随机变量,用小写字母x, y, z, w等表示实数。
随机变量的取值随着试验的结果而定,因而在试验之前,只能知道它可能取值的范围,而不能预
知它取哪一个值。且试验的所有结果的出现都有一定的概率,因而随机变量的取值也有一定的概率。

《概率论与数理统计》课件

《概率论与数理统计》课件

条件概率与独立性
条件概率
在某个事件B已经发生的条件下,另 一事件A发生的概率,记为P(A|B)。
独立性
两个事件A和B如果满足 P(A∩B)=P(A)P(B),则称事件A和B是 独立的。
随机变量及其分布
01
随机变量
随机变量是定义在样本空间上的 一个实值函数,表示随机试验的 结果。
02
离散型随机变量
03
连续型随机变量
离散型随机变量的取值可以一一 列举出来,其概率分布可以用概 率质量函数或概率函数表示。
连续型随机变量的取值范围是一 个区间或半开区间,其概率分布 可以用概率密度函数表示。
数理统计初步
02
统计数据的描述
01
统计数据的收集
描述如何通过调查、试验或观测 等方法,获取用于统计分析的数
据。
03
夫链
随机过程的基本概念
随机过程
随机过程是一组随机变量,每个随机 变量对应于时间或空间的一个点。
有限维分布
描述随机过程在有限个时间点上的联 合分布。
独立性
如果随机过程在不相交的时间区间上 的随机变量是独立的,则该随机过程
是独立的。
马尔科夫链及其性质
马尔科夫性
在已知现在状态下,未来与过去独立,即“未来 只取决于现在”。
03
数据的可视化
介绍如何使用图表(如直方图、 散点图等)将数据可视化,以便 更直观地理解数据分布和关系。
02
数据的整理
介绍如何对数据进行分类、排序 和分组,以便更好地理解和分析

04
数据的数字特征
介绍如何使用均值、中位数、众 数、方差等统计量来描述数据的
中心趋势和离散程度。
参数估计与置信区间

《数理统计》第8章§6分布拟合检验

《数理统计》第8章§6分布拟合检验
第八章 假设检验
§6
分布拟合检验
7/7
11,13,18,19, 11,13,18,19,23
第八章 假设检验

第八章 假设检验
§6
分布拟合检验
2/7
χ2
通常认为一个班的某课程的考试成绩 X 服从正态 分布,但事实是否真的如此? 分布,但事实是否真的如此?有必要检验假设 H0 : ~ N(,σ 2 ) X 考察某台电子仪器的无故障时间 12 次,得数据
28, 42, 54, 92, 138, 159, 169, 181, 210, 234, 236, 266
i =1
第八章 假设检验
§6
分布拟合检验
4/7
设 X1, X 2,, Xn为离散型总体 X的样本 , X 的分布律 未知, 未知,要检验假设
H0: {X = ai} = pi , H1: {X = ai} ≠ pi (i =1,2,, k ) P P k 均已知, 其中 a i , pi (1, 2, , k)均已知,且 ∑ pi =1
§6
2 k
分布拟合检验
5/7
( f i npi )2 统计量 χ = ∑ npi 的近似分布是 χ2 (k r 1) ,其中 r i =1 是被估计参数的个数. 是被估计参数的个数. 一般当 n ≥ 50 就认为 χ2 ~ χ2 (k r 1)
H0的拒绝域是 k ( f np )2 i ∑ npi i > χ12α (k r 1) i =1
§6
分布拟合检验
1/7
设 X1, X2 , , Xn 是总体 X ~ f (x ,θ ) 的样本 的形式已知, 未知, 如果 f 的形式已知,只有参数 θ 未知,则可通过点估 计,区间估计,参数假设检验等方法对 θ 进行统计推断 区间估计, 如果 f 的形式未知,怎样对总体进行统计推断 的形式未知,

概率论与数理统计试题和答案上海大学

概率论与数理统计试题和答案上海大学

概率论与数理统计试题和答案上海大学概率论与数理统计试题和答案上海大学上海大学2022~2022学年冬季学期试卷(A卷)课程名: 概率论与数理统计A 课程号:。

应试人应试人学号应试人所在院系一.是非题(每小题2分,5题共10分)B互不相容,若A不发生,那么B一定发生。

()2、事件AB表示事件“A与B都没有发生”。

()3、设和S2分别是总体X~N( , 2)的样本均值和样本方差,样本容量是n,和2是未知参数,但U ()仍是一个统计量。

4、如果X是一个连续型的随机变量,那么P(X x) 0。

()5、如果X~ 2(n),Y~ 2(m),则一定有结论:F()X/n~F(n,m)。

Y/m二.填空题(每空3分,共15分)和B的概率分别为P(A) 0.7和P(B) 0.5,且这两个事件独立,那么,P(B A) 。

7、设随机变量X服从区间[0,1]上的均匀分布,则随机变量Y eX的数学期望EY DY 。

8、把5只球随机放入三个盒中,则每个盒子中至少有一球的概率为。

9、设X1,9,X10是来自总体X~N( , 2)的简单样本,当常数c 统计量c (Xi 1 Xi)2为参数2的无偏估计。

i 1三.选择题(每小题2分,5题共10分)概率论与数理统计试题和答案上海大学10、随机事件A和B的概率为P(A) 0.6,P(B) 0.4,则正确的是。

(A) A B;(B) A与B互不相容;(C) P(AB) 0;(D)上述结论不一定成立。

11、设随机变量X和Y服从指数分布,且相互独立,则下列分布一定服从指数分布的是。

(A) Z X Y;(B) Z min{X,Y};(C) Z max{X,Y};(D)Z XY。

12、设总体X~N( 1, 2),总体Y~N( 2, 2),且相互独立,X1,分别是它们的简单样本,那么不正确的是。

(A),Xn1和Y1,,Yn2~t(n1 n2 1);(B)~t(n1 1);~t(n2 1)。

~t(n1 n2 2);(D)13、如果总体X服从正态分布N( , 2),其中,已知,2未知,X1,X2,X3是取自总体的一个样本,那么是统计量的是。

概率统计简明教程-同济_第八章_统计与统计学

概率统计简明教程-同济_第八章_统计与统计学

每一样品Xi与总体同分布。 ②独立性——样本中的样品取值相互不影响,即
x1, x2,…,xn相互独立。
2020/8/14
皖西学院 数理系
12
样本的分布函数
设总体X的分布函数为F(x),则容量为n的样本是一
概 率
个n维随机变量,其联合分布函数为

F ( x)

n
F(x1, , xn ) F(xi ) i 1
皖西学院 数理系
21
与与数数理理统统与与数数理理统统2012420皖西学院数理系15在有放回的条件下样本与与数数理理统统与与数数理理统统2012420皖西学院数理系16与与数数理理统统与与数数理理统统2012420皖西学院数理系17某社区计划建一所养老院服从对象为满足一定条件的65岁以上的老人
引言
数理统计是具有广泛应用的一个数学分支,它是在
皖西学院 数理系
5

率 论
第二节 总体和样本





2020/8/14
皖西学院 数理系
6
我们今后所讨论的统计问题主要属于下面这种类型:
从一个集合中选取一部分元素,对这些元素的某些数
量指标进行测量,根据测量获得的数据来推断此集合
概 率
中全部元素的这些数量指标的分布情况。
论 在统计学中,我们把所研究的全部元素组成的集合
概 样本中所包含的个体数目称为样本容量(或子样容量)
率 论
在重复抽样中,每一个个体也是一个随机变量,因此容
与 量为n的样本可以看作是一个n维随机变量,即
数 理
(X1, X2,
, Xn).
统 计
为了使样本在尽可能大的程度上反映总体的特性,

分布拟合检验及其应用ppt

分布拟合检验及其应用ppt





4 X E X E X E X 2 E D X 2 DX

4
当总体X服从正态分布时, 1 0
2 3
现在检验假设 H 0 : X服从正态分布
N ,

2

所以 H0 的拒绝域为
分布拟合检验及其应用
总体分布服从正态分布或总体分布已知 条件下的统计检验,称为参数检验。 但是在数据探索分析中,我们需要拟合的 正是数据的分布。这就要用到非参数假设检 验——分布拟合检验(用于检验样本观测值 是否来自某种给定分布)。 2 检验, 常用的分布拟合检验方法有 经验分布拟合检验法,以及正态性W检验法。
k
n pi
fi pi n
2


i 1
k
fi
2
np i
n
其中
fi
表示样本观察值落在
i
Ai
的个数
当H0 为真时,我们可以根据H0中所假设的X 的分布函数来计算事件 A 的概率,得到
p i P Ai
定理
• 若n充分大(n 50),则当Ho为真时上面 2 定义的统计量近似服从 (k-1)分布 • 2 拟合检验法是基亍上述定理得到的,所 以使用时必须注意n丌能小亍50.另外 np i 丌 能太小,应大亍等亍5,否则应适当合并 Ai

2


i 1
k
fi
2
n ~ ( k r 1)
2
n pi
若显著性水平为 拒绝域为 2 2

( k r 1)
2 (n)
在软件中,检验通常会以P值的形式输出,P值是检 验统计量在原假设下取其观测值及其更极端值的 概率。 对亍以上检验
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

n pi
分布), 上统计量总是近似地服 从自由度为 k − r − 1 的 χ 2 分布, 其中, r是被估计的参数
( fi − npi ) 2 ≥ χα 2 (k − r − 1), 于是 , 如果在假设 H 0 下, χ = ∑ npi i =1
k 2
的个数 .
则在显著性水平 α 下拒绝 H 0 , 否则就接受 H 0 .
x 1 −θ e , x > 0, H 0 : X 的概率密度 f ( x ) = θ 0, x ≤ 0. 由于在 H 0 中参数 θ 未具体给出, 故先估计θ.
2231 ˆ 由最大似然估计法得 θ = x = = 13.77, 162 X 为连续型随机变量 为连续型随机变量,
将 X 可能取值区间 [0 , + ∞ ) 分为 k = 9 个互不重叠 见下页表) 见下页表 的子区间 [ai , ai +1 ), i = 1, 2,⋯, 9. (见下页表
i fi Ai 0 1 A0 1 5 A1 2 16 A2 3 17 A3 4 5 26 11 A4 A5 6 9 A6 7 9 A7 8 2 A8 9 1 A9 10 2 A10 11 1 A11 ≥ 12 0 A12
其中 f i 是观察到有 i 个 α 粒子的次数 . 从理论上 e − λ λi 考虑 X 应服从泊松分布 P {X = i} = , i = 0,1,2,⋯, i! −λ i e λ 问 P {X = i} = 是否符合实际 ? (α = 0.05) i! 解 所求问题为 在水平 0.05 下检验假设 所求问题为: e − λ λi , i = 0, 1, 2,⋯, H 0 : 总体 X 服从泊松分布 P {X = i} = i!
8
认为样本服从指数分布. 故在水平 0.05 下接受 H0 , 认为样本服从指数分布
例4 下面列出了84个依特拉斯坎人男子的头颅 下面列出了 个依特拉斯坎人男子的头颅 的最大宽度(mm), 试验证这些数据是否来自正 的最大宽度 (α = 0.1) 态总体? 态总体 141 148 132 138 154 142 150 146 155 158 150 140 147 148 144 150 149 145 149 158 143 141 144 144 126 140 144 142 141 140 145 135 147 146 141 136 140 146 142 137 148 154 137 139 143 140 131 143 141 149 148 135 148 152 143 144 141 143 147 146 150 132 142 142 143 153 149 146 149 138 142 149 142 137 134 144 146 147 140 142 140 137 152 145
由于在 H 0 中参数 λ 未具体给出, 故先估计λ . 由最大似然估计法得 λ = x = 4.2, 根据题目中已知表格, 根据题目中已知表格 P{ X = i }有估计
e − 4 .2 4 .2 i ˆ ˆ pi = P {X = i} = , i = 0, 1, 2,⋯, i! ˆ ˆ 如 p0 = P {X = 0} = e −4.2 = 0.015,
i =1 k
假设 H 0 下, 我们可以计算
ˆ ˆ pi = P ( Ai ) (或 pi = P ( Ai )), i = 1, 2, ⋯ , k .
在 n 次试验中 , 事件 Ai 出现的频率
fi ˆ 与 pi (或 pi ) 往往有差异 , n 但一般来说 , 若 H 0 为真 , 且试验次数又多时 , 这种差异不应很大 .
8.5 分布拟合检验
1. χ 检验法的定义 2. χ 2检验法的基本思想
2
3. 皮尔逊定理 4.小结 4.小结
1. χ 2检验法的定义
这是在总体的分布未知 的情况下, 根据样本 X 1 , X 2 , ⋯ , X n 来检验关于总体分布的 假设 H 0 : 总体 X 的分布函数为 F ( x ), H 1 : 总体 X 的分布函数不是 F ( x ), 的一种方法 .
e − 4 .2 4 .2 3 ˆ ˆ p3 = P {X = 3} = = 0.185, 3!
ˆ ˆ ˆ p12 = P{X ≥ 12} = 1 − ∑ pi = 0.002,
i =1
11
具体计算结果见下页表 ,
2 例2的 χ 拟合检验 A6
A7 A8 A9 A10

所求问题为检验假设
H 0 : X 的概率密度 f ( x ) =
1 e 2πσ
}
x − ˆ X 的分布函数的估计为 F ( x ) = 1 − e 13.77 , x > 0, 0, x ≤ 0. 概率 pi = P ( Ai )有估计 ˆ ˆ ˆ ˆ ˆ pi = P ( Ai )= P{ai ≤ X < ai +1 } = F (ai +1 ) − F (ai ), ˆ ˆ ˆ 如 p2 = P ( A2 ) = P {4.5 ≤ X < 0.5}
在这里备择假设H 在这里备择假设 可以不必写出. 说明 (1)在这里备择假设 1可以不必写出
( 2) 若总体 X 为离散型 : 则上述假设相当于
H0 : 总体 X 的分布律为 {X = xi } = pi , i = 1,2,⋯. P
( 3) 若总体 X 为连续型 : 则上述假设相当于 H0 : 总体 X 的概率密度为f ( x).
取 Ω i = { i } , ( i = 1, 2, ⋯ ,6 )
则事件 Ai = {X ∈ Ω i } = { X = i } ( i = 1,2, ⋯ ,6) 为 互不相容事件 .
1 为真的前提下, 在 H0 为真的前提下 pi = P ( Ai ) = , ( i = 1, 2,⋯,6) 1 2 6 1 2 ( 40 − 300 × ) k (70 − 300 × )2 ( f − npi ) 6 + 6 + χ2 = ∑ i = 1 npi 1 i =1 300 × 300 × 6 1 2 1 2 16 (48 − 300 × ) (60 − 300 × ) (52 − 300 × )2 ( 30 − 300 × 1 )2 6 + 6 + 6 + 6 , + 1 1 1 1 300 × 300 × 300 × 300 × 6 6 6 6 χ 2 = 20.16, 自由度为 6 − 1 = 5 ,
X Y 0 − 4 5 − 9 10 − 14 15 − 19 20 − 24 25 − 29 30 − 34 35 − 39 ≥ 40 50 31 26 17 10 8 6 6 8
服从指数分布. 试检验相继两次地震间隔天数 X 服从指数分布 解 所求问题为: 所求问题为 在水平 0.05下检验假设 下检验假设
ˆ fi 2 / npi
4.615 19.394 15.622 34.845 7.423 7.105 11.739 5.538
}
∑ =106.281
ˆ 其中有些 npi < 5的组予以合并 , 使得每组均有 npi ≥ 5, 如表中第 3列花括号所示.
并组后 k = 8, 故 χ 2 的自由度为 8 − 1 − 1 = 6,
2 查χ 2 (5)表得χ 02.05 = 11.07, χ = 20.16 > 11.07,
所以拒绝 H0, 认为这颗骰子的六个面不是匀称的 认为这颗骰子的六个面不是匀称的. 不是匀称的
在一试验中, 例2 在一试验中 每隔一定时间观察一次由某种铀所放射的到达 粒子数, 共观察了100次, 得结果如下表 计数器上的α 粒子数 共观察了 次 得结果如下表:
ˆ pi
0.2788 0.2196 0.1527 0.1062 0.0739 0.0514 0.0358 0.0248 0.0568
ˆ npi
ˆ f i 2 / npi
A7 : 29.5 ≤ x ≤ 34.5 A8 : 34.5 < x ≤ 39.5 A9 : 39.5 < x < ∞
}
}
45.1656 55.3519 35.5752 27.0132 24.7374 27.3270 17.2044 16.7980 11.9718 8.3530 8.3268 7.6860 5.7996 6.2073 4.0176 14.8269 13.2192 ∑ =163.5633 9.2016
, , . χ 注意 在使用 2检验法时 n要足够大 npi 不太小 , np 根据实践 一般n ≥ 50, 或每一个 i ≥ 5.
例1 把一颗骰子重复抛掷 300 次, 结果如下 结果如下: 出现的点数 1 2 3 4 5 6 出现的频数 40 70 48 60 52 30
试检验这颗骰子的六个面是否匀称? 试检验这颗骰子的六个面是否匀称 (取 α = 0.05 ) 这颗骰子的六个面是匀称的. 解 根据题意需要检验假设H0: 这颗骰子的六个面是匀称的 1 (或 H 0 : P { X = i } = ( i = 1,2, ⋯ ,6)) 6 其中 X 表示抛掷这骰子一次所出现的点数 (可能值只有 6 个), 可能值只有
2 例3的 χ 拟合检验计算表 的
Ai
A1 : 0 ≤ x ≤ 4.5
A2 : 4.5 < x ≤ 9.5 A3 : 9.5 < x ≤ 14.5 A4 : 14.5 < x ≤ 19.5 A5 : 19.5 < x ≤ 24.5 A6 : 24.5 < x ≤ 29.5
fi
50 31 26 17 10 8 6 6 8
χ α2 ( k − r − 1) = χ 02.05 (6) = 12.592 > 6.2815,
认为样本来自泊松分布总体. 故接受 H0, 认为样本来自泊松分布总体
相关文档
最新文档