数理统计10

合集下载

数理统计课后答案.

数理统计课后答案.

数理统计一、填空题1、设n X X X ,,21为母体X 的一个子样,如果),,(21n X X X g , 则称),,(21n X X X g 为统计量。

不含任何未知参数2、设母体σσμ),,(~2N X 已知,则在求均值μ的区间估计时,使用的随机变量为nX σμ-3、设母体X 服从修正方差为1的正态分布,根据来自母体的容量为100的子样,测得子样均值为5,则X 的数学期望的置信水平为95%的置信区间为 。

025.01015u ⨯±4、假设检验的统计思想是 。

小概率事件在一次试验中不会发生5、某产品以往废品率不高于5%,今抽取一个子样检验这批产品废品率是否高于5%, 此问题的原假设为 。

0H :05.0≤p6、某地区的年降雨量),(~2σμN X ,现对其年降雨量连续进行5次观察,得数据为: (单位:mm) 587 672 701 640 650 ,则2σ的矩估计值为 。

1430.87、设两个相互独立的子样2121,,,X X X 与51,,Y Y 分别取自正态母体)2,1(2N 与)1,2(N , 2*22*1,S S 分别是两个子样的方差,令2*2222*121)(,S b a aS +==χχ,已知)4(~),20(~222221χχχχ,则__________,==b a 。

用)1(~)1(222*--n S n χσ,1,5-==b a8、假设随机变量)(~n t X ,则21X 服从分布 。

)1,(n F 9、假设随机变量),10(~t X 已知05.0)(2=≤λX P ,则____=λ 。

用),1(~2n F X 得),1(95.0n F =λ10、设子样1621,,,X X X 来自标准正态分布母体)1,0(N ,X为子样均值,而01.0)(=>λX P , 则____=λ01.04)1,0(~1z N nX=⇒λ 11、假设子样1621,,,X X X 来自正态母体),(2σμN ,令∑∑==-=161110143i i i iX XY ,则Y 的分布 )170,10(2σμN12、设子样1021,,,X X X 来自标准正态分布母体)1,0(N ,X 与2S 分别是子样均值和子样方差,令2*210S X Y =,若已知01.0)(=≥λY P ,则____=λ 。

《数理统计》试题库填空题

《数理统计》试题库填空题

数理统计试题库-----填空题(每题3分)第一章1. 设()211~,X N μσ,()222~,Y N μσ相互独立,样本容量分别为12,n n ,则()Var X Y -= 。

2. 设1234,,,X X X X 是来自正态总体2(0,2)N 的简单随机样本,221234(2)(34)X a X X b X X =-+-,则a = ,b = 时,统计量2~(2)X χ。

3.设1234,,,X X X X 是来自正态总体2(0,3)N 的简单随机样本,221234(2)()X a X X b X X =-+-,则a = ,b = 时,统计量2~(2)X χ。

4. 设总体()2Xk χ,12,,,n X X X 是取自该总体的一个样本,则1ni i X =∑服从2χ分布,且自由度为 。

5.设12345,,,,X X X X X 是来自正态总体(0,1)N 的简单随机样本,2212()X a X X =+,则a = 时,统计量X 服从2χ分布,其自由度为 。

6.设12345,,,,X X X X X 是来自正态总体(0,1)N 的简单随机样本,X =,则a = 时,统计量X 服从t 分布,其自由度为 。

7.X 服从正态分布,1-=EX ,25EX =,12,,,n X X X 是来自总体X 的一个样本,则11ni i X X n ==∑服从的分布为 。

8. 设随机变量 X 服从正态分布2(0,3)N , 而 129,,,X X X 是来自X 的样本,则统计量()22212919U X X X =+++服从 。

9. 设随机变量 X 和 Y 相互独立且都服从正态分布2(0,3)N , 而129,,,X X X 和 129,,,Y Y Y 分别是来自X 和Y 的样本,则统计量292221921YY Y X X X U ++++++=服从 。

10. 设12,,,n X X X 是来自总体X 的简单随机样本,已知(1,2,3,4)k k EX k α== 则当n 充分大时,随机变量211n n i i Z X n ==∑近似服从正态分布,其分布参数为____________11. 设12,,,n X X X 是来自总体X 的一个样本,X 服从参数为λ的指数分布,则∑=ni i X 12λ服从____________分布.12. 设在总体2(,)N μσ中抽取一个容量为16的样本,这里2,μσ均为未知, 则2.DS =____________ 13. 设11,,,,,n n n m X X X X ++是分布2(0,)N σ的容量为n m +的样本,统计量1n iX Y =__________。

数理统计常用公式

数理统计常用公式

数理统计常用公式1.样本均值的公式:样本均值(x̄)是在一组样本数据中,所有数据的总和除以样本数量的结果。

即:x̄=(x₁+x₂+x₃+...+x̄)/n其中,x₁、x₂、x₃等为样本数据,n为样本数量。

2.总体均值的公式:总体均值(μ)是在一个总体中,所有数据的总和除以总体数量的结果。

在样本数据无法覆盖总体数据的情况下,可以通过样本均值来估计总体均值。

即:μ=(x₁+x₂+x₃+...+x̄)/N其中,x₁、x₂、x₃等为样本数据,N为总体数量。

3.样本方差的公式:样本方差(s²)是一组样本数据与其均值之差的平方和除以样本数量减一的结果。

即:s²=((x₁-x̄)²+(x₂-x̄)²+(x₃-x̄)²+...+(x̄-x̄)²)/(n-1)其中,x₁、x₂、x₃等为样本数据,x̄为样本均值,n为样本数量。

4.总体方差的公式:总体方差(σ²)是一组数据与其均值之差的平方和除以总体数量的结果。

在样本数据无法覆盖总体数据的情况下,可以通过样本方差来估计总体方差。

即:σ²=((x₁-μ)²+(x₂-μ)²+(x₃-μ)²+...+(x̄-μ)²)/N其中,x₁、x₂、x₃等为样本数据,μ为总体均值,N为总体数量。

5.样本标准差的公式:样本标准差(s)是样本方差的平方根。

即:s=√(s²)其中,s²为样本方差。

6.总体标准差的公式:总体标准差(σ)是总体方差的平方根。

即:σ=√(σ²)其中,σ²为总体方差。

7.相关系数的公式:相关系数(r)衡量了两个变量之间线性关系的强度和方向。

其计算公式为:r=Σ((x-x̄)*(y-ȳ))/(√(Σ(x-x̄)²)*√(Σ(y-ȳ)²))其中,x、y为两个变量的取值,x̄、ȳ分别为两个变量的均值,Σ表示求和。

高等数学与工程数学课件第十章数理统计基础.ppt

高等数学与工程数学课件第十章数理统计基础.ppt
14.70,15.21,14.90,14.91,15.32,15.32, 假设滚珠直径总体分布的方差为0.05,问能否认为这一批滚珠
的平均直径为15.25 mm? ( 0.05) 解 提出原假设: 0 15.25,
由于方差已知,故选统计量
U X 0 ~ N (0,1) n
由P{|U | } P{U } P{U } 1 () () 2 2 () 0.05 .
由P{ 2
2}
2
0.025, 2
~
2 (15),查表得2
27.5,
由P{ 2
1}
1
2
0.975, 2
~
2 (15),查表得1
6.26.
故 2的95%的置信区间为
15
0.00244,15 27.5
0.00244 6.26
即 [0.0013,0.0058] .
二、假设检验的方法
假设检验的一般步骤如下: (1) 提出原假设 H0,明确所要检验的对象, (2) 构造合适的统计量 , (3) 求出临界值,确定拒绝域,
6
9.05.
S2 1 6 5 i1
2
Xi X
1 0.052 0.252 0.052 0.252 0.152 0.152
5
0.035.
返回
4、解: X N u, 2 且已知 2
选取统计量
U
X
n
该统计量服从标准正态分布,即:U N 0,1.
ห้องสมุดไป่ตู้
返回
机变量
X1,X

2
,X n 的函数称为样本函数,若样本函
数不含未知参数且是连续的,我们称之为统计量.(不含
未知参数的样本函数叫统计量.)

数理统计课后题答案完整版

数理统计课后题答案完整版

第一章3. 解:因为i i x ay c-=所以 i i x a cy =+11nii x x n ==∑()1111ni i ni i a cy n na cy n ===+⎛⎫=+ ⎪⎝⎭∑∑1nii c a y n a c y==+=+∑所以 x a c y =+ 成立因为 ()2211n x i i s x xn ==-∑()()()22122111ni i ini i nii a cy a c y n cy c y n c y y n====+--=-=-∑∑∑又因为 ()2211n y i i s y yn ==-∑所以 222xys c s = 成立 6. 解:变换()1027i i y x =-11li i i y m y n ==∑()13529312434101.5=-⨯-⨯+⨯+=- 2710yx=+= ()2211lyi i i s m y yn ==-∑()()()()22221235 1.539 1.5412 1.534 1.510440.25⎤=⨯-++⨯-++⨯+++⎡⎣⎦= 221 4.4025100x y s s == 7解:*11li i i x m x n ==∑()1156101601416426172121682817681802100166=⨯+⨯+⨯+⨯+⨯+⨯+⨯=()22*11li i i s m x xn ==-∑()()()()()()()2222222110156166141601662616416628168166100121721668176166218016633.44=⨯-+⨯-+⨯-+⨯-⎡⎣⎤+⨯-+⨯-+⨯-⎦=8解:将子样值重新排列(由小到大) -4,,,,,0,0,,,,,,()()()()()172181203.2147.211.2e n n e nM X X R X X M X X +⎛⎫ ⎪⎝⎭⎛⎫+ ⎪⎝⎭====-=--==== 9解:121211121211n n i j i j n x n x n n x n n ==+=+∑∑112212n x n x n n +=+()12221121n n ii s x x n n +==-+∑()()()1212221122111122121222222111222112212122222211221122112212121222211211122121n n i i n n i ji j x xn n x x n x n x n n n n n s x n sx n x n xn n n n n s n s n x n x n x n x n n n n n n n n n x n n s n sn n +====-++⎛⎫+=- ⎪++⎝⎭+++⎛⎫+=-⎪++⎝⎭⎛⎫+++=+- ⎪+++⎝⎭+++=++∑∑∑()()()()()()22212211222122222112212112212122121222212121122212122n n x n x n x n n n s n s n n x n n x n n x x n n n n n n x x n s n sn n n n +-++++-=+++-+=+++12. 解:()ix P λ i Ex λ= i Dx λ= 1,2,,i n =⋅⋅⋅1122111111n n i i i i nni i i i n E X E x Ex n n n n DX D x Dx n nn n λλλλ============∑∑∑∑13.解:(),ix U a b 2i a b Ex += ()212i b a Dx -= 1,2,,i n =⋅⋅⋅ 在此题中()1,1i x U - 0i Ex = 13i Dx = 1,2,,i n =⋅⋅⋅112111101113n ni i i i nni ii i E X E x Ex n n DX D x Dx n nn ==========∑∑∑∑14.解:因为()2,iXN μσ 0i X Eμσ-= 1i X Dμσ-=所以 ()0,1i X N μσ- 1,2,,in =⋅⋅⋅由2χ分布定义可知()222111nniii i X Y Xμμσσ==-⎛⎫=-= ⎪⎝⎭∑∑服从2χ分布所以 ()2Yn χ15. 解:因为()0,1iX N1,2,,i n =⋅⋅⋅()1230,3X X X N ++0=1=所以()0,1N()221χ同理()221χ由于2χ分布的可加性,故()222123Y χ=+可知 13C =16. 解:(1)因为 ()20,i X N σ 1,2,,i n =⋅⋅⋅()0,1iX N σ所以 ()22121ni i X Y n χσσ=⎛⎫= ⎪⎝⎭∑(){}11122Y Yy F y P Y y P σσ⎧⎫=≤=≤⎨⎬⎩⎭()220yf x dx σχ=⎰()()211'221Y Y y f y F y f χσσ⎛⎫==⨯ ⎪⎝⎭因为 ()2122202200n x n x e x n f x x χ--⎧⎪>⎪⎛⎫=⎨Γ⎪⎪⎝⎭⎪≥⎩所以 ()21122202200ny n nY y e y n f y y σσ--⎧⎪>⎪⎛⎫=⎨Γ⎪⎪⎝⎭⎪≤⎩(2) 因为 ()20,i X N σ 1,2,,i n =⋅⋅⋅()0,1iX N σ所以()22221ni i X nY n χσσ=⎛⎫= ⎪⎝⎭∑(){}()22222220nyY nYny F y P Y y P f x dx σχσσ⎧⎫=≤=≤=⎨⎬⎩⎭⎰()()222'22Y Y ny nf y F y f χσσ⎛⎫== ⎪⎝⎭故 ()221222202200n nny n n Y n y e y n f y y σσ--⎧⎪>⎪⎛⎫=⎨Γ⎪⎪⎝⎭⎪≤⎩(3)因为 ()20,iX N σ 1,2,,i n =⋅⋅⋅()10,1ni N =所以()22311n i Y n χσ=⎛= ⎝(){}()()22333210yn Y Y F y P Y y P y f x dx n σχσ⎧⎫=≤=≤=⎨⎬⎩⎭⎰()()()233'2211Y Y y f y F y f n n χσσ⎛⎫== ⎪⎝⎭()()221000x x f x x χ-⎧>=≤⎩故 ()232000y n Y y f y y σ-⎧>=≤⎩ (4)因为()20,iX N σ 1,2,,i n =⋅⋅⋅所以()()1224210,11ni ni N Y χσ==⎛= ⎝(){}()()()()()224224442210'2211yY Y Y y F y P Y y P f x dxy f y F y f σχχχσσσσ⎧⎫=≤=≤=⎨⎬⎩⎭⎛⎫== ⎪⎝⎭⎰ 故()242000yY y f y y σ-⎧>=≤⎩17.解:因为 ()Xt n存在相互独立的U ,V()0,1UN ()2Vn χ 使X = ()221Uχ则 221U X V n=由定义可知 ()21,F n χ18解:因为 ()20,iX N σ 1,2,,i n =⋅⋅⋅()10,1ni N =()221n mi i n X m χσ+=+⎛⎫ ⎪⎝⎭∑所以()1nniX Yt m ==(2)因为()0,1iX N σ1,2,,i n m =⋅⋅⋅+()()221221ni i n mi i n X n X m χσχσ=+=+⎛⎫ ⎪⎝⎭⎛⎫ ⎪⎝⎭∑∑所以 ()221122211,ni n i ii n mn mi ii n i n X m X n Y F n m X n X mσσ==++=+=+⎛⎫⎪⎝⎭==⎛⎫ ⎪⎝⎭∑∑∑∑19.解:用公式计算()20.010.019090χ=查表得 0.01 2.33U =代入上式计算可得()20.01909031.26121.26χ=+=20.解:因为()2Xn χ 2E n χ= 22D n χ=由2χ分布的性质3可知()0,1N{}P X c P ≤=≤22lim t n P dt -→∞-∞≤==Φ 故 {}PX c ≤≈Φ第 二 章 1.,0()0,0()()1()111x x x x xe xf x x E x f x xdx xe dxxe e d x e xλλλλλλλλλλλλ-+∞+∞--∞+∞+∞--+∞-⎧≥=⎨<⎩=⋅==-+=-==⎰⎰⎰令从而有1x λ∧= 2.()111121).()(1)(1)1111k k x x E x k p p p k p ppp ∞∞--===-=-==⎡⎤--⎣⎦∑∑令1p =X所以有1p X ∧=2).其似然函数为1`11()(1)(1)ni x i i nX nni L P P p p p -=-=∑=-=-∏1ln ()ln ()ln(1)ni i L P n p X n p ==+--∑1ln 1()01ni i d L n X n dp p p ==--=-∑解之得11nii np X X∧===∑3. 解:因为总体X服从U(a ,b )所以()2122!2!!()12ni i a b n E X r n r X X X X a b S X b X =∧∧+=--⎧=⎪⎪⎨-⎪=⎪⎩⎧=⎪⎨⎪=⎩∑222(a-b )() D (X )=12令E (X )= D (X )=S ,1S =n a+b 2()a 4. 解:(1)设12,,n x x x 为样本观察值则似然函数为:111()(),01,1,2,,ln ()ln ln ln ln 0nni i i nii in i i L x x i nL n x d L nx d θθθθθθθθ-====<<==+=+=∏∑∑(-1)解之得:11ln ln nii nii nxnxθθ=∧==-==∑∑(2)母体X 的期望1()()1E x xf x dx x dx θθθθ+∞-∞===+⎰⎰而样本均值为:11()1nii X x n E x X X Xθ=∧===-∑令得5.。

(高等数学与工程数学习题课指导)第十章数理统计基础

(高等数学与工程数学习题课指导)第十章数理统计基础

数据的数字特征
集中趋势
偏态与峰态
描述数据的中心趋势,如平均数、中 位数等。
描述数据分布的形状,如偏度、峰度 等。
离散程度
描述数据的离散程度,如方差、标准 差等。
03
概率论基础
概率的基本概念
概率
描述随机事件发生的可能性大小 的量度,取值范围在0到1之间, 其中0表示不可能事件,1表示必
然事件。
频率
第十章 数理统计基础
目录 Contents
• 数理统计基础概述 • 描述性统计 • 概率论基础 • 参数估计与假设检验 • 方差分析数理统计基础概述
定义与概念
定义
数理统计是数学的一个重要分支 ,它研究如何从数据中获取有用 信息,以及如何利用这些信息进 行决策。
数据清洗
对数据进行预处理,如缺 失值填充、异常值处理等, 以提高数据质量。
数据分组
根据研究目的和数据特征, 将数据分为若干组,便于 后续分析。
数据的图表表示
柱状图
折线图
散点图
箱线图
用于展示分类数据和连 续数据的对比关系。
用于展示时间序列数据 的变化趋势。
用于展示两个连续变量 之间的关系。
用于展示数据的分布特 征和异常值。
描述两个随机变量同时取值的分散程度和它 们之间的相关性的量,计算公式为 Cov(X,Y)=E[(X−E(X))(Y−E(Y))]。
描述两个随机变量之间线性相关程度的量 ,取值范围在-1到1之间,其中1表示完全 正相关,-1表示完全负相关,0表示无关。
04
参数估计与假设检验
点估计与区间估计
点估计
用单一数值表示估计的参数值,常见 的点估计方法有矩估计和极大似然估 计。

数理统计符号

数理统计符号

数理统计符号
数理统计符号是数学中用于描述统计概念和方法的符号。

以下是一些常见的数理统计符号及其含义:
1. 总体和样本:总体是研究对象的全体数据,样本是从总体中选取的一部分数据。

通常用大写字母X表示总体,小写字母x表示样本。

2. 概率:描述随机事件发生的可能性大小的量。

通常用P(X)表示随机事件X的概率。

3. 分布函数:描述随机变量取值的概率规律的函数。

通常用F(x)表示随机变量X的分布函数。

4. 概率密度函数:描述连续型随机变量概率分布规律的函数。

通常用f(x)表示随机变量X的概率密度函数。

5. 期望值:描述随机变量取值的平均水平的量。

通常用E(X)表示随机变量X的期望值。

6. 方差:描述随机变量取值离散程度的量。

通常用Var(X)表示随机变量X的方差。

7. 协方差:描述两个随机变量之间相关性的量。

通常用Cov(X,Y)表示随机变量X和Y的协方差。

8. 相关性系数:用于描述两个随机变量之间线性关系的量。

通常用ρxy表示随机变量X和Y的相关系数。

9. 假设检验:用于检验某个假设是否成立的统计方法。

通常用H0表示原假设,H1表示备择假设。

10. 置信区间:用于估计某个参数的取值范围的统计方法。

通常用θ表示未知参数,θ^表示参数的估计值,θ_low 和θ_high分别表示参数的置信下限和置信上限。

以上是一些常见的数理统计符号,当然还有许多其他的符号和概念,具体可以参考相关的统计学书籍或教材。

华北理工大学研究生期末数理统计综合(10套)

华北理工大学研究生期末数理统计综合(10套)

专业数理统计综合练习一、单项选择题(每题3分) 第一章1.设总体 X 服从正态分布),(2σμN ,其中μ未知,2σ已知,123,,X X X 是取自总体 X的一个样本,则以下不是统计量的为( )3)()(321X X X A ++ ()()X B μ-()321,,max )(X X X C 2321)()(σX X X D ++2.设总体X 服从二项分布(,)B n p ,其中n 已知,p 未知,1X ,2X ,3X 是取自总体的一个样本,则下列选项中不是统计量的是( )(A )3113ii X=∑ (B )()123min ,,X X X(C )12X p + (D )321()ii XX =-∑3. 设4321,,,X X X X 是总体),(2σμN 的样本,μ已知,2σ未知,则不是统计量的是( ). (A )415X X +; (B )41ii Xμ=-∑;(C )σ-1X ; (D )∑=412i iX4. 设12n X X X ,,,是来自总体X 的样本,则()2111ni i X X n =--∑是( ). (A ) 样本矩 (B ) 二阶原点矩 (C ) 二阶中心矩(D ) 统计量5.设12,,,n X X X 为总体X 的样本,期望μ、方差σ2未知,X 、s 2分别为样本均值和样本方差,则下列样本函数为统计量的是( ).(A ) 211()ni i X X n =-∑(B ) 11n i i X n μσ=-∑(C )22(1)n s σ- (DX6.设总体X 服从()223N ,,1210X X X ,,,是X 的样本,则有( ).(A ) ()20.9X N 服从, (B ) ()29X N 服从, (C ) ()209X N 服从,(D ) ()2090X N 服从,7.设X 服从()2N σ0,,则服从自由度为()1n -的t 分布的随机变量是( ).(A )nXS (B(C ) 2nX S(D 8.设()211~,X N μσ,()222~,Y N μσ相互独立,样本容量分别为1n ,2n ,则有( ) (A )()221212Var X Y n n σσ-=- (B )()1212Var X Y n n σσ-=+(C )()1212Var X Y n n σσ-=-(D )()221212Var X Y n n σσ-=+9.设12,,,n X X X 是来自正态总体~(0,1)X N 的简单随机样本,X 为样本均值,2S 为样本方差,则有( ) (A )~(0,1)XN (B )~(0,1)nX N(C )~(1)nXt n S - (D )2122~(1,1)n ii X F n X =-∑ 10. 设总体()2~,XN μσ,12,,,n X X X 为其一个样本,则下列选项正确的是( )(A )(~(0,1)N X Sμ- (B )(()~1X t n μσ--(C )(()~X t n Sμ- (D )(~(0,1)N X μσ-11. 设128,,,X X X 和1210,,,Y Y Y 分别是取自两个正态总体2(1,2)N -和2(2,5)N 的简单随机样本且相互独立,21S 和22S 分别是两个样本的样本方差,则统计量2122254S S 服从的分布是( )(A )(9,7)F (B )(7,9)F(C )(7,7)F (D )(9,9)F12. 设n X X X ,,,21 是总体),(2σμN 的样本,X 是样本均值,记=21S∑∑∑===--=-=--n i n i n i i i i X n S X X n S X X n 1112232222)(11,)(1,)(11μ,∑=-=ni i X n S 1224)(1μ,则服从自由度为1-n 的t 分布的随机变量是( ).(A )1/1--=n S X T μ; (B )1/2--=n S X T μ;(C )nS X T /3μ-=; (D )n S X T /4μ-=13. X 服从正态分布,1-=EX ,25EX =,12,,,n X X X 是来自总体X 的一个样本,则11ni i X X n ==∑服从的分布为( )。

数理统计课后答案汇总

数理统计课后答案汇总

数理统计一、填空题1、设n X X X ,,21为母体X 的一个子样,如果),,(21n X X X g , 则称),,(21n X X X g 为统计量。

不含任何未知参数2、设母体σσμ),,(~2N X 已知,则在求均值μ的区间估计时,使用的随机变量为nX σμ-3、设母体X 服从修正方差为1的正态分布,根据来自母体的容量为100的子样,测得子样均值为5,则X 的数学期望的置信水平为95%的置信区间为 。

025.01015u ⨯±4、假设检验的统计思想是 。

小概率事件在一次试验中不会发生5、某产品以往废品率不高于5%,今抽取一个子样检验这批产品废品率是否高于5%, 此问题的原假设为 。

0H :05.0≤p6、某地区的年降雨量),(~2σμN X ,现对其年降雨量连续进行5次观察,得数据为: (单位:mm) 587 672 701 640 650 ,则2σ的矩估计值为 。

7、设两个相互独立的子样2121,,,X X X 与51,,Y Y 分别取自正态母体)2,1(2N 与)1,2(N , 2*22*1,S S 分别是两个子样的方差,令2*2222*121)(,S b a aS +==χχ,已知)4(~),20(~222221χχχχ,则__________,==b a 。

用)1(~)1(222*--n S n χσ,1,5-==b a8、假设随机变量)(~n t X ,则21X 服从分布 。

)1,(n F 9、假设随机变量),10(~t X 已知05.0)(2=≤λX P ,则____=λ 。

用),1(~2n F X 得),1(95.0n F =λ10、设子样1621,,,X X X 来自标准正态分布母体)1,0(N ,X为子样均值,而01.0)(=>λX P , 则____=λ01.04)1,0(~1z N nX=⇒λ 11、假设子样1621,,,X X X 来自正态母体),(2σμN ,令∑∑==-=161110143i i i iX XY ,则Y 的分布 )170,10(2σμN12、设子样1021,,,X X X 来自标准正态分布母体)1,0(N ,X 与2S 分别是子样均值和子样方差,令2*210S X Y =,若已知01.0)(=≥λY P ,则____=λ 。

考研数学三(概率论与数理统计)历年真题试卷汇编10(题后含答案及解析)

考研数学三(概率论与数理统计)历年真题试卷汇编10(题后含答案及解析)

考研数学三(概率论与数理统计)历年真题试卷汇编10(题后含答案及解析)题型有:1. 选择题 2. 填空题 3. 解答题选择题下列每题给出的四个选项中,只有一个选项符合题目要求。

1.设随机变量X和y相互独立,其概率分布为则下列式子正确的是:A.X=YB.P{X-Y}=0C.P{X-Y}=D.P{X=Y}=1正确答案:C解析:P(X=Y)=P(X=-1,Y=-1)+P(X=1,Y=1) =P(X=-1)P(Y =-1)+P(X=1)P(Y=1) =知识模块:概率论与数理统计2.设随机变量X的密度函数为φ(χ),且φ(-χ)=φ(χ),F(χ)为X的分布函数,则对任意实数a,有A.F(-a)=1-∫0aφ(χ)dχB.F(-a)=-∫0aφ(χ)dχC.F(-a)=F(a)D.F(-a)=2F(a)-1正确答案:B解析:由概率密度的性质和已知,可得1-∫-∞+∞φ(χ)dχ=2∫0+∞φ(χ)dχ,∴∫0+∞φ(χ)dχ=而F(-a)=∫-∞-aφ(χ)dχ∫+∞aφ(-t)(-dt)=∫a+∞φ(t)dt =∫0+∞φ(χ)dχ-∫0aφ(χ)dχ=-∫0aφ(χ)dχ故选B.知识模块:概率论与数理统计3.设随机变量X~N(/μ,σ2),则随着σ的增大,概率P(|X-μ|<σ)A.单调增大.B.单调减小.C.保持不变.D.增减不定.正确答案:C解析:由已知X~N(μ,σ2),得~N(0,1) 故P{|X-μ|<σ}==Ф(1)-Ф(-1) 故选C.知识模块:概率论与数理统计4.设两个随机变量X与Y相互独立且同分布。

P(X=-1)=P(Y=-1)=.P(X=1)=P(Y=1)=,则下列各式成立的是A.P(X=Y)=B.P(X=Y)=1C.P(X+Y=0)=D.P(XY=1)=正确答案:A解析:P(X=Y)=P(X=-1,Y=-1)+P(X=1,Y=1) =P(X=-1)P(Y =-1)+P(X=1)P(Y=1) =知识模块:概率论与数理统计5.设F1(χ)与F2(χ)分别为随机变量X1与X2的分布函数.为使F(χ)=a1F1(χ)-bF2(χ)是某一随机变量的分布函数,在下列给定的各组数值中应取A.B.C.D.正确答案:A解析:∵F1(χ)和F2(χ)均为分布函数,∴F1(+∞)=F2(+∞)=1 要使F(χ)为分布函数,也有F(+∞)=1.对该式令χ→+∞,即得a-b=1,只有A符合.知识模块:概率论与数理统计6.设随机变量Xi~(i=1,2),且满足P{X1X2=0}=1,则P{X1=X2}等于A.0B.C.D.1正确答案:A解析:由P(X1X2=0)=1 可知P(X1=-1,X2=-1)=P(X1=-1,X2=1)=P(X1=1,X2=-1)=P(X1=1,X2=1)=0 由联合、边缘分布列(多维离散型)的性质和关系得(X1,X2)的联合、边缘分布列如下表.得:P(X1=X2)=P(X1=-1,X2=-1)+P(X1=0,X2=0)+P(X1=1,X2=1)=0+0+0=0 故选A.知识模块:概率论与数理统计7.设随机变量X服从正态分布N(0,1),对给定的α∈(0,1),数ua满足P{X>ua}=α,若P{|X|<χ}=α,则χ等于A.B.C.D.u1-α正确答案:C解析:设Ф(χ)=P(X≤χ)为服从标准正态分布的X的分布函数,有结果:Ф(χ)+Ф(-χ)=1.χ∈(-∞,+∞) (1) 又由α=P(|X|<χ)=P(-χ<X<χ)=Ф(χ)-Ф(-χ) (显然χ>0) (2) 由(1)、(2)式得2Ф(-χ)=1-α.得=Ф(-χ)=1-Ф(χ)=1-P(X≤χ)=P(X>χ) 与题目中α=P(X>uα)比较,注意Ф(χ)为严格单调增函数(∵Ф(χ)=>0,χ∈R′),这时P(X>χ)=P(X>),故χ=,选C.知识模块:概率论与数理统计8.设随机变量X服从正态分布N(μ1,σ12),随机变量Y服从正态分布N(μ2,σ22),且P{|X-μ1|<1}>P{|Y-μ2|<1} 则必有A.σ1<σ2.B.σ1>σ2.C.μ1<μ2.D.μ1>μ2.正确答案:A解析:P{|X-μ1|<1}==2Ф()-1.同理:P{|Y-μ2|<1}=2Ф()-1.由已知得:由分布函数的非降性得:.故σ1<σ2.知识模块:概率论与数理统计9.设随机变量X,Y独立同分布,且X的分布函数为F(χ),则Z=max{X,Y}的分布函数为A.F2(χ)B.F(χ)F(y)C.1-[1-F(χ)]2D.[1-F(χ)][1-F(y)]正确答案:A解析:Z的分布函数FZ(χ)=P{Z≤χ}=P{max(X,Y)≤χ}=P{X≤X,Y ≤χ}=P{X≤χ}.P{Y≤χ}=F2(χ),故选A.知识模块:概率论与数理统计10.设随机变量X与Y相互独立,且X服从标准正态分布N(0,1),Y的概率分布为P{Y=0}=P{Y=1}=.记FZ(z)为随机变量Z=XY的分布函数,则函数FZ(z)的间断点个数为A.0.B.1.C.2.D.3.正确答案:B解析:FZ(z)=P(Z≤z)=P(XY≤z) =P(XY≤z|Y=0)P{Y=0}+P{XY ≤z|Y=1}P{Y=1} =P{0≤z|Y=0}+P{X≤z|Y=1} 而P{0≤z|Y=0}=P{0≤z}=P{X≤z|Y=1}=P{X≤z}=故FZ(z)=在z<0和z>0上,FZ(z)显然连续;在z=0上,可见FZ(z)只有1个间断点(z=0处,∵),故选B.知识模块:概率论与数理统计11.设随机变量X的分布函数F(χ)=,则P{X=1}=A.0.B..C.-e-1.D.1-e-1.正确答案:C解析:P(X=1)=F(1)-F(1-0)=(1-e-1)-e-1,故选C.知识模块:概率论与数理统计12.设f1(χ)为标准正态分布的概率密度,f2(χ)为[-1,3]上均匀分布的概率密度,若为概率密度,则a,b应满足A.2a+3b=4.B.3a+2b=4.C.a+b=1.D.a+b=2.正确答案:A解析:由题意知:f1(χ)=,-∞<χ<+∞所以2a+3b=4,故选A.知识模块:概率论与数理统计13.设F1(χ)与F2(χ)为两个分布函数,其相应的概率密度f1(χ)与F2(χ)是连续函数,则必为概率密度的是A.f1(χ),f2(χ).B.2f2(χ)F1(χ).C.f1(χ)F2(χ).D.f1(χ)F2(χ)+f2(χ)F1(χ).正确答案:D解析:由题意知′1(χ)=f1(χ),F′2(χ)=f2(χ),且F1(χ)F2(χ)为分布函数,那么[F1(χ)F2(χ)]′=f1(χ)F2(χ)+F1(χ)f2(χ)为概率密度,故选D.知识模块:概率论与数理统计填空题14.连续型随机变量取任何给定实数值的概率都等于6._______(填“是”或“不是”)正确答案:是涉及知识点:概率论与数理统计15.设随机变量X的分布函数为则A=_______,P{|X|<}=_______.正确答案:1;.解析:分布函数是右连续的,故得1=Asin∴A=1 这时,F(χ)在(-∞,+∞)上都连续,于是知识模块:概率论与数理统计16.设随机变最X的分布函数为则X的概率分布为_______.正确答案:解析:F(χ)为一阶梯状函数,则X可能取的值为F(χ)的跳跃点:-1,1,3.P(X=-1)=F(-1)-F(-1-0)=0.4 P(X=1)=F(1)-F(1-0)=0.8-0.4=0.4 P(X-3)=F(3)-F(3-0)=1-0.8=0.2 知识模块:概率论与数理统计17.设随机变量X的概率密度为以Y表示对X的三次独立重复观察中事件{X≤}出现的次数,则P(Y=2}=_______.正确答案:解析:由题意,Y~B(3,p).其中故P{Y=2}=知识模块:概率论与数理统计18.设随机变量X的概率密度为若忌使得P{X≥k}=,则k的取值范围是_______.正确答案:[1,3]解析:P(X≥k)=∫k+∞f(χ)dχ.可见:若0<k<1,则P(X≥k)=若k>6,则P(X≥k)=0 若3<k≤6,则P(X≥k)=∫k6(6-k) 若1≤k≤3,则P≥k)=知识模块:概率论与数理统计19.从数1,2,3,4中任取一个数,记为X,再从1,…,X中任取一个数,记为Y,则P{Y=2}=_______.正确答案:解析:由题意,X的概率分布为而P(=2|X=1)=0,P(Y=2|X=2)=,P(Y=2|X=3)=,P(Y=2|X=4)=,故由全概率公式得P{Y-2}=P{X=i}P{Y=2|X=i}=.知识模块:概率论与数理统计20.设二维随机变量(X,Y)的概率分布为若随机事件{X=0}与{X+Y =1}相互独立,则a=_______,b=_______.正确答案:a=0.4,b=0.1.解析:由题意知0.4+a+b+0.1=1,∴a+b=0.5 而P{X=0}=0.4+a,P{X+Y=1}=P(X=0,Y=1}+P(X=1,Y=0}=a+b=0.5,P{X =0,X+Y=1}=P{X=0,Y=1}=a 由P{X=0,X+Y=1}=P{X=0}P{X +Y=1} ∴a=(0.4+a)0.5,得a=0.4,从而b=0.1.知识模块:概率论与数理统计21.设随机变量X与Y相互独立,且均服从区间[0,3]上的均匀分布,则P{max(X,Y)≤1}=_______。

常用数理统计公式

常用数理统计公式

常用数理统计公式以下是一些常用的数理统计公式:1. 样本均值 (Sample Mean):x̄ = (Σxi) / n2. 总体均值 (Population Mean):μ = (Σxi) / N3. 样本方差 (Sample Variance):s^2 = (Σ(xi - x̄)^2) / (n - 1)4. 总体方差 (Population Variance):σ^2 = (Σ(xi - μ)^2) / N5. 样本标准差 (Sample Standard Deviation):s=√s^26. 总体标准差 (Population Standard Deviation):σ=√σ^27. 样本协方差 (Sample Covariance):Cov(x, y) = (Σ(xi - x̄)(yi - ȳ)) / (n - 1)8. 总体协方差 (Population Covariance):Cov(X, Y) = (Σ(xi - μx)(yi - μy)) / N9. 样本相关系数 (Sample Correlation Coefficient):r = Cov(x, y) / (sxsy)10. 总体相关系数 (Population Correlation Coefficient):ρ = Cov(X, Y) / (σXσY)11. 样本标准误 (Standard Error of the Mean):SEM=s/√n12. 置信区间 (Confidence Interval):CI=x̄±(zα/2*SEM)13. z分数 (z-Score):z=(x-μ)/σ14. t分数 (t-Score):t=(x-μ)/(s/√n)15. 卡方检验 (Chi-Square Test):Chi^2 = Σ((O - E)^2) / E16. t检验 (t-Test):t=(x̄1-x̄2)/√((s1^2/n1)+(s2^2/n2))17. 方差分析 (Analysis of Variance, ANOVA):F=(MSB/MSE)18. 线性回归方程 (Linear Regression Equation):y=b0+b1*x19. 残差 (Residual):e=y-ŷ20. 判定系数 (Coefficient of Determination):R^2=(SSR/SST)=1-(SSE/SST)这些公式可以用于描述和分析数据集的中心趋势、变异性、相互关系和模型拟合程度。

考研数学一概率论与数理统计历年真题试卷汇编10_真题-无答案

考研数学一概率论与数理统计历年真题试卷汇编10_真题-无答案

考研数学一(概率论与数理统计)历年真题试卷汇编10(总分54,考试时间90分钟)选择题下列每题给出的四个选项中,只有一个选项符合题目要求。

1. 设两个相互独立的随机变量X和Y的方差分别为4和2,则随机变量3X-2Y的方差是A. 8B. 16C. 28D. 442. 设二维随机变量(X,Y)服从二维正态分布,则随机变量ξ=X+Y与η=X-Y不相关的充分必要条件为A. E(X)=E(Y)B. E(X2)=[E(X)]2=E(Y2)=[E(Y)]2C. E(X2)=E(Y2)D. E(X2)+EE(X)]2=E(Y2)+EE(Y)]23. 将一枚硬币重复掷n次,以X和Y分别表示正面向上和反面向上的次数,则X和Y的相关系数等于A. -1B. 0C.D. 14. 设随机变量X1,X2,…,Xn(n>1)独立同分布,且其方差σ2>0,令Y=,则A. cov(X1,Y)=B. cov(X1,Y)=σ2C. D(X1+Y)=σ2D. D(X1-Y)=σ25. 设随机变量(X,Y)服从二维正态分布,且X与Y不相关,fX(χ),fY(y)分别表示X,Y 的概率密度,则在Y=y的条件下,X的条件概率密度fX|Y(χ|y)为A. fX(χ).B. fY(y).C. fX(χ)fY(y).D.6. 设随机变量X~N(0,1),Y~N(1,4),且相关系数.ρXY=1,则A. P{Y=-2X-1}=1B. P{Y=2X-1}=1C. P{Y=-2X+1}=1D. P{Y=2X+1}=17. 设随机变量X的分布函数为F(χ)=0.3Ф(χ)+0.7Ф(),其中Ф(χ)为标准正态分布的分布函数,则EX=A. 0.B. 0.3.C. 0.7.D. 1.2. 填空题1. 已知连续型随机变量X的概率密度为f(χ)=则EX=_______,DX=_______.2. 已知随机变量X服从参数为2的泊松分布,且随机变量Z=3X-2,则EZ_______.3. 设随机变量X服从均值为2、方差为σ2的正态分布.且P{2<X<4}=0.3,则,P{X <0}=_______.4. 设随机变量X服从参数为1的指数分布,则E(X+e2X)=_______.5. 设X表示10次独立重复射击命中日标的次数。

常用数理统计表

常用数理统计表

常用数理统计表
以下是常用的数理统计表:
1. 频数表(Frequency table):将数据按照不同的类别或区间划分,并统计每个类别或区间中的观测值的个数。

2. 百分比表(Percentage table):将频数表中的频数转化为相应的百分比。

3. 累计频数表(Cumulative frequency table):将频数表中的频数累计相加得到的表,反映了累计频数的变化情况。

4. 频率分布表(Frequency distribution table):在频数表的基础上,再增加一列表示每个类别或区间的频率(频数除以总观测值个数)。

5. 直方图(Histogram):用矩形条代表不同类别或区间的频数或频率,并将矩形条相邻排列,展示数据的分布情况。

6. 条形图(Bar chart):用矩形条代表不同类别或区间的频数或频率,并将矩形条垂直排列,展示数据的分布情况。

7. 折线图(Line chart):用连续的线段连接数据的各个观测点,展示数据的变化趋势。

8. 饼图(Pie chart):用圆形上的扇形区域表示每个类别或区间的频数或频率,展示数据的相对比例。

9. 散点图(Scatter plot):用坐标轴上的点表示相应的观测值,并以点的分布形态反映数据的关系。

10. 箱线图(Box plot):通过展示数据的上四分位数、下四分位数、中位数和异常值等参数,反映数据的中心位置和离散程度。

以上是常见的数理统计表和图形,可以根据实际需要选择合适的表和图来展示数据的特征和分布情况。

数理统计公式大全

数理统计公式大全
(1)联合分布
离散型
如果二维随机向量(X,Y)的所有可能取值为至多可列个有序对(x,y),则称为离散型随机量。
设=(X,Y)的所有可能取值为,且事件{= }的概率为pij,,称
为=(X,Y)的分布律或称为X和Y的联合分布律。联合分布有时也用下面的概率分布表来表示:
Y
X
y1
y2

yj

x1
p11
p12
。其中L为几何度量(长度、面积、体积)。
(10)加法公式
P(A+B)=P(A)+P(B)-P(AB)
当P(AB)=0时,P(A+B)=P(A)+P(B)
(11)减法公式
P(A-B)=P(A)-P(AB)
当B A时,P(A-B)=P(A)-P(B)
当A=Ω时,P( )=1- P(B)
(12)条件概率
定义设A、B是两个事件,且P(A)>0,则称为事件A发生条件下,事件B发生的条件概率,记为。
分布密度f(x,y)具有下面两个性质:
(1)f(x,y)≥0;
(2)
(2)二维随机变量的本质
(3)联合分布函数
设(X,Y)为二维随机变量,对于任意实数x,y,二元函数
称为二维随机向量(X,Y)的分布函数,或称为随机变量X和Y的联合分布函数。
分布函数是一个以全平面为其定义域,以事件的概率为函数值的一个实值函数。分布函数F(x,y)具有以下的基本性质:
条件概率是概率的一种,所有概率的性质都适合于条件概率。
例如P(Ω/B)=1 P( /A)=1-P(B/A)
(13)乘法公式
乘法公式:
更一般地,对事件A1,A2,…An,若P(A1A2…An-1)>0,则有

第十章概率论与数理统计

第十章概率论与数理统计

第十章概率论与数理统计10.1写出下列随机试验的样本空间及下列事件的样本点:(1)掷一颗骰子,出现奇数点;(2)将一枚均匀硬币抛两次,A:第一次出现正面;B:两次出现同一面;C:至少有一次出现正面;(3)一个口袋中有5只球,编号分别为1,2,3,4,5,从中同时取三个球,球的最小号码为1;(4)1,2,3,4四个数中可重复地取两个数,一个数是另一个数的2倍。

10.2在信息工作系学生中选一名学生,令事件A表示被的学生是男生,事件B 表示该生为三年级生,事件C表示该生是运动员。

(1)叙述事件CAB意义;ABC=成立?(2)在什么条件下CC⊂是正确的?(3)在什么时候关系式B(4)什么时候BA=成立?(5)什么时候BA=成立?10.3将下列事件用A,B,C表示出来:(1)A发生;(2)只有A发生;(3)A与B都发生与C不发生;(4)三个事件中至少有两个发生;(5)三个事件中不多于两个发生;(6)三个事件都不发生。

10.4一批灯泡有40只,其中3只是坏的,从中任取5只进行检查,问:(1)5只都是好的概率是多少?(2)5只中有2只坏的概率是多少?10.5一幢10怪楼中的一架电梯在底层走上7位乘客。

电梯在每一层都停,乘客从第二层起离开电梯,设每位乘客在每层离开都是等可能的,求没有2位乘客在同一层离开的概率。

10.6某城市的摩托车有10 000辆,牌照号从00001到10000,问事件“偶然遇到的一辆摩托,其牌照号码中有数字8”的概率为多大?10.7一个中学有15个班级,每班选出3个代表出席学生代表会议,从45名代表中选出15名组成工作委员会。

求下列事件的概率:(1)一年级一班在委员会中有代表;(2)每个班级在委员会中都有代表。

10.8从一副扑克牌(共52张)中任意抽出4张,求4张牌花色各不相同的概率。

10.9在书架上任意放着10本书,求某给定的3本书放在一起的概率。

n≤),求下列10.10设有n个人等可能地被分配到N个房间中的任一间去住(N事件的概率:(1)指定的n间房间里各住一人;(2)恰好有n间房间,其中各住一人。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
设对变量x,y进行了n次观测,并按某个相同的准则排列出 x的等级为x1,x2
,…xn,y的等级为y1,y2,…yn,则x与y的等级相关系数
6 di2 rs 1 n(n2 1)
其中di= xi-yi i =1…n。xi与yi,之差越大, di2越大,当等级完全相反时,
d 达到最大值,此时rs=-1,我们认为x、y之间等级完全负相关。当等级 完全相同时,xi-yi =0, d =0,rs=+1,x与y之间等级完全正相关,一般rs
2 i 2 i
值在-1到+1之间,当rs=0时,x,y之间等级不相关。若rs为其他的值,则需 要通过统计检验判断x、y之间是否具有相关关系。
检验异方差的方法
假设检验表述为:
H0:x、y之间具有相关关系。
H1:x、y之间不具有相关关系。 rs n 2 所采用的统计量及分布为:t ~t(n-2) 2 1 rs 给定,当 t t ,存在相关关系, 当 t t
AΩA’=I。 由于Ω为一个对称正定阵,必存在一个非奇异阵B,使 Ω=BB’,所以,当A=B-1时,AΩA’= B-1(BB’)B-1’=I。 所以,如果对线性回归模型y=Xb+ε(1),进行左乘B-1的线性 变换,得:B-1y= B-1Xb+ B-1ε(2),令
u* B1 ;方程(2)又可表示为
4.1
1. 什么是多重共线性
2. 多重共线性的后果
多重共线性
3. 多重共线性的检验
4. 多重共线性问题的解决方法
什么是多重共线性:
线性模型基本假设要求rank X=m+1,若这一条被违背,即rank X<m+1,即X中某一个向量可被其他几个向量线性表出,这时 1 有〡X’X〡=0 .而 b的最小二乘估计 中的 不存在。 X'X 这时,我们称模型y=xb+ε 中的X具有完全共线性。 当 X ' X 0 的情况,是由于X中的向量存在高度相关,虽然 rank X 仍为m+1,但是由于
ˆ 关,这时 ( X ' X )1 对角线上的值会很大。由于 b
OLS
1 1 对角线上的值表示 ˆ 2 X ' X 。 矩阵为 Db (X ' X ) OLS
ˆ 中的分量的方差,这个值大,意味着 Db ˆ 会很大,也 b OLS j
ˆ 是不稳定的估计,或称敏感的估计。说明用不同的 就是 b j
xi 2 为前2期 投资。本期投资额往往可能受上一期投资影响。这样 xi 2 大 ,可能 xi 1就会小,而 xi 1 小,可能 xi 就大。这时,三个
x是相关的。 (3)横截面数据:y=f(K,L,S,E)K增大,L可能减少。


1 有 X'X 的方差
1 由于存在多重共线性时,X ' X 0 ,而 ( X ' X )与
(2)建立与xi之间的一元线性回归方程|ei| =a+bxil+ui,ui为随机 干扰,其中 l 可取不同的值,如 l=1,1/2,-1 可以通过 t , F 检验,
确定|ei|与xi之间最优的回归模型。
(3)如果在所选的 l 值中进行检验,有显著的结果,即存在异 方差。 在多元线性回归模型中,如果ε可能与多个解释变量有关,则 可以类似的方法进行多元线性回归。
高度的负共线性同样 对回归有影响
产生多重共线性的原因
(1)模型中几个变量都受大趋势的影响,如储著,消费,出口
贸易额。经济繁荣时,这些量就会同时增加,经济衰退时,
这些量会同时减少。因此向量间具有相关关系。 (2) 滞后变量的使用:如投资模型 yi f xi , xi 1, xi 2 i 其中 yi 为投资收益,xi 为本期投资, xi 1 为前1期投资 ,
tj
Se ˆ n m 1
2
ˆ b j ˆ 2c j 1, j 1
和cj+1,j+1均要求同方差才能求出
• 预测精度会降低
检验异方差的方法
• 图示法
把ei做为εi的估计值,然后,建立一个坐标系,横轴表示 x,纵轴表示|e|,描出(xi , |ei| )各点,根据e与x的散布图判 断 e是否有随x变化而变化的趋势。
异阵 A ,回归模型左乘 A ,则会获得一个新的多元回归模型 :Ay=AXb+Aε,在新的模型中,我们令 ;此模型又可表示为 , y* Ay X * AX
u* A
y* X *b u
异方差问题的解决方法
在新模型中,u为随机干扰,它的方差矩阵为:
Du=D(Aε)=A DεA’=σ2AΩA’。只要矩阵A选择得当,就能使
1 , y* B y
X * B 1 X
y* X *b u (3),在方程
(3)中,随机干扰u的方差阵
Du=D(B-1ε)= B-1(Dε)B-1’= σ2B-1(BB’)B-1’=σ2I
异方差问题的解决方法
2. 用广义最小二乘法解决异方差问题: 在有异方差的情况下,
12 0 0 k1 0 0 2 0 k 0 2 2 2 2 k 3 3 0 0 0 0 k 2 0 0 n n
1/3~1/4,在小样本时,c也可为0。
3. 剩下的n-c个样本分为两个段,将两段数据分别回归,这样 会获得两个回归方程,记为方程(1),方程(2);
) ( 2) 4. 记方程(1)的残差平方和为 S e(1,方程 (2)的残差平方和记为 Se
检验异方差的方法
5. 用 S e , Se 的均方和构造统计量
2
=3.182
检验异方差的方法
用等级相关系数法判断是否存在异方差 用此法检验 x 与ε之间是否相关。这时ε值无
法得到。故先进行方程回归,以求得ei,并
对ei的绝对值与xi分别分级;然后确定rs,给
定并进行检验。
检验异方差的方法
•戈德菲尔德——夸特(Goldfield-Quant)法 具体步骤如下: 1. 将样本值按从小到大的顺序排列。 2. 略去中间c个样本,在大样本情况下(n>30)约为样本容量的
(1)
( 2)
(n c) (2) (n c) 其中 f m 1;f e m 1, 2 2 如果检验显著,存在异方差。
(1) e
Se(1) F (2) ~ F ( f e(1) , fe( 2) ) Se
检验异方差的方法
•戈里瑟(Glesjer)检验法。
(1)对数据进行线性回归,求出残差ei,并取绝对值|ei| 。
出现异方差性的原因:
• 经济现象之间的错综复杂的关系 • ε中的因素与解释变量之间存在某种相互影
响的关系
• 建模时采用横截面数据
• 用时间序列建模
异方差带来的后果:
1 ˆ (X •b X) X Y 不再具有最有效性
• 显著性检验失效
以t检验为例。在多元线性回模中,进行的假设检验,采用 的是如下统计量
样本构造的估计相差可能很大,即对样本敏感。
多重共线性的后果
• • • •
回归方程系数的方差增大
• 回归系数的大小与所期望的不同
回归系数的符号与所期望的不同 增加或减少变量引起回归方程系数较大的变化 增加或减少数据点引起回归方程系数估计值甚或符号 的较大的变化
• 有些情况下,t检验无效而F统计量显著。

t12 r12
n2 ~ t (n 2) 2 1 r12
1
若 t12 t

2
(n 2)无相关关系,t12 t1 (n 2) 有相关关系
2
多重共线性的检验
•多重决定系数
分别将x1…xk作为被解释变量,其余k-1个作为解释变量作
k次多元线性回归,即:
x1 b0 b2 x2 b3 x3 bk xk
x2 b0 b1x1 b3 x3 bk xk

xk b0 b2 x2 b3 x3 bk 1xk 1
每一个方程均会有一个R2,记为R2j
多重共线性的检验
对每一个方程进行F检验,即
R2 j Fj
1 R
2 j
m 1 nm
~ F m 1, n m
给定,若
Fj F1 说明相应的xj与其余的x有线性关系。(只要有一
个方程显著,就有多重共线性)
Fj F1 说明相应的与其余的X没有线性关系
实际操作中,可选择R2j的最大值先做检验
多重共线性的检验
•方差扩大因子(Variance inflation factor ——VIF)
异方差问题的解决方法
•广义最小二乘法(General Least Square,简称GLS)
1. 广义最小二乘法的一般介绍:
广义最小二乘法用于解决一切当回归模型y=Xb+ε的随机干扰 向量ε的方差矩阵为Dε=σ2Ω,(其中Ω不为单位阵I)的情况。
设Dε=σ2Ω ,对回归模型进行线性变换,即存在一个n阶非奇
X ' X 0 ,对模型还会有严重影
响.这种X中两个或多个向量相关的情况被称为多重共线性 。
多重共线性
x2 x1 x2 x1
正交的 X 变量 从独 立来源提供信息。 无多重共线性
x2 x1
完全共线性的X 变量 提供相同的信息内容 无法回归.
x2
x1
某种程度的共线性对 回归的影响取决于共 线性的程度
1 VIFj 1 R2 j
VIF越偏离于1,相应的Xj与其他解释变量之间的相关性就 越强。当VIFj10时,我们认为存在高度多重共线性
VIF100
相关文档
最新文档