西南交通大学研究生数理统计与多元统计考试 试题答案
数理统计学考试题及答案
数理统计学考试题及答案一、单项选择题(每题3分,共30分)1. 下列哪个选项是描述数据集中趋势的统计量?A. 方差B. 标准差C. 平均数D. 极差答案:C2. 假设检验中,若原假设为H0:μ=μ0,备择假设为H1:μ≠μ0,则该检验属于:A. 单尾检验B. 双尾检验C. 左尾检验D. 右尾检验答案:B3. 以下哪个分布是描述二项分布的?A. 正态分布B. t分布C. F分布D. 泊松分布答案:A4. 以下哪个选项是描述数据离散程度的统计量?A. 众数B. 中位数C. 极差D. 均值答案:C5. 以下哪个选项是描述数据分布形态的统计量?A. 偏度B. 方差C. 标准差D. 均值答案:A6. 以下哪个选项是描述数据分布集中趋势的统计量?A. 偏度B. 峰度C. 众数D. 标准差答案:C7. 以下哪个选项是描述数据分布离散程度的统计量?A. 偏度B. 峰度C. 标准差D. 均值答案:C8. 以下哪个选项是描述数据分布形态的统计量?A. 均值B. 方差C. 偏度D. 众数答案:C9. 以下哪个选项是描述数据分布集中趋势的统计量?A. 极差B. 标准差C. 均值D. 偏度答案:C10. 以下哪个选项是描述数据分布离散程度的统计量?A. 均值B. 众数C. 方差D. 偏度答案:C二、多项选择题(每题4分,共20分)1. 以下哪些统计量可以用来描述数据的集中趋势?A. 均值B. 中位数C. 众数D. 方差答案:ABC2. 以下哪些统计量可以用来描述数据的离散程度?A. 极差B. 方差C. 标准差D. 均值答案:ABC3. 以下哪些统计量可以用来描述数据的分布形态?A. 偏度B. 峰度C. 均值D. 方差答案:AB4. 以下哪些分布是描述连续型随机变量的?A. 正态分布B. 泊松分布C. 二项分布D. t分布答案:AD5. 以下哪些检验是用于检验总体均值的?A. t检验B. 方差分析C. 卡方检验D. F检验答案:A三、计算题(每题10分,共50分)1. 给定一组数据:2, 4, 6, 8, 10,求其平均数和标准差。
(完整版)多元统计复习题附答案
复习题原文:答案:4.2 试述判别分析的实质。
4.3 简述距离判别法的基本思想和方法。
4.4 简述贝叶斯判别法的基本思想和方法。
4.5 简述费希尔判别法的基本思想和方法。
4.6 试析距离判别法、贝叶斯判别法和费希尔判别法的异同。
4.2 试述判别分析的实质。
答:判别分析就是希望利用已经测得的变量数据,找出一种判别函数,使得这一函数具有某种最优性质,能把属于不同类别的样本点尽可能地区别开来。
设R1,R2,…,Rk是p维空间R p的k个子集,如果它们互不相交,且它们的和集为R p,则称R1,R2⋯R p为R p的一个划分。
判别分析问题实质上就是在某种意义上,以最优的性质对p维空间R p构造一个“划分”,这个“划分”就构成了一个判别规则。
4.3 简述距离判别法的基本思想和方法。
答:距离判别问题分为①两个总体的距离判别问题和②多个总体的判别问题。
其基本思想都是分别计算样本与各个总体的距离(马氏距离),将距离近的判别为一类。
①两个总体的距离判别问题设有协方差矩阵∑相等的两个总体G1和G2,其均值分别是μ1和μ2,对于一个新的样品X,要判断它来自哪个总体。
计算新样品X到两个总体的马氏距离D2(X,G1)和D2(X,G2),则X∈G1,D2(X,G1)≤ D2(X,G2)X ∈G 2 ,D 2(X ,G 1)> D 2(X ,G 2, 具体分析,2212(,)(,)D G D G -X X111122111111111222*********()()()()2(2)2()-----------''=-----''''''=-+--+'''=-+-X μΣX μX μΣX μX ΣX X ΣμμΣμX ΣX X ΣμμΣμX ΣμμμΣμμΣμ11211212112122()()()2()22()2()---''=-++-'+⎛⎫=--- ⎪⎝⎭''=--=--X ΣμμμμΣμμμμX ΣμμX μααX μ 记()()W '=-X αX μ 则判别规则为X ∈G 1 ,W(X)≥0 X ∈G 2 ,W(X)<0②多个总体的判别问题。
西南交通大学研究生数理统计与多元统计考试 试题答案
西南交通大学研究生2016-2017 学年第(1)学期考试试卷答案课程代码 课程名称 数理统计与多元统计 考试时间 150分钟 1、设总体X (0,1)N :,12n ,,,X X X L 是来自正态的简单随机样本,其中ξ=,321241)3i i n ii nX X η==-=∑∑(试推断统计量ξ和η的分布。
解:=(1)X t n ξ=-:(5分)32321122441)33(3-3)-3ii i i nniii i XnX F n XXn ====-=~∑∑∑∑(,()(5分)2、设某种元件的使用寿命X 的概率密度为()1(;)0x ex f x x μθμθθμ--⎧≥⎪=⎨⎪<⎩其中00θμ>>,为未知参数,又设12,,,n x x x L 是X 的一组样本观测值,(1)试求参数,μθ的极大似然估计量;(2) 试求参数,μθ的矩估计量.解:1121()1(,,,)1(,,),ni i n nx i i ni L X X X f x ex μθθμθμμθ=--=∑==>∏L 极大似然函数为:(2分)1211ln (,,,)ln (),nn ii i L X X X n x x θμθμμθ==--->∑L (1分)21ln (,)1(),nii i L n x x μθμμθθθ=∂-=+->∂∑(2分)ln (,)0,i L nx θμμμθ∂=>>∂(2分)12(1)(2)(),,...,:...n x x x x x x ≤≤≤的顺序统计值为(1)1ˆmin i i nX X μ≤≤==,()X θ∧1=X-,(2分) 1()x uEX xf x dx xedx μθθμθ--+∞+∞-∞===+⎰⎰(2分)22221()2()x uEX x f x dx x edxμθθμθθμ--+∞+∞-∞===++⎰⎰(2分)1222121211212()ˆˆn ii X X n X θθθθθθθθ=⎧+=⎪⎨++=⎪⎩⎧=⎪⎪⎨⎪=⎪⎩∑解方程得矩估计为:-(2分)3.抛一枚硬币,设正面向上的概率为θ,提出如下假设: 0113::24H H θθ==如果检验规则为:将该硬币抛掷5次,若正面向上的次数多余3次,则拒绝0H 。
多元统计复习题及答案
填空题:1、费希尔(Fisher)判别法是1936年提出来的,该方法的主要思想是通过将多维数据投影到某个方向上。
2、因子分析的内容非常丰富,常用的因子分析类型是R型因子分析和Q型因子分析。
3、K均值聚类分析的基本思想是将每一个样品分配给最接近业壶些直的类中。
4、对应分析是将R型因子分析Q型因子分析结合起来进行的统计分析方法。
5、总体方差未知的情况下,采用样本方差代替总体方差的方法进行计算。
6、主成分分析数学模型中的正交变换,在几何上就是作一个坐标旋转7、设X、N2 ( U , N),其中X=(》1,》2),号),则CovQq +》2,*1 - *2)= _0__8、判别分析是判别样品所属类型的一种统计方法,常用的判别方法有距离判别法、Fisher 判另U法、Bayes判另U法、逐步判另U法9 多元正态分布的任何边缘分布为正态分布10、应用多元统计分析方法用于解决多指标问题,聚类分析就是分析如何对样品(或变量)进行量化分类的问题。
通常聚类分析分为Q型聚类和R型聚类。
11、总离差平方和可以分解为回归离差平方和和剩余离差平方和两个部分,各自的自由度为(P )和(n-p-1),其中回归离差平方和在总离差平方和中所占比重越大,则线性回归效果越显著。
12、系统聚类分析方法有最短距离法、最长距离法、中间距离法、重心法、类平均统和可变类平均法。
13、典型相关分析是研究两组变量之间相关关系的一种多元统计方法14、因子分析中因子载荷系数叫,•的统计意义是:(第i个变量与第j个公因子的相关系数)15、相应分析的特点是研究的变量是定性的16、公共因子方差与特殊因子方差之和为o17、设Z 是总体X=(X”…,乂皿)的协方差阵,X 的特征根人。
=1,2,..・田)与对应的单位正交化特征向量% =(%,%2,,则第一主成分的表达式=% ]X| + %2、2 + ・•• + /mX"],方差为2]18、相应分析的主要目的是寻求列联表行因素A和列因素B的基本分析特征和它们的最优联立表示19聚类分析一是分析如何对样品或变量进行量化分类的问题。
西南交通大学研究生数理统计与多元统计考试12-13试卷答案
(6)方差分析通过比较 果的影响越显著,当
2 SA 大于某个临界值时,则认为 A 因素对结果的影响显著。 2 SE
(1)在 H 0 成立时,求犯第一类错误的概率 ; (2)在 H 0 不成立时,且 1 0 时,求犯第二类错误的概率 ; 答案:(1)构造检验统计量
X
n ( X ) : N (0,1)
n
P X c 0 P
n ( X 0 ) n (c 0 )
(1)求未知参数 的极大似然估计量;
1 (2)求随机事件 X 发生概率的矩估计量。 2
n n 1 0 xi 1 ( xi ) , 答案:(1)似然函数 L( x1 , x2 ,L , xn , ) i 1 0 , 其它
对数似然函数
之间的距离为 27; 第四步:将 G8 和 G4 合并为新类 G9 。
1 3 1 2 2 1 ˆ 答案: 2 1 1 2 3
3
3 2 1 3 4 1 ˆ1 , X ˆ2 X 5 6 1 5 2 3
y b0 b1 x1 b2 x2 L bp x p (2) , p 1 E ( ) 0
(3) 多元线性回归分析中用残差和刻画各个变量的观测数据对理论模型中 y 的线性影 响以外的一切其它因素导致 y 的波动。残差和越小,意味着各个变量对 y 的线性影响越大。
多元统计分析期末试题及答案
4、 __________, __________, ________________。
(1) 试从Σ出发求X 的第一总体主成分;(2) 试问当 取多大时才能使第一主成分的贡献率达95%以上。
1、0 2、W 3(10,∑) 3、211342113611146R ⎛⎫-⎪ ⎪ ⎪=-- ⎪ ⎪ ⎪- ⎪⎝⎭4、0.872 1 1.7435、T 2(15,p )或(15p/(16-p))F (p ,n-p )一、填空题:1、多元统计分析是运用 数理统计 方法来研究解决 多指标 问题的理论和方法.2、回归参数显着性检验是检验 解释变量 对 被解释变量 的影响是否着.3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。
通常聚类分析分为 Q 型 聚类和 R 型 聚类。
4、相应分析的主要目的是寻求列联表 行因素A 和 列因素B 的基本分析特征和它们的最优联立表示。
5、因子分析把每个原始变量分解为两部分因素:一部分为 公共因子 ,另一部分为 特殊因子 。
6、若()(,),P x N αμα∑=1,2,3….n 且相互独立,则样本均值向量x 服从的分布为_x ~N(μ,Σ/n)_。
二、简答1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。
在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。
选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。
被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。
2、简述相应分析的基本思想。
ρ(),123设X=xx x 的相关系数矩阵通过因子分析分解为211X h =的共性方差111X σ=的方差相应分析,是指对两个定性变量的多种水平进行分析。
设有两组因素A 和B ,其中因素A 包含r 个水平,因素B 包含c 个水平。
对这两组因素作随机抽样调查,得到一个rc 的二维列联表,记为 。
西南交通大学研究生数理统计与多元统计考试 试题答案
西南交通大学研究生2016-2017 学年第(1)学期考试试卷答案课程代码 课程名称 数理统计与多元统计 考试时间 150分钟 1、设总体X (0,1)N :,12n ,,,X X X L 是来自正态的简单随机样本,其中ξ=,321241)3i i n ii nX X η==-=∑∑(试推断统计量ξ和η的分布。
解:=(1)X t n ξ=-:(5分)32321122441)33(3-3)-3ii i i nniii i XnX F n XXn ====-=~∑∑∑∑(,()(5分)2、设某种元件的使用寿命X 的概率密度为()1(;)0x ex f x x μθμθθμ--⎧≥⎪=⎨⎪<⎩其中00θμ>>,为未知参数,又设12,,,n x x x L 是X 的一组样本观测值,(1)试求参数,μθ的极大似然估计量;(2) 试求参数,μθ的矩估计量.解:1121()1(,,,)1(,,),ni i n nx i i ni L X X X f x ex μθθμθμμθ=--=∑==>∏L 极大似然函数为:(2分)1211ln (,,,)ln (),nn ii i L X X X n x x θμθμμθ==--->∑L (1分)21ln (,)1(),nii i L n x x μθμμθθθ=∂-=+->∂∑(2分)ln (,)0,i L nx θμμμθ∂=>>∂(2分)12(1)(2)(),,...,:...n x x x x x x ≤≤≤的顺序统计值为(1)1ˆmin i i nX X μ≤≤==,()X θ∧1=X-,(2分) 1()x uEX xf x dx xedx μθθμθ--+∞+∞-∞===+⎰⎰(2分)22221()2()x uEX x f x dx x edxμθθμθθμ--+∞+∞-∞===++⎰⎰(2分)1222121211212()ˆˆn ii X X n X θθθθθθθθ=⎧+=⎪⎨++=⎪⎩⎧=⎪⎪⎨⎪=⎪⎩∑解方程得矩估计为:-(2分)3.抛一枚硬币,设正面向上的概率为θ,提出如下假设: 0113::24H H θθ==如果检验规则为:将该硬币抛掷5次,若正面向上的次数多余3次,则拒绝0H 。
西南交通大学 数理统计考试题
西南交通大学研究生2015-2016 学年第(1)学期考试试卷课程代码 课程名称 数理统计与多元统计 考试时间 150分钟 题号 一 二 三 四 五 六 七 八 总成绩 得分阅卷教师签字:1.设129,,,XX X L 是来自正态总体X 的简单随机样本,其中1161()6Y X X =++L ,27891()3Y X X X =++,922271()2i i S X Y ==−∑,12)Y Y Z S−=试推断统计量Z 的分布。
(10分)解:因为129,,,X X X L 相互独立且服从正态分布2(,)N μσ,则有26111~(,)66i i Y X N σμ==∑,29271~(,)33i i Y X N σμ==∑----------------------------------(2分)且相互独立, 22212~(0,)(0,)632Y Y N N σσσ−+=,~(0,1)N -----------------------------(3分)又因2S 为样本方差,所以由定理得 2222~(2)S χσ,---------------------------------(2分)且2S 与1Y 与2Y 相互独立,故与12Y Y −也是相互独立的,于是由t 分布定义知12)~(2)Y Y Z t S −==---------------------------------(3分)即统计量Z 服从自由度为2的t 分布。
2. 设某种元件的使用寿命X的概率密度为2()2(;)0x e x f x x θθθθ−−⎧>=⎨≤⎩其中0θ>为未知参数,又设12,,,n x x x L 是X 的一组样本观测值,(1)试求参数θ的极大似然估计量ˆθ极;(2)求极大似然估计 ˆθ极的方差。
(15分)解:(1)由X 的概率密度函数,得似然函数112()112()22()(;)2=22(1,2,,)i nni i i i n nx i i i x x n nni L f x e eex i n θθθθθθ==−−==−−−+==∑∑=>=∏∏L ---------------------------------(2分)取对数得:1ln ()ln 222(1,2,,)ni i i L n x n x i n θθθ==−+>=∑L ---------------------------------(2分)再对θ求导得:ln ()20(1,2,,)i d L n x i n d θθθ=>>=L ---------------------------------(1分)即()L θ是单调增加的,虽然θ越大则()L θ越大,但θ必须满足条件(1,2,,)i x i n θ<=L所以当取θ为12,,,n x x x L 中最小值(1)x 时,()L θ取得满足条件的最大值,所以θ的最大似然估计值为(1)12ˆmin{,,,}nx x x x θ==L ---------------------------------(2分) (2)2()1()0x e x F x x θθθ−−⎧−≥=⎨<⎩---------------------------------(1分) 2()(1)1()1(1())0n x ne x F x F x x θθθ−−⎧−≥=−−=⎨<⎩---------------------------------(1分) 2()(1)(1)()2()0n x dF x ne x f x dxx θθθ−−⎧≥==⎨<⎩--------------------------------(1分)2()(1)122n x EX x ne dx nθθθ+∞−−==+∫--------------------------------(2分)22()2(1)1[]22n x E X x ne dx nθθθθ+∞−−==++∫--------------------------------(2分)22(1)(1)(1)2(21)11[][][]4n D X E X EX n n nθ−=−=+−------------------------------(1分)3. 假设0.50,1.25,0.80,2.00是来自总体X 的简单随机样本值,已知ln Y X =服从正态分布(,1)N μ。
12研究生数理统计习题部分解答
12研究生数理统计习题部分解答第六章 抽样分布1. (1994年、数学三、选择)2. 设),,,(21n X X X 是来自总体),(2σμN 的简单随机样本,X 是样本均值,记22121)(11∑=--=i i X X n S ,22122)(1∑=-=i i X X n S ,22123)(11∑=--=i i X n S μ,22124)(1∑=-=i i X n S μ则服从自由度1-n 的t 分布的随机变量是=T ( )。
3. A .11--n S X μB .12--n S X μ4. C .nS X 3μ-D .nS X 4μ-[答案:选B ]5. 当2212)(11∑=--=i i X X n S 时,服从自由度1-n 的t 分布的随机变量应为 6. =T nSX μ-7. A 、由222121)(11S X X n S i i =--=∑=,111--=--=n S X n S X T μμ 8. 而不是nSX T μ-=9. B 、由212221221)(111)(1S nn X X n n n X X n S n i ii i -=--⋅-=-=∑∑== 10. nSX n S X n S X T nn μμμ-=--=--=∴-1112。
11. (1997年、数学三、填空)12.设随机变量Y X ,相互独立,均服从)3,0(2N 分布且91,,X X 与91,,Y Y 分别是来自总体Y X ,的简单随机样本,则统计量292191Y Y X X U ++++= 服从参数为( )的()分布。
13.[答案:参数为(9)的(t )分布]14.解:由Y X ,相互独立,均服从)3,0(2N 分布,又91,,X X 与91,,Y Y 分别来自总体Y X ,,可知91,,X X 与91,,Y Y 之间均相互独立,均服从分布)3,0(2N 15.因而)39,0(~291⨯∑=N X i i ,)1,0(~9191N X X i i ∑==,)1,0(~3N Y i ,)9(~32912χ∑=⎪⎭⎫ ⎝⎛i i Y ,且∑==9191i i X X 与∑=⎪⎭⎫ ⎝⎛9123i i Y 相互独立, 16. 因而()292191912919123919191Y Y X X YXXi ii ii Y i ii ++++==∑∑∑∑==== 服从参数为9的t 分布。
西南交通大学2013年数理统计与多元统计考试题
西南交通大学研究生2012-2013 学年第(1)学期考试试卷课程代码 课程名称 数理统计与多元统计 考试时间 150分钟题号 一 二 三 四 五 六 七 八 九 十 总成绩得分阅卷教师签字:1.(1)设总体()220,80~N X ,()10021,,,X X X Λ是取自总体的样本,求样本均值大于总体均值的概率;(2)设()n t Y ~,求(){}n t Y P α≤ (10分)2.设总体X 的概率密度()⎩⎨⎧<<θ=−θ其它 010 1x x x f ,(1)求未知参数θ的极大似然估计量;(2)求随机事件⎭⎬⎫⎩⎨⎧≤21X 发生概率的矩估计量。
(10分)3. 从一批产品中抽取了100只进行检验,发现有3只次品,试在95%的置信度下给出这批产品次品率的区间估计。
(10分)4.设n X ,,X ,X Λ21是取自正态总体()1,N μ的样本,其中μ未知。
若对假设检验问题 0H :0μ=μ 1H :0μ>μ ,取拒绝域 {}c x W ≥=. (1)在0H 成立时,求犯第一类错误的概率α;(2)在0H 不成立,且01μ>μ=μ时,求犯第二类错误的概率β; (10分)5.设()()()()2521,,,X X X Λ是取自某连续型总体的容量为25的样本次序统计量.近似计算: (1)()()135.0X P <ξ院 系 学 号 姓 名密封装订线 密封装订线 密封装订线(2)()()()92.02X X P <ξ< (10分)6.(1) 回归分析研究变量间的什么关系? (2) 写出多元线性回归分析的数学模型;(3)多元线性回归分析中如何刻画观测数据与理论模型的符合程度? (4)在单因素方差分析中如何刻画数据总的波动程度?(5)在单因素方差分析中如何度量随机误差对数据波动的影响?(6)方差分析是通过比较什么量的大小来推断因素各状态间是否存在显著差异?并简要论述其合理性。
研究生多元统计分析试题(A卷)(答案)
内蒙古农业大学2009—2010学年第一学期一、判断题(每小题2分,共10分) 1.多元正态分布的任何边缘分布为正态分布; ( 对 ) 2.正态总体),(∑μp N 的样本均值X 是μ的无偏,有效,一致估计; ( 对 ) 3.Wilks 统计量可以化成2T 统计量但是化不成F 统计量; ( 错 ) 4.Fisher 判别法对总体的分布有特定的要求; ( 错 )5.. ( 对 )二、填空题(每小题3分,共15分)1. 设X 和S 分别是正态总体),(∑μp N 的样本均值和离差阵,则X 和S 的关系为相互独立;2.若X ~),0(∑p N ,S ~),(∑n W p 且X 与S 相互独立,则X S X pp n 1'1-+-~(,1)F p n p -+;3.若1A ~),(1∑n W p ,p n ≥1,2A ~),(2∑n W p ,∑>0,且1A 和2A 相互独立, 则211A A A +~12(,,)p n n ∧;4.设资料阵X=()pn ijx ⨯,则样品()i X 与()j X 的切比雪夫距离)(∞ij d =1max ||i j px x ααα≤≤-;5.设S 是正态总体),(∑μp N 的离差阵,则∑的相合估计为11()1s s n n - . 三、选择题(每小题3分,共15分)1.设S 是正态总体),(∑μp N 的离差阵,样本容量为n ,则S 为正定矩阵的充要..条件..是(A ) A .n >p B. n <p C. n ≥p D. n ≤p2.下列不.是.系统聚类法是( ) A. 对应分析法 B.重心法 C. 可变法 D. 类平均法3. 以下关于聚类分析的说法不正确...的是(A ) A.聚类分析与群分析是不同的统计分析方法 B. 聚类分析属于多元统计分析方法 C. 系统聚类法是一种常用的聚类分析法 D. 模糊聚类法是一种常用的聚类分析法4. 判别分析是种常用的商情分析工具,下列关于判别分析的说法正确的是( D ) A. 判别分析是属于一元统计方法 B. 判别函数只有线性判别一种类型C. 无论判别标准是否相同,所得到的结论是相同的D. 判别分析是判别样本所属类型的统计方法5.“用一条直线代表散点图上的分布趋势,使各点与该纵向距离的平方和最小”是( A )方法B. 判别分析C. 聚类分析D. 相关分析四、计算题(每小题10分,共 30分)1.设抽取五个样品,每个样品只测一个指标,它们是2,3,4.5,8,10,试用最短距离法对五个样品进行分类. (请用绝对距离)解: 设样品为: x1,x2,x3,x4,x5 则他们的距离(绝对值距离)为(0)D =12345123450102.5 1.5065 3.5087 5.520x x x x x x x x x x ⎛⎫ ⎪ ⎪ ⎪⎪ ⎪⎪ ⎪ ⎪⎝⎭ (1)D =1234512345,,01.505 3.507 5.52x x x x x x x x x x ⎛⎫⎪ ⎪ ⎪⎪ ⎪ ⎪ ⎪ ⎪⎝⎭(2)D =1234512345,,,,03.505.520x x x x x x x x x x ⎛⎫ ⎪ ⎪ ⎪⎪⎝⎭ (3)D =1234512345,,,,,0, 3.50x x x x x x x x x x ⎛⎫⎪ ⎪ ⎪ ⎪⎝⎭2.设三元总体X 的协方差阵为200050009⎛⎫ ⎪∑= ⎪ ⎪⎝⎭,从∑出发,求总体主成分123,,F F F ,并求前两个主成分的累积贡献率。
研究生统计专业试题及答案
研究生统计专业试题及答案一、选择题(每题2分,共20分)1. 在统计学中,总体参数和样本统计量的主要区别是什么?A. 总体参数是固定的,样本统计量是随机的B. 总体参数是随机的,样本统计量是固定的C. 总体参数和样本统计量都是随机的D. 总体参数和样本统计量都是固定的答案:A2. 以下哪个是描述性统计分析的主要内容?A. 变量的估计B. 变量的假设检验C. 数据的收集D. 数据的描述和概括答案:D3. 假设检验中的零假设(H0)通常表示什么?A. 研究者想要证明的假设B. 研究者想要拒绝的假设C. 研究者认为不存在效应的假设D. 研究者认为有效应的假设答案:C4. 以下哪个不是常见的概率分布?A. 正态分布B. 二项分布C. 泊松分布D. 均匀分布答案:D(注:均匀分布也是常见的概率分布之一,此题设计有误)5. 以下哪个是衡量数据集中趋势的指标?A. 方差B. 标准差C. 均值D. 极差答案:C6. 相关系数的取值范围是多少?A. -1 到 1B. 0 到 1C. -∞ 到∞D. 0 到∞答案:A7. 以下哪个是时间序列分析的主要目的?A. 预测未来趋势B. 描述数据分布C. 检验变量间的关系D. 分析数据的随机性答案:A8. 以下哪个是多元回归分析中可能遇到的问题?A. 多重共线性B. 数据的正态性C. 数据的独立性D. 样本的代表性答案:A9. 在统计推断中,置信区间和假设检验的共同点是什么?A. 都需要事先设定显著性水平B. 都是基于样本数据来推断总体C. 都是用来估计总体参数的D. 都是用来检验总体参数的答案:B10. 以下哪个是生存分析中常用的统计方法?A. 回归分析B. 因子分析C. Kaplan-Meier估计D. 主成分分析答案:C二、简答题(每题10分,共30分)1. 请简述中心极限定理的内容及其在实际应用中的意义。
答案:中心极限定理是统计学中的一个重要定理,它指出,对于任意一个总体,只要样本量足够大,无论总体分布如何,样本均值的分布都将趋近于正态分布。
多元统计1-5章习题答案
多元统计1-5章习题答案多元统计学是一门研究多个变量之间关系的学科,它涉及到统计学中的各种方法和技术。
在多元统计学的学习过程中,习题是非常重要的一部分,通过解答习题可以加深对知识的理解和掌握。
本文将回答多元统计学1-5章的一些习题,帮助读者更好地学习和应用多元统计学。
第一章是多元统计学的基本概念和原理,其中包括多元数据的描述和总体参数的估计。
在这一章的习题中,常见的问题是关于均值、方差和协方差的计算。
通过计算这些统计量,可以了解数据的分布和变异程度。
同时,还有一些关于总体参数估计的问题,如最大似然估计和矩估计。
这些问题可以帮助读者理解参数估计的原理和方法。
第二章是关于多元正态分布的内容,其中包括多元正态分布的性质和参数估计。
在这一章的习题中,常见的问题是关于多元正态分布的性质和特点。
例如,如何计算多元正态分布的密度函数和累积分布函数,以及如何利用多元正态分布进行假设检验和置信区间估计。
这些问题可以帮助读者理解多元正态分布的基本概念和应用。
第三章是关于多元方差分析的内容,其中包括单因素多元方差分析和多因素多元方差分析。
在这一章的习题中,常见的问题是如何进行多元方差分析和解释结果。
例如,如何计算多元方差分析的F统计量和p值,以及如何进行多重比较和效应大小的计算。
这些问题可以帮助读者理解多元方差分析的原理和应用。
第四章是关于多元线性回归的内容,其中包括多元线性回归模型和参数估计。
在这一章的习题中,常见的问题是如何建立多元线性回归模型和解释结果。
例如,如何进行多元线性回归的参数估计和假设检验,以及如何进行模型选择和解释变量的重要性。
这些问题可以帮助读者理解多元线性回归的基本原理和应用。
第五章是关于主成分分析和因子分析的内容,其中包括主成分分析和因子分析的原理和应用。
在这一章的习题中,常见的问题是如何进行主成分分析和因子分析,并解释结果。
例如,如何计算主成分和因子的贡献率和累积贡献率,以及如何解释主成分和因子的含义。
多元统计分析期末试题(卷)与答案解析
22121212121~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ⎛⎫∑==∑=⎪⎝⎭+-1、设其中则Cov(,)=____.10312~(,),1,,10,()()_________i i i i X N i W X X μμμ='∑=--∑、设则=服从。
()1234433,492,3216___________________X x x x R -⎛⎫ ⎪'==-- ⎪⎪-⎝⎭=∑、设随机向量且协方差矩阵则它的相关矩阵4、__________, __________,________________。
215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。
(),123设X=x xx 的相关系数矩阵通过因子分析分解为211X h =的共性方差111X σ=的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R⎛⎫- ⎪⎛⎫⎛⎫⎪-⎛⎫ ⎪ ⎪⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪⎪⎝⎭12332313116421(,,)~(,),(1,0,2),441,2142X x x x N x x x x x μμ-⎛⎫⎪'=∑=-∑=-- ⎪ ⎪-⎝⎭-⎛⎫+ ⎪⎝⎭、设其中试判断与是否独立?11262(90,58,16),82.0 4.310714.62108.946460.2,(5)( 115.6924)14.6210 3.17237.14.5X S μ--'=-⎛⎫ ⎪==-- ⎪ ⎪⎝⎭0、对某地区农村的名周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。
(完整版)研究生数理统计问答题答案
(完整版)研究生数理统计问答题答案201311。
检验的显著性水平:在假设检验中,若小概率事件的概率不超过α,则称α为检验水平或显著性水平.检验的P 值:拒绝原假设的最小显著水平称为假设检验中的P 值。
2。
参数估计的类型:① 点估计;② 区间估计;参数的点估计的方法:① 矩估计法 基本思想:由于样本来源于总体,样本矩在一定程度上反映了总体矩,而且由大数定律可知,样本矩依概率收敛于总体矩。
因此,只要总体X 的k 阶原点矩存在,就可以用样本矩作为相应总体矩的估计量,用样本矩的函数作为总体矩的函数的估计量。
② 极大似然估计法 基本思想:设总体分布的函数形式已知,但有未知参数θ,θ可以取很多值,有θ的一切可能取值中选一个使样本观察值出现的概率为最大的值作为θ的估计值,记作 ∧θ ,并称为θ的极大似然估计值.这种求估计值的方法称为极大似然估计法。
参数的点估计的评价方法:错误!无偏性;错误!有效性;错误!一致性。
3.假设检验的思想:先假设总体具有某种特征,然后再通过对样本的加工,即构造统计量推断出假设的结论是否合理。
假设检验是带有概率性质的反证法.推理依据:第一,假设检验所采用的逻辑推理方法是反证法.第二,合理与否,所依据的是“小概率事件实际不可能发生的原理”。
参数假设检验步骤:错误!提出原假设和备择假设;错误!选择适当的统计量,并确定其分布形式;错误!选择显著性水平α ,确定临界值;错误!作出结论。
5。
正交试验数据分析方法:○,1直接对比法就是对试验结果进行简单的直接对比。
错误!直观分析法是通过对每一因素的平均极差来分析问题。
所谓极差就是平均效果中最大值和最小值的差。
有了极差,就可以找到影响指标的主要因素,并可以帮助我们找到最佳因素水平组合。
4。
方差分析的目的:方差分析的目的是通过分析,判定某一因子是否显著,当因子显著时,我们还可以给出每一水平下指标均值的估计,以便找出最好的水平。
方差分析是对多个总体均值是否相等这一假设进行检验。
西南交通大学2012年数理统计与多元统计考试题
………………2 分
所以 θ = X (1) λ =
∧
∧
1 1 ∑ ln xi − ln X (1) n i =1
n
……………………2 分
三、 (15 分)设总体 X ∼ N ( μ ,32 ) ,其中参数 μ 未知。若 X 1 , X 2 ,L , X n 是 来自该总体的容量为 n 的样本。 (1) 、若样本容量 n=10,样本均值 x = 150 ,试求参数 μ 的置信水平为 0.95 的置信区间; (2) 、若要求置信水平为 0.95 的置信区间的长度小于 1,则样本容量 n 最小取值为多少? (3) 、若样本容量 n=100,则区间 [ x − 1, x + 1] [ x − 1, x + 1] 作为的置信区 间,其置信水平是多少? 解、 (1) 、X =
西南交通大学研究生 2012-2014 学年第(1)学期考 试试卷
课程代码
课程名称 数理统计与多元统计 考试时间 150 分钟
一、 (10 分)设 X 1 , X 2 , L , X n , X n +1 是来自于正态总体 N ( μ , σ 2 ) 的样本,
X=
2 X −X 1 n 1 n 2 , 。试求常数 c ,使得 c n+1 服从 X S = X − X ( ) ∑ ∑ i n i i =1 i =1 Sn n n −1
i =1
n
∂Ln n n = n ln θ + − ∑ ln xi = 0 …………………………3 分 λ i =1 ∂λ
λ=
∧
1
∧ 1 ln xi − ln θ ∑ n i =1 n
∂Ln nλ = > 0 ………………………………1 分 θ ∂θ
多元统计分析期末试题与答案
多元统计分析期末试题与答案22121212121~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ∑==∑=+-1、设其中则Cov(,)=____.10312~(,),1,,10,()()_________i i i i X N i W X X μμμ='∑=--∑、设则=服从。
()1234433,492,3216___________________X x x x R -?? ?'==-- ?-?=∑、设随机向量且协方差矩阵则它的相关矩阵4、__________, __________,________________。
215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。
12332313116421(,,)~(,),(1,0,2),441,2142X x x x N x x x x x μμ-??'=∑=-∑=-- ? ?-??-??+、设其中试判断与是否独立?(),123设X=x x x 的相关系数矩阵通过因子分析分解为211X h =的共性方差111X σ=的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.4 4730.8350.4470.1032013R ?--?? ? ?=-=-+ ? ? ? ??? ? ? ????? ?11262(90,58,16),82.0 4.310714.62108.946460.2,(5)( 115.6924)14.6210 3.17237.14.5X S μ--'=-?? ?==-- ? 0、对某地区农村的名周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
西南交通大学研究生2016-2017 学年第(1)学期考试试卷答案
课程代码 课程名称 数理统计与多元统计 考试时间 150分钟 1、设总体X (0,1)N :,12n ,,,X X X L 是来自正态的简单随机样本,其中
ξ=
,3
2
1
2
4
1)3i i n i
i n
X X η==-=∑∑(试推断统计量ξ和η的分布。
解:
=
(1)
X t n ξ=
-:(5分)
3
23
2
1
1
224
4
1)33
(3-3)-3i
i i i n
n
i
i
i i X
n
X F n X
X
n ====-=
~∑∑∑∑(,()
(5分)
2、设某种元件的使用寿命X 的概率密度为
()
1(;)0x e
x f x x μθμθθ
μ
--⎧≥⎪=⎨⎪<⎩
其中00θμ>>,为未知参数,又设12,,,n x x x L 是X 的一组样本观测值,(1)试求参数,μθ的极大似然估计量;(2) 试求参数,μθ的矩估计量.
解:
1
121
()
1(,,,)1
(,,),
n
i i n n
x i i n
i L X X X f x e
x μθ
θμθμμ
θ
=-
-=∑==
>∏L 极大似然函数为:(2分)
121
1
ln (,,,)ln (),
n
n i
i i L X X X n x x θμθμμθ
==--
->∑L (1分)
21ln (,)1(),
n
i
i i L n x x μθμμθθθ=∂-=+->∂∑(2分)
ln (,)0,
i L n
x θμμμθ
∂=>>∂(2分)
12(1)(2)(),,...,:...n x x x x x x ≤≤≤的顺序统计值为
(1)1ˆmin i i n
X X μ
≤≤==,()X θ∧
1=X-,(2分) 1
()x u
EX xf x dx xe
dx μ
θ
θμθ
--
+∞
+∞
-∞
===+⎰
⎰
(2分)
2
2
2
21
()2()
x u
EX x f x dx x e
dx
μ
θ
θ
μθθμ--
+∞
+∞
-∞
===++⎰
⎰
(2分)
1222121211212()ˆˆn i
i X X n X θθθθθθθθ=⎧+=⎪
⎨++=⎪⎩⎧=⎪⎪⎨
⎪=⎪⎩
∑解方程得矩估计为:
-(2
分)
3.抛一枚硬币,设正面向上的概率为θ,提出如下假设: 011
3::2
4
H H θθ=
=
如果检验规则为:将该硬币抛掷5次,若正面向上的次数多余3次,则拒绝0H 。
(1)求该检验犯第一类错误的概率。
(2)求该检验犯第二类错误的概率。
(3)在硬币抛掷次数不变的情况下,为使检验的显著性水平0.05α=,应如何修改检验规则。
解:
(1)44
55
516(3|)=C (1)22
P X θθθθ>=-+= (2)5114
5223332553(3|)=(1)C (1)
4C (1)C (1)
P X θθθθθθθθ≤=-+--+-
1144455513(|)=C (1)C (1)0.052
m m m P X m θθθθθθ++->=-+-+=L ()
4. (15分)为了研究某商品的需求量Y 与价格x 之间的关系,收集到下列10对数据,得出以下结果:
(1) 估计截距0β和斜率系数1β及其标准误,并进行t 检验;(2)回归直线未解
释的价格变差部分是多少?(3)对0β和1β分别建立95%的置信区间。
解:(1)
;
12
ˆ74.1+2.0615.9
ˆ=
13.42
102
yy xx l l n βσ
-⨯=≈--
2ˆyy xx S l b l =-剩,2ˆˆxx xy S b l bl ==回
22
2
1ˆ[],ˆ,xx xx
x Da
n l Db l σσ=+=
2
ˆ[2
a t n α±-()
2
ˆ2
b t n α±-(()
5.简要回答下列问题:1、判别分析和聚类分析有何区别?
2、在单因素方差分析中,进行总变量平方和分解的目的和意义是什么?
22
31,58,147,112,410.5,
i i i i i i x y x y x y =====∑∑∑∑∑()()14710 3.1 5.832.8
xy
i i i i l
x x y y x y nx y =--=-=-⨯⨯=-∑∑2
222()11210 3.115.9
xx i i l x x x nx =-=-=-⨯=∑∑2
222()410.510 5.874.1
yy i i l y y y ny =-=-=-⨯=∑∑32.8ˆˆˆ2.06, 5.8 2.06 3.112.1915.9xy xx l b a
y bx l -==≈-=-≈+⨯≈
6.从协方差阵相同的两个二元正态总体中,各自抽取了容量1230,25n n ==的样
本,算的_
_
_^127.2 6.0 1.040.68,2.3 3.10.680.58x x ⎛⎫⎛⎫⎛⎫==∑= ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭。
现取一个样本 6.42.9x ⎛⎫
= ⎪⎝⎭
,
试用距离判别法判别x 的归属。
从协方差阵相同的两个二元正态总体中,根据过去收集的资料样本,已估计出
_
_
_^122422,6223x x ⎛⎫⎛⎫⎛⎫==∑= ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭。
现取一个样本35x ⎛⎫
= ⎪⎝⎭
, 试用距离判别法判别x 的归属。
7. (13分)设12344
(,,,)~(0,)T X X X X X N =∑,其协方差矩阵为 1
11
1ρ
ρρρρ
ρρρρρ
ρ
ρ
⎛⎫ ⎪
⎪∑= ⎪
⎪⎝⎭
其中01ρ<≤ (1) 试从Σ出发求X 的第一总体主成分;
(2) 试问当ρ取多大时才能使第一主成分的贡献率达95%以上。
8. (10分)表中给出了五个样品两两间的距离,根据系统聚类法
(1)按最短距离法,第一步如何聚类?第二步如何聚类?聚类时的距离分别 是多少?(2)按最长距离法,第一步如何聚类?第二步如何聚类?
121341123114013,
11
111011111
1222
2111222x x x x Z X X X λρρρρλρρ
λρρρλρρρρλλλλρ
λρ
ρρρλρρλρ
ρλρρρρλλ--------==+--------===-----⎛⎫⎛⎫ ⎪
⎪---- ⎪
⎪= ⎪---- ⎪ ⎪
⎪----⎝⎭⎝⎭'⎛⎫
⎪⎝⎭
=++1234、(1)由得特征根为解所对应的方程得所对应的单位特征向量为故得第一主成分4
1
11
2
1395%4
0.9541
0.9333
X λρ
λλλλρ++=
≥+++⨯-≥
≈234
(2)第一个主成分的贡献率为
得。