《数据分析与统计软件》期末测试试题()
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《数据分析与统计软件》期末试题()
————————————————————————————————作者:————————————————————————————————日期:
A卷
20xx—20xx学年第一学期
《数据分析与统计软件》期末试卷(1)
专业班级
姓名
学号
开课系室理学院应用数学系
考试日期
题号一二三四五六总分本题满分21 18 16 17 17 11 100 本题得分
阅卷人
注意事项:
1.本试卷正文共6页。
2.反面及附页可作草稿纸。
3.答题时请在试卷正面指定位置答题,注意书写清楚,保持卷面清洁。
4. 试卷本请勿撕开,不能铅笔答题,否则作废。
一、填空题(本题满分21分,每空3分)
1、设X 为p 维总体,()(1,2,,)i X i n =L 是X 的样本,
样本均值为()1
1n
i i X X n ==∑,则()Cov X 的常用无偏估
为:_________________________________。
2、设Y 是取0,1两个值的随机变量,它受变量12,X X 的影响,则Y 与变量
12,X X 的LOGISTIC 回归模型为_______________________________。
3、设变量123(,,)T X X X 的协方差阵为4222932325⎡⎤
⎢⎥∑=-⎢⎥
⎢⎥-⎣⎦
,则它的相关阵为________________________;偏相关系数13(2)ρ⋅为________________。
4、今对5人进行测试,测得2个指标:脉搏1X ,引体向上次数2X ,数据如
下表,则两者的样本Spearman 相关系数为:__________________;两者的样本Kendall τ相关系数为:__________________ 。
X 1 50 52 58 46 56 X 2
15 12 13 17 14
5、在R 中,对一列0,1二值观测数据向量x 进行随机性检验的函数调用格
式为:____________________________。
本题满分21分 本题得分
二、(本题满分18分,分为2个小题,分别为8分和10分) 1、填写出下列经修订的R 软件输出的单因子方差分析 表中所缺的数值。
ANOV A Table
Source Sum Sq Df Mean Sq F A 406
Residuals 30
Total
676
34
2、设(,),1,2,,i i x y i n =L 是来自一元线性回归模型012
~(0,)
Y x N ββε
εσ=++⎧⎨⎩的样本,而¶0β和µ1β分别是0β和1β的最小二乘估计。求证:最小二乘回归方程$¶µ01
y x ββ=+经过点()
,x y ,其中11
11,n n
i i i i x x y y n n ====∑∑。
本题满分18分 本题得分
设三维总体X 的相关阵为:
11(01)1r r r r r r r ρ⎡⎤
⎢⎥=<≤⎢⎥⎢⎥⎣⎦
(1) 求出总体X 的标准化变量的第一主成分;
r 多大时才能使总体X 的第一主成分的贡献率达90%以上?
(2) 将上述结果推广到(3)p p >维总体情形。
本题得分
收集了从事数学研究的24位数学家的年工资额Y 与他们的研究成果的质量指标1X 、工作年限2X 、以及获得资助的指标3X 的数据(data3.1.txt ),利用R 软件建立年工资额Y 关于其他变量的多元线性回归模型,结果如下:
> x<-read.table("D:/data3.1.txt",header=T)
> lm.reg<-lm(y~1+x1+x2+x3,data=x) > summary(lm.reg) Call:
lm(formula = y ~ 1 + x1 + x2 + x3, data = x) Residuals:
Min 1Q Median 3Q Max -3.2724 -0.8039 0.0032 1.1557 3.2311 Coefficients:
Estimate Std. Error t value Pr(>|t|) (Intercept) 17.62493 1.99893 8.817 2.51e-08 *** x1 1.12812 0.32595 3.461 0.002468 ** x2 0.32327 0.03632 8.902 2.15e-08 *** x3 1.30343 0.29354 4.440 0.000251 *** ---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 1.731 on 20 degrees of freedom
Multiple R-squared: 0.913, Adjusted R-squared: 0.9 F-statistic: 69.98 on 3 and 20 DF, p-value: 8.802e-11
试写出:(1)残差的三均值;
(2)变量3X 的系数显著性检验的p 值;
(3)回归方程是否显著?为什么?如果显著,请写出回归方程; (4)如果给某位数学家的3个自变量的一组值010203(,,)x x x 为 (5.1,20,7.2),请给出该数学家的年工资额0Y 的点预测值。
本题得分