《数据分析与统计软件》期末试题(1)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
A卷
20xx—20xx学年第一学期
《数据分析与统计软件》期末试卷(1)
专业班级
姓名
学号
开课系室理学院应用数学系
考试日期
题号一二三四五六总分本题满分21 18 16 17 17 11 100 本题得分
阅卷人
注意事项:
1.本试卷正文共6页。
2.反面及附页可作草稿纸。
3.答题时请在试卷正面指定位置答题,注意书写清楚,保持卷面清洁。
4. 试卷本请勿撕开,不能铅笔答题,否则作废。
一、填空题(本题满分21分,每空3分)
1、设X 为p 维总体,()(1,2,,)i X i n =L 是X 的样本,
样本均值为()1
1n
i i X X n ==∑,则()Cov X 的常用无偏
估为:_________________________________。
2、设Y 是取0,1两个值的随机变量,它受变量12,X X 的影响,则Y 与变量
12,X X 的LOGISTIC 回归模型为_______________________________。
3、设变量123(,,)T X X X 的协方差阵为4222932325⎡⎤
⎢⎥∑=-⎢⎥
⎢⎥-⎣⎦
,则它的相关阵为________________________;偏相关系数13(2)ρ⋅为________________。
4、今对5人进行测试,测得2个指标:脉搏1X ,引体向上次数2X ,数据
如下表,则两者的样本Spearman 相关系数为:__________________;两者的样本Kendall τ相关系数为:__________________ 。
5、在R 中,对一列0,1二值观测数据向量x 进行随机性检验的函数调用
格式为:____________________________。
二、(本题满分18分,分为2个小题,分别为8分和10分) 1、填写出下列经修订的R 软件输出的单因子方差分析 表中所缺的数值。
2、设(,),1,2,,i i x y i n =L 是来自一元线性回归模型012
~(0,)
Y x N ββε
εσ=++⎧⎨⎩的样本,而¶0β和µ1
β分别是0β和1β的最小二乘估计。求证:最小二乘回归方程$¶
µ01
y x ββ=+经过点()
,x y ,其中11
11,n n
i i i i x x y y n n ====∑∑。
设三维总体X 的相关阵为:
11(01)1r r r r r r r ρ⎡⎤
⎢⎥=<≤⎢⎥⎢⎥⎣⎦
(1) 求出总体X 的标准化变量的第一主成分;r 多大时
才能使总体X 的第一主成分的贡献率达90%以上?
(2) 将上述结果推广到(3)p p >维总体情形。
收集了从事数学研究的24位数学家的年工资额Y 与他们的研究成果的质量指标1X 、工作年限2X 、以及获得资助的指标3X 的数据(data3.1.txt ),利用R 软件建立年工资额Y 关于其他变量的多元线性回归模型,结果如下:
> x<-read.table("D:/data3.1.txt",header=T) > lm.reg<-lm(y~1+x1+x2+x3,data=x) > summary(lm.reg) Call:
lm(formula = y ~ 1 + x1 + x2 + x3, data = x) Residuals:
Min 1Q Median 3Q Max -3.2724 -0.8039 0.0032 1.1557 3.2311 Coefficients:
Estimate Std. Error t value Pr(>|t|) (Intercept) 17.62493 1.99893 8.817 2.51e-08 *** x1 1.12812 0.32595 3.461 0.002468 ** x2 0.32327 0.03632 8.902 2.15e-08 *** x3 1.30343 0.29354 4.440 0.000251 *** ---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 1.731 on 20 degrees of freedom
Multiple R-squared: 0.913, Adjusted R-squared: 0.9 F-statistic: 69.98 on 3 and 20 DF, p-value: 8.802e-11
试写出:(1)残差的三均值;
(2)变量3X 的系数显著性检验的p 值;
(3)回归方程是否显著?为什么?如果显著,请写出回归方程; (4)如果给某位数学家的3个自变量的一组值010203(,,)x x x 为 (5.1,20,7.2),请给出该数学家的年工资额0Y 的点预测值。
抽取了某地52名中学生的数学(1X )、物(2X )、 化学(3X )、语文(4X )、历史(5X )和英语(6X )成 绩(data5.1.xls ),利用R 软件进行因子分析,结果如下:
> x<-read.csv("D:/data5.1.csv",header=T)
> fa<-factanal(x,2,scores="Bartlett",rotation="varimax")
> fa Call:
factanal(x = x, factors = 2, scores = "Bartlett", rotation = "varimax") Uniquenesses:
x1 x2 x3 x4 x5 x6 0.228 0.459 0.333 0.148 0.210 0.150 Loadings:
Factor1 Factor2 x1 -0.309 0.823 x2 -0.309 0.668 x3 0.811 x4 0.848 -0.363 x5 0.862 -0.216 x6 0.899 -0.206
Factor1 Factor2 SS loadings 2.471 2.001 Proportion Var 0.412 0.333 Cumulative Var 0.412 0.745
试写出:(1)因子模型*X Af ε=+中的A 及()Cov ε; (2)样本相关阵R 的前两个特征根;
(3)前两个公因子的方差贡献率及累积方差贡献率;
(4)与公因子1f 最相关的三个原变量,与公因子2f 最相关的三个原变量。