《数据分析与统计软件》期末试题(1)

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

A卷

20xx—20xx学年第一学期

《数据分析与统计软件》期末试卷(1)

专业班级

姓名

学号

开课系室理学院应用数学系

考试日期

题号一二三四五六总分本题满分21 18 16 17 17 11 100 本题得分

阅卷人

注意事项:

1.本试卷正文共6页。

2.反面及附页可作草稿纸。

3.答题时请在试卷正面指定位置答题,注意书写清楚,保持卷面清洁。

4. 试卷本请勿撕开,不能铅笔答题,否则作废。

一、填空题(本题满分21分,每空3分)

1、设X 为p 维总体,()(1,2,,)i X i n =L 是X 的样本,

样本均值为()1

1n

i i X X n ==∑,则()Cov X 的常用无偏

估为:_________________________________。

2、设Y 是取0,1两个值的随机变量,它受变量12,X X 的影响,则Y 与变量

12,X X 的LOGISTIC 回归模型为_______________________________。

3、设变量123(,,)T X X X 的协方差阵为4222932325⎡⎤

⎢⎥∑=-⎢⎥

⎢⎥-⎣⎦

,则它的相关阵为________________________;偏相关系数13(2)ρ⋅为________________。

4、今对5人进行测试,测得2个指标:脉搏1X ,引体向上次数2X ,数据

如下表,则两者的样本Spearman 相关系数为:__________________;两者的样本Kendall τ相关系数为:__________________ 。

5、在R 中,对一列0,1二值观测数据向量x 进行随机性检验的函数调用

格式为:____________________________。

二、(本题满分18分,分为2个小题,分别为8分和10分) 1、填写出下列经修订的R 软件输出的单因子方差分析 表中所缺的数值。

2、设(,),1,2,,i i x y i n =L 是来自一元线性回归模型012

~(0,)

Y x N ββε

εσ=++⎧⎨⎩的样本,而¶0β和µ1

β分别是0β和1β的最小二乘估计。求证:最小二乘回归方程$¶

µ01

y x ββ=+经过点()

,x y ,其中11

11,n n

i i i i x x y y n n ====∑∑。

设三维总体X 的相关阵为:

11(01)1r r r r r r r ρ⎡⎤

⎢⎥=<≤⎢⎥⎢⎥⎣⎦

(1) 求出总体X 的标准化变量的第一主成分;r 多大时

才能使总体X 的第一主成分的贡献率达90%以上?

(2) 将上述结果推广到(3)p p >维总体情形。

收集了从事数学研究的24位数学家的年工资额Y 与他们的研究成果的质量指标1X 、工作年限2X 、以及获得资助的指标3X 的数据(data3.1.txt ),利用R 软件建立年工资额Y 关于其他变量的多元线性回归模型,结果如下:

> x<-read.table("D:/data3.1.txt",header=T) > lm.reg<-lm(y~1+x1+x2+x3,data=x) > summary(lm.reg) Call:

lm(formula = y ~ 1 + x1 + x2 + x3, data = x) Residuals:

Min 1Q Median 3Q Max -3.2724 -0.8039 0.0032 1.1557 3.2311 Coefficients:

Estimate Std. Error t value Pr(>|t|) (Intercept) 17.62493 1.99893 8.817 2.51e-08 *** x1 1.12812 0.32595 3.461 0.002468 ** x2 0.32327 0.03632 8.902 2.15e-08 *** x3 1.30343 0.29354 4.440 0.000251 *** ---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 1.731 on 20 degrees of freedom

Multiple R-squared: 0.913, Adjusted R-squared: 0.9 F-statistic: 69.98 on 3 and 20 DF, p-value: 8.802e-11

试写出:(1)残差的三均值;

(2)变量3X 的系数显著性检验的p 值;

(3)回归方程是否显著?为什么?如果显著,请写出回归方程; (4)如果给某位数学家的3个自变量的一组值010203(,,)x x x 为 (5.1,20,7.2),请给出该数学家的年工资额0Y 的点预测值。

抽取了某地52名中学生的数学(1X )、物(2X )、 化学(3X )、语文(4X )、历史(5X )和英语(6X )成 绩(data5.1.xls ),利用R 软件进行因子分析,结果如下:

> x<-read.csv("D:/data5.1.csv",header=T)

> fa<-factanal(x,2,scores="Bartlett",rotation="varimax")

> fa Call:

factanal(x = x, factors = 2, scores = "Bartlett", rotation = "varimax") Uniquenesses:

x1 x2 x3 x4 x5 x6 0.228 0.459 0.333 0.148 0.210 0.150 Loadings:

Factor1 Factor2 x1 -0.309 0.823 x2 -0.309 0.668 x3 0.811 x4 0.848 -0.363 x5 0.862 -0.216 x6 0.899 -0.206

Factor1 Factor2 SS loadings 2.471 2.001 Proportion Var 0.412 0.333 Cumulative Var 0.412 0.745

试写出:(1)因子模型*X Af ε=+中的A 及()Cov ε; (2)样本相关阵R 的前两个特征根;

(3)前两个公因子的方差贡献率及累积方差贡献率;

(4)与公因子1f 最相关的三个原变量,与公因子2f 最相关的三个原变量。

相关文档
最新文档