非参数统计——期末试卷
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
每小题20分
1. 下面是DMBA 公司为了研究某一种癌症所做的试验。Group 1和2分别代表试验的控制组和对照组。下面是所得的试验老鼠的生存数据,*代表数据被右删失。请回答下面问题:
Group 1: 164 188 190 192 206 209 213 216 220 230 234 246
265 304 216* 244*
Group 2: 156 163 198 205 232 233 239 240 261 280 296 323
204* 344*
1)请给出非参数的Kaplan-Meier 估计的公式,并计算在时间点t=156,164这两点的具体估计值,若假设在t=164处被删失,计算此处的估计值。
2)如果协变量分别取为1和0,请用Cox 模型模拟上述数据,给出计算协变量的系数的相关公式;
3)给出Kaplan-Meier 估计的Matlab 程序。
2. 下面是16个学生的体能测试数据: P81例3.14
82 53 70 73 103 71 69 80 54 38 87 91 62 75 65 77。
1) 请用顺序统计量方法构造置信度为95%的中位数的置信区间;
2) 编写上述计算的Matlab 程序
3. 下面是申请进入法学院学习的学生的LSAT 测试成绩和GPA 成绩。
LSAT: 576 635 558 578 666 580 555 661 651 605 653 575 545 572 594
GPA: 3.39 3.30 2.81 3.03 3.44 3.07 3.00 3.43 3.36 3.13 3.12 2.74
2.76 2.88
3.96
每个数据点用(,),i i i X Y Z 其中i Y 表示LSAT 成绩,i Z 表示GPA 成绩
1) 计算i Y 和i Z 的Pearson 相关系数 (只写出公式); (5分)
2) 使用Boostrap 方法估计相关系数的标准误差(只写出算法步骤);(5分)
3) 编写相应的Matlab 程序。(10分)
4. 假设数据12(,,)n X X X 是来自真实密度为()f x 的简单随机字样,
1) 请给出该密度函数的直方图密度估计;
2) 求直方图密度估计的期望和方差;
3) 给出在平方损失下的最优窗宽公式,并证明此结论
5. 已知 随机变量i Y =()i i m x ξ+,设计变量i x 来自均匀分布[0,1]U ,i ξ是服从均值和方
差分别为0和2的正态分布,请回答下列问题(每问各5分)
1) 假设函数()m x 完全未知,请用局部回归给出它的一个估计(取p=1,只写出公式);
2) 写出最优窗宽选择公式;
3) 请用Matlab 实现上述计算(编写程序)[选Epanechikov 核,假设2()sin()m x x x =+]
4) 并作图比较()m x 和它的估计(并做出散点图);