非参数估计 练习题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
非参数估计练习题
1. 对于以下数据集,使用非参数估计方法估计它的中位数和75%分位数。
9, 12, 10, 15, 14, 13, 11, 8, 7, 12
- 中位数的估计:
将数据按升序排列:7, 8, 9, 10, 11, 12, 12, 13, 14, 15
中位数位置为(n+1)/2 = (10+1)/2 = 5.5,因此需要计算第5个和第6个观测值的平均值。
中位数估计值= (11 + 12)/2 = 11.5
- 75%分位数的估计:
将数据按升序排列:7, 8, 9, 10, 11, 12, 12, 13, 14, 15
根据公式计算位置为(3/4)n = (3/4) x 10 = 7.5 的观测值在第7位和第8位之间,因此需要计算这两个观测值的平均值。
75%分位数的估计值= (13 + 14)/2 = 13.5
因此,该数据集的中位数估计值为11.5,75%分位数的估计值为13.5。
2. 对于以下数据集,使用核密度估计方法估计其概率密度函数。
6.5,
7.1,
8.3, 8.4, 6.2, 7.8, 8.5, 7.2, 6.5, 7.9
首先,需要选择一个核函数和带宽大小。
在本例中,我们选择高斯核函数和带宽大小为1。
高斯核函数的公式为:
K(x) = 1/√(2π) exp(-x^2/2)
其中,x为观测值,K(x)为对应的核函数值。
然后,使用以下公式计算每个观测值对概率密度函数的贡献:
f(x) = 1/nh Σ(K((x-xi)/h))
其中,xi为观测值,h为带宽大小,n为样本数量。
将数据排序,并将每个观测值带入上述公式中:
f(6.2) = 0.127
f(6.5) = 0.155
f(6.5) = 0.155
f(7.1) = 0.183
f(7.2) = 0.191
f(7.8) = 0.204
f(7.9) = 0.187
f(8.3) = 0.139
f(8.4) = 0.127
f(8.5) = 0.115
最终得到估计的概率密度函数为:
f(x) = 1/nh Σ(K((x-xi)/h))
= 1/(10 x 1) Σ(K((x-xi)/1))
= (1/√(2π)) Σ(exp(-((x-xi)^2)/2))
因此,该数据集的概率密度函数为高斯分布。