精选-华中科技大学数理统计第二次作业
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
学院:机械工程学院
1、收集到26家保险公司人员构成的数据,现希望对目前保险公司从业人员受高等教育的程度和年轻化的程度进行推断,具体来说就是推断具有高等教育水平的员工平均比例是否低于80%,35岁以下的年轻人的平均比例是否为0.5。(数据见 练习2数据.xls —练习2.1) 解:希望通过分析这26家保险公司人员构成的数据,研究目前保险公司从业人员受高等教育的程度和年轻化的程度。
(1)推断高等教育水平的员工平均比例是否低于80%
设原假设:保险公司具有高等教育水平的员工比例平均值不低于0.8,即H 0: μ=μ0≥0.8 备择假设:H 1
:μ<0.8 n=26,属于小样本,由于σ2未知,选用t 检验,检验统计量
T =,取α=0.05 计算的x =0.729273 ,s 2
=0.039274
(1)
t n ∂≤-- , 1.784t =
=- 查t 检验分布表知临界值t α(26-1)=-1.7081
显然,t=-1.784<- t α(25) =-1.7081,因此在α=0.05 的水平上拒绝原假设,选择备择假设 结论:保险公司具有高等教育水平的员工比例平均值低于0.8
(2)推断35 岁以下的年轻人的平均比例是否为0.5
设原假设:年轻人比例的平均值与0.5 无显著性差异,即H 0: μ=μ0
=0.5
备择假设H 1
: μ≠0.5. n=26,属于小样本,由于σ2未知,选用t 检验,检验统计量
X T =,取α=0.05 计算的x =0.713875 ,s 2
=0.022705
拒绝域:
/2(1)x t n ∂≥- , 7.097t =
= 查表知α=0.05 的双尾t 检验临界值t α/2(25)=2.0595。故超出[-2.0595,2.0595]的值均在
拒
绝域内
由于t=7.097不在拒绝域[-2.0595,2.0595]范围内,因此在α=0.05 的水平上拒绝原假设,选择备择假设
结论:保险公司35 岁以下年轻人比例平均值不等于0.5
2、练习1中保险公司的类别分为:1. 全国性公司;2. 区域性公司;3. 外资和中外合资公司。试分析公司类别1与3的人员构成中,具有高等教育水平的员工比例的均值是否存在显著性的差异。(数据见 练习2数据.xls
—练习2.1)
解:设原假设H 0:μ1-μ2=0,即公司类别1 与3 具有高等教育水平的员工比例均值无显著 性差异
备择假设H 1:μ1-μ2≠0,α=0.05.
利用双尾t 检验,选择统计量为~(2)11W X Y
T t m n S m n
-=
+-+ 由数据可得X =0.61203,Y =0.81067,S X 2=0.068303, S Y 2=0.014699
2212(1)(1)(81)*0.068303(161)*0.0146990.0317528162
W m s n s S m n -+--+-===+-+- 14.5611110.03175816
W X Y t S m n -===-++ 查表知t α/2(8+16-2)=2.074,所以接收域为[-2.074, 2.074]
由两个样本(1 类和3 类公司受高等教育人数比例)均值和标准差求得检验统计量t=-14.56 超出接收域,故拒绝原假设,接收备择假设。
结论:具有高等教育水平的员工比例的均值存在显著性的差异
3、欲研究不同收入群体对某种特定商品是否有相同的购买习惯,市场研究人员调查了4个不同收入组的消费者共527人,购买习惯分别为:经常购买,不购买,有时购买。要求:(1)提出假设;(2)计算x 2
值;(3)以99%的显著性水平进行检验。(数据见 练习2数据.xls —练习2.3)
解:(1)设原假设H 0:不同收入人群对该商品有相同购买习惯,即μ1=μ2=μ3=μ4
备择假设H 1:不同收入人群对该商品购买习惯不同,即μ1、μ2、μ3、μ4不全相等
(2)
根据公式算出对应的期望值f e
,结果如下表所示:
使用EXCLE 进行运算得x2为17.55437331自由度为(4-1)*(3-1)=6
(3)自由度为=(R-1)(r-1)=(4-1)*(3-1)=6
α=0.01 时,可以查表得:X2(0.01)(6)=16.8
拒绝域为;(16.8,+∞),由于X2> X2α,故拒绝原假设H0,即认为不同收入群体对某种特定商品,没有相同的购买习惯
结论:不同收入人群对该商品购买习惯不同
4、由我国某年沿海和非沿海省市自治区的人均国内生产总值(GDP)的抽样数据,采用各种
非参数检验方法进行检验,判断它们的分布是否存在显著性差异,并进行评价。(数据见练习2数据.xls—练习2.4)
解:(1)曼-惠特尼U 检验
设原假设H0:该年我国沿海和非沿海省市自治区的人均国内生产总值(GDP)的抽样
数据的分布不存在显著性差异
备择假设H1:该年我国沿海和非沿海省市自治区的人均国内生产总值(GDP)的抽样
数据的分布存在显著性差异
沿海样本数量m=12,非沿海样本数量n=18,故Wilcoxon W=W Y=180
U=W-0.5n(n+1)=9
大样本,Z=-4.19<-3,拒绝原假设,选择备择假设
结论:该年我国沿海和非沿海省市自治区的人均国内生产总值(GDP)的抽样数据的分
布存在显著性差异。
(2)K-S检验
设原假设H0:该年我国沿海和非沿海省市自治区的人均国内生产总值(GDP)的抽样
数据的分布不存在显著性差异
备择假设H1:该年我国沿海和非沿海省市自治区的人均国内生产总值(GDP)的抽样
数据的分布存在显著性差异
将这两组样本混合并按升序排序,分别计算两组样本秩的累计频数和累计频率,计算累
计频率之差,得到秩的差值序列并得到D= 0.861
查表得p> 0.99 > (1-α) = 0.95
结论:该年我国沿海和非沿海省市自治区的人均国内生产总值(GDP)的抽样数据的分
布存在显著性差异。
(3)游程检验
设原假设H0:该年我国沿海和非沿海省市自治区的人均国内生产总值(GDP)的抽样
数据的分布不存在显著性差异
备择假设H1:该年我国沿海和非沿海省市自治区的人均国内生产总值(GDP)的抽样
数据的分布存在显著性差异
由上表可知游程r = 6
μr= 2mnm+n = 14.4
σr2= 2mn(2mn−m−n)(m+n)2(m+n−1) = 6.654
Z = r- μrσr = -3.256
p = 0.00056 < α = 0.05,拒绝H0
结论:该年我国沿海和非沿海省市自治区的人均国内生产总值(GDP)的抽样数据的分
布存在显著性差异。