数理统计第一次作业
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.收集到26家保险公司人员构成的数据,现希望对目前保险公司从业人员受高等教育的程度和年轻化的程度进行推断,具体来说就是推断具有高等教育水平的员工平均比例是否低于80%,35岁以下的年轻人的平均比例是否为0.5。(数据见练习2数据.xls—练习
2.1)
解:
提出假设
H0:具有高等教育水平的员工平均比例大于等于80%,即μ≥0.8
H1:具有高等教育水平的员工比例小于80%,即μ<0.8
对高等教育人数所占比例和35岁以下年轻人所占比例进行加权的单样本T 检验,加权量为总人数 结果如下
单个样本统计量
N
均值
标准差
均值的标准误
高等教育人数所占比例 480243
.35279847910329
.250418704198497
.000361356808829
由上表可以看出,μ的均值是0.35279847910329,标准差为
0.250418704198497,双侧检验P 值为0.00<0.05,因此拒绝原假设,且从差分的95%的置信区间不包含0也可以看出,应拒绝原假设。所以足够的理由说明具有高等教育的员工的比例低于80%。
同样的,对35岁以下的年轻人的平均比例是否为0.5进行加权的单样本T 检验,加权量为总人数
提出假设
H0:35岁以下的年轻人的平均比例为0.5,即μ=0.5
H1:35岁以下的年轻人的平均比例不等于0.5,即μ≠0.5
利用SPSS 对35岁以下的年轻人的平均比例进行单样本T 检验,结果如下
由上表可以看出,μ的均值为0.54024733312094,样本标准差为
0.071212767572642,双侧检验的P值为0.00<0.05,且从差分的95%的置信区间不包含0也可看出,拒绝原假设H0。所以,有足够的证据表明35岁以下的年轻人的平均比例不等于0.5.
2. 练习1中保险公司的类别分为:1. 全国性公司;2. 区域性公司;
3. 外资和中外合资公司。试分析公司类别1与3的人员构成中,具有高等教育水平的员工比例的均值是否存在显著性的差异。(数据见练习2数据.xls—练习2.1)
解
提出假设
H0:公司类别1与3的人员构成中,具有高等教育水平的员工比例的均值相等,即μ1=μ2
H1:公司类别1与3的人员构成中,具有高等教育水平的员工比例的均值不相等,即μ1≠μ2
利用SPSS对公司类别1与3的人员构成中,具有高等教育水平的员工比例的均值进行加权的独立样本T检验,加权量为总人数,结果如下
组统计量
公司类别N 均值标准差均值的标准误
高等教育人数所占比例 1 476143 .349804575516
18 .249145201038
893
.000361063696
750
3 3039 .755182625863
77 .0898********
792
.001628968358
469
从组统计量表中可以看出,在全国性公司(公司类别1)中,高等教育人数所占比例的均值为0.34980457551618,样本标准差为0.249145201038893.在外资和中外合资公司(公司类别3)中,高等教育人数所占比例的均值为
0.75518262586377,样本标准差为0.001628968358469.可以看出两类不同的公司员工受高等教育人数所占比例的均值存在较大差异。
从独立样本检验表中可以看出F检验的P值为26710.867>0.05,认为总体的方差相等,接下来的t检验使用方差相等的检验结果。由于均值的t检验的P值为
0.000<0.05,且差分的95% 置信区间不包含0,因此拒绝H0,即有做够的证据表明全国性保险公司和外资与中外合资保险公司中,员工受高等教育比例的均值存在显著性差异。
3. 欲研究不同收入群体对某种特定商品是否有相同的购买习惯,市场研究人员调查了4个不同收入组的消费者共527人,购买习惯分别为:经常购买,不购买,有时购买。
要求:(1)提出假设;(2)计算x2值;(3)以99%的显著性水平进行检验。(数据见练习2数据.xls—练习2.3)
解
(1)提出假设
H0:不同收入人群对某种商品具有相同的购买习惯
H1:不同收入人群对某种商品具有不同的购买习惯
(2)
求得χ2=17.62584
(3)
α=0.01,自由度df=(3-1)*(4-1)=6
2=16.8
χ2=17.62584>χ0.01
因此拒绝H0,即有足够的证据表明,不同收入人群对某种商品具有不同的购买习惯。
4. 由我国某年沿海和非沿海省市自治区的人均国内生产总值(GDP)的抽样数据,采用各种非参数检验方法进行检验,判断它们的分布是否存在显著性差异,并进行评价。(数据见练习2数据.xls—练习2.4)
解:采用最小显著差数法对数据进行检验
2代表非沿海地区。
ANOVA
GDP
平方和df 均方 F 显著性
组间 2.213E8 1 2.213E8 21.012 .000
组内 2.949E8 28 10532396.122
总数 5.162E8 29
从描述表中可以看出,组1(沿海地区)的人均GDP的均值是9552.58,而组2(非沿海地区)的人均GDP的均值是4008.50,存在较大差距。
由ANOVA表可以看出,组间P值小于0.05,说明在5%的显著性水平下,沿海地区和非沿海地区的GDP有显著性的差异。这反映了我国区域发展不平衡的现状,东部和中西部差异巨大。