华中科技大学数理统计第二次作业
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
华中科技大学数理统计第二次作业
学院:机械工程学院
1、收集到26家保险公司人员构成的数据,现希望对目前保险公司从业人员受高等教育的程度和年轻化的程度进行推断,具体来说就是推断具有高等教育水平的员工平均比例是否低于80% 35岁以下的年轻人的平均比例是否为0.5。(数据见练习2数据.xls —练习2.1)
解:希望通过分析这26家保险公司人员构成的数据,研究目前保险公司从业人员受高等教育的程度和年轻化的程度。
(1)推断高等教育水平的员工平均比例是否低于80%
设原假设:保险公司具有高等教育水平的员工比例平均值不低于0.8,即H0:卩=卩0.8
备择假设:H’:卩<0.8
n=26,属于小样本,由于b 2未知,选用t检验,检验统计量T B,取a =0.05
S/Jn ‘
计算的X=0.729273,£=0.039274
拒绝域: x 0
S/ .n t (n 1) t
.
729273_0.8厉1
’0.19817669
1.784
查t 检验分布表知临界值t 却)=-1.7081 显然,t=-1.784<- t a
25)=-1.7081,因此在a =0.05
的水平上拒绝原假设,选择备择假设
结论:保险公司具有高等教育水平的员工比例平 均值低于0.8
(2)推断35岁以下的年轻人的平均比例是否 为
0.5
设原假设:年轻人比例的平均值与0.5无显著性 差异,即H 。
:卩=卩.
=0.5
备择假设H 1
:卩疋0.5.
n=26,属于小样本,由于a 2
未知,选用t 检验, 检验
统计量T 篙,取a =0.05
计算的 X =0.713875,s 2
=0.022705 拒绝域:丄卡
1
t /2(n 1)
,
SM/n
'
查表知a =0.05的双尾t 检验临界值ta. (25)
=2.0595。故超出[-2.0595,2.0595]的值均在拒
绝域内
由于t=7.097不在拒绝域[-2.0595,2.0595]范围 内,因此在a =0.05的水平上拒绝原假设,选择
0.713875 0.5
、、0.022705
.26 1
7.097
备择假设
结论:保险公司35岁以下年轻人比例平均值不 等于0.5
2、练习1中保险公司的类别分为:1.全国性公 司;2.区域性公司;3.外资和中外合资公司。 试分析公司
类别1与3的人员构成中,具有高等 教育水平的员工比例的均值是否存在显著性的 差异。(数据见 练习2数据.xls —练习2.1 ) 解:设原假设H 。:卩1-卩
2
=0,即公司类别1与3具 有高等教育水平的员工比例
均值无显著 性差异
备择假设H 1:卩1-卩2工0,a =0.05. 利用双尾t 检验,选择统计量为T X Y
~ t (m n 2) 1 1 m n
由数据可得 X =0.61203,
Y
=0.81067,
2 2
S X =0.068303, S 丫 =0.014699
c (m 1)q 2 (n 1)S 22
(8 1)*0.068303 (16 1)*0.014699
S
w —
m n 2
丄 X Y 0.61203 0.81067 …厂 t , 14.56 /1 1 <11 瓦 一 .’ O .。3175
.m n
查表知t (8+16-2) =2.074,所以接收域为[-
2.074, 2.074]
X S
W -
■ 0.03175
8 16 2
1 8 16
由两个样本(1类和3类公司受高等教育人数比例)均值和标准差求得检验统计量t=-14.56 超出接收域,故拒绝原假设,接收备择假设。结论:具有高等教育水平的员工比例的均值存在显著性的差异
3、欲研究不同收入群体对某种特定商品是否有相同的购买习惯,市场研究人员调查了4个不同收入组的消费者共527人,购买习惯分别为:经常购买,不购买,有时购买。要求:(1)提出假设;(2)计算x2值;(3)以99%勺显著性水平进行检验。(数据见练习2数据.xls —练习2.3 )解:(1)设原假设H。:不同收入人群对该商品有相同购买习惯,即U =卩卩3=卩 4 备择假设R:不同收入人群对该商品购买习惯2=
不同,即口2、匕3、卜不全相等
(2)
根据公式算出对应的期望值 f e ,结果如下表所示:
使用EXCLE进行运算得X2为仃.55437331自由度为(4-1)*(3-1)=6
(3)自由度为=(R-1)(r-1)= (4-1)*(3-1)=6
a =0.01 时,可以查表得:X2(0.01)(6)=16.8 拒绝域为;(16.8,+〜由于X2〉乂“,故拒绝原假设H), 即认为不同收入群体对某种特定商品,没有相同
的购买习惯
结论:不同收入人群对该商品购买习惯不同
4、由我国某年沿海和非沿海省市自治区的人均国内生
产总值(GDP的抽样数据,采用各种非参数检验
方法进行检验,判断它们的分布是否存在显著性
差异,并进行评价。(数据见
练习2数据.xls —练习2.4 )
解:(1)曼-惠特尼U检验
设原假设H。:该年我国沿海和非沿海省市自治区的人均国内生产总值(GDP)的抽样
数据的分布不存在显著性差异
备择假设H i:该年我国沿海和非沿海省市自治区