精选-华中科技大学数理统计第二次作业

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

学院：机械工程学院
1、收集到26家保险公司人员构成的数据，现希望对目前保险公司从业人员受高等教育的程度和年轻化的程度进行推断，具体来说就是推断具有高等教育水平的员工平均比例是否低于80%，35岁以下的年轻人的平均比例是否为0.5。

（数据见练习2数据.xls —练习2.1）解：希望通过分析这26家保险公司人员构成的数据，研究目前保险公司从业人员受高等教育的程度和年轻化的程度。

（1）推断高等教育水平的员工平均比例是否低于80%
设原假设：保险公司具有高等教育水平的员工比例平均值不低于0.8，即H 0: μ=μ0≥0.8 备择假设：H 1
：μ<0.8 n=26，属于小样本，由于σ2未知，选用t 检验，检验统计量
T =，取α=0.05 计算的x =0.729273 ，s 2
=0.039274
(1)
t n ∂≤-- , 1.784t =
=- 查t 检验分布表知临界值t α(26-1)=-1.7081
显然，t=-1.784<- t α(25) =-1.7081,因此在α=0.05 的水平上拒绝原假设，选择备择假设结论：保险公司具有高等教育水平的员工比例平均值低于0.8
（2）推断35 岁以下的年轻人的平均比例是否为0.5
设原假设：年轻人比例的平均值与0.5 无显著性差异，即H 0: μ=μ0
=0.5
备择假设H 1
： μ≠0.5. n=26，属于小样本，由于σ2未知，选用t 检验，检验统计量
X T =，取α=0.05 计算的x =0.713875 ，s 2
=0.022705
拒绝域：
/2(1)x t n ∂≥- , 7.097t =
= 查表知α=0.05 的双尾t 检验临界值t α/2（25）=2.0595。

故超出[-2.0595,2.0595]的值均在
拒
绝域内
由于t=7.097不在拒绝域[-2.0595,2.0595]范围内，因此在α=0.05 的水平上拒绝原假设，选择备择假设
结论：保险公司35 岁以下年轻人比例平均值不等于0.5
2、练习1中保险公司的类别分为：1. 全国性公司；2. 区域性公司；3. 外资和中外合资公司。

试分析公司类别1与3的人员构成中，具有高等教育水平的员工比例的均值是否存在显著性的差异。

（数据见练习2数据.xls
—练习2.1）
解：设原假设H 0：μ1-μ2=0，即公司类别1 与3 具有高等教育水平的员工比例均值无显著性差异
备择假设H 1：μ1-μ2≠0,α=0.05.
利用双尾t 检验，选择统计量为~(2)11W X Y
T t m n S m n
-=
+-+ 由数据可得X =0.61203，Y =0.81067，S X 2=0.068303, S Y 2=0.014699
2212(1)(1)(81)*0.068303(161)*0.0146990.0317528162
W m s n s S m n -+--+-===+-+- 14.5611110.03175816
W X Y t S m n -===-++ 查表知t α/2（8+16-2）=2.074，所以接收域为[-2.074, 2.074]
由两个样本（1 类和3 类公司受高等教育人数比例）均值和标准差求得检验统计量t=-14.56 超出接收域，故拒绝原假设，接收备择假设。

结论：具有高等教育水平的员工比例的均值存在显著性的差异
3、欲研究不同收入群体对某种特定商品是否有相同的购买习惯，市场研究人员调查了4个不同收入组的消费者共527人，购买习惯分别为：经常购买，不购买，有时购买。

要求：（1）提出假设；（2）计算x 2
值；（3）以99%的显著性水平进行检验。

（数据见练习2数据.xls —练习2.3）
解：（1）设原假设H 0：不同收入人群对该商品有相同购买习惯，即μ1=μ2=μ3=μ4
备择假设H 1：不同收入人群对该商品购买习惯不同，即μ1、μ2、μ3、μ4不全相等
（2）
根据公式算出对应的期望值f e
，结果如下表所示：
使用EXCLE 进行运算得x2为17.55437331自由度为（4-1）*（3-1）=6
（3）自由度为=（R-1）(r-1)=（4-1）*（3-1）=6
α=0.01 时,可以查表得：X2（0.01）（6）=16.8
拒绝域为;(16.8,+∞),由于X2> X2α，故拒绝原假设H0，即认为不同收入群体对某种特定商品，没有相同的购买习惯
结论：不同收入人群对该商品购买习惯不同
4、由我国某年沿海和非沿海省市自治区的人均国内生产总值（GDP）的抽样数据，采用各种
非参数检验方法进行检验，判断它们的分布是否存在显著性差异，并进行评价。

（数据见练习2数据.xls—练习2.4）
解：（1）曼-惠特尼U 检验
设原假设H0：该年我国沿海和非沿海省市自治区的人均国内生产总值（GDP）的抽样
数据的分布不存在显著性差异
备择假设H1：该年我国沿海和非沿海省市自治区的人均国内生产总值（GDP）的抽样
数据的分布存在显著性差异
沿海样本数量m=12，非沿海样本数量n=18，故Wilcoxon W=W Y=180
U=W-0.5n(n+1)=9
大样本，Z=-4.19<-3，拒绝原假设，选择备择假设
结论：该年我国沿海和非沿海省市自治区的人均国内生产总值（GDP）的抽样数据的分
布存在显著性差异。

（2）K-S检验
设原假设H0：该年我国沿海和非沿海省市自治区的人均国内生产总值（GDP）的抽样
数据的分布不存在显著性差异
备择假设H1：该年我国沿海和非沿海省市自治区的人均国内生产总值（GDP）的抽样
数据的分布存在显著性差异
将这两组样本混合并按升序排序，分别计算两组样本秩的累计频数和累计频率，计算累
计频率之差，得到秩的差值序列并得到D= 0.861
查表得p> 0.99 > (1-α) = 0.95
结论：该年我国沿海和非沿海省市自治区的人均国内生产总值（GDP）的抽样数据的分
布存在显著性差异。

（3）游程检验
设原假设H0：该年我国沿海和非沿海省市自治区的人均国内生产总值（GDP）的抽样
数据的分布不存在显著性差异
备择假设H1：该年我国沿海和非沿海省市自治区的人均国内生产总值（GDP）的抽样
数据的分布存在显著性差异
由上表可知游程r = 6
μr= 2mnm+n = 14.4
σr2= 2mn(2mn−m−n)(m+n)2(m+n−1) = 6.654
Z = r- μrσr = -3.256
p = 0.00056 < α = 0.05，拒绝H0
结论：该年我国沿海和非沿海省市自治区的人均国内生产总值（GDP）的抽样数据的分
布存在显著性差异。

5、某企业在制定某商品的广告策略时，收集了该商品在不同地区采用不同广告形式促销后的销售额数据，希望对广告形式和地区是否对商品销售额产生影响进行分析，
a)以商品销售额为因变量，广告形式和地区为自变量，通过单因素方差分析方法分别
对广告形式、地区对销售额的影响进行分析；
b)试进一步分析，究竟哪种广告形式的作用较明显，哪种不明显，以及销售额和地区
之间的关系等。

c)试分析广告形式、地区以及两者的交互作用是否对商品销售额产生影响。

（数据见练习2数据.xls—练习2.5，其中广告形式为：1. 报纸； 2. 广播； 3. 宣传品； 4. 体验）
解：a）设4种不同的广告形式后的销售额均值分别为μ1、μ2、μ3、μ4，则原假设H0及备择假
设H1分别为：
H0：4种不同的广告形式对销售额无显著性影响，即μ1=μ2=μ3=μ4。

H1：4种不同的广告形式对销售额有显著性影响，即μ1、μ2、μ3、μ4不全相等。

利用Excel数据分析中单因素方差分析可得，当α = 0.05时，F = 13.48311 >F0.95(3，140) =
2.669256，所以拒绝H0，即有证据表明4种不同的广告形式对销售额有显著性影响。

设18个地区的销售额均值为μi(i = 1, 2, 3,···18)，则原假设H0及备择假设H1分别为：H0：地区对销售额无显著性影响，即μ1=μ2=μ3=μ4=···=μ15=μ16=μ17=μ18。

H1：地区对销售额有显著性影响，即μ1、μ2、μ3、μ4···μ16、μ17、μ18不全相等。

利用Excel数据分析中单因素方差分析可得，当α = 0.05时，F = 4.062486> F0.95(17，126) = 1.704427，所以拒绝H0，即有证据表明地区对销售额有显著性影响。

b）利用最小显著差异方法LSD进行分析，原假设H0及备择假设H1分别为：
H0：μi = μj（第i个总体的均值等于第j个总体的均值）
H1：μi≠μj（第i个总体的均值不等于第j个总体的均值）
=n1=n2=n3=n4=36，MSE=145.023，α = 0.05，
由公式LSD tα
得LSD = 5.61。

根据前面表中的计算结果x̅1= 73.22，x̅2= 70.89，x̅3= 56.56，x̅4= 66.61，计算统计检
验量。

| x̅1 - x̅2| = 73.22 –70.89 = 2.33 < 5.61
所以广告形式1和广告形式2对销售额无显著性影响。

| x̅1 - x̅3| = 73.22 –56.56 = 16.66 > 5.61
所以广告形式1和广告形式3对销售额有显著性影响。

| x̅1 - x̅4| = 73.22 –66.61 = 6.61 > 5.61
所以广告形式1和广告形式4对销售额有显著性影响。

| x̅2 - x̅3| = 70.89 –56.56= 14.33 > 5.61
所以广告形式2和广告形式3对销售额有显著性影响。

| x̅2 - x̅4| = 70.89 –66.61 = 4.28 < 5.61
所以广告形式2和广告形式4对销售额无显著性影响。

| x̅3 - x̅4| = 66.61 –56.56 = 10.05 >5.61
所以广告形式3和广告形式4对销售额有显著性影响。

广告形式与销售额的关系强度R2
= 0.224159
地区与销售额的关系强度R2= 0.354052
结论：广告形式和地区相比，广告形式与销售额的关系强度较低，地区与销售额的关系
强度较高。

c）对因素A提出的假设为
H0：4种不同的广告形式对销售额无显著性影响，即μ1=μ2=μ3=μ4。

H1：4种不同的广告形式对销售额有显著性影响，即μ1、μ2、μ3、μ4不全相等。

对因素B提出的假设为
H0：地区对销售额无显著性影响，即μ1=μ2=μ3=μ4=···=μ15=μ16=μ17=μ18。

H1：地区对销售额有显著性影响，即μ1、μ2、μ3、μ4···μ16、μ17、μ18不全相等。

对因素A×B提出的假设为
H0：地区和广告形式的交互作用对销售额无显著性影响
H1：地区和广告形式的交互作用对销售额有显著性影响
由EXCLE数据分析可知，广告形式及地区所对应的p均小于α= 0.05，所以拒绝H0，即广
告形式、地区对销售额有显著性影响；而广告形式与地区的交互作用所对应的p=0.296 > α= 0.05，所以不拒绝H0，即没有充足证据表明广告形式与地区的交互作用对销售额有显著性影响。

（注：专业文档是经验性极强的领域，无法思考和涵盖全面，素材和资料部分来自网络，供参考。

可复制、编制，期待你的好评与关注）。