统计学作业参考答案
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
根据样本数据计算得: , 。
网络公司员工平均每周加班时间的90%的置信区间为:
,即(10.36,16.76)。
7.22
参考例题。
7.24
参考书上例题。
7.26
解:统计量:
置信区间:
=0.058, =0.006
n1=n2=21
=0.95, = =2.4645,
=
= = =0.4058
=(4.05,24.6)
= =
= =2 -1,查标准正态分布表得 =0.8159
因此, =0.6318
6.4
根据样本方差的抽样分布知识可知,样本统计量:
此处,n=10, ,所以统计量
根据卡方分布的可知:
又因为:
因此:
则:
查概率表: =3.325, =19.919,则
=0.369, =1.88
7.6
(1)已知:总体服从正态分布, , , , , 。
第五章
某公司职员每周的加班津贴服从均值为50元、标准差为10元的正态分布,那么全公司中有多少比例的职员每周的加班津贴会超过70元,又有多少比例的职员每周的加班津贴在40元到60元之间呢?
解:设=50,=10,X~N(50,102)
6.2
总体方差知道的情况下,均值的抽样分布服从 的正态分布,由正态分布,标准化得到标准正态分布:z= ~ ,因此,样本均值不超过总体均值的概率P为:
19
31212.3
593033.5
300~400
350
30
5878.3
176348.7
400~500
450
42
544.3
22860.1
500~600
550
18
15210.3
273785.2
600以上
650
11
49876.3
548639.2
合计
—
120
102721.5
1614666.7
。
4.7
(1)两位调查人员所得到的平均身高应该差不多相同,因为均值的大小基本上不受样本大小的影响。
(Baidu Nhomakorabea)
(4)平均数小于中位数和众数,数据呈现左偏分布。
4.3
(2) 。
。
(3)由于两种排队方式的平均数不同,所以用离散系数进行比较。
第一种排队方式: ; 。由于 ,表明第一种排队方式的离散程度大于第二种排队方式。
(4)选方法二,因为第二种排队方式的平均等待时间较短,且离散程度小于第一种排队方式。
4.6
(2)男生: (磅), (磅);
女生: (磅), (磅);
(3)假定体重为对称分布,根据经验法则,在平均数加减1个标准差范围内的数据个数大约为68%。因此,男生中大约有68%的人体重在55kg到65kg之间。
(4)假定体重为对称分布,根据经验法则,在平均数加减2个标准差范围内的数据个数大约为95%。因此,女生中大约有95%的人体重在40kg到60kg之间。
由于总体服从正态分布,所以总体均值 的95%的置信区间为:
,即(8646.97,9153.03)。
(2)已知:总体不服从正态分布, , , , , 。
虽然总体不服从正态分布,但由于 为大样本,所以总体均值 的95%的置信区间为:
,即(8734.35,9065.65)。
(3)已知:总体不服从正态分布, 未知, , , , , 。
(2)两位调查人员所得到的身高的标准差应该差不多相同,因为标准差的大小基本上不受样本大小的影响。
(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。
4.8
(1)要比较男女学生体重的离散程度应该采用离散系数。女生体重的离散系数为 ,男生体重的离散系数为 ,所以女生的体重差异大。
虽然总体不服从正态分布,但由于 为大样本,所以总体均值 的90%的置信区间为:
,即(8760.97,9039.03)。
(4)已知:总体不服从正态分布, 未知, , , , , 。
虽然总体不服从正态分布,但由于 为大样本,所以总体均值 的99%的置信区间为:
,即(8681.95,9118.05)。
7.11
第八章 假设检验
第1题
第2题
根据题意,该样本是配对样本。
旧饮料
5
4
7
3
5
8
5
6
新饮料
6
6
7
4
3
9
7
6
配对差
1
2
0
1
-2
1
2
0
_
配对差均值d=(1+2+0+1-2+1+2+0)/8=0.625
配对差标准差sd= = =1.3
H0:d=0
H1:d≠0
α=0.05
临界值: tα(n-1)=t0.05(7)=1.895
(1)平均数计算过程见下表:
按利润额分组
组中值
企业数
200~300
250
19
4750
300~400
350
30
10500
400~500
450
42
18900
500~600
550
18
9900
600以上
650
11
7150
合计
—
120
51200
。
标准差计算过程见下表:
按利润额分组
组中值
企业数
200~300
250
(1)已知:总体服从正态分布,但 未知, 为大样本, , 。
根据样本数据计算得: , 。
该种食品平均重量的95%的置信区间为:
,即(100.87,101.77)。
(2)根据样本数据可知,样本合格率为 。该种食品合格率的95%的置信区间为:
,即(0.82,0.98)。
7.13
已知:总体服从正态分布,但 未知, 为小样本, , 。
(4)r= = =0.7746,由于是负相关,因此r=-0.7746
(5)从F检验看线性关系显著。
4.10
通过标准分数来判断,各天的标准分数如下表:
日期
周一
周二
周三
周四
周五
周六
周日
标准分数Z
3
-0.6
-0.2
0.4
-1.8
-2.2
0
周一和周六两天失去了控制。
4.11
(1)应该采用离散系数,因为它消除了不同组数据水平高低的影响。
(2)成年组身高的离散系数: ;
幼儿组身高的离散系数: ;
由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。
1.3
(1)总体:IT从业者。
(2)数值型变量
(3)分类变量
(4)截面数据
思考题:
PPT作业:
(1)没有众数
(2)中位数位置:5.5中位数为1020
(3)QL位置2.5,QL=765 QU位置7.5,QU=1375
(4)均值1146
4.1
(1)众数: 。
中位数: , 。
平均数: 。
(2) , 。
, 。
统计量:t= = =1.36
-t0.05(7)<t<t0.05(7),落在接受域内,接受原假设,即消费者对两种饮料的评分不存在显著差异。
第3题
第4题
11.11
解:(1)SSR的自由度为k=1;SSE的自由度为n-k-1=18;
因此:F= = =27
(2) = =4.41
(3)拒绝原假设,线性关系显著。
网络公司员工平均每周加班时间的90%的置信区间为:
,即(10.36,16.76)。
7.22
参考例题。
7.24
参考书上例题。
7.26
解:统计量:
置信区间:
=0.058, =0.006
n1=n2=21
=0.95, = =2.4645,
=
= = =0.4058
=(4.05,24.6)
= =
= =2 -1,查标准正态分布表得 =0.8159
因此, =0.6318
6.4
根据样本方差的抽样分布知识可知,样本统计量:
此处,n=10, ,所以统计量
根据卡方分布的可知:
又因为:
因此:
则:
查概率表: =3.325, =19.919,则
=0.369, =1.88
7.6
(1)已知:总体服从正态分布, , , , , 。
第五章
某公司职员每周的加班津贴服从均值为50元、标准差为10元的正态分布,那么全公司中有多少比例的职员每周的加班津贴会超过70元,又有多少比例的职员每周的加班津贴在40元到60元之间呢?
解:设=50,=10,X~N(50,102)
6.2
总体方差知道的情况下,均值的抽样分布服从 的正态分布,由正态分布,标准化得到标准正态分布:z= ~ ,因此,样本均值不超过总体均值的概率P为:
19
31212.3
593033.5
300~400
350
30
5878.3
176348.7
400~500
450
42
544.3
22860.1
500~600
550
18
15210.3
273785.2
600以上
650
11
49876.3
548639.2
合计
—
120
102721.5
1614666.7
。
4.7
(1)两位调查人员所得到的平均身高应该差不多相同,因为均值的大小基本上不受样本大小的影响。
(Baidu Nhomakorabea)
(4)平均数小于中位数和众数,数据呈现左偏分布。
4.3
(2) 。
。
(3)由于两种排队方式的平均数不同,所以用离散系数进行比较。
第一种排队方式: ; 。由于 ,表明第一种排队方式的离散程度大于第二种排队方式。
(4)选方法二,因为第二种排队方式的平均等待时间较短,且离散程度小于第一种排队方式。
4.6
(2)男生: (磅), (磅);
女生: (磅), (磅);
(3)假定体重为对称分布,根据经验法则,在平均数加减1个标准差范围内的数据个数大约为68%。因此,男生中大约有68%的人体重在55kg到65kg之间。
(4)假定体重为对称分布,根据经验法则,在平均数加减2个标准差范围内的数据个数大约为95%。因此,女生中大约有95%的人体重在40kg到60kg之间。
由于总体服从正态分布,所以总体均值 的95%的置信区间为:
,即(8646.97,9153.03)。
(2)已知:总体不服从正态分布, , , , , 。
虽然总体不服从正态分布,但由于 为大样本,所以总体均值 的95%的置信区间为:
,即(8734.35,9065.65)。
(3)已知:总体不服从正态分布, 未知, , , , , 。
(2)两位调查人员所得到的身高的标准差应该差不多相同,因为标准差的大小基本上不受样本大小的影响。
(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。
4.8
(1)要比较男女学生体重的离散程度应该采用离散系数。女生体重的离散系数为 ,男生体重的离散系数为 ,所以女生的体重差异大。
虽然总体不服从正态分布,但由于 为大样本,所以总体均值 的90%的置信区间为:
,即(8760.97,9039.03)。
(4)已知:总体不服从正态分布, 未知, , , , , 。
虽然总体不服从正态分布,但由于 为大样本,所以总体均值 的99%的置信区间为:
,即(8681.95,9118.05)。
7.11
第八章 假设检验
第1题
第2题
根据题意,该样本是配对样本。
旧饮料
5
4
7
3
5
8
5
6
新饮料
6
6
7
4
3
9
7
6
配对差
1
2
0
1
-2
1
2
0
_
配对差均值d=(1+2+0+1-2+1+2+0)/8=0.625
配对差标准差sd= = =1.3
H0:d=0
H1:d≠0
α=0.05
临界值: tα(n-1)=t0.05(7)=1.895
(1)平均数计算过程见下表:
按利润额分组
组中值
企业数
200~300
250
19
4750
300~400
350
30
10500
400~500
450
42
18900
500~600
550
18
9900
600以上
650
11
7150
合计
—
120
51200
。
标准差计算过程见下表:
按利润额分组
组中值
企业数
200~300
250
(1)已知:总体服从正态分布,但 未知, 为大样本, , 。
根据样本数据计算得: , 。
该种食品平均重量的95%的置信区间为:
,即(100.87,101.77)。
(2)根据样本数据可知,样本合格率为 。该种食品合格率的95%的置信区间为:
,即(0.82,0.98)。
7.13
已知:总体服从正态分布,但 未知, 为小样本, , 。
(4)r= = =0.7746,由于是负相关,因此r=-0.7746
(5)从F检验看线性关系显著。
4.10
通过标准分数来判断,各天的标准分数如下表:
日期
周一
周二
周三
周四
周五
周六
周日
标准分数Z
3
-0.6
-0.2
0.4
-1.8
-2.2
0
周一和周六两天失去了控制。
4.11
(1)应该采用离散系数,因为它消除了不同组数据水平高低的影响。
(2)成年组身高的离散系数: ;
幼儿组身高的离散系数: ;
由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。
1.3
(1)总体:IT从业者。
(2)数值型变量
(3)分类变量
(4)截面数据
思考题:
PPT作业:
(1)没有众数
(2)中位数位置:5.5中位数为1020
(3)QL位置2.5,QL=765 QU位置7.5,QU=1375
(4)均值1146
4.1
(1)众数: 。
中位数: , 。
平均数: 。
(2) , 。
, 。
统计量:t= = =1.36
-t0.05(7)<t<t0.05(7),落在接受域内,接受原假设,即消费者对两种饮料的评分不存在显著差异。
第3题
第4题
11.11
解:(1)SSR的自由度为k=1;SSE的自由度为n-k-1=18;
因此:F= = =27
(2) = =4.41
(3)拒绝原假设,线性关系显著。