西南大学2020年春季统计学原理 【9062】课程考试大作业参考答案
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(2)计算分布的偏态系数和峰度系数。
答:(一)
(1)众数:因为这120家企业中有42家企业的利润都在400-500万元,出现的次数最多。L=400,U=500,f表示众数所在组次数=42,f-1表示众数所在组前一组的次数=30,f+1表示众数所在组后一组的次数=18,代入上限公式,得众数:
=500-[(42-18)/(42-18)+(42-30)] ×(500-400)=433.33万元
(2)对应p值=2(1-F(z)) ,查表得到F(z)在0.999 994和0.999 999之间,所以p值在0.000 006和0.000 001之间(因为表中给出了双侧检验的接受域概率,因此本题中双侧检验的p值=1-F(|z|),直接查表即得F(|z|))。p值<0.05,拒绝原假设。都说明平均加油量并非12加仑。
四、某市调查400户居民家庭收入资料如下表:
人均月收入(元)
组中值
家庭户数
月收入
100—200
200—300
300—400
400—500
500—600
150
250
350
450
550
40
120
140
80
20
6000
30000
49000
36000110Leabharlann 0合计-400
132000
试求全距,平均差,标准差,标准差系数
(1)以0.05的显著性水平,是否有证据说明平均加油量并非12加仑?
(2)计算(1)的p-值。
(3)以0.05的显著性水平来说,是否有证据说明少于20%的驾车者购买无铅汽油?
(4)计算(3)的p-值。
答:
(1)假设检验为 。采用正态分布的检验统计量 。查出 =0.05水平下的临界值为1.96。计算统计量值 。因为z=4.6875>1.96,所以拒绝原假设。
二、简述相关分析和回归分析的关系?
答:相关分析不必区分自变量(解释变量)和因变量(被解释变量),变量之间是平行关系,而回归分析要根据研究目的确定自变量和因变量,变量之间是因果关系;相关分析中两个变量都是随机的,而回归分析中,因变量是随机变量,而自变量是非随机的;回归分析可以得到变量之间关系的方向、强弱程度和具体数量变动关系,而相关分析只能确定变量之间关系的方向和程度。回归分析是在相关分析的基础之上,进一步研究现象之间的数量变化规律。
代入下限公式,得中位数:
=400+[(120/2-49)/42] ×(500-400)=426.19 万元。
(3)5个利润额组的组中值分别为:
(200+300)/2=250,(300+400)/2=350,(400+500)/2=450,(500+600)/2=550,600+100/2=650
均值=(19×250+30×350+42×450+18×550+11×650)/120=426.67万元
标准差系数=102.96/330=0.312
五、对某地区120家企业按利润额进行分组,结果如表所示。
按利润额分组(万元)
企业数(个)
向上累计
200—300
300—400
400—500
500—600
600以上
19
30
42
18
11
19
49
91
109
120
合计
120
(1)计算120家企业利润的众数、中位数和均值;
(3)假设检验为 。采用成数检验统计量 。查出 =0.05水平下的临界值为1.64和1.65之间。计算统计量值 ,因此z=-2.5<-1.65(<-1.64),所以拒绝原假设。
西南大学网络与继续教育学院课程考试试题卷
类别:网教专业:会计等2020年6月
课程名称【编号】:统计学原理【9062】 A卷
大作业满分:100 分
简答与计算(要求:前三题至少100字,后三题列出完整步骤;一~三题至少选择一题;四~六题至少选择一题。每题50分)
一、一个完整的统计调查方案应包括哪些主要内容?
答:
全距 = 600-100=500(元)
平均值= 132000/400=330(元)
平均差MD=(|150-330|×40+|250-330|×120+|350-330|×140+|450-330|×80+|550-330|×20)÷400=84
标准差σ={【(150-330)平方×40+(250-330)平方×120+(350-330)平方×140+(450-330)平方×80+(550-330)平方×20】÷400}开平方=102.96(元)
(二)
先计算120家企业利润额的标准差σ={【(250-426.67)平方×19+(350-426.67)平方×30+(450-426.67)平方×42+(550-426.67)平方×18+(650-426.67)平方×11】/120}开平方=116
分布的偏态系数SKp=
峰度系数=
六、某加油站经理希望了解驾车人士在该加油站的加油习惯。在一周内,他随机地抽取100名驾车人士调查,得到如下结果:平均加油量等于13.5加仑,样本标准差是3.2加仑,有19人购买无铅汽油。试问:
(2)中位数的位置=(n+1)/2=60.5,位于400-500万元组
Me——中位数;L——中位数所在组下限=400;U——中位数所在组上限=500;fm——为中位数所在组的次数=42;∑f——总次数=120;d——中位数所在组的组距(U-L);Sm− 1——中位数所在组以下的累计次数=49;Sm+ 1——中位数所在组以上的累计次数=29。
三、 统计数据收集过程中,可能有哪些误差?
答:统计数据收集过程中,可能存在两种误差:观测性误差和代表性误差。
观测性误差(登记性误差或调查性误差),是在调查观测的各个环节因工作粗心,或被观测者不愿很好配合而造成的所收集数据与实际情况不符的误差。观测性误差在全面调查和非全面调查中都会产生。
代表性误差是在抽样调查中,由于样本不能完全代表总体而产生的估计结果与总体真实数量特征不符的误差。代表性误差又分为系统性代表性误差 和偶然性代表性误差,系统性代表性误差是指由于抽样框不完善,抽样违反随机原则,被调查者无回答等因素引起的误差;系统性代表性误差通常难以计算和控制。偶然性代表性误差是由于抽样的随机性引起的样本结构与总体结构不完全相符,从而产生的估计结果与总体真值不一致的误差;偶然性代表性误差不可避免,但是可以计算和控制。抽样调查中的观测性误差和系统性代表性误差统称为非抽样误差,而偶然性代表性误差称为抽样误差。
答:(一)
(1)众数:因为这120家企业中有42家企业的利润都在400-500万元,出现的次数最多。L=400,U=500,f表示众数所在组次数=42,f-1表示众数所在组前一组的次数=30,f+1表示众数所在组后一组的次数=18,代入上限公式,得众数:
=500-[(42-18)/(42-18)+(42-30)] ×(500-400)=433.33万元
(2)对应p值=2(1-F(z)) ,查表得到F(z)在0.999 994和0.999 999之间,所以p值在0.000 006和0.000 001之间(因为表中给出了双侧检验的接受域概率,因此本题中双侧检验的p值=1-F(|z|),直接查表即得F(|z|))。p值<0.05,拒绝原假设。都说明平均加油量并非12加仑。
四、某市调查400户居民家庭收入资料如下表:
人均月收入(元)
组中值
家庭户数
月收入
100—200
200—300
300—400
400—500
500—600
150
250
350
450
550
40
120
140
80
20
6000
30000
49000
36000110Leabharlann 0合计-400
132000
试求全距,平均差,标准差,标准差系数
(1)以0.05的显著性水平,是否有证据说明平均加油量并非12加仑?
(2)计算(1)的p-值。
(3)以0.05的显著性水平来说,是否有证据说明少于20%的驾车者购买无铅汽油?
(4)计算(3)的p-值。
答:
(1)假设检验为 。采用正态分布的检验统计量 。查出 =0.05水平下的临界值为1.96。计算统计量值 。因为z=4.6875>1.96,所以拒绝原假设。
二、简述相关分析和回归分析的关系?
答:相关分析不必区分自变量(解释变量)和因变量(被解释变量),变量之间是平行关系,而回归分析要根据研究目的确定自变量和因变量,变量之间是因果关系;相关分析中两个变量都是随机的,而回归分析中,因变量是随机变量,而自变量是非随机的;回归分析可以得到变量之间关系的方向、强弱程度和具体数量变动关系,而相关分析只能确定变量之间关系的方向和程度。回归分析是在相关分析的基础之上,进一步研究现象之间的数量变化规律。
代入下限公式,得中位数:
=400+[(120/2-49)/42] ×(500-400)=426.19 万元。
(3)5个利润额组的组中值分别为:
(200+300)/2=250,(300+400)/2=350,(400+500)/2=450,(500+600)/2=550,600+100/2=650
均值=(19×250+30×350+42×450+18×550+11×650)/120=426.67万元
标准差系数=102.96/330=0.312
五、对某地区120家企业按利润额进行分组,结果如表所示。
按利润额分组(万元)
企业数(个)
向上累计
200—300
300—400
400—500
500—600
600以上
19
30
42
18
11
19
49
91
109
120
合计
120
(1)计算120家企业利润的众数、中位数和均值;
(3)假设检验为 。采用成数检验统计量 。查出 =0.05水平下的临界值为1.64和1.65之间。计算统计量值 ,因此z=-2.5<-1.65(<-1.64),所以拒绝原假设。
西南大学网络与继续教育学院课程考试试题卷
类别:网教专业:会计等2020年6月
课程名称【编号】:统计学原理【9062】 A卷
大作业满分:100 分
简答与计算(要求:前三题至少100字,后三题列出完整步骤;一~三题至少选择一题;四~六题至少选择一题。每题50分)
一、一个完整的统计调查方案应包括哪些主要内容?
答:
全距 = 600-100=500(元)
平均值= 132000/400=330(元)
平均差MD=(|150-330|×40+|250-330|×120+|350-330|×140+|450-330|×80+|550-330|×20)÷400=84
标准差σ={【(150-330)平方×40+(250-330)平方×120+(350-330)平方×140+(450-330)平方×80+(550-330)平方×20】÷400}开平方=102.96(元)
(二)
先计算120家企业利润额的标准差σ={【(250-426.67)平方×19+(350-426.67)平方×30+(450-426.67)平方×42+(550-426.67)平方×18+(650-426.67)平方×11】/120}开平方=116
分布的偏态系数SKp=
峰度系数=
六、某加油站经理希望了解驾车人士在该加油站的加油习惯。在一周内,他随机地抽取100名驾车人士调查,得到如下结果:平均加油量等于13.5加仑,样本标准差是3.2加仑,有19人购买无铅汽油。试问:
(2)中位数的位置=(n+1)/2=60.5,位于400-500万元组
Me——中位数;L——中位数所在组下限=400;U——中位数所在组上限=500;fm——为中位数所在组的次数=42;∑f——总次数=120;d——中位数所在组的组距(U-L);Sm− 1——中位数所在组以下的累计次数=49;Sm+ 1——中位数所在组以上的累计次数=29。
三、 统计数据收集过程中,可能有哪些误差?
答:统计数据收集过程中,可能存在两种误差:观测性误差和代表性误差。
观测性误差(登记性误差或调查性误差),是在调查观测的各个环节因工作粗心,或被观测者不愿很好配合而造成的所收集数据与实际情况不符的误差。观测性误差在全面调查和非全面调查中都会产生。
代表性误差是在抽样调查中,由于样本不能完全代表总体而产生的估计结果与总体真实数量特征不符的误差。代表性误差又分为系统性代表性误差 和偶然性代表性误差,系统性代表性误差是指由于抽样框不完善,抽样违反随机原则,被调查者无回答等因素引起的误差;系统性代表性误差通常难以计算和控制。偶然性代表性误差是由于抽样的随机性引起的样本结构与总体结构不完全相符,从而产生的估计结果与总体真值不一致的误差;偶然性代表性误差不可避免,但是可以计算和控制。抽样调查中的观测性误差和系统性代表性误差统称为非抽样误差,而偶然性代表性误差称为抽样误差。