数学分析统计学大作业
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数学分析统计学大作业
3、利用居民储蓄调查数据,从中随机选取85%的样本,进行频数分析,实现以下分析目
标:
1. 分析储户一次存款金额的分布,基本描述统计量,并对城镇储户和农村储户进行比较;
2.分析不同年龄的储户对什么合算的认同是否一致。
3.检验城镇储户的一次存款金额的均值为5000元, 是否可信?
先从全部数据中随机选取85%的样本
操作:数据-选择个案-随机个案样本85%
(1)分析储户一次存款金额的分布,基本描述统计量,并对城镇储户和农村储户进行比较思路:(1)数据分组,将存(取)款金额重新分成五组,五组区间分布为,少于500元,500-2000元,2000-3500元,3500-5000元,5000元以上。分组后进行频数分析并绘制带正态曲线的直方图。(2)利用SPSS的频数分析计算所有样本的存(取)款金额的四分位数;然后,按照户口类型对数据进行拆分(Split file)并重新计算分位数,分别得到城镇户口和农村户口的存(取)款金额的四分位数。
操作:转换-重新编码为不同变量-a5存款金额分组-添加新值和旧值-分析-描述统计-概率-存款金额分组-图标直方图
操作:数据-拆分文件-户口-比较组-频率-统计量-四分位数
操作:分析-描述统计-描述-存取款金额-选项
结论:(1)由存款金额分组频数表我们可以看出,一次存款在500以下的人数最多,最少的是2001~3500范围内的。(2)对城镇户口和农村户口的存取款金额的四分位数进行比较,可以发现城镇户口的四分位数都高于农村户口的四分位数。由此可以知道,城镇户口的存取款金额高于农村户口的存取款金额。城镇户口的存取款金额的分布层次较多,而农村户口的存取款金额几乎分布在2000以下。
(2)分析不同年龄的储户对什么合算的认同是否一致
思路:利用交叉列联表行列变量间关系的分析不同年龄的储户对什么合算的认同是否一致。操作:分析-描述统计-交叉表-行年龄-列什么合算
结论:在20岁以下以及50岁以上的人们认为买东西合算和存钱合算的人一样多,其余年龄层都认为把钱用来买东西更合算,尤其是20~35岁的人们。
(3)检验城镇储户的一次存款金额的均值为5000元,是否可信?
思路:以“户口”将数据进行拆分,然后用总体均值的检验以95%的置信度来检验“城镇居民一次存款金额的均值为5000元”是否可信。
操作:数据-拆分文件-户口-分析-比较均值-单样本t检验-存取款金额-检验值5000
结论:由上面的表格可以知道,因为sig为0.931大于0.025,拒绝H0,所以“城镇居民一次存款金额的均值为5000元”不可信。
5、某电器公司想知道某产品销售量与销售方式及销售地点是否有关,根据近2个月的情况
得到下表的数据,以0.05的显著性水平进行检验:
(1)给出SPSS数据集的格式(列举前4个样本即可);
(2)销售方式对销售量的影响;
(3)销售方式和销售地点以及它们的交互作用对销售量的影响。
(1)给出SPSS数据集的格式(列举前4个样本即可);
操作:分别定义分组变量A、X、B,在变量视图与数据视图中输入表格数据
(2)销售方式对销售量的影响;
思路:对地区和销售量进行方差分析,如果F >F1- (k-1, n-k),则地区对销售量有显著影响。
操作:分析-比较均值-单因素ANOV A项-因变量销量-因子方式
结论:F=13.244 F 1-α (k-1, n-k)=1/F 0.05(36,3 )=0.12F> F 1-α (k-1, n-k) ,所以销售方式对销量有显著影响。
(3)销售方式和销售地点以及它们的交互作用对销售量的影响。
操作:分析-一般线性模型-单变量-因变量销量-固定因子方式、地区
F A =70.190 F B =11.623 F AB =10.358
1(1,(1))A F F m mr t α->--=1/F 0.05(20,3)=0.12
α->1F F B (1,(1))r mr t --=1/F 0.05(20,4)=0.17
1((1)(1),(1))A B F F m r mr t α⨯->---=1/F 0.05(20,12)=0.39
结论:销售方式、销售地点以及它们的交互作用都对销售量有显著影响。
9、【例】一家百货公司在10个地区设有经销分公司。公司认为商品销售额与该地区的人口
数和年人均收入有关,并希望建立它们之间的数量关系式,以预测销售额。有关数据如下表。试确定销售额对人口数和年人均收入的线性回归方程,并分析回归方程的拟合程度,并对各回归系数进行显著性检验(=0.05)。
试确定销售额对人口数和年人均收入的线性回归方程,并分析回归方程的拟合程度,并对各回归系数进行显著性检验
思路:利用线性回归确定销售额对人口数和年人均收入的线性回归方程,并进行分析
操作:输入数据-分析-回归-线性-因变量销售额-自变量人口数、人年均收入
结论:线性回归方程为y=1.341x1+0.023x2-38.825调整后的拟合优度=0.919,接近1,拟合程度较高P值=0.000<0.005,该回归模型具有统计意义。