统计分析综合实验答题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计分析综合实验考题
一.样本数据特征分析:
要求收集国家统计局2011年与2000年全国人口普查相关数据,进行二者的比较,然后写出有说明解释的数据统计分析报告,文字通顺,对统计结果的说明分析重点突出,几条要求如下:1.报告必须包含所收集的原始数据表,至少包括总人口,流动人口,城乡、性别、年龄、民族构成,教育程度,家庭户人口八大指标;
2.报告中必须有针对某些指标的条形图,饼图,直方图以及累计频率条形图,(茎叶图可选作)
3.采用适当方式分别检验二次调查得到的人口年龄比例以及教育程度这两个指标是否有显著不同,写明检验过程及结论。二.一元线性回归分析:
回归模型:自由建立,如将某地人均食品消费支出与人均收入作为因变量与解释变量,或某地家用汽车消费量与人均收入作为因变量与解释变量等均可。
统计分析报告必须写明:实际问题的背景,所采用的模型与数据来源,至少有20个原始的样本数据,回归方差分析表以及回归系数及显著性检验表(5%),回归系数的95%置信区间,散点图,分析结论,应用价值等均不可缺少。
特别提醒:按时交打印稿并且附此试题!
统计分析综合实验答题
一、样本数据特征分析
2000年全国人口普查与2011年全国人口普查相关数据分析报告
2011年第六次全国人口普查数据显示,总人口数为1339724852,比2000年的第五次人口普查的1242612226人次,总人口数增加97112626人,增长7.82%,平均年增长率为0.78%。
(二)家庭户人口
2000年人口普查家庭户人口数共有1178271219人,有家庭户340491197,平均每个家庭3.46人。2011年增长到1244608395人,平均每个家庭户的人口为3.10人,比2000年减少0.36人。
(三)流动人口
2011年人口普查数据中,居住地与户口登记地所在的乡镇街道不一致且离开户口登记地半年以上的人口为261386075人,同2000年第五次全国人口普查相比,居住地与户口登记地所在的乡镇街道不一致且离开户口登记地半年以上的人口增加116995327人,增长81.03%。
(四)城乡构成
2000年农村居民人口数为783841243人,占63.08%;城镇居民则有458770983人,占36.92%。2011年人口普查显示居住在城镇的人口为665575306人,占49.68%;居住在乡村的人口为674149546人,占50.32%。通过下面的条形图可以清楚的看到2000年—2011年十年间,农村居民减少而城镇居民增加,通过进一步计算可以得知城镇人口比重上升12.76个百分点。
城乡人口复式条形图 城乡人口堆积面积图
(五)性别构成
2000年第五次人口普查男性人口为640275969人占51.53%;女性人口为602336257人,占48.47%。2011年第六次人口普查显示男性人口为686852572人,占51.27%;女性人口为652872280人,占48.73%。通过下面的饼图可以放大百分比上些微的变化(两个年份左边较小的部分均为女性人口数),总人口性别比(以女性为100,男性对女性的比例)由2000年第五次全国人口普查的106.31下降为105.20。
根据上面给出的原始数据表,两次普查的年龄构成大致如下。2000年人口普查:0-14岁人口为284527594人,占22.90%;15-59岁人口为828106762人,占66.64%;60岁及以上人口为 129977870人,占10.46%。20011年人口普查:0-14岁人口为222459737人,占16.60%;15-59岁人口为939616410人,占70.14%;60岁及以上人口为177648705人,占13.26%。
为了进一步分析各年龄段,根据联合国卫生组织的新划分标准将年龄进一步细分,用直方图进行分析。原始数据整理如下:
两次人口普查年龄数据 单位(人)
年龄段
2000年 2011年 少儿(0~14岁) 284527594 221322621 青年(15~44岁) 632911142 668233610 中年(45~59岁)
195195620
265660198
男女人口数饼图
通过直方图的分布可以得出,两次统计结果显示了相似的正态分布。青年人口数量占有绝对较高的比例。具体看到各个年龄段的人口变化(为了方便陈述,以数值代指各年龄段),年龄段1有较明显的人口数量减少,年龄段2、3、4、5在其原有基础上缓慢增长,年龄段3取代年龄段1变为人口数第二的年龄段。由于年龄段6人口数始终较少,在处理数据过程中其特征无法被放大,2000年年龄段6的频数为0.242,2011年增长到0.496,其增长比例是最为显著的,说明随着社会经济的发展高龄老年人数量逐渐增多。
(七)民族构成
2000年普查,汉族人口为1137386112人,占91.53%;少数民族人口为105226114人,占8.47%。2011年普查,汉族人口为1225932641人,占91.51%;各少数民族人口为113792211人,占8.49%。
(八)教育程度
2000年人口普查时,具有大学(大专及以上)文化程度的人口为44020145人;具有高中(含中专)文化程度的人口为138283459人;具有初中文化程度的人口为422386607人;具有小学文化程度的人口为441613351人,文盲人口(15岁及以上不识字的人)为85069667人。
2011年,具有大学(大专及以上)文化程度的人口为119636790人;具有高中(含中专)文化程度的人口为187985979人;具有初中文化程度的人口为519656445人;具有小学文化程度的人口为358764003人,文盲人口(15岁及以上不识字的人)为54656573人。
以累计频率条形图对教育程度进行进一步分析,类似于年龄构成的数据处理方法,以500万为单位对各个文化段的人口数进行调整,得出具体的个体值,再