统计学上机实验指导
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据的收集、整理与显示
统计数据的收集、整理与显示是统计分析的基础和初步,其中涉及到抽样方法的选择,数据的筛选、排序,数据的分类和分组以及频数分布的制作等。本章主要介绍如何使用Excel 进行相应处理,其中第一节统计数据的收集,介绍“抽样”工具的使用;第二节数据的预处理,介绍“筛选”、“排位和百分比排位”工具的使用;第三节品质数据的整理与显示,介绍如何使用“直方图”工具制作品质型数据的频数分布;第四节数值型数据的整理与显示,介绍如何使用“直方图”工具制作数值型数据的频数分布以及多变量数据的雷达图制作。
第一节统计数据的收集
收集统计数据是统计研究的第一步。统计数据最初都来源于直接的调查或实验,其中抽样调查是实际中应用最广泛的一种调查方式,它是从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种非全面调查方式。在Excel的“数据分析”工具中有一个“抽样”工具,可以较简单迅速地完成一些常规的抽样任务。
Excel菜单栏“工具”选项中“数据分析”工具是统计分析时经常需要用到的,在初次使用时会发现在Excel相应位置中找不到这一选项,其原因在于在安装Office办公集成软件或Microsoft Excel时,一般使用的是“自动”或“典型”安装。为此,需要使用者自己加载这一功能。
如图1.1和图1.2所示,在“工具”菜单中单击“加载宏”选项,从其弹出的对话框列表中,单击“分析工具库”前面的标志复选框,然后点击“确定”。此时,Microsoft Excel 会弹出对话框询问是否要安装,点击“是”选项后,系统会提示使用者放入光盘或指定资源位置。按提示操作后,点击“确定”即可。
图1.1 在“工具”菜单中单击“加载宏”选项
在加载成功“数据分析”选项后,下面说明如何使用数据分析工具中“抽样”工具抽取样本。首先需要编制总体单位编号表。总体单位编号,可按随机原则也可按照与调查目的有关或无关的标志排队编号。例如:某年级有100名学生,要调查四级英语考试情况,按学生的姓名笔画排队编号,是无关标志编号;按学生的英语成绩排队编号,属有关标志编号。输入编号的方法很简单,这里不在详述。把100名学生的编号输入Excel表格中,如表1-1所示。
图1.2 在“加载宏”列表中选择“分析工具库”
表1-1 总体单位编号表
在Excel表中输入总体编号后,可按以下步骤操作完成抽样工作
第一步:在“工具”菜单中单击“数据分析”选项,从其对话框“分析工具”列表中选择“抽样”,回车打开“抽样”对话框。(见图1.3~图 1.5)
图1.3 在“工具”菜单中单击“数据分析”选项
图1.4从“分析工具”列表中选择“抽样”
图1.5“抽样”工具对话框
第二步:在“抽样”对话框中进行相应设置。本例在“输入区域(I)”(总体单位编号所在区域)输入A1:J10(在Excel执行过程中自动更换为绝对引用形式,即在字符和数字前加$号,使用者没有必要考虑这两种形式的不同)。Excel将从A列开始抽样,然后按顺序抽取B列至J列。如果“输入区域(I)”的第一行或第一列有标题,则需单击“标志(L)”前面的复选框(使其出现对钩,表示已被选定)。
第三步:在“抽样方法”选择区域具体选择抽样模式:
1、“周期(E)”模式,即等距抽样或机械抽样。采用此模式,需要将总体单位数除以所需样本数,求得取样的周期间隔。本例中如果在100名学生中抽取10名进行调查,100/10=10,可在“间隔框”中输入10(如果计算得到的周期间隔不是整数,取整即可)。
2、“随机(R)”模式适用于纯随机抽样、分层抽样、整群抽样和多阶段抽样。如采用纯随机抽样,只需在“样本数”框中输入所需的样本单位数。本例,可在“样本数”框中输入10。对于分层抽样、整群抽样和多阶段抽样的具体含义,可参考有关教科书,这里不再详述,其具体做法与纯随机抽样的区别在于第二步“输入区域(I)”上的不同。如采用分层抽样,事先要计划好分几层,每层要抽取多少样本,每层的总体单位编号在何区域。在每一层中,分别采用纯随机抽样,步骤同上。
第四步:指定“输出区域(O)”。“输出区域(O)”是指Excel结果输出的起始位置,输入单元格的行列号即可,本例输入“e6”。当然,也可以选择“新工作表组(P)”或“新工作薄(W)”作为放置抽样结果的位置。
完成以上操作后,回车确认,即在指定的位置给出抽样结果。
第二节数据的预处理
数据的预处理是数据整理的先前步骤,是在对数据分类或分组之前所做的必要处理,包括数据的审核、筛选、排序等。本节主要介绍Excel中筛选和排序功能的使用。
一、数据筛选
数据筛选包括两方面内容:一是将某些不符合要求的数据或有明显错误的数据予以剔除;二是将符合某种特定条件的数据筛选出来,对不符合特定条件的数据予以剔除。
下面举例说明Excel进行数据筛选的过程。
表1-28名学生的考试成绩数据单位:分
表1-2是八名学生四门课程的考试成绩数据,使用Excel“筛选”命令分别找出统计成绩等于75分的学生;英语成绩前三名的学生;数学成绩大于80小于90的学生;统计成绩和数学成绩大于80分,或者英语成绩大于90分的学生。
Excel提供了两种筛选命令:“自动筛选”(适用于简单的条件)和“高级筛选”(适用于复杂的条件)。接下先来介绍“自动筛选”的使用。
首先,将表格中的数据区域选定或者只需确保活动单元格处于数据区域既可(如表1-2所示,活动单元格为B3)。选择“数据”菜单,并选择“自动筛选”命令。如图1.6所示。
图1.6从“数据”菜单中选择“筛选自动”
这时会在第一行(列标题)出现下拉箭头,用鼠标点击箭头会出现如下结果,如图 1.7所示。
图1.7“自动筛选”命令
图1.8统计成绩75分的学生
图1.9英语成绩前三名的学生
图1.10数学成绩大于80小于90的学生