上机1用EXCEL对原始数据进行分组汇总

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

上机用Excel对原始数据进行分组汇总

[实验目的]

掌握用EXCEL进行数据的整理

[实验内容]

编制变量数列

对原始数据进行简单与交叉(复合)分组汇总

[操作指导]

例1:对品质型原始数据进行简单分组汇总。资料见上机训练数据“性别与年龄构成工作表”

方法之一:利用countif函数。

方法之二:利用数据透视表。

例2:用对数值型型原始数据进行简单分组汇总。资料见上机训练数据“能力测试分工作表”。(编制变量数列)

方法一:利用countif函数。(等距或异距均可)

方法二:利用直方图分析工具。(一般是等距,异距也可但不宜直接作图)步骤:

第一步——打开Excel,在某一空白列中输入需要编制变量数列的所有原始数据,每一单元格输入一个变量值;

第二步——利用函数找出原始数据中的最大值(用函数max)与最小值(用函数min)。

第三步——利用公式求出极差(即最大值与最小值之差),依据数据类型、多少与分布特点确定组数与组距以及组限。

第四步——选择一空列,定组限名如“按能力分分组”,输入除最后一组以外的各组的上限值(注意,Excel默认的是上限在本组内);

第五步——单击“工具”下拉式菜单,选定“数据分析”选项,在弹出的对话框中选定“直方图”,再单击“确定”,得到如下图所示的对话框:

第六步——在对话框中“输入区域”框内键入原始数据所在单元格,绝对、相对引用均可。)

在“接收区域”框内键入组限所在单元格)

选中“标志”(当引用单元格未包括标志所在单元格时,不选)

可在“输出区域”框内键入一空列的某一单元格

可选择“累积百分率”

选择“图表输出”

单击“确定”

第七步——为了把变量数列转化为平常表达习惯,需将表中的“频率”改成次数名称“人数”,将各组上限值依次改为区间,在与最后一组相邻的下一行单元格写上合计,选定“合计”单元格右邻的单元格并在工具栏上双击“∑”符号;还可在与次数相邻的列计算“比重”[计算时注意公式中单元格的相对引用(分子)与绝对引用(分母)]

第八步——默认直方图形式为柱形图,可以调整为标准的直方图形式。具体方法是:在图中“柱”上右击弹出菜单,选“数据系列格式”命令,再选“选项”,将其对话框中的“间距宽度”调整为“0”即可。输出结果如下:

特别提醒:由于每一组对数据值小于或等于上限的数据进行计数,所以在确定组限时,如果上组限不包含在本组内,一定要选择小于上组限的数。

方法三:利用频数分布函数。(一般是等距,异距也可但不宜直接作图)

步骤:

第一步——打开Excel,在某一空白列中输入需要编制变量数列的所有原始数据,每一单元格输入一个变量值;

第二步——利用函数找出原始数据中的最大值(用函数max)与最小值(用函数min)。

第三步——利用公式求出极差(即最大值与最小值之差),依据数据类型、多少与分布特点确定组数与组距以及组限。

第四步——选择一空列,定组限名同前。注意,Excel默认的是上限在本组内);

第五步——方式一:选定一列多行单元格区域(注意行数与组数对应),单击“插入”下拉式菜单,选定“函数”选项,在弹出的对话框中选定“统计”类别下的frequency(如下图1),再单击“确定”,得到对话框。在date_array旁边的方框内输入原始数据所在单元格;在bins_array旁边的方框内输入组限所在单元格(也可以直接输入各组组限,注意要用大括号括住且各组限之间用分号隔开)(如下图2),然后同时按Ctrl/shift/enter键,则得到各组频数。方式二:也可以选定一列多行单元格区域(注意行数与组数对应)后,直接输入“=frequency(原始数据所在单元格,组限所在单元格)”, 然后同时按Ctrl/shift/enter键,则得到各组频数。

图1

图2

方法之四:利用数据透视表。详见课堂上机操作讲解。(宜等距)

例3:对原始数据进行交叉分组汇总。

方法之一:利用数据透视表。详见课堂上机操作讲解。

方法之二:利用数组求和函数sum。

A不定义名称

如例子中,在性别为“男”,年龄为<25岁的单元格中输入:

=SUM(($B$3:$B$52=$I4)*($C$3:$C$52<25)),然后同时按ctrl、shift、enter键,则得到25岁以下男性人数。

同理,依次在25-35岁、35-45岁、45-55岁及>=55岁的单元格中以下相应公式:

=SUM(($B$3:$B$52=$I4)*($C$3:$C$52>=25)*($C$2:$C$52<35))

=SUM(($B$3:$B$52=$I4)*($C$3:$C$52>=35)*($C$2:$C$52<45))

=SUM(($B$3:$B$52=$I4)*($C$3:$C$52>=45)*($C$2:$C$52<55))

=SUM(($B$3:$B$52=$I4)*($C$3:$C$52>=55))

而各年龄段女性人数,只要选定上述单元格用填充柄即可。

B先定义名称

定义名称的便利之处是不用输入上述公式中复杂的单元格符号。详见课堂上机操作讲解。

例4:用Excel对调查问卷原始数据进行简单分组与交叉分组汇总

一、原始数据录入的注意事项

问卷中问题的输入:按列输入。对于只能从备选项中择一的问题,一个问题占用一个单元格;其它情况(如可任选多项或可选限定的项数并排序)最好是一个备选项占用一个单元格即一个备选项作为一个变量,也可以只占用一个单元格。

问卷中对问题回答的输入:按行输入即一份问卷占用一行。对于非数值型数据,最好用数字序号代替。

二、简单分组汇总

方法:利用countif函数。

操作说明:

假设某问卷问题占有从B列(问卷中第一个问题)至AA列共26列,第4-203行为200份问卷对各问题回答的录入,且录入多为数字序号;对每个问题的回答序号有1-7不等即有些备选项只有2项,最多的备选项是7项。

可以在A205单元格内输入:“选1”,表示对每个问题选第一个备选项的人数。然后利用填充柄拖至A211,会依次出现选2、选3至选7。在A212单元格中输入“总计”

在B205单元格内输入:“=countif($B$4:$B$203,1)”,然后回车,即可得到对第一个问题选第一个备选项的总人数;选定B205单元格,利用填充柄拖到B211单元格,依次选B206、B207至B211单元格,将相应单元格公式中的“1”改为“2”、“3”至“7”,这样则得到对第一个问题选择各个备选项的总人数。当然,如果本题只有两个备选项,则从B207单元格开始显示为“0”;

选定B212单元格,对B205至B211单元格求和。可用工具栏上的求和按钮或sum函数。

可以选定A214单元格并输入“各选项所占比重”,将A205:A212单元格复制到A215:A222单元格;

在B215单元格内输入:“= B205/B$212*100”,然后回车,即可得到对第一个问题选第一个备选项的人数占回答总人数的比重;选定B215单元格,利用填充柄拖到B222单元格,即得到该问题选每一个选项的人数占全部回答人数的比重;

选定B205:B222,利用填充柄拖至问卷的最后一列即AA222。对于所有只能从备选项中择一的问题,既得到了选每一项的人数,也得到了其所占比重。对于可以选择多项的情况则要对比重另行计算。

三、交叉分组汇总(介绍最方便的两种)

方法一:利用数据透视表。(具体操作参照前面项目)

方法二:利用数组求和函数。(具体操作参照前面项目)

四、多项选择问题汇总方法简介

方法一:

原始数据输入办法——备选答案的每一个选项作为一个变量输入,每一份问卷选择项用同一符号(数字或字母)记入相应变量列;

使用countif函数汇总每一选项总频数,构造公式对汇总后的这一行所有选项计算相对频数即比率。

方法二:

原始数据输入办法——将每一份问卷选择的选项的代号(字母或数字,最好是字母)输入一个单元格

选定某一列若干空白单元格分别输入各备选项的代号,如选定P501-506单元格依次输入abcdef;

相关文档
最新文档