第二章 统计图表
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章 统计图表
• 第一节 数据的初步整理 • 在对数据进行统计分类以后,得到的各种数量 结果称为统计指标,把统计指标和被说明的事物 之间的关系用表格的形式表示就成为统计表 (tabulation)。统计表具有简明、清晰、准确的特 点,表中的数据易于比较分析。统计图(graph或 chart)是依据数字资料,应用点、线、画、面、体、 色等描绘制成,简明而又有规律,并且能显示数 量的图形,它是统计数据资料的可视化显示方式。 图形比数字更为具体形象,能形象化地呈现事实 或现象的全貌,给人以简明扼要、清晰易懂的印 象,便于学习和记忆。
统计表的结构和组成要素可以用简 单统计表显示如下:
四、统计图
• 统计图一般采用直角坐标系,通常横坐标 (abscissa)或横轴(horizontalaxis)表示事物的组别 或自变量X,称为分类轴(category axis);纵坐标 (ordinate)或纵轴(vertical axis)表示事物出现的次 数或因变量Y,称为数值轴(scale axis)。除直角 坐标外,如圆形图还有角度坐标等。统计图一般 由下面几个部分组成: • 图号及图题 图号是图的序号。图题或标题是统 计图的名称。图题与图号之间也空一个汉字。与 统计表格不同的是,统计图形的标题常置于图的 正下方。图题的字体要与整个图形的大小相称, 一般是图中使用的最大号的文字。书写顺序一般 与图形标目一致,自左至右书写。
•
在制定统计表和统计图时,首先要对收集的数据 资料进行初步整理。整理的基本方式有排序和统 计分组两种。 • 一、数据排序 • 数据排序(sort或order),就是按照某种标准, 对收集到的杂乱无章的数据按照一定顺序标准进 行排列。数据排序是整理数据最简单的方法。 • 将一组数据按照数值大小、高低、长短、多少, 依升序(ascending order)或降序(descending order)排列后,就可显示出数据的分布情况。
统计图的结构和组成要素如图2—2 所示:
第二节 次数分布表
• 次数分布可区分为简单次数分布、分组次 数分布、相对次数分布、累积次数分布等。 次数分布表和次数分布图就是各种次数分 布的列表形式和图示形式。 • 一、简单次数分布表 • 简单次数分布表(simple frequency table) 就是依据每一个分数值在一列数据中出现 的次数或总计数资料编制成的统计表。
• 图目 写在图形基线上的各种不同类别、名称,或 时间、空间的统计数量值,即横坐标上所用的各 种单位名称。也叫刻度线标签。 • 图尺 在统计图的横坐标及纵坐标上都要用一定 的距离表示各种单位,这些单位称为图尺(ruler或 scale)。图尺分点(tick)要清楚,整个图尺大小要 包括所有的数据值,如果数据值大小相差悬殊, 图尺可用断尺法或回尺法,减少图幅。 • 图形 是图的主要部分,图形线条要清晰,一般 除图形线外,避免书写文字。要表示不同的结果, 用不同的图形线以示区别。 • 图例 用来表示并标明各种图形的含义。图例 (legend)的位置可选图中或图外适当的地方,注 意保证整个统计图的和谐美观和均衡。 • 图注 凡是图形中需要借助文字或数字加以补充 说明的,均称为图注。图注部分的文字要少,字 号要小。
[例2—2]下面是100名学生在某项测验中的成 绩分数,试将它制成一个次数分布表。
76.0 88.0 89.0 75.0 79.5 66.0 71.5 77.5 73.5 94.0 77.5 81.0 78.0 84.0 80.5 83.0 83.0 75.0 76.0 79.0 82.0 76.5 78.0 90.0 73.0 87.0 91.0 79.0 88.5 80.0 90.5 67.0 80.0 80.0 93.0 82.5 96.0 79.0 85.0 75.5 81.0 83.0 78.5 86.0 83.0 79.5 75.5 80.5 89.5 83.5 85.5 84.0 76.5 84.5 72.0 80.0 89.0 74.5 78.5 82.0 71.0 84.0 75.0 68.5 68.0 82.0 87.5 77.0 76.0 65.0 80.5 92.5 77.0 62.0 79.0 72.0 79.5 86.0 81.5 71.0 86.0 81.5 71.0 87.0 78.0 81.0 86.5 83.5 69.0 74.0 70.0 82.5 72.5 73.5 74.0 98.0 73.0 74.5 80.0 70.5
• 2.数量类别。这是以数据的取值大小为分类标志, 把数据按数值大小以分组或不分组的形式排出一 个顺序来。
• 三、统计表 • 统计表的结构一般包括几个组成要素,它们的 名称和编制要求如下: • 表号 表的序号位于表的左上方,一般以出现的 先后顺序排列。 • 名称 又称标题,是一个表格的名称,应写在表 的上方。标题用语要简练扼要,准确得体,一望 即知该表的内容。
• 3.列出分组区间 • 分组区间即一个组的起点值和终点值之间的距离, 又叫组限。起点值称组下限,终点值称组上限,组 限有表述组限和精确组限两种。例如,一组组距为 10的分组数据,它们的表述组限为10~19,20~29, 30~39,40~49等,实际上它们的精确组限(或称 实际组限)分别为9.5~19.499,19.5~ 29.499,29.5~39.499,39.5~49.499等。 这种做法是为了简便也易于计算。在写分组区间时 要注意这样几点:在列出的分组区间内,最高组区 间应包含最大的数据,最低组区间应包含最小的数 据。最高组或最低组的下限最好是组距i的整数倍。 各分组区间一般在纵坐标上按顺序排列,数值大的 分组区间排在上面,数值小的分组区间排在下面。 在呈现表格时,各分组区间使用表述组限,并且为 了书写方便,通常只用整数写下限值,然后在右侧 画一横线。
• 4.登记次数 • 依次将数据登记到各个相应的组别内,一般用画线记 数(丗)或写“正”字的方法。为确保登记准确,第一次 登记后需再核实。 • 5.计算次数 • 根据登记的结果计算各组的次数,计算各组次数的总 和即总次数。并核对各组次数总和与数据的总个数是否 相等。 • 然后,取消画线登记次数一栏,重新制表。新表包括 的栏目有:第一列为分组区间,第二列为各分组区间的 组中值。组中值是每组精确下限加上组距的二分之一, 或精确下限与精确上限之和的一半。第三列为次数(f)。 这样整理的统计表就是次数分布表,见表2—3。表2-3 中第四列和第五列为相对次数,分别用频数比率(f/N) 和百分次数表示,这两列有时可不用列出。
• 2.分类标志要明确,要能包括所有的数据 • 对数据进行分组时,所依据的特性称为分组或 分类的标志。 • (三)分组的标志 • 分类标志有各种各样。这些分类标志按形式大 致可分为性质类别与数量类别两种。 • 1.性质类别。主要是根据事物的属性不同将 被观测的事物加以划分,反映事物在组别、种类 上的不同,不说明事物之间的数量差异。 • 性质类别可根据事物的性质及研究的需要分成 不同的层次,每个层次又可分为不同数量的细目。
• K=1.87(N─1) 2/5(N为数据个数,K取近似整数) • 用这个公式计算出的组数,只是一个近似数。因为 究竟能分多少组,与分组时最低组的下限值和组距i 有关,因为i=全距/K。有关研究指出,经验和理论 都证明,如果任一组观测数值被分为10~15组,全 部信息就都被保留下来了。一般说来,分组数目或 组距小有变化时,对次数分布表作用的显示和计算 的准确性,不产生很大影响。因此对组数与组距并 不要求严格界定。 • 那么,应该如何掌握分组的标准呢?一般说,分 组数目多,则组距小,计算精确,但它要求总的数 据量大,否则会出现有的组距内无次数分布的现象, 那将使整个数据的分布规律显示不明显,也就不能 发挥次数分布表的作用了。如果分组少,组距就大, 计算简单,但引进计算误差较大。因此,要做到既 不增加搜集数据的工作量,又能使分组后的计算精 确到最大限度,使用上述公式分组是一个较好的方 法。
•
标目 即分类的项目。标目一般在表的上面一行 (tablespanner)或左侧一列(stub column)。如果分 类的标志只有一个,写在表的上行或左列都可以。 如果分类的标志有两个,且二者没有隶属关系, 则左列与上行各一个。如果两个分类标志有隶属 关系,则要放在一个方向(或上面或左侧)分两行 分述。标目确立了数据组织的逻辑,并确定了栏 目下数据栏的性质。 • 数字 数字是统计表的语言,又称统计指标。数 字应以个数位(或小数点)对准上下对齐,缺数字 的项要划“一”。表中的数字一般不带单位、% (百分号)等,单位和%一般归在标目中。表中的 数字构成了表体。 • 表注 写于表的下面,是对统计表或者表内的某 些内容进行补充说明和解释。数据来源、附记等 都可作为表注的内容,文字可长可短。
表2—1 80名员工对部门主管尽职程 度调查结果
• 员工对主管尽职情况的评定 • ①非常不尽职 • ②不尽职 • ③不置可否 • ④尽职 • ⑤非常尽职 • 总计 人数 9 30 10 25 6 80
二、分组次数分布表
• 当数据量很大时,应该把所有的数据先划分为 若干分组区间,然后将数据按其数值大小划归到 相应的组别内,分别统计各个组别中包括的数据 个数,再用列表形式呈现出来,就构成了分组次 数分布表(grouped frequency table)。 • (一)编制分组次数分布表的步骤 • 1.求全距 • 全距(range)指最大数与最小数两个数据值之间 的差距。从被分组的数据中找出最大数与最小数, 二者相减所得差数就是全距。
• 2.决定组距与组数 • 组距(interval)是指任意一组的起点和终点之间的距离, 用符号i表示。决定组距的大小,需要以全距为参考。全 距大,则组距可大一些;全距小,则组距可小一些。组 距经常取2、3、5、10、20等数值,这样便于分组,便 于计算分组区间和组中值。如果先确定了组数,就可以 用全距除以组数后,取整数表示组距。 • 组数(分组数目)的多少要根据数据的多少来定。如果 数据个数在100以上,习惯上一般分10~20组,经常取 12~16组。数据个数较少时,一般分为7~9组。如果 数据的总体分布为正态,可用下面的经验公式计算组数 (K),这样可使分组满足渐近最优关系。
• •
• •பைடு நூலகம்•
• •
二、统计分组 所谓统计分组(grouping),就是根据被研究对象 的特征,将所得数据划分到各个组别中去。 (一)统计分组前的准备 将数据进行分组前,先要对观测数据做进一步 的核对和校验。 如果要删除数据,也应遵循三个标准差准则, 即该数据是否落在平均数加减三个标准差之外。 对于不能解释其产生原因的异常数据,都应遵循 这个准则取舍。 (二)统计分组应注意的问题 1.分组要以被研究对象的本质特性为基础
• 第四步,登记与计算次数。登记次数时要 特别注意处于分组区间分界点(breakpoint) 上的几个值。如:62.5,65.5,68.5,71.5, 74.5,77.5,80.5,83.5,86.5,89.5, 92.5,95.5,都应登记到上一组。表2—2 是登记结果。登记完毕后应再核实一次, 确保无误后,计算次数。表中∑f是指所有 各组的次数和。
• 这一组学生成绩分数的分布范围在62~98之间,测验 分数属于连续性随机变量,编制分组次数分布表的方法 步骤如下: • 第一步,找出最大值与最小值分别为98.0、62.0,全 距为98-62=36。 • 第二步,确定组数与组距。 • 第三步,列分组区间。因为这组数据最小值为62,组 距定为3,因此,最低组的下限取为60,既可将最小值 62包含在最低组内,其值又是3的整数倍,这样比较好。 各组区间可写为:60~,63~,66~,69~,72~, 75~,78~,81~,84~,87~,90~,93~,96~, 最高组96~99,也可将最高分98包括进去。为书写方 便,这里各分组区间用整数表示。在对数据进行分组时, 按各组的精确组限归类,如:59.5~62.499,62.5~ 65.499,以下类推。
• 第一节 数据的初步整理 • 在对数据进行统计分类以后,得到的各种数量 结果称为统计指标,把统计指标和被说明的事物 之间的关系用表格的形式表示就成为统计表 (tabulation)。统计表具有简明、清晰、准确的特 点,表中的数据易于比较分析。统计图(graph或 chart)是依据数字资料,应用点、线、画、面、体、 色等描绘制成,简明而又有规律,并且能显示数 量的图形,它是统计数据资料的可视化显示方式。 图形比数字更为具体形象,能形象化地呈现事实 或现象的全貌,给人以简明扼要、清晰易懂的印 象,便于学习和记忆。
统计表的结构和组成要素可以用简 单统计表显示如下:
四、统计图
• 统计图一般采用直角坐标系,通常横坐标 (abscissa)或横轴(horizontalaxis)表示事物的组别 或自变量X,称为分类轴(category axis);纵坐标 (ordinate)或纵轴(vertical axis)表示事物出现的次 数或因变量Y,称为数值轴(scale axis)。除直角 坐标外,如圆形图还有角度坐标等。统计图一般 由下面几个部分组成: • 图号及图题 图号是图的序号。图题或标题是统 计图的名称。图题与图号之间也空一个汉字。与 统计表格不同的是,统计图形的标题常置于图的 正下方。图题的字体要与整个图形的大小相称, 一般是图中使用的最大号的文字。书写顺序一般 与图形标目一致,自左至右书写。
•
在制定统计表和统计图时,首先要对收集的数据 资料进行初步整理。整理的基本方式有排序和统 计分组两种。 • 一、数据排序 • 数据排序(sort或order),就是按照某种标准, 对收集到的杂乱无章的数据按照一定顺序标准进 行排列。数据排序是整理数据最简单的方法。 • 将一组数据按照数值大小、高低、长短、多少, 依升序(ascending order)或降序(descending order)排列后,就可显示出数据的分布情况。
统计图的结构和组成要素如图2—2 所示:
第二节 次数分布表
• 次数分布可区分为简单次数分布、分组次 数分布、相对次数分布、累积次数分布等。 次数分布表和次数分布图就是各种次数分 布的列表形式和图示形式。 • 一、简单次数分布表 • 简单次数分布表(simple frequency table) 就是依据每一个分数值在一列数据中出现 的次数或总计数资料编制成的统计表。
• 图目 写在图形基线上的各种不同类别、名称,或 时间、空间的统计数量值,即横坐标上所用的各 种单位名称。也叫刻度线标签。 • 图尺 在统计图的横坐标及纵坐标上都要用一定 的距离表示各种单位,这些单位称为图尺(ruler或 scale)。图尺分点(tick)要清楚,整个图尺大小要 包括所有的数据值,如果数据值大小相差悬殊, 图尺可用断尺法或回尺法,减少图幅。 • 图形 是图的主要部分,图形线条要清晰,一般 除图形线外,避免书写文字。要表示不同的结果, 用不同的图形线以示区别。 • 图例 用来表示并标明各种图形的含义。图例 (legend)的位置可选图中或图外适当的地方,注 意保证整个统计图的和谐美观和均衡。 • 图注 凡是图形中需要借助文字或数字加以补充 说明的,均称为图注。图注部分的文字要少,字 号要小。
[例2—2]下面是100名学生在某项测验中的成 绩分数,试将它制成一个次数分布表。
76.0 88.0 89.0 75.0 79.5 66.0 71.5 77.5 73.5 94.0 77.5 81.0 78.0 84.0 80.5 83.0 83.0 75.0 76.0 79.0 82.0 76.5 78.0 90.0 73.0 87.0 91.0 79.0 88.5 80.0 90.5 67.0 80.0 80.0 93.0 82.5 96.0 79.0 85.0 75.5 81.0 83.0 78.5 86.0 83.0 79.5 75.5 80.5 89.5 83.5 85.5 84.0 76.5 84.5 72.0 80.0 89.0 74.5 78.5 82.0 71.0 84.0 75.0 68.5 68.0 82.0 87.5 77.0 76.0 65.0 80.5 92.5 77.0 62.0 79.0 72.0 79.5 86.0 81.5 71.0 86.0 81.5 71.0 87.0 78.0 81.0 86.5 83.5 69.0 74.0 70.0 82.5 72.5 73.5 74.0 98.0 73.0 74.5 80.0 70.5
• 2.数量类别。这是以数据的取值大小为分类标志, 把数据按数值大小以分组或不分组的形式排出一 个顺序来。
• 三、统计表 • 统计表的结构一般包括几个组成要素,它们的 名称和编制要求如下: • 表号 表的序号位于表的左上方,一般以出现的 先后顺序排列。 • 名称 又称标题,是一个表格的名称,应写在表 的上方。标题用语要简练扼要,准确得体,一望 即知该表的内容。
• 3.列出分组区间 • 分组区间即一个组的起点值和终点值之间的距离, 又叫组限。起点值称组下限,终点值称组上限,组 限有表述组限和精确组限两种。例如,一组组距为 10的分组数据,它们的表述组限为10~19,20~29, 30~39,40~49等,实际上它们的精确组限(或称 实际组限)分别为9.5~19.499,19.5~ 29.499,29.5~39.499,39.5~49.499等。 这种做法是为了简便也易于计算。在写分组区间时 要注意这样几点:在列出的分组区间内,最高组区 间应包含最大的数据,最低组区间应包含最小的数 据。最高组或最低组的下限最好是组距i的整数倍。 各分组区间一般在纵坐标上按顺序排列,数值大的 分组区间排在上面,数值小的分组区间排在下面。 在呈现表格时,各分组区间使用表述组限,并且为 了书写方便,通常只用整数写下限值,然后在右侧 画一横线。
• 4.登记次数 • 依次将数据登记到各个相应的组别内,一般用画线记 数(丗)或写“正”字的方法。为确保登记准确,第一次 登记后需再核实。 • 5.计算次数 • 根据登记的结果计算各组的次数,计算各组次数的总 和即总次数。并核对各组次数总和与数据的总个数是否 相等。 • 然后,取消画线登记次数一栏,重新制表。新表包括 的栏目有:第一列为分组区间,第二列为各分组区间的 组中值。组中值是每组精确下限加上组距的二分之一, 或精确下限与精确上限之和的一半。第三列为次数(f)。 这样整理的统计表就是次数分布表,见表2—3。表2-3 中第四列和第五列为相对次数,分别用频数比率(f/N) 和百分次数表示,这两列有时可不用列出。
• 2.分类标志要明确,要能包括所有的数据 • 对数据进行分组时,所依据的特性称为分组或 分类的标志。 • (三)分组的标志 • 分类标志有各种各样。这些分类标志按形式大 致可分为性质类别与数量类别两种。 • 1.性质类别。主要是根据事物的属性不同将 被观测的事物加以划分,反映事物在组别、种类 上的不同,不说明事物之间的数量差异。 • 性质类别可根据事物的性质及研究的需要分成 不同的层次,每个层次又可分为不同数量的细目。
• K=1.87(N─1) 2/5(N为数据个数,K取近似整数) • 用这个公式计算出的组数,只是一个近似数。因为 究竟能分多少组,与分组时最低组的下限值和组距i 有关,因为i=全距/K。有关研究指出,经验和理论 都证明,如果任一组观测数值被分为10~15组,全 部信息就都被保留下来了。一般说来,分组数目或 组距小有变化时,对次数分布表作用的显示和计算 的准确性,不产生很大影响。因此对组数与组距并 不要求严格界定。 • 那么,应该如何掌握分组的标准呢?一般说,分 组数目多,则组距小,计算精确,但它要求总的数 据量大,否则会出现有的组距内无次数分布的现象, 那将使整个数据的分布规律显示不明显,也就不能 发挥次数分布表的作用了。如果分组少,组距就大, 计算简单,但引进计算误差较大。因此,要做到既 不增加搜集数据的工作量,又能使分组后的计算精 确到最大限度,使用上述公式分组是一个较好的方 法。
•
标目 即分类的项目。标目一般在表的上面一行 (tablespanner)或左侧一列(stub column)。如果分 类的标志只有一个,写在表的上行或左列都可以。 如果分类的标志有两个,且二者没有隶属关系, 则左列与上行各一个。如果两个分类标志有隶属 关系,则要放在一个方向(或上面或左侧)分两行 分述。标目确立了数据组织的逻辑,并确定了栏 目下数据栏的性质。 • 数字 数字是统计表的语言,又称统计指标。数 字应以个数位(或小数点)对准上下对齐,缺数字 的项要划“一”。表中的数字一般不带单位、% (百分号)等,单位和%一般归在标目中。表中的 数字构成了表体。 • 表注 写于表的下面,是对统计表或者表内的某 些内容进行补充说明和解释。数据来源、附记等 都可作为表注的内容,文字可长可短。
表2—1 80名员工对部门主管尽职程 度调查结果
• 员工对主管尽职情况的评定 • ①非常不尽职 • ②不尽职 • ③不置可否 • ④尽职 • ⑤非常尽职 • 总计 人数 9 30 10 25 6 80
二、分组次数分布表
• 当数据量很大时,应该把所有的数据先划分为 若干分组区间,然后将数据按其数值大小划归到 相应的组别内,分别统计各个组别中包括的数据 个数,再用列表形式呈现出来,就构成了分组次 数分布表(grouped frequency table)。 • (一)编制分组次数分布表的步骤 • 1.求全距 • 全距(range)指最大数与最小数两个数据值之间 的差距。从被分组的数据中找出最大数与最小数, 二者相减所得差数就是全距。
• 2.决定组距与组数 • 组距(interval)是指任意一组的起点和终点之间的距离, 用符号i表示。决定组距的大小,需要以全距为参考。全 距大,则组距可大一些;全距小,则组距可小一些。组 距经常取2、3、5、10、20等数值,这样便于分组,便 于计算分组区间和组中值。如果先确定了组数,就可以 用全距除以组数后,取整数表示组距。 • 组数(分组数目)的多少要根据数据的多少来定。如果 数据个数在100以上,习惯上一般分10~20组,经常取 12~16组。数据个数较少时,一般分为7~9组。如果 数据的总体分布为正态,可用下面的经验公式计算组数 (K),这样可使分组满足渐近最优关系。
• •
• •பைடு நூலகம்•
• •
二、统计分组 所谓统计分组(grouping),就是根据被研究对象 的特征,将所得数据划分到各个组别中去。 (一)统计分组前的准备 将数据进行分组前,先要对观测数据做进一步 的核对和校验。 如果要删除数据,也应遵循三个标准差准则, 即该数据是否落在平均数加减三个标准差之外。 对于不能解释其产生原因的异常数据,都应遵循 这个准则取舍。 (二)统计分组应注意的问题 1.分组要以被研究对象的本质特性为基础
• 第四步,登记与计算次数。登记次数时要 特别注意处于分组区间分界点(breakpoint) 上的几个值。如:62.5,65.5,68.5,71.5, 74.5,77.5,80.5,83.5,86.5,89.5, 92.5,95.5,都应登记到上一组。表2—2 是登记结果。登记完毕后应再核实一次, 确保无误后,计算次数。表中∑f是指所有 各组的次数和。
• 这一组学生成绩分数的分布范围在62~98之间,测验 分数属于连续性随机变量,编制分组次数分布表的方法 步骤如下: • 第一步,找出最大值与最小值分别为98.0、62.0,全 距为98-62=36。 • 第二步,确定组数与组距。 • 第三步,列分组区间。因为这组数据最小值为62,组 距定为3,因此,最低组的下限取为60,既可将最小值 62包含在最低组内,其值又是3的整数倍,这样比较好。 各组区间可写为:60~,63~,66~,69~,72~, 75~,78~,81~,84~,87~,90~,93~,96~, 最高组96~99,也可将最高分98包括进去。为书写方 便,这里各分组区间用整数表示。在对数据进行分组时, 按各组的精确组限归类,如:59.5~62.499,62.5~ 65.499,以下类推。