统计数据整理之变量分布数列的编制
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
【课题】统计数据整理之变量分布数列的编制 【教材版本】
娄庆松,曹少华.统计基础知识,第二版.北京:高等教育出版社.2006 娄庆松.统计基础知识教学参考书,第二版.北京:高等教育出版社.2006 娄庆松,祝刚.统计基础知识习题集,第二版. 北京:高等教育出版社.2006 【教学目标】
1.知识目标:理解频数分布的含义及种类;掌握变量分布数列的编制;掌握组距式数列中基本概念。
2.水平目标:培养学生编制简单小型的分布数列的水平。
3.德育目标:树立严谨、规范意识,养成实事求是的工作态度。
【教学重点、难点】
1.教学重点:频数分布的概念、组距式变量分布数列的编制、组距式分布数列中基本概念。
2.教学难点:组距式分布数列中基本概念(组距、组数、组中值、组限、等距数列、异距数列、连续数列)
【教学方法】
讲授教学法、案例分析法、比较综合法 【教学媒体】
《统计基础知识多媒体课件》和 中教学资源。
【课时安排】 2课时(90分钟)。
【教学过程】 【复复习习】(4分钟) 统计分组的方法及原则? 【引引入入】(3分钟)
教师:前面讲过的统计分组,就是按其分组标志实行分组的过程,实际上就是变量分布形成的过程,如图1所示:(要求学生实行分组归类)
分组
图2—1 统计分组过程 【新新授授】
那么前面的我们所做的那个分组过程及结果表示怎样用专业术语来表示呢?这就是我们本节课所学习的内容。
一、分配数列的概念(10分钟)
(一)次数分配概念:在统计分组的基础上,将总体中所有单位按组归类整理,并汇总各组内的单位数,形成总体中各单位数在各组间的分配称为次数分配。
(二)基本概念:
在分布数列中,分配在各组的单位数叫次数或频数,一般用f 表示;各组次数与总次数的比率叫频率或比率,一般用f/Σf 表示。
各比率之和为100或1即Σ=1。
(三)分配数列的概念:
将各组组别与次数依次排列而形成的数列叫次数分配数列,简称分配数列。
(四)分配数列组成要素:
分配数列的构成要素:一个是分成的各个组别;一个是各组出现的频数和频率。
二、分配数列的种类(33分钟)
教师:由于我们在选择分组标志实行统计分组时,可选标志有品质标志和数量标志,所以根据分组标志分组得到的分布数列相对应的也有两个。
(一)品质数列
1.定义:用品质标志实行分组得到的分布数列。
2.构成要素:用文字表示的各组和频数或频率
3.举例:将财会11班按照性别分为男和女两组。
如表1: 财会11班分布情况表
(二)变量数列
1.定义:用数量标志实行分组得到的分布数列。
2.构成要素:用数字表示的各组和频数或频率
3.分类
⑴单项式变量数列:是按每个变量值分别列组而形成的数列。
如表1:财会11班年龄分布情况表
⑵组距式变量数列:把各变量值按照一定区间实行分组而形成的数列。
如表2:财会11班成绩情况表
学生讨论总结一下单项式分布数列与组距式分布数列的关系(包括区别和联系)
教师总结区别:
1.前者用一个数字表示各组;后者是用数据变化的一定区间来表示各组的;
2.前者反映的变量变动数值只集中在某几个数字上;后者反映的变量变动范围大。
解释:在组距式数列中出现的基本概念
组限:表示各组界限的变量值称为组限,如“60—70”,其中较小的变量值称为下限,如60、
70、80、90等,较大的变量值为上限,60,70、80、90等
说明:“60”分在“60—70”组是下限,在“60以下”组是上限。
开口组:分为上开口组和下开口组,如60分以下是下开口组,90分以上是上开口组。
组中值:各组上限与下限的中点称为组中值,即组中值=(上限+下限)/2,(60+70)/2=65,(70+80)/2=75。
下开口的组中值=上限-1/2邻组组距上开口的组中值=下限+下限1/2邻组组距
说明:组中值具有一定的假定性,即假定次数在各组内的分布是均匀的,代表了各组内的一般水平。
练习题:如果是分组变量数列,计算的均值则是实际均值的近似值(错)分析:对于单项式分布数列来说,计算的均值就不是近似值;而组距式变量数列则是近似值。
全距:所有变量值中的最大值—最小变量值
组距:各组上限与下限之差即为组距,组距=上限-下限,如70-60=10,80-70=10.
组数:组数=全距/组距
在组距数列中还能够分为以下几类:
①等距数列和异距数列
a等距数列:各组组距都相等的数列,例如表1。
b异距数列:各组组距不相等,并不指所有的组距都不相等。
如表3:财会11班成绩情况表
判断题:异距数列就是各组组距都不相等的数列(错)
②连续变量数列和离散变量数列
a连续变量数列:是用连续型变量做的各组,即各组数字能够用小数点表示,可作无限分割。
如表2、3均是。
b离散变量数列:是用离散型变量做的各组,即各组数字能够用整数表示,上下限容易分出。
如表4:某市大型工业企业设备分布情况
三、变量分布数列的编制(25分钟)
(一)编制步骤:
排序分组累计次数形成数列
(二)编制条件:在此让学生自己考虑对于不同的资料适合编制哪一种变量分布数列。
1.对于那些总体数值变动范围小,具体集中在某几个数字时,并且变量值不多的情况下,适宜编制单项式分配数列;
2.对于那些总体数值变动范围大,分布较分散且变量值较多的数列适宜编制组距式分配数列。
(三)组距式分配数列的编制
举例说明:例如对某班40名学生统计考试成绩按试卷登记得到如下资料:
54 6062 97 85 52 83 79 95 80
89 85 77 68 86 93 70 81 78 89
71 89 80 85 75 78 90 6678 73
82 82 99 77 88 84 75 88 76 80
要求学生自己先独立完成分布数列的编制,教师找出编制的较好学生回答编制过程及思路。
教师带领大家:编制等距数列一般要经过如下几个步骤:
第一步:将原始数据按大小顺序排列起来,并确定变量性质。
52 54 60 62 66 68 70 71 73 75 76 77 77 78 78 78 79 80 80 80 81 82 82 83 84 85 85 85 86 88 88 89 89 89 89 90 93 95 97 99
变量性质为连续变量,确定变量性质,是为了准确实行数列的编制和确定组限的表示方法。
第二步:计算全距
计算全距是为了实行分组,全距是用原始数据求得的,全距=最大变量值—最小变量值在本例中:全距=99—52=47
第三步:确定组限、组距和组数。
确定组距和组数的具体方法如下:
1.在计算组距和组数时,所使用的变量值最小值应略低于实际资料的最小值,自50分开始,最大值应略高于实际资料最大值,取至100分,则全距为100—50=50分。
2.组数和组距怎样求呢?组数必须是整数,而且尽可能是全距的整除数。
因为全距是50分,所以组数能够是5或者是10,则相对应的组距是10或者5本例资料适宜选用组距为10,而组数为5.
第四步:写出组限并据以归类汇总计算各组次数。
1.归类汇总遵循的原则:不重复、不遗漏。
不重复是指所确定的组限必须使各组的范围互斥,以确保每个数据只能归入唯一的组内,不能模棱两可,或是归属不定。
不遗漏是指所确定的组限必须包容全部原始数据,不允许任何数据遗漏在外。
确定组限的原则是最低值组下限应小于或等于最小变量值,最高值组上限应大于或等于最大变量值。
第五步:编制统计表,形成变量分布数列。
(学生自学开口组数列的编制)
教师:上开口与下开口的含义,上开口即确定了下限,下开口即是确定了上限;
开口组数列编制的适用范围:如果全部变量数列中的最大值和最小值与其他值相差悬殊,为避免出现空白组或个别极端值被遗漏,第一组和最后一组能够采用“××以下”和“××以上”这样的开口组标记法。
【练习】(10分钟)
多项选择题:
1.组距数列包括( B C )
A.单项数列
B.等距数列
C.异距数列
D.品质数列
2.编制组距式数列就是要确定( A B E )
A.组限
B.组数
C.组中值
D.次数
E.组距
3.组限的确定原则是( AD )
A.最低值组下限应小于或等于最小变量值
B.最高值组上限应小于或等于最大变量值
C.最低值组下限应大于或等于最小变量值
D.最高值组上限应大于或等于最大变量值综合题:
某班组20名工人的资料如下表:
1.要求按性别、文化水准和技术等级分别编制单项式变量分布数列,、。
2.按照年龄分组编制等距数列。
【归纳总结】(5分钟)
小结(对着板书实行小结,板书如下图)
【布置作业】
《统计基础知识习题集》第二章
填空:14—20 单选:24—26 判断:14、15、16 综合题:2、3、4
河北徐水县职业技术教育中心
高丽林
2009年2月4日。