统计学中几个容易混淆的问题
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、直方图与条形图 直方图是统计学中对数据描述的一个图形,在高 中教材中也有介绍,但有一部分学生对这个概念理解 不清。曾对学习统计学一年以后的大三学生做过一项 统计学方面的调查,班级共有68名学生,有36名学生 对直方图与条形图不能很好地区分开来,约占53%。 有的学生把二者混为一谈,对于二者的应用范围分不 清楚。条形图是用宽度相同的条形的高来表示数据多 少的图形,每一矩形表示一个类别,其宽度没有实际 意义,每个小矩形不相连。条形图有单式条形图和复 式条形图之分,它一般适应于品质数据。 直方图是用于展示定量数据分布的一种常用图 形,它是用矩形的宽度和高度来表示频数的分布,矩 形的宽度表示分组数据的组距,由于分组数据具有连 续性,所以每个矩形是相连的,通过直方图可以观察 数据分布的大致情况。一般用每个小区间内的频率比 上组距来表示小矩形的高度,这样做是为了使得直方 图围成的面积为1,因为一维连续型随机变量的概率 密度函数与x轴围成的面积为1,通过对直方图的折线 近似拟合,观察这条折线与已知分布的哪个概率密度 函数拟合得比较好,可得出这组数据的大致分布。 但是,在有的教材中,往往把直方图的高这一数 据标错,给学生理解带来困难。右图为某公司电脑销 售额分布的直方随机变量X、Y的相关系数一般用rXY (简记为r)或
ρ XY 表 示 ,定 义 为 r XY =
Cov(X,Y) ,这里随机变 姨D(X)姨D(Y)
比较分散。方差的开平方 姨D(X)称为标准差或均方 差。方差和标准差是否有单位,应该怎样定义单位呢? 关于这个问题有很多人认识不清,方差和标准差是否 有单位,取决于“样本数据”,若“样本数据”有单位,那 么方差和标准差均有单位;若“样本数据”是没有单位
收稿日期:2018-11-24 基金项目:本文系河南大学民生学院教育教学改革研究项目“统计学课程教学改革与实践探究”(项目编号:MSJG2014018)研究成果 作者简介:张明亮,教授,硕士生导师,研究方向为概率统计、数学教育。
-188-
2019 年 6 月 第 24 期
教育教学论坛 EDUCATION TEACHING FORUM
Jun. 2019 NO.24
的数值,那么方差和标准差均没有单位。由方差的定 关系;相关系数为1,也只能说明随机变量X与Y之间以
义知,一个随机变量X的方差,是这个随机变量与它的 概率1存在着线性关系,直观来说,就是几乎所有的点
2019 年 6 月 第 24 期
【学法指导】
教育教学论坛 EDUCATION TEACHING FORUM
Jun. 2019 NO.24
统计学中几个容易混淆的问题
张明亮 (河南大学 民生学院,河南 开封 475004)
摘要:统计学是一门重要的学科,在日常生活中有着极其广泛的应用。本文对统计学教学中几个容易混淆
个明显的错误。
四、无限与不可数
可数和无穷多是两个不同的概念。可数可以简单
地认为是可以按一定顺序排列出来,所以也称为可
列。如所有自然数{0,1,2,3,…}是可数个,只要能与自
然数一一对应就是可数的,如所有奇数、所有偶数、所
有有理数都是可数的。不可数就是没有办法一一排列
出来,如区间[0,1]内的所有实数就是不可数的。
例:根据例4.1的数据,计算9名员工月工资收入的 方差和标准差。
解 : 根 据 式 (4.9) 得 :s 2 = (1500-1200)2+(750-1200)2+…+(1630-1200)2
9-1 =186350(元)
根据式(4.11)得标准差为:s= 姨186350 =431.683
(元)。
这里方差与标准差的单位都写成了“元”,这是一
的问题进行阐明,旨在帮助学生对统计学中的一些概念有个正确的理解。
关键词:统计学;直方图;总体;相关系数
中图分类号:C81
文献标志码:A
文章编号:1674-9324(2019)24-0188-02
统计学是一套处理和分析数据的方法和技术,是 一门数据分析的学科。统计学作为一门基础课程,越 来越受到人们的重视,呈现着新的发展趋势及活力。 但是,学生往往对一些概念产生模糊认识,甚至一些 教科书中,也出现对一些概念表述不清的情况,这里 就学生在学习中容易产生混淆的几个问题进行阐述, 旨在帮助学生对一些概念有一个正确的理解。
高度都不是频率与组距的比,直方图围成的面积自然 也不能保证是1。
二、对总体的理解 总体是指研究的对象的全体或试验的全部可能 的观察值。由此可见,总体是指研究对象,一般是一些 具体的数值。如,要考察一个班级《统计学》期末的考 试成绩,不能把这个班的学生看作总体,而应是每个 学生的《统计学》成绩组成的集合为总体,因为这里考 察 的 仅 仅 是《统 计 学》的 成 绩 ,而 不 是 其 他 学 科 的 成 绩。有的学生对总体理解不到位,甚至一些教材上也 犯有同样的错误。 三、方差与标准差的单位 随机变量X的方差用D(X)或Var(X)表示,若 E [X-E(X)]2存在,则D(X)=E[X-E(X)]2称为随机变量X 的方差。它刻画了随机变量X的取值与其数学期望E (X)的偏离程度,若方差较小,意味着随机变量X的取 值比较集中在E(X)附近,反之,说明随机变量X取值
数学期望的差的平方的数学期望,若这个随机变量X (X、Y)都在直线Y=aX+b上,允许个别点不在这条直线
有单位,它的数学期望就与这个随机变量具有相同的 上,不在这条直线上的点的概率应为0,但不能说二者
单位,二者差的平方的单位应该是原单位的平方,再 求数学期望则单位不变,因此,方差的单位应该是“样 本数据”单位的平方,而标准差是由方差开方得到,所 以标准差的单位与“样本数据”的单位相同。如果数据 的单位是千克,方差的单位就是千克的平方,标准差 的单位就是千克;如果数据的单位是秒,方差的单位 就是秒的平方,标准差的单位就是秒。只是现在教科 书中对方差的单位比较淡化,一般考试中,所求的方 差不要求写单位。但是,在有的教材中仍会出现单位 标注错误。有本教材给出的例题是这样的:
ρ XY 表 示 ,定 义 为 r XY =
Cov(X,Y) ,这里随机变 姨D(X)姨D(Y)
比较分散。方差的开平方 姨D(X)称为标准差或均方 差。方差和标准差是否有单位,应该怎样定义单位呢? 关于这个问题有很多人认识不清,方差和标准差是否 有单位,取决于“样本数据”,若“样本数据”有单位,那 么方差和标准差均有单位;若“样本数据”是没有单位
收稿日期:2018-11-24 基金项目:本文系河南大学民生学院教育教学改革研究项目“统计学课程教学改革与实践探究”(项目编号:MSJG2014018)研究成果 作者简介:张明亮,教授,硕士生导师,研究方向为概率统计、数学教育。
-188-
2019 年 6 月 第 24 期
教育教学论坛 EDUCATION TEACHING FORUM
Jun. 2019 NO.24
的数值,那么方差和标准差均没有单位。由方差的定 关系;相关系数为1,也只能说明随机变量X与Y之间以
义知,一个随机变量X的方差,是这个随机变量与它的 概率1存在着线性关系,直观来说,就是几乎所有的点
2019 年 6 月 第 24 期
【学法指导】
教育教学论坛 EDUCATION TEACHING FORUM
Jun. 2019 NO.24
统计学中几个容易混淆的问题
张明亮 (河南大学 民生学院,河南 开封 475004)
摘要:统计学是一门重要的学科,在日常生活中有着极其广泛的应用。本文对统计学教学中几个容易混淆
个明显的错误。
四、无限与不可数
可数和无穷多是两个不同的概念。可数可以简单
地认为是可以按一定顺序排列出来,所以也称为可
列。如所有自然数{0,1,2,3,…}是可数个,只要能与自
然数一一对应就是可数的,如所有奇数、所有偶数、所
有有理数都是可数的。不可数就是没有办法一一排列
出来,如区间[0,1]内的所有实数就是不可数的。
例:根据例4.1的数据,计算9名员工月工资收入的 方差和标准差。
解 : 根 据 式 (4.9) 得 :s 2 = (1500-1200)2+(750-1200)2+…+(1630-1200)2
9-1 =186350(元)
根据式(4.11)得标准差为:s= 姨186350 =431.683
(元)。
这里方差与标准差的单位都写成了“元”,这是一
的问题进行阐明,旨在帮助学生对统计学中的一些概念有个正确的理解。
关键词:统计学;直方图;总体;相关系数
中图分类号:C81
文献标志码:A
文章编号:1674-9324(2019)24-0188-02
统计学是一套处理和分析数据的方法和技术,是 一门数据分析的学科。统计学作为一门基础课程,越 来越受到人们的重视,呈现着新的发展趋势及活力。 但是,学生往往对一些概念产生模糊认识,甚至一些 教科书中,也出现对一些概念表述不清的情况,这里 就学生在学习中容易产生混淆的几个问题进行阐述, 旨在帮助学生对一些概念有一个正确的理解。
高度都不是频率与组距的比,直方图围成的面积自然 也不能保证是1。
二、对总体的理解 总体是指研究的对象的全体或试验的全部可能 的观察值。由此可见,总体是指研究对象,一般是一些 具体的数值。如,要考察一个班级《统计学》期末的考 试成绩,不能把这个班的学生看作总体,而应是每个 学生的《统计学》成绩组成的集合为总体,因为这里考 察 的 仅 仅 是《统 计 学》的 成 绩 ,而 不 是 其 他 学 科 的 成 绩。有的学生对总体理解不到位,甚至一些教材上也 犯有同样的错误。 三、方差与标准差的单位 随机变量X的方差用D(X)或Var(X)表示,若 E [X-E(X)]2存在,则D(X)=E[X-E(X)]2称为随机变量X 的方差。它刻画了随机变量X的取值与其数学期望E (X)的偏离程度,若方差较小,意味着随机变量X的取 值比较集中在E(X)附近,反之,说明随机变量X取值
数学期望的差的平方的数学期望,若这个随机变量X (X、Y)都在直线Y=aX+b上,允许个别点不在这条直线
有单位,它的数学期望就与这个随机变量具有相同的 上,不在这条直线上的点的概率应为0,但不能说二者
单位,二者差的平方的单位应该是原单位的平方,再 求数学期望则单位不变,因此,方差的单位应该是“样 本数据”单位的平方,而标准差是由方差开方得到,所 以标准差的单位与“样本数据”的单位相同。如果数据 的单位是千克,方差的单位就是千克的平方,标准差 的单位就是千克;如果数据的单位是秒,方差的单位 就是秒的平方,标准差的单位就是秒。只是现在教科 书中对方差的单位比较淡化,一般考试中,所求的方 差不要求写单位。但是,在有的教材中仍会出现单位 标注错误。有本教材给出的例题是这样的: