数据集中趋势和离散程度(名师总结)
集中趋势和离散趋势
Variance and Standard Deviation
返回总目录
集中趋势的测度
集中趋势是对频数分布资料的集中状况和平均水平的综 合测度。而离散趋势是对频数分布资料的差异程度和离 散程度的测度,用来衡量集中趋势所测度的代表性,或 者反映变量值的稳定性和均匀性。
常用来表达数列集中趋势的测度有算术平均数、调和平均 数、几何平均数、中位数和众数。这些测度在统计学中也 称为平均指标或平均数,可以用来反映标志值的典型水平 和标志值分布的中心位置或集中趋势。
几何平均数
(概念要点)
1. 2. 3. 4. 5. 集中趋势的测度值之一 N 个变量值乘积的 N 次方根 适用于特殊的数据 主要用于计算平均发展速度 计算公式为
GM N X 1 X 2 X N N X i
i 1 N
6. 可看作是均值的一种变形
1 log GM (log X 1 log X 2 log X N ) N
则
XH
m1 m2 m3 mn mn m1 m2 m3 X1 X 2 X 3 Xn
m
i 1 n
n
i
mi X i 1 i
调和平均数
(概念要点)
1. 集中趋势的测度值之一 2. 均值的另一种表现形式 3. 易受极端值的影响 4. 用于定比数据 5. 不能用于定类数据和定序数据 6. 计算公式为L源自fmfSm1
i
——中位数所在组的组距
也可以利用中位数所在组的上限来测算中位数,即中位数的 上限公式为 :
Me U
f
2
Sm 1 fm
i
式中: U
Sm1
——中位数所在组的上限 ——大于中位数组的各组次数之和
数据的集中趋势与离散程度
数据的集中趋势与离散程度统计学中,描述和衡量数据分布特征的两个重要方面是集中趋势和离散程度。
集中趋势指的是数据集中在哪个数值附近,而离散程度描述了数据的分散程度。
在本文中,我将详细介绍集中趋势和离散程度的定义、常用的衡量指标和如何应用。
一、集中趋势集中趋势是指数据集中在哪个数值处的趋势或位置,常用的衡量指标包括均值、中位数和众数。
1. 均值均值是数据集所有观测值的算术平均数。
它是最常用的衡量集中趋势的指标。
计算均值的方法是将所有观测值相加,再除以观测值的个数。
均值受极端值的影响较大。
2. 中位数中位数是将数据集按照大小排序后,位于中间位置的观测值。
如果数据集的个数是奇数,则中位数就是排序后位于中间的观测值;如果数据集的个数是偶数,则中位数是中间两个观测值的平均数。
中位数对极端值不敏感,更能反映数据的典型情况。
3. 众数众数是数据集中出现频率最高的观测值。
一个数据集可能存在一个众数,也可能存在多个众数,或者没有众数。
众数主要用于描述离散型数据。
二、离散程度离散程度是描述数据分散程度的指标,常用的衡量指标包括极差、方差和标准差。
1. 极差极差是数据集中最大观测值和最小观测值之间的差值。
极差越大,表示数据的离散程度越大;极差越小,表示数据的离散程度越小。
极差对极端值非常敏感。
2. 方差方差是数据集观测值与均值之差的平方的平均值。
方差衡量了数据与其均值之间的离散程度,数值越大表示数据的离散程度越大,反之亦然。
方差对极端值非常敏感。
3. 标准差标准差是方差的平方根,用于衡量数据集的离散程度。
标准差具有与原始数据相同的度量单位,比方差更容易解释和理解。
标准差越大,表示数据的离散程度越大,反之亦然。
三、应用集中趋势和离散程度的概念和指标在各个领域具有广泛的应用。
在金融领域,通过分析股票价格的均值和离散程度,可以评估股票的风险和收益。
在市场调研中,通过分析产品价格的中位数和标准差,可以了解市场需求和产品价值的稳定性。
集中趋势与离散趋势
允许用户自定义查询条件、筛选数据和调整图表 参数,以便更深入地探索数据的内在规律和关联 关系。
数据动画
将数据变化过程以动画形式展现出来,帮助用户 更直观地理解数据的变化趋势和动态特征。
06 总结与展望
CHAPTER
主要发现与结论
集中趋势描述
通过平均数、中位数和众数等指标,可以有 效地描述数据的集中趋势,反映数据分布的 中心位置。
众数
一组数据中出现次数最多的数。众数可能不唯一,也可能不存在。众数适用于分类数据和顺序数据,对于数值型 数据,如果数据分布的波动性较大,众数可能不能很好地代表数据的集中趋势。
03 离散趋势
CHAPTER
定义与概念
离散趋势
指一组数据中各数值之间的差异程度 或离散程度,是数据分布的另一个重 要特征。
直方图(Histogram)
将数据按照一定范围进行分组并用矩形条表示,通过矩形条的高度和宽度反映数据的分布 规律。
散点图(Scatter Plot)
用点的位置表示两个变量之间的关系,可通过观察点的分布情况和趋势线分析数据的集中 和离散趋势。
动态数据可视化在趋势分析中的应用
1 2 3
时间序列分析
通过动态展示数据随时间变化的情况,揭示数据 的长期趋势、季节波动和周期性规律。
• 关注数据质量和异常值处理:在实际数据分析中,异常值和数据质量问题是不 可忽视的。未来的研究可以关注如何有效地处理异常值和数据质量问题,以提 高集中趋势和离散趋势分析的准确性和可靠性。例如,可以采用稳健的统计方 法或者数据清洗技术对异常值进行处理,以保证分析结果的稳定性和可靠性。
谢谢
THANKS
Tableau
功能强大的数据可视化工具,支持交互式数据分析和动态图表展示, 适用于大数据处理。
第21章数据的集中趋势和离散程度
第21章 数据的集中趋势和离散程度回顾与思考 1.统计的一般过程2.平均数、中位数和众数(1)定义:①有n 个数x 1,x 2,…,x n ,则x= 叫这n 个数的平均数.②一组数据中 的数据叫这组数据的众数.③将一组数据按大小依次排列,把处在 或 叫这组数据的中位数. (2)平均数的计算方法①定义法;②加权平均法:x = ;③新数据法:若x 1,x 2,…,x n 的平均数是x ,则ax 1,ax 2,…,ax n 的平均数是 ;x 1+b ,x 2+b ,…,x n +b 的平均数是 ;ax 1+b ,ax 2+b ,…,ax n +b 的平均数是 .(3)平均数、众数和中位数的意义:平均数、众数及中位数都是描述一组数据的集中趋势的特征数,但描述的角度和适用范围有所不同,平均数是度量一组数据波动大小的基准,是描述一组数据的集中趋势的量.平均数大小与每一个数据都有关,所有数据都参加运算,其中任何数据的变动都会相应引起平均数的变动,是利用数据信息最充分的特征数,但很容易受极端值的影响;中位数计算简单,只与数据的排列位置有关,某些数据的变动与对中位数没有影响,但不能充分利用和反映所有的数据信息,当一组数据中个别数据变动较大时,可用它来描述数据的集中趋势;众数计算简单,只与数据重复的次数有关,但不能充分利用和反映所有的数据信息,当各数据的重复次数大致相等时,众数往往没有特别的意义.当一组数据中有不少数据多次重复出现时,其众数往往是我们关心的一种统计量.平均数与中位数均唯一,但众数不一定唯一. 3.极差、方差与标准差(1)定义:在一组数据中, 的差叫这组数据的极差.在一组数据x 1,x 2,…,x n 中,各数据与它们的平均数x 的差的平方的平均数,•叫做这组数据的方差.通常用“S 2”表示,即S 2= .数据收集数据整理数据分析 作出决策普查与抽查 个体样本总体样本容量 涉及 概念 收集 方式 整理 统计表和统计图形式集中趋势离散程度 平均数 中位数 众数 极差方差标准差方差的叫做这组数据的标准差,用“S”表示,即S= .(2)方差的计算①基本公式:S2= ;②简化计算公式:S2 = ,也可写成S2= ,此公式的记忆方法是:方差等于原数据平方的平均数减去平均数的平方.③新数据法:若x1,x2,…,x n的方差是s2,标准差是s,则ax1,ax2,…,ax n的方差是,标准差是;x1+b,x2+b,…,x n+b的方差是,标准差是;ax1+b,ax2+b,…,ax n+b 的方差是,标准差是.(3)方差和标准差的意义:方差和标准差都是用来描述一组数据波动情况的特征数,常用来比较两组数据的波动大小,我们所研究的权是这两组数据的个数相等、平均数相等或比较接近时的情况.方差较大的数据波动较大,方差较小的数据波动较小.4.用样本估计总体方法与技能【例1】小明对这家公司有了一定的了解,他决定留下来工作,公司并对员工的工资进行调整。
沪科版数据的集中趋势与离散程度课件
偏态分布
定义
偏态分布是指数据分布的形状偏离正态分布的情况。
类型
正偏态分布和负偏态分布。
图形特征
正偏态分布时,数据集中于右侧,左侧有较长尾部;负偏态分布时, 数据集中于左侧,右侧有较长尾部。
峰态分布
1 2 3
定义 峰态分布是指数据分布的顶点部分的形状。
类型 尖锐峰态和扁平峰态。
图形特征 尖锐峰态时,数据分布顶点突出,两侧较陡峭; 扁平峰态时,数据分布顶点较平缓,两侧较平直。
特点
平均数易受极端值的影响,当数据 集中出现极端值时,平均数的代表 性可能会降低。
中位数
01 02
定义
中位数是一组数据按大小顺序排列后,处于中间位置的数。如果数据的 个数是奇数,则中位数是中间那个数;如果数据的个数是偶数,则中位 数是中间两个数的平均值。
计算方法
将数据按大小顺序排列,然后找到中间位置的数即可。
01
02
03
平均价格趋势
通过计算股票的平均价格, 可以了解股票价格的总体 趋势。
价格波动分析
通过观察股票价格的波动 情况,可以分析股票的活 跃度和市场情绪。
价格与收益关系
研究股票价格与公司收益 之间的关系,有助于预测 未来的股票价格走势。
风险评 估
波动率分析
通过计算股票价格的波动 率,可以评估股票的风险 水平。
数据的集中趋势与离散程度在数据分 析中的应用
描述性统计分析
确定数据分布的集中趋势
01
通过计算平均数、中位数和众数等统计指标,可以大致了解数
据的集中趋势。
确定数据分布的离散程度
02
通过计算方差、标准差和四分位数间距等统计指标,可以了解
数据的离散程度。
数据的集中趋势和离散程度(名师总结)
数据的集中趋势和离散程度【知识点1】正确理解平均数、众数和中位数的概念一、平均数:平均数是反映一组数据的平均水平的特征数,反映一组数据的集中趋势.平均数的大小与一组数据里的每一个数据都有关系,任何一个数据的变化都会引起平均数的变化.例1:有四个数每次取三个数,算出它们的平均数再加上另一个数,用这种方法计算了四次,分别得到以下四个数:86, 92, 100, 106, 那么原4个数的平均数是________ .例2:有几位同学参加语文考试,赵峰的得分如果再提高13分,他们的平均分就达到90分,如果赵峰的得分降低5分,他们的平均分就只得87分,那么这些同学共有________人.例3:有5个数,其平均数为138,按从小到大排列,从小端开始前3个数的平均数为127,从大端开始顺次取出3个数,其平均数为148,则第三个数是_______ .例4:某5个数的平均值为60,若把其中一个数改为80,平均值为70,这个数是________ .例5:A、B、C、D四个数,每次去掉一个数,将其余下的三个数求平均数,这样计算了4次,得到下面4个数.23, 26, 30, 33 A、B、C、D 4个数的平均数是多少例6:有5个抽屉,分别有图书33本、42本、20本、53本和32本,平均每个抽屉里有图书多少本?例7:小明参加了四次数学测验,平均成绩是88分,他想再通过一次数学测验将五次的平均成绩提高到最少90分,那么在下次测验中,至少要得多少分?例8:四个数的平均值是30,若把其中一个改为50,平均值就变为40,这个数原来是多少?例9:有甲、乙、丙三个数,甲数和乙数的平均数是42,甲数和丙数的平均数是46,乙数和丙数的平均数是47,求甲、乙、丙三个数各是多少?例10:某人沿一条长为12千米的路上山,又从原路返回,上山的速度是2千米/小时,下山的速度是6千米/小时。
那么,他在上山和下山的全过程当中的平均速度是多少千米每小时?例11:若不选择教材中的引入问题,也可以替换成更贴近学生学习生活中的实例,下举一例可供借鉴参考。
数据的集中趋势与离散程度(非常全面)
练习:P133页 练习
问题:某市三个郊县的人数及人均耕地面积如下表。
郊县 人数/万 人均耕地面积/公顷
A
15
0.15
B
C
7
10
0.21
0.18
这个市郊县人均耕地面积是多少(精确到0.01公顷)
小明求得这个市郊县的人均耕地面积为:
0.15 0.21 0.18 x 0.18(公顷 ) 3
请问此商场的经理关注的是这组数据的平均数 吗?他关注的是什么?为什么?如果你是经理, 你将如何调整这种冰箱的进货数量呢?
1、计算平均数的时候,所有的数据都参加运 算,它能成分利用数据所提供的信息,在现实 生活中较为常用;但它容易受到极端值的影响.
2、中位数的优点计算简单,受极端值的影响 较小,但不能充分利用所有数据的信息.
3、一组数据中某些数据多次重复出现时,众 数往往是人们尤为关心的一个量,但各个数据 的重复次数大致相等时,众数往往没有特别意 义.
2、八年级某班的教室内,三位同学正在为谁的数学成绩 最好而争论,他们的5次数学成绩分别是:
小华 72 84 95 98 95
小明
62
62
97
99
100
小刚
40
72
80
100
有人对展览馆七天中每天进馆参观的人 数做了记录,情况如下: 180,176,176,173,176,181,182 求这组数据的中位数和众数.
8、如下表是统计某一城市7月份的每天的气温情况统 计表,求7月份的气温的众数.
气 温 ℃ 天 数
2 1 2 3 2 4
2 6 2
2 7 3
2 8
2
2 9
4
上面的平均数0.17称为3个数0.15、0.21、018的加权平均数, 三个郊县的人数(单位是万),15、7、10分别为三个数据 的权
数据的集中趋势与离散程度
(一)知识要点知识点1:表示数据集中趋势的代表平均数、众数、中位数都是描述一组数据集中趋势的特征数,只是描述的角度不同,其中平均数的应用最为广泛。
知识点2:表示数据离散程度的代表极差的定义:一组数据中最大值与最小值的差,能反映这组数据的变化范围,我们就把这样的差叫做极差。
极差=最大值-最小值,一般来说,极差小,则说明数据的波动幅度小。
知识点3:生活中与极差有关的例子在生活中,我们经常用极差来描述一组数据的离散程度,比如一支篮球队队员中最高身高与最矮身高的差。
一家公司成员中最高收入与最低收入的差。
知识点4:平均差的定义在一组数据x1,x2,…,x n中各数据与它们的平均数的差的绝对值的平均数即T=叫做这组数据的“平均差”。
“平均差”能刻画一组数据的离散程度,“平均差”越大,说明数据的离散程度越大。
知识点5:方差的定义在一组数据x1,x2,…,x n中,各数据与它们的平均数差的平方,它们的平均数,即S2=来描述这组数据的离散程度,并把S2叫做这组数据的方差。
知识点6:标准差方差的算术平方根,即用S=来描述这一组数据的离散程度,并把它叫做这组数据的标准差。
知识点7:方差与平均数的性质若x1,x2,…x n的方差是S2,平均数是,则有①x1+b,x2+b…x n+b的方差为S2,平均数是+b②ax1,ax2,…ax n的方差为a2s2,平均数是a③ax1+b,ax2+b,…ax n+b的方差为a2s2,平均数是a+b同步练习:1为了从甲、乙两名学生中选拔一人参加电脑知识竞赛,在相同条件下对他的电脑知识进行了10次测试,成绩如下:(单位:分)甲的成绩76849086818786828583乙的成绩82848589798091897479回答下列问题:(1)甲学生成绩的众数是分,乙学生成绩的中位数是分。
(2)若甲学生成绩的平均数为,乙学生成绩的平均数为,则与的大小关系是。
(3)经计算知=13.2,=26.36,这说明。
第20章数据的集中趋势和离散程度复习总结
习题:
(1)计算八·二班学生有多少件作品获奖? (2)求出八·二班获奖作品的平均成绩。 (3)求出获奖作品成绩的众数和中位数。
极差:
1、极差的意义 2、极差的计算方法:
方差:
1、方差的意义 2、方差的计算方法
标准差:
1、标准差的意义 2、标准差的计算方法
方差的运算性质:
预习检测:
数据的离散程度是数据分布的另一个重要 特征,它所反映的是各个数据远离其中心 值的程度,可利用极差、方差、标准差 等刻 画一组数据的离散程度。
平均数:
1、平均数的意义 2、平均数的计算方法:
中位数:
1、中位数的意义 2、中位数的计算方法
众数:
1、众数的意义 2、众数的计算方法
平均数、中位数、众数的异同点:
相同点有哪些? 不同点有哪些?
梳理:
1.若数据 x1,x2,,xn,则平均数=
。
2.若n个数据中x1出现f1次,x2出现f2次,…xn出现
x1fn次,则平均数=。3.一般地,个数据按大小顺序排列,处于 的
一个数据(或
)叫做这组数据的中位数.
4.一般地,一组数据中出现次数
数据的集中趋势和 离散程度
单元整理和复习
复习回顾:
集中 趋势
平均数 中位数 众数
离散 程度
极差 方差 标准差
用
样本平均数
样
估计
本
总体平均数
估
计
样本方差
总
估计
体
总体方差
复习提纲:
1、数据的集中趋势的三个特征数 2、数据的离散程度的三个特征数 3、用样本估计总体
预习检测:
数据的代表是指利用平均数、中位数、众数等 刻画一组数据的集中趋势。所谓集中趋势 是指一组数据向某一中心值靠拢的倾向, 测量集中趋势就是寻找数据一般水平的代 表值或中心值。
初中数学知识归纳统计数据的集中趋势和离散程度
初中数学知识归纳统计数据的集中趋势和离散程度统计学是一门研究数据收集、处理、分析和解释的学科,它在生活中的应用非常广泛。
在统计学中,我们常常需要描述数据的集中趋势和离散程度。
本文将介绍几种常见的数据集中趋势和离散程度的统计量以及它们的含义和计算方法。
一、数据的集中趋势数据的集中趋势是指一组数据向某个中心值靠拢的趋势。
常用的统计量有均值、中位数和众数。
1. 均值(Mean)均值是指一组数据的总和除以数据的个数。
它是最常用的集中趋势统计量,用于表示数据的平均水平。
计算均值的方法是将所有数据相加,然后除以数据的个数。
2. 中位数(Median)中位数是指一组数据中处于中间位置的值。
当数据集的个数为奇数时,中位数就是数据排序后的中间值;当数据集的个数为偶数时,中位数是中间两个数的平均值。
计算中位数的方法是将数据从小到大排序,然后找到中间位置的值。
3. 众数(Mode)众数是指一组数据中出现次数最多的数值。
一个数据集可能有一个或多个众数,也可能没有众数。
计算众数的方法是统计每个数值出现的频数,然后找到频数最大的数值。
二、数据的离散程度数据的离散程度是指一组数据的分散程度或波动程度。
常用的统计量有极差和标准差。
1. 极差(Range)极差是指一组数据的最大值与最小值之间的差值。
它是最简单的离散程度统计量,可以直观地反映数据的变化范围。
计算极差的方法是将最大值减去最小值。
2. 标准差(Standard Deviation)标准差是指一组数据偏离平均值的程度。
它通过计算每个数据与均值的差的平方,并求平均值来衡量数据的离散程度。
标准差越大,数据的离散程度越大。
计算标准差的方法包括计算均值、计算每个数据与均值的差的平方,并求平均值再开方。
三、应用举例现在我们来举两个实际问题的例子,通过计算集中趋势和离散程度的统计量来分析数据。
例1:小明的五次数学考试成绩分别是85、92、88、79和90,求这五次考试成绩的均值、中位数、众数、极差和标准差。
【个人精编】数据集中趋势和离散程度笔记
数据的集中趋势和离散程度笔记一、知识点梳理知识点1:表示数据集中趋势的代表平均数、众数、中位数都是描述一组数据集中趋势的特征数,只是描述的角度不同,其中平均数的应用最为广泛。
(1)平均数算术平均数(简称为平均数):121()n xx x x n(公式一)①一般地,如果在一组数据中,x 1出现f 1次,x 2出现f 2次,……,x k 出现f k 次,(f 1,f 2,…f k 为正整数),则这组数据的平均数:当n 个数据中某些数据反复出现时,用该公式较简洁; f 1+f 2+…+f k =n (数据的总个数)。
②一般地,如果一组数据都在某个数a 上下波动时,就可以采用把原来每个数据都减去a ,得一组新数据,再算得这组新数据的平均数'x ,这样原来数据的平均数是:x =a +'x (公式三)平均数定义公式和两个简化计算公式都很重要,应根据具体情况,恰当选用。
特别的:一组数据x 1,x 2,…,x n 的平均数为x ,①若每个数据都扩大a 倍,即ax 1,ax 2,…,ax n ,则平均数也扩大a 倍,即a x ; ②若每个数据都增加b ,即x 1+b ,x 2+b ,…,x n +b ,则平均数增加b ,即x +b ; ③若每个数据都扩大a 倍后又都增加b ,则平均数也扩大a 倍后增加b ,即a x +b . 当数据组中数据较大又在某个数值左右波动或数据之间存在某种倍数关系时,利用这些规律求平均数比较直接、简便。
加权平均数在计算数据的平均数时,往往根据其重要程度,分别给每个数据一个“权”,由此求出平均数叫做加权平均数。
恒量各个数据“重要程度”的数值叫做权。
相同数据的个数叫做权,这个“权”含有所占分量轻重的意思。
ω1越大,表示x 1的个数越多,于是x 1的“权”就越重。
若n 个数x 1,x 2,…,x n 的权是分别是ω1,ω2,…,ωn ,则x =nnn x x x ωωωωωω++++++ 212211① 当ω1=ω2=…=ωn ,即各项的权相等时,加权平均数就是算术平均数。
数据的集中趋势与离散程度
数据的集中趋势与离散程度数据在现代社会中扮演着重要的角色,它们不仅可以揭示事物的本质和规律,还可以为决策提供支持。
在数据分析中,我们经常会关注数据的集中趋势和离散程度,这些指标能够帮助我们更好地理解数据的特征和分布。
本文将探讨数据的集中趋势和离散程度,并介绍一些常用的统计量和方法。
一、集中趋势集中趋势是描述数据分布中心位置的指标,它能够反映数据的平均水平。
常见的集中趋势统计量有均值、中位数和众数。
均值是数据的算术平均值,它是将所有数据相加后再除以数据个数得到的结果。
均值能够反映数据的总体水平,但受极端值的影响较大。
例如,一个班级的学生年龄平均值是15岁,但如果班级中有一个20岁的学生,那么平均值就会被拉高。
因此,在计算均值时需要注意数据的分布情况。
中位数是将数据按大小顺序排列后,位于中间位置的数值。
中位数能够较好地反映数据的中心位置,不受极端值的影响。
例如,一个班级的学生年龄中位数是14岁,即有一半学生的年龄小于等于14岁,另一半学生的年龄大于等于14岁。
众数是数据中出现次数最多的数值。
众数能够反映数据中的典型值,但可能存在多个众数或无众数的情况。
例如,一个班级的学生身高众数是160cm,即身高为160cm的学生最多。
二、离散程度离散程度是描述数据分布的分散程度的指标,它能够反映数据的波动情况。
常见的离散程度统计量有范围、方差和标准差。
范围是数据的最大值与最小值之间的差异。
范围能够简单地反映数据的离散程度,但容易受极端值的影响。
例如,一个班级的学生成绩范围是60分到100分,范围为40分,但如果有一个学生得了0分或者满分150分,范围就会变得不够准确。
方差是数据与均值之间差异的平方的平均值。
方差能够较好地反映数据的离散程度,但计算过程较为繁琐。
方差越大,数据的离散程度越高。
例如,一个班级的学生成绩方差为100,说明学生成绩波动较大。
标准差是方差的平方根,它与方差具有相同的度量单位。
标准差能够在方差的基础上更好地理解数据的离散程度。
数据的集中趋势和离散程度知识点
数据的集中趋势和离散程度知识点文章一:《啥是数据的集中趋势?》朋友们,咱今天来聊聊数据的集中趋势。
比如说,咱班这次考试的成绩。
要是大部分同学都考了 80 分左右,那 80 分就可能是这个成绩数据的集中趋势。
再比如,咱去菜市场买菜。
一堆苹果,大多数都在半斤左右,那半斤就是这堆苹果重量数据的集中趋势。
像平均数、中位数和众数,都是能帮咱找到数据集中趋势的好帮手。
就拿平均数来说,一家人一个月的水电费,把所有费用加起来除以天数,得到的那个数就是平均数,能大概反映出这家人每天用水电的平均情况。
数据的集中趋势能让咱一下子就明白一堆数据的中心在哪儿,是不是挺有用?文章二:《走进数据的集中趋势》亲爱的小伙伴们,今天咱们来探索一下数据的集中趋势。
想象一下,学校运动会上,大家跑步的时间。
如果很多同学都在2 分钟左右跑完,那 2 分钟差不多就是跑步时间这个数据的集中趋势啦。
还有,大家一起收集树叶,看看树叶的大小。
要是多数树叶的面积都差不多,那这个差不多的大小就是树叶面积数据的集中趋势。
咱举个例子哈,一个班级同学的身高,把所有人的身高加起来除以人数,得到的那个数就是平均身高。
这个平均身高就能让咱知道这个班同学大概的身高水平。
再比如说,一组数字 3、5、5、7、8,这里面 5 出现的次数最多,那 5 就是众数,也是这组数据的集中趋势之一。
所以说,了解数据的集中趋势能帮咱快速抓住重点,是不是很有意思?文章三:《数据的集中趋势,你懂了吗?》朋友们好呀!今天咱们要说的数据的集中趋势,其实不难理解。
比如说,咱们去超市买零食,看各种零食的价格。
要是大部分零食都在 5 块钱左右,那 5 块钱就是这些价格数据的集中趋势。
再比如,咱们统计一个月里每天的气温。
如果有好多天的气温都在 25 度上下,那 25 度就可能是这个气温数据的集中趋势。
就拿咱班同学的零花钱来说吧,把大家的零花钱都加起来,再除以人数,算出来的那个数就是平均零花钱。
通过这个平均零花钱,咱能大概知道同学们零花钱的一般情况。
第三章 数据的集中趋势和离散程度小结与思考
第三章 数据的集中趋势和离散程度小结与思考一、基础知识:1、平均数:如果有n 个数x 1,x 2,…,x n,那么:=x 叫做这n 个数的 ,简称为 .2、中位数: 一般地,将一组数据按 顺序排列,如果数据的个数是奇数,那么处于 位置的数叫做这组数据的中位数;如果数据的个数是偶数,那么处于 位置的 数的 叫做这组数据的中位数.3、众数:一组数据中出现次数最 的数据叫做这组数据的众数。
4、方差:用一组数据x 1,x 2,…,x n 与它们的平均数x 差的平方的平均数,即s =2 叫做这组数据的方差。
5、极差:一组数据的最 数与最 数的差叫做这组数据的极差。
二、经典例题:例1、在“感恩一日捐”捐赠活动中,某班40位同学捐款金额统计如下,则在这次活动中,该班同学捐款金额的平均数是 元.金额(元) 20 30 36 50 100 学生数(人) 3 7 5 15 10例2、某户家庭今年1-5月的用电量分别是:72,66,52,58,68,这组数据的中位数是( )A .52B .58C .66D .68例3、某校六个绿化小组一天植树的棵数如下:10 , 11 , 12 , 13 ,9 , x .若这组数据的平均数是11,则这组数据的众数是 。
例4、为了筹备班级初中毕业联欢会,班长对全班同学爱吃哪几种水果作了民意调查,那么最终买什么水果,下面的调查数据中最值得关注的是( )A 、平均数B 、加权平均数C 、中位数D 、众数例5、小明和小刚两人参加体育项目训练,近期的5次测试成绩如下表所示,谁的成绩比较稳定?为什么?测试次数 1 2 3 4 5 小明 13 14 13 12 13 小刚 1013161412nx x x n+⋯++21三、巩固练习:1、体育课上测量立定跳远,其中一组六个人的成绩(单位:米)分别是:1.0,1.3,2.2,2.0,1.8,1.6,则这组数据的中位数是 。
2、在50,20,50,30,50,25,35这组数据中,众数和中位数分别是( )A .50,20B .50,30C .50,35D .35,50 3、数据-2,-2,2,2 的中位数及方差分别是( )A.-2,-2B.2,2C.0,2D.0,44、已知一组数据为2、0、-1、3、-4,则这组数据的方差为 。
九上数数据的集中趋势和离散程度
数据的集中趋势和离散程度一、知识点梳理知识点1:表示数据集中趋势的代表平均数:一组数据的总和除以这组数据个数所得到的商叫这组数据的平均数。
中位数:将一组数据按大小顺序排列,处在最中间位置的一个数叫做这组数据的中位数。
众数:在一组数据中出现次数最多的数叫做这组数据的众数。
平均数、众数、中位数都是描述一组数据集中趋势的特征数,只是描述的角度不同,其中平均数的应用最为广泛。
知识点2:表示数据离散程度的代表极差的定义:一组数据中最大值与最小值的差,能反映这组数据的变化范围,我们就把这样的差叫做极差。
极差=最大值-最小值,一般来说,极差小,则说明数据的波动幅度小。
知识点3:方差的定义在一组数据x1,x2,…,x n中,各数据与它们的平均数差的平方,它们的平均数,即S2=来描述这组数据的离散程度,并把S2叫做这组数据的方差。
一组数据的方差越大,说明这组数据的离散程度越大;一组数据的方差越小,说明这组数据的离散程度越小。
知识点4:标准差方差的算术平方根,即用S=来描述这一组数据的离散程度,并把它叫做这组数据的标准差。
知识点5:方差与平均数的性质若x1,x2,…x n的方差是S2,平均数是,则有①x1+b,x2+b…x n+b的方差为S2,平均数是+b②ax1,ax2,…ax n的方差为a2s2,平均数是a③ax1+b,ax2+b,…ax n+b的方差为a2s2,平均数是a+b二、典型例题剖析1、数据5,7,8,8,9的众数是()A.5B.7C.8D.9【解析】一组数据中的众数是指出现次数最多的数,8出现次数最多。
【答案】选:C.【点评】此题考查的是众数的定义,属于基础题。
2、重庆农村医疗保险已经全面实施。
某县七个村中享受了住院医疗费用报销的人数分别为:20,24,27,28,31,34,38,则这组数据的中位数是___________解析:根据中位数的定义即可求出,答案:28点评:如果所给的数据没按大小顺序排列,第一步首先按大小顺序排列好,第二步,如果数据的个数是奇数个,中间的那位就是中位数,如果有偶数个,中间的两位的平均数是中位数。
数据的集中趋势与离散程度——知识讲解
数据的集中趋势与离散程度——知识讲解撰稿:杜少波 责编:张晓新【学习目标】1、掌握平均数、加权平均数的意义和求法,体会用样本平均数估计总体平均数的思想.2、了解中位数和众数的意义,掌握中位数的求法,并会找一组数据的众数.3、了解方差的意义及求法,体会用样本方差估计总体方差的思想,能用方差解决一些实际问题.4、从事收集、整理、描述和分析数据得出结论的统计活动,经历数据处理的基本过程,体验统计与生活的联系,感受统计在生活和生产中的作用. 【要点梳理】要点一、平均数和加权平均数 1.平均数一般地,如果有n 个数据123n x x x x 、、、…,那么,()1231n x x x x n⋅⋅⋅++++就是这组数据的算术平均数,简称平均数,用“x ”表示.即()1231n x x x x x n=⋅⋅⋅++++. 要点诠释:(1)平均数表示一组数据的“平均水平”,反映了一组数据的集中趋势.(2)平均数的大小与一组数据里的每个数据均有关系,其中任意一个数据的变动都会引起平均数的变动,所以平均数容易受到个别特殊值的影响. 2.加权平均数若数据1x 出现1f 次,2x 出现2f 次,3x 出现3f 次……k x 出现k f 次,这组数据的平均数为x ,则x =1122k k12kx f x f x f f f +f +++++……(其中1f +2f +…+k f =n ,k ≤n )在一组数据中,数据重复出现的次数f 叫做这个数据的权.按照上述方法求出的平均数,叫做加权平均数.数据的权能够反映数据的相对“重要程度”. 要点诠释:(1)k f 越大,表示k x 的个数越多,“权”就越重. “权”越重,对平均数的影响就越大.加权平均数的分母恰好为各权的和.(2)加权平均数实际上是算术平均数的另一种表现形式,是平均数的简便运算. 要点二、中位数和众数 1.中位数一般地,当一组数据按大小顺序排列后,位于正中间的一个数据(当数据的个数是奇数时)或正中间两个数据的平均数(当数据的个数是偶数时)叫做这组数据的中位数. 要点诠释:(1)一组数据的中位数是唯一的;一组数据的中位数不一定出现在这组数据中. (2)由一组数据的中位数可以知道中位数以上和以下数据各占一半. 2.众数一组数据中出现次数最多的数据叫做这组数据的众数. 要点诠释:(1)一组数据的众数一定出现在这组数据中;一组数据的众数可能不止一个. (2)众数是一组数据中出现次数最多的数据而不是数据出现的次数. 要点三、平均数、中位数与众数的联系与区别联系:平均数、众数、中位数都是反映数据集中趋势的统计量,能从不同的角度提供信息.区别:平均数能充分利用数据提供的信息,它的使用最为广泛,能刻画一组数据整体的平均状态,但不能反映个体性质,易受极端值的影响.中位数代表了这组数据数值大小的“中点”,不易受极端值影响,但不能充分利用所有数据的信息.众数反映一组数据中出现次数最多的数据.一组数据中,众数可能不止一个,也可能没有.总之,要根据具体问题来选择刻画一组数据的集中程度的统计量,选择的统计量要能够更客观地反映实际背景. 要点四、方差设一组数据是12,,n x x x …,,它们的平均数是x ,我们用()[]222212)(...)(1x x x x x x nS n -++-+-=来衡量这组数据的离散程度,并把它叫做这组数据的方差.一组数据的方差越大,说明这组数据的离散程度越大,越不稳定. 在两组数据的平均数相差较大时,以及在比较单位不同的两组数据时,不能直接用方差来比较它们的离散程度. 要点诠释:(1)方差反映的是一组数据偏离平均值的情况.方差越大,数据的波动越大;方差越小,数据的波动越小.(2)一组数据的每一个数都加上(或减去)同一个常数,所得的一组新数据的方差不变. (3)一组数据的每一个数据都变为原来的k 倍,则所得的一组新数据的方差变为原来的2k倍.要点五、用样本估计总体在考察总体的平均水平或方差时,往往都是通过抽取样本,用样本的平均水平或方差近似估计得到总体的平均水平或方差. 要点诠释:(1)如果总体数量太多,或者从总体中抽取个体的试验带有破坏性,都应该抽取样本.取样必须具有尽可能大的代表性.(2)用样本估计总体时,样本容量越大,样本对总体的估计也越精确.样本容量的确定既要考虑问题本身的需要,又要考虑实现的可能性所付出的代价. 【典型例题】类型一、平均数、众数和中位数1、某选手在青歌赛中的得分如下(单位:分):99.60,99.45,99.60,99.70,98.80,99.60,99.83,则这位选手得分的众数和中位数分别是( ) A .99.60,99.70 B .99.60,99.60 C .99.60,98.80 D .99.70,99.60 【思路点拨】根据众数和中位数的定义求解即可. 【答案】B ;【解析】解:数据99.60出现3次,次数最多,所以众数是99.60;数据按从小到大排列:99.45,99.60,99.60,99.60,99.70,99.80,99.83,中位数是99.60.故选B .【总结升华】本题考查了中位数,众数的意义.找中位数的时候一定要先排好顺序,然后再根据奇数和偶数个来确定中位数.如果数据有奇数个,则正中间的数字即为所求;如果是偶数个,则找中间两位数的平均数.众数是一组数据中出现次数最多的数据,注意众数可以不止一个. 举一反三:【高清课堂 数据的分析 例8】【变式1】若数据3.2,3.4,3.2,x ,3.9,3.7的中位数是3.5,则其众数是________,平均数是________. 【答案】3.2;3.5; 解:由题意3.43.5, 3.62x x +==,所以众数是3.2,平均数是3.5. 【变式2】某中学随机地调查了50名学生,了解他们一周在校的体育锻炼时间,结果如下表所示:则这50名学生这一周在校的平均体育锻炼时间是( ) A .6.2小时 B .6.4小时 C .6.5小时 D .7小时 【答案】B ;解:根据题意得:(5×10+6×15+7×20+8×5)÷50 =(50+90+140+40)÷50 =320÷50 =6.4(小时).故这50名学生这一周在校的平均体育锻炼时间是6.4小时. 类型二、利用平均数、众数、中位数解决问题2、某校欲招聘一名数学教师,学校对甲、乙、丙三位候选人进行了三项能力测试,各项测试成绩满分均为100分,根据结果择优录用.三位候选人的各项测试成绩如下表所示:测试项目 测试成绩甲 乙 丙 教学能力 85 73 73 科研能力 70 71 65 组织能力647284(2)根据实际需要,学校将教学、科研和组织三项能力测试得分按5:3:2的比例确定每人的成绩,谁将被录用,说明理由. 【思路点拨】(1)运用求平均数公式()1231n x x x x n⋅⋅⋅++++即可求出三人的平均成绩,比较得出结果;(2)将三人的成绩按比例求出测试成绩,比较得出结果. 【答案与解析】解:(1)甲的平均成绩为:(85+70+64)÷3=73,乙的平均成绩为:(73+71+72)÷3=72, 丙的平均成绩为:(73+65+84)÷3=74, ∴ 候选人丙将被录用.(2)甲的测试成绩为:(85×5+70×3+64×2)÷(5+3+2)=76.3,乙的测试成绩为:(73×5+71×3+72×2)÷(5+3+2)=72.2, 丙的测试成绩为:(73×5+65×3+84×2)÷(5+3+2)=72.8,∴ 候选人甲将被录用.【总结升华】5、3、2即各个数据的“权”,反映了各个数据在这组数据中的重要程度,按加权平均数来录用. 举一反三:【高清课堂 数据的分析 例10】【变式】小王在八年级第一学期的数学成绩分别为:测验一得89分,测验二得78分,测验三得85分,期中考试得90分,期末考试得87分,如果按照平时、期中、期末的10%、30%、60%量分,那么小王该学期的总评成绩应该为多少?【答案】解:小王平时测试的平均成绩897885843x ++==(分). 所以8410%9030%8760%87.610%30%60%⨯+⨯+⨯=++(分). 答:小王该学期的总评成绩应该为87.6分. 【高清课堂 数据的分析 例11】3、下表是七年级(2)班30名学生期中考试数学成绩表(已破损).已知该班学生期中考试数学成绩平均分是76分. (1)求该班80分和90分的人数分别是多少?(2)设此班30名学生成绩的众数为a ,中位数为b ,求a b +的值. 【答案与解析】解:(1)设该班得80分的有x 人,得90分的有y 人.根据题意和平均数的定义,得257330,763050260570780901003,x y x y +++++=⎧⎨⨯=⨯+⨯+⨯+++⨯⎩整理得13,89109,x y x y +=⎧⎨+=⎩ 解得8,5.x y =⎧⎨=⎩即该班得80分的有8人,得90分的有5人.(2)因为80分出现8次且出现次数最多.所以a =80,第15、16两个数均为80分,所以b =80,则a b +=80+80=160.【总结升华】本题为统计题,考查平均数、众数与中位数的意义.解题的关键是准确理解题意,建立等量关系. 举一反三:【变式】某教师为了对学生零花钱的使用进行教育指导,对全班50名学生每人一周内的零花钱数额进行了调查统计,并绘制了统计图表如图所示的统计图.零花钱数额(元) 5 10 15 20学生个数(个)a15 20 5请根据图表中的信息,回答以下问题.(1)求a的值;(2)求这50名学生每人一周内的零花钱额的众数和平均数.【答案】解:(1) a=50-15-20-5=10.(2)众数是15.平均数为150(5×10+10×15+15×20+20×5)=12.类型三、方差4.甲、乙两班举行汉字输入比赛,•参赛学生每分钟输入汉字的个数经统计计算后,填入下表:班级参加人数中位数方差平均字数甲 55 149 191 135乙 55 151 110 135(1)甲、乙两班学生成绩的平均水平相同;(2)乙班优秀的人数多于甲班优秀的人数(每分钟输入汉字150个为优秀)(3)甲班学生成绩的波动情况比乙班成绩波动大.A.(1)(2) B.(1)(2)(3) C.(2)(3) D.(1)(3)【思路点拨】理清表格中所列数据代表的含义,以及数据差异而导致的不同.【答案】B【解析】甲、乙两班学生的平均字数都是135个/分钟,所以平均水平相同;从中位数上看,乙班的151大于甲班的149,表明乙班优秀的人数多于甲班优秀的人数;从方差上看,甲班的方差大于乙班的方差,所以甲班学生成绩的波动情况比乙班成绩波动大.因此,(1)(2)(3)都正确,选B.【总结升华】此类题关键是要能从表格中筛选出所需要的信息,理解每个数据所代表的含义. 举一反三:【变式】甲、乙两人各射击6次,甲所中的环数是8,5,5,A,B,C, 且甲所中的环数的平均数是6,众数是8;乙所中的环数的平均数是6,方差是4.根据以上数据,对甲、乙射击成绩的正确判断是()A.甲射击成绩比乙稳定 B.乙射击成绩比甲稳定C .甲、乙射击成绩稳定性相同D .甲、乙射击成绩稳定性无法比较 【答案】B.类型四、用样本估计总体5、我国是世界上严重缺水的国家之一.为了倡导“节约用水从我做起”,小刚在他所在班的50名同学中,随机调查了10名同学家庭中一年的月均用水量(单位:t),并将调查结果绘成了如图所示的条形统计图.(1)求这10个样本数据的平均数、众数和中位数;(2)根据样本数据,估计小刚所在班50名同学家庭中月均用水量不超过7t 的约有多少户.【思路点拨】(1)根据条形统计图,即可知道每一名同学家庭中一年的月均用水量.再根据加权平均数的计算方法、中位数和众数的概念进行求解;(2)首先计算样本中家庭月均用水量不超过7t 的用户所占的百分比,再进一步估计总体. 【答案与解析】解:(1)观察条形图,可知这组样本数据的平均数是62 6.54717.52816.810x ⨯+⨯+⨯+⨯+⨯==.∴ 这组样本数据的平均数为6.8.∴ 在这组样本数据中,6.5出现了4次,出现的次数最多. ∴ 这组数据的众数是6.5.∵ 将这组样本数据按从小到大的顺序排列,其中处于中间的两个数都是 6.5,有6.5 6.56.52+=. ∴ 这组数据的中位数是6.5.(2)∵ 10户中月均用水量不超过7t 的有7户,有7503510⨯=. ∴ 根据样本数据,可以估计出小刚所在班50名同学家庭中月均用水量不超过7t 的约有35户.【总结升华】本题考查的是条形统计图的运用.读懂统计图,从统计图中得到必要的信息是解决问题的关键.条形统计图能清楚地表示出每个项目的数据.掌握平均数、中位数和众数的计算方法.6. 从甲、乙两种玉米苗中各抽10株,分别测得它们的株高如下:(单位:cm ) 甲: 21 42 39 14 19 22 37 41 40 25 乙: 27 16 40 41 16 44 40 40 27 44 (1)根据以上数据分别求甲、乙两种玉米的方差.(2)哪种玉米的苗长得高些? (3)哪种玉米的苗长得齐?【思路点拨】本题考察方差的定义.熟记方差的计算公式是解决问题的关键. 【答案与解析】解:(1)甲的平均值:)()(甲cm x 3025404137221914394221101=+++++++++= 乙的平均值:甲的方差:)(2.10410)3025()3042()3021(22222cm S =-++-+-=甲, 乙的方差:)(8.12810)3144()3116()3127(22222cm S =-++-+-=乙(2)因为甲种玉米的平均高度小于乙种玉米的平均高度,所以乙种玉米的苗长的高. (3)因为22S S 甲乙<,所以甲种玉米的苗长得整齐.【总结升华】本题既是一道与方差计算有关的问题,又是利用方差解决实际问题的一道题目,关键是理解和掌握方差的计算公式. 举一反三: 【变式】为了比较甲、乙两种水稻的长势,农技人员从两块试验田中,分别随机抽取5棵植株,将测得的苗高数据绘制成下图:请你根据统计图所提供的数据,计算平均数和方差,并比较两种水稻的长势. 【答案】5.8 5.2x x ==乙甲∵,,∴甲种水稻比乙种水稻长得更高一些.222.160.56S S ==乙甲∵,,∴乙种水稻比甲种水稻长得更整齐一些.植株编号 1 2 3 4 5甲种苗高 7 5 4 5 8乙种苗高 6 4 5 6 5。
数据集中趋势与数据离散程度的数值描述(ppt 92页)
频率(%)
Extremes (>=64)
105~110 3 6 不必要的三维效果:三维图形可能比二维图形更能吸引读者的注意,但只能用来反映变化的趋势,不能用来进行精确的比较。
虽然经理人员收入的绝对离散程度远远大于工人,但经理人员收入的相对离散程度小于工人。
110~115 5 例如某学院2008年毕业研究生毕业时发表论文篇数的频数分布表(右表)。
4
8
合计
50
100
中央财经大学统计学院2010
11
11
等距分组表(上下组限重叠,上组限不在内)
4、反复加工和修改是获得优秀统某计图车形的间重要5步0骤名。 工人日加工零件数分组表
根据原始数据计算中位数
按零件数分组 频数(人) 中央财经大学统计学院2010
82
常用测度指标包括极差,四分位距,方差和标准差,离散系数等
4
4
频数分布举例
成绩 人数
频率
两个构成要素:
各组的分组界限 每组中的次数或频率 通过频数分布表可以发 现数据分布的特征。
60以下 3
60-70
8
70-80 12
80-90 15
90以上 4
7.14% 19.05% 28.57% 35.71%
9.52%
合计
42 100.00%
频数(frequency) :每个组中的数据个数,也
列联表中的数字为交叉单元格中的频数或频率。
以列联表为基础可以对两个变量之间的关系进行 多种统计检验。
中央财经大学统计学院2010
14
14
列联表举例
市场营销专业的男生有10人。
市场营销专业 统计学专业
男生
第06讲数据的集中趋势和离散程度(6大考点)(原卷版)
第06讲数据的集中趋势和离散程度(6大考点)考点考向一.算术平均数(1)平均数是指在一组数据中所有数据之和再除以数据的个数.它是反映数据集中趋势的一项指标.(2)算术平均数:对于n个数x1,x2,…,x n ,则=(x1+x2+…+x n)就叫做这n个数的算术平均数.(3)算术平均数是加权平均数的一种特殊情况,加权平均数包含算术平均数,当加权平均数中的权相等时,就是算术平均数.二.加权平均数(1)加权平均数:若n个数x1,x2,x3,…,x n的权分别是w1,w2,w3,…,w n,则x1w1+x2w2+…+xnwnw1+w2+…+wn叫做这n个数的加权平均数.(2)权的表现形式,一种是比的形式,如4:3:2,另一种是百分比的形式,如创新占50%,综合知识占30%,语言占20%,权的大小直接影响结果.(3)数据的权能够反映数据的相对“重要程度”,要突出某个数据,只需要给它较大的“权”,权的差异对结果会产生直接的影响.(4)对于一组不同权重的数据,加权平均数更能反映数据的真实信息.三.计算器平均数(1)如果是普通计算器,那么只能把所有的数字相加,然后除以数字的个数.(2)如果是科学记算器,那么可以用如下方法:①调整计算器的模式为STAT模式.②依次输入数据,每次输入数据后按DATA键确认数据的输入.③输入完毕后,按x¯键,即可获得平均数了.(3)由于计算器的型号不同,可以按照说明书中的方法进行操作.四.中位数(1)中位数:将一组数据按照从小到大(或从大到小)的顺序排列,如果数据的个数是奇数,则处于中间位置的数就是这组数据的中位数.如果这组数据的个数是偶数,则中间两个数据的平均数就是这组数据的中位数.(2)中位数代表了这组数据值大小的“中点”,不易受极端值影响,但不能充分利用所有数据的信息.(3)中位数仅与数据的排列位置有关,某些数据的移动对中位数没有影响,中位数可能出现在所给数据中也可能不在所给的数据中出现,当一组数据中的个别数据变动较大时,可用中位数描述其趋势.五.众数(1)一组数据中出现次数最多的数据叫做众数.(2)求一组数据的众数的方法:找出频数最多的那个数据,若几个数据频数都是最多且相同,此时众数就是这多个数据.(3)众数不易受数据中极端值的影响.众数也是数据的一种代表数,反映了一组数据的集中程度,众数可作为描述一组数据集中趋势的量..六.方差(1)方差:一组数据中各数据与它们的平均数的差的平方的平均数,叫做这组数据的方差.(2)用“先平均,再求差,然后平方,最后再平均”得到的结果表示一组数据偏离平均值的情况,这个结果叫方差,通常用s2来表示,计算公式是:s2=[(x1﹣)2+(x2﹣)2+…+(x n ﹣)2](可简单记忆为“方差等于差方的平均数”)(3)方差是反映一组数据的波动大小的一个量.方差越大,则平均值的离散程度越大,稳定性也越小;反之,则它与其平均值的离散程度越小,稳定性越好.考点精讲一.算术平均数(共3小题)1.(2022•泗阳县一模)若a、b、c的平均数为7,则a+1、b+2、c+3的平均数为()A.7B.8C.9D.102.(2022•淮安)一组数据3、﹣2、4、1、4的平均数是.3.(2022•张家港市一模)对于三个数a,b,c用M{a,b,c}表示a ,b,c这三个数的平均数,用min{a,b,c}表示a,b,c这三个数中最小的数.例如:M{﹣1,2,3}==,min{﹣1,2,3}=﹣1.(1)若M{x﹣1,﹣5,2x+3}=(1+3x),求x的值;(2)是否存在一个x的值,使得M{2x,2﹣x,3}=×min{﹣1,0,4x+1),若存在,请求出x的值;若不存在,请说明理由.二.加权平均数(共2小题)4.(2022•如皋市二模)小林参加学校举办的“五四最美少年”主题演讲比赛,他的演讲资料、语言表达、形象风度、综合印象得分分别为85分,70分,80分,80分.若学校将上面的四项依次按照40%,40%,10%,10%的占比计算总成绩(百分制),则小林的总成绩是()A.80分B.79分C.78分D.77分5.(2022•邳州市一模)3月14日是国际数学节,为迎接数学节,某学校3月份举办“数学嘉年华之手抄报评比活动”,对甲、乙、丙、丁四组候选作品进行量化评分,具体成绩(百分制)如下表,如果按照创新性占60%,丰富性占40%计算总成绩,并根据总成绩择优推荐,那么应推荐的作品是()项目作品甲乙丙丁创新性90959090丰富性90909585A.甲B.乙C.丙D.丁三.计算器平均数(共1小题)6.(2020•海门市校级模拟)某同学使用计算器求30个数据的平均数时,错将其中一个数据75输入为15,那么所求出的平均数与实际平均数的差是()A.2.5B.2C.1D.﹣2四.中位数(共4小题)7.(2022•宿豫区二模)已知一组数据:1、4、2、3、4,这组数据的中位数是()A.1B.2C.3D.48.(2022•泗洪县三模)某市三月份连续7天的最高气温依次是:18,15,16,15,16,18.19(单位:℃),则这组数据的中位数是()A.19B.18C.17D.169.(2022秋•兴化市月考)随机抽取某小吃店一周的营业额(单位:元)如下表:星期一星期二星期三星期四星期五星期六星期日54068064064078011101070(1)分析数据,填空:这组数据的平均数是元,中位数是元.(2)估计一个月的营业额(按30天计算);①星期一到星期五营业额相差不大,用这5天的平均数估算合适么:.(填“合适”或“不合适”)②选择一个你认为最合适的数据估算这个小吃店一个月的营业额.10.(2022•丰县二模)某校将学生体质健康测试成绩分为A、B、C、D四个等级,对应分数分别为4分、3分、2分、1分.为了解学生整体体质健康状况,拟抽样120人进行统计分析.(1)以下是三种抽样方案:甲方案:随机抽取七年级男、女生各60人的体质健康测试成绩.乙方案:随机抽取七、八、九年级男生各40人的体质健康测试成绩.丙方案:随机抽取七、八、九年级男生、女生各20人的体质健康测试成绩.你认为较为合理的是方案(选填甲、乙、丙);(2)按照合理的抽样方案,将随机抽取的测试成绩整理并绘制成如图统计图.①这组数据的中位数是分;②请求出这组数据的平均数;③小明的体质健康测试成绩是C等级,请你结合以上数据,对小明的体质健康状况做出评价,并给出一条合理的建议.五.众数(共4小题)11.(2022春•宿豫区期中)已知一组数据:14、16、15、16、17,这组数据的众数是()A.14B.15C.16D.1712.(2022•南通)为了了解八年级学生本学期参加社会实践活动的天数情况,A,B两个县区分别随机抽查了200名八年级学生,根据调查结果绘制了统计图表,部分图表如下:A,B两个县区的统计表平均数众数中位数A县区 3.8533B县区 3.854 2.5(1)若A县区八年级共有约5000名学生,估计该县区八年级学生参加社会实践活动不少于3天的学生约为名;(2)请对A,B两个县区八年级学生参加社会实践活动的天数情况进行比较,作出判断,并说明理由.13.(2022•徐州)如图,下列装在相同的透明密封盒内的古钱币,其密封盒上分别标有古钱币的尺寸及质量,例如:钱币“文星高照”密封盒上所标“45.4*2.8mm,24.4g”是指该枚古钱币的直径为45.4mm,厚度为2.8mm,质量为24.4g.已知这些古钱币的材质相同.根据图中信息,解决下列问题.(1)这5枚古钱币,所标直径的平均数是mm,所标厚度的众数是mm,所标质量的中位数是g;(2)由于古钱币无法从密封盒内取出,为判断密封盒上所标古钱币的质量是否有错,桐桐用电子秤测得每枚古钱币与其密封盒的总质量如下:名称文星高照状元及第鹿鹤同春顺风大吉连中三元总质量/g58.758.155.254.355.8盒标质量24.424.013.020.021.7盒子质量34.334.142.234.334.1请你应用所学的统计知识,判断哪枚古钱币所标的质量与实际质量差异较大,并计算该枚古钱币的实际质量约为多少克.14.(2022•钟楼区校级模拟)2022年3月,新冠疫情突袭常州,社会各界众志成城,共同抗疫.严酷战疫中,我们又一次感受到祖国的强大,口罩也成为人们防护防疫的必备武器.钟楼区某药店有2500枚口罩准备出售,从中随机抽取了一部分口罩,根据它们的价格(单位:元),绘制出如图的统计图.请根据相关信息,解答下列问题:(1)图①中m的值为;(2)统计的这组数据的平均数为,众数为,中位数为;(3)根据样本数据,估计这2500枚口罩中,价格为2.0元的约有为多少枚?六.方差(共5小题)15.(2022秋•盐都区月考)某班学期末对考核成绩进行统计,结果显示甲、乙两组的平均成绩相同,但S甲2<S乙2,则考核成绩比较稳定的是()A.甲组B.乙组C.甲、乙两组一样稳定D.无法确定16.(2022秋•兴化市月考)甲、乙、丙、丁四人进行射击测试,每人10次射击成绩的平均数都为9.0环,方差分别为s甲2=0.63,s乙2=0.51,s丙2=0.42,s丁2=0.48,则四人中成绩最稳定的是()A.甲B.乙C.丙D.丁17.(2022•江都区二模)某信息咨询机构从A和B两家外卖快送公司分别抽取了20名骑手的月收入进行了一项抽样调查,骑手的月收入(单位:千元)如图所示:根据以上信息,整理分析数据如下:(1)完成表格填空;平均月收入/千元中位数/千元众数/千元方差/千元2A公司①6③ 1.2B公司 5.5②5④(2)根据以上数据,若小张想从这两家外卖快送公司中选择一家应聘骑手,你会推荐哪家公司,请说明理由.18.(2022•崇川区一模)为让全校学生牢固树立爱国爱党的崇高信念,某校近期开展了形式多样的党史学习教育活动.在党史知识竞赛中,八、九年级各有300名学生参加,现随机抽取两个年级各20名学生的成绩进行整理分析,得到如表信息:a.表1九年级20名学生的成绩(百分制)统计表8280979194727191857094789275979291928398b.表2九年级抽取的20名学生成绩的平均数、中位数、方差统计表年级平均数中位数方差九年级86a86.3 c.随机抽取八年级20名学生的成绩的中位数为88,方差为83.2,且八、九两个年级抽取的这40名学生成绩的平均数是84.5.请根据以上信息,回答下列问题:(1)在表2中,a的值等于;(2)求八年级这20名学生成绩的平均数;(3)你认为哪个年级的成绩较好?试从两个不同的角度说明推断的合理性.19.(2022•海门市二模)峰峰老师为了解所教1班、2班同学们(各有40名学生)的经典文化知识掌握情况,从两个班级中各随机抽取10名学生进行了检测,成绩(百分制)如下:1班:79,85,73,80,75,59,87,70,75,97.2班:92,45,80,82,72,81,94,83,70,81.峰峰老师的简要分析:平均分众数中位数方差1班7875779642班7881811704请你解决以下问题:(1)若对这两个班级的所有学生都进行检测,估计这两个班级内成绩为优秀(不少于80分)的学生一共有多少人?(2)比较这两个班级的经典文化知识掌握情况,哪个班级更好些?并说明理由(至少从两个不同的角度比较).巩固提升一、单选题1.(2021·沭阳县怀文中学)已知一组数据85,80,x,90的平均数是85,那么x等于()A.80B.85C.90D.952.(2021·江苏苏州·)为增强学生的环保意识,共建绿色文明校园.某学校组织“废纸宝宝旅行记”活动.经统计,七年级5个班级一周回收废纸情况如下表;班级一班二班三班四班五班废纸重量(kg) 4.5 4.4 5.1 3.3 5.7则每个班级回收废纸的平均重量为()A.5kg B.4.8kg C.4.6kg D.4.5kg3.(2021·江苏盐城市·景山中学九年级月考)截止2021年3月,“费尔兹奖”得主中最年轻的8位数学家获奖时的年龄分别为:29,27,31,31,31,29,29,31,则由年龄组成的这组数据的众数是()A.27 B.29 C.30 D.314.(2021·连云港市新海实验中学九年级)小明对居住在某小区的50名成年人一周的体育锻炼时间进行了统计,并绘制成如图所示的条形统计图,这组数据的众数和中位数分别是()A.6,4 B.6,6 C.4,4 D.4,65.(2021·连云港市新海实验中学)某校九(1)班语文课代表统计了去年1~8月“我爱读书”活动中全班同学的课外阅读数量(单位:本),绘制了如图折线统计图,在这组课外阅读数量的数据中,中位数和众数分别是()A.53,56 B.53,63 C.56,56 D.56,636.(2021·连云港市新海实验中学)我校开展了“好书伴我成长”读书活动,为了解5月份九年级学生的读书情况,随机调查了九年级50名学生读书的册数,统计数据如下表所示,下列说法正确的是()册数0 1 2 3 4人数 4 12 16 17 1A .众数是17B .中位数是2C .平均数是2D .方差是2二、填空题 7.(2021·江苏九年级)已知一组数据:1,3,a ,8,10的平均数是5,则a =___.8.(2020·江苏九年级期末)在本赛季CBA 比赛中,某运动员最后六场的得分情况如下:17,15,21,28,12,19,则这组数据的极差为_______.9.下列数据1,3,5,5,6,2的极差是______.10.(2021·江苏镇江·)一组数据2,3,1,6,3的平均数为_____.11.(2021·江苏)一组数据1x 、2x 、…、n x 的方差是0.8,则另一组数据11x +、21x +、…、1n x +的方差是________.三、解答题12.(2021·苏州市吴江区青云中学九年级月考)保障房建设是民心工程.某市从2008年开始加快保障房建设进程.现统计了该市2008年到2012年这5年新建保障房情况,绘制成如图所示的折线统计图和不完整的条形统计图.(1)小丽看了统计图后说:“该市2011年新建保障房的套数比2010年少了.”你认为小丽的说法正确吗?请说明理由;(2)请补全条形统计图;(3)求这5年平均每年新建保障房的套数.13.(2021·江苏镇江·九年级)学校组织学生参加科普知识问答竞赛,每班抽25名同学参加比赛,成绩分别为A ,B ,C ,D 四个等级,其中相应等级的得分依次记为100分、90分、80分、70分,学校将八年级一班和二班的成绩整理并绘成统计图,如图所示:(1)将一班竞赛成绩统计图补充完整;(2)求出二班竞赛成绩的平均数;(3)若八一班共有40人,请根据本次调查结果,估计八一班得分在80分以上(含80分)的人数.14.(2021·江苏)下表是某地某个月中午12时的气温(单位:℃)的统计数据.某地某个月中午12时的气温频数分布表组别气温分组频数方法指导数据分组后,一个小组的组中值是指这个小组的两个端点的数的平均数,例如:第1小组1216x ≤<的组中值为1216142+=.根据频数分布表求加权平均数时,统计中常用各组的组中值代表各组的实际数据,把各组的频数看作相应组中值的权.根据统计的数据,回答下列问题:(1)该地该月中午12时的气温的中位数落在第_________组内;(2)求该地该月中午12时的平均气温.15.(2021·仪征市实验初中九年级月考)国家规定“中小学生每天在校体育活动时间不低于1小时”,为了解学生参加体育活动的情况,调查了某校八年级甲、乙两班学生每天参加体育锻炼的时间,并将调查结果制成如下的频数分布表和频数分布直方图(数据包括左端点不包括右端点).甲班学生每天参加体育活动时间频数分布表分组(单位: h)频数t≤< 200.5t≤<100.51t≤<141 1.5t≤<121.52t≤< 22 2.5请你根据图表所提供的信息解答下列问题:(1)如果每天在校体育活动时间不低于1小时为“达标”,求甲班学生每天在校体育活动时间的达标率;(2)乙班学生每天参加体育活动时间的中位数落在哪一组?(3)请选择一个适当的统计量,对甲、乙两班学生每天参加体育活动的时间进行评价.16.(2021·江苏玄武区·九年级期中)某校举办了一次题为“致敬最美逆行者”的演讲比赛.甲、乙两组学生成绩分布的折线统计图如图(学生成绩均为整数):(1)根据以上信息,填空:组别平均数/分中位数/分方差/分2甲7 2.8乙7(2)如果学校准备选派其中一组参加区级比赛,你认为选派哪一组参赛更好?为什么?17.(2021·江苏)2020年12月4日是第七个国家宪法日,也是第三个“宪法宣传周”.甲、乙两班各选派5名学生参加学校宪法知识竞赛(满分100分),成绩如下:甲班:96,92,94,97,96;乙班:90,98,97,98,92.通过数据分析,列表如下:(1)a=________,b=________,c=________;(2)如果要从这两个班中选择一个班的学生代表学校参加市宪法知识竞赛,你认为选哪个班的学生更合适?为什么?18.(2021·江苏泰州中学附属初中九年级)某校组建了射击兴趣小组,甲、乙两人连续8次射击成绩如下列图、表所示(统计图中乙的第8次射击成绩缺失).甲、乙两人连续8次射击成绩统计表平均成绩(环)中位数(环)方差(2环)甲_______ 7.5 _______乙 6 _______ 3.5(1)补全统计图和统计表;(2)如果你是教练,要从甲、乙两人中选一位参加比赛,你会选谁?写出你这样选择的2条理由.19.(2021·江苏徐州市·中考真题)某市近年参加初中学业水平考试的人数(以下简称“中考人数”)的情况如图所示.根据图中信息,解决下列问题:(1)这11年间,该市中考人数的中位数是______________万人;(2)与上年相比,该市中考人数增加最多的年份是____________年;(3)下列选项中,与该市2022年中考人数最有可能接近的是()A. 12.8万人;B. 14.0万人;C. 15.3万人(4)2019年上半年,该市七、八、九三个年级的学生总数约为()A. 23.1万人;B. 28.1万人;C. 34.4万人(5)该市2019年上半年七、八、九三个年级的数学教师共有4000人,若保持数学教师与学生的人数之比不变,根据(3)(4)的结论,该市2020年上半年七、八、九三个年级的数学教师较上年同期增加多少人(结果取整数)?20.(2021·江苏南通·中考真题)某农业科技部门为了解甲、乙两种新品西瓜的品质(大小、甜度等),进行了抽样调查.在相同条件下,随机抽取了两种西瓜各7份样品,对西瓜的品质进行评分(百分制),并对数据进行收集、整理,下面给出两种西瓜得分的统计图表.甲、乙两种西瓜得分表序号 1 2 3 4 5 6 7甲种西瓜(分)75 85 86 88 90 96 96乙种西瓜(分)80 83 87 90 90 92 94甲、乙两种西瓜得分统计表平均数中位数众数甲种西瓜88 a 96乙种西瓜88 90 b(1)a=___________,b=___________;(2)从方差的角度看,___________种西瓜的得分较稳定(填“甲”或“乙”);(3)小明认为甲种西瓜的品质较好些,小军认为乙种西瓜的品质较好些.请结合统计图表中的信息分别写出他们的理由.。
数据的集中趋势及离散分析总结性讲义
一对一
(2)根据实际需要,公司将创新、综合知识、语言三项测试得分按 4︰3︰1 的比例确定各人的测试成绩,此时谁将被 录用? 测试项目 创新 综合知识 语言 测试成绩 甲 72 50 88 乙 85 74 45 丙 67 70 67
点评:从本例应体会到“权”的差异对结果的影响,认识到“权”的重要性,从中也认识到算术平均数与加权平均数 的区别. 例 3、某水果店有 200 个菠萝,原计划以 2.6 元/千克的价格出售,现在为了满足市场的需要,水果店决定将所有的菠 萝去皮后出售.以下是随机抽取的 5 个菠萝去皮前、后相应的质量统计表(单位:千克): 去皮前各菠萝的质量 去皮后各菠萝的质量 1.0 0.6 1.1 0.7 1.4 0.9 1.2 0.8 1.3 0.9
课外拓展
下表显示了今年夏天某地进行钓鱼比赛的部分结果,这个表记录了钓到 n 条鱼的选手数: n 钓到 n 条鱼的人数 0 9 1 5 2 7 3 23 „ „ 13 5 14 2 15 1
在赛事新闻中报道了: (1)冠军钓到 15 条鱼; (2)钓到 3 条或更多条鱼的所有选手平均钓到 6 条鱼; (3)钓到 12 条或更少条鱼的所有选手平均钓到 5 条鱼; 问:在整个比赛中共钓到多少条鱼? 分析:关键是求出表中未列出的人数和钓到的鱼的数量.
2
) B.3 C.0.5 D.-3 )
6.一组数据的方差为 S ,将该数据每一个数据,都乘 2,所得到一组新数据的方差是(
S2 A. 2
B.S
2
C.2 S
2
D.4 S
2
7.已知一组数据:-1,x,0,1,-2 的平均数是 0,那么,这组数据的方差是( A. 2 8.下列说法中,错误的有 B.2 ( C.4 )
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据的集中趋势和离散程度【知识点1】正确理解平均数、众数和中位数的概念一、平均数:平均数是反映一组数据的平均水平的特征数,反映一组数据的集中趋势.平均数的大小与一组数据里的每一个数据都有关系,任何一个数据的变化都会引起平均数的变化.例1:有四个数每次取三个数,算出它们的平均数再加上另一个数,用这种方法计算了四次,分别得到以下四个数:86, 92, 100, 106,那么原4个数的平均数是________ .例2:有几位同学参加语文考试,赵峰的得分如果再提高13分,他们的平均分就达到90分,如果赵峰的得分降低5分,他们的平均分就只得87分,那么这些同学共有________人.例3:有5个数,其平均数为138,按从小到大排列,从小端开始前3个数的平均数为127,从大端开始顺次取出3个数,其平均数为148,则第三个数是_______ .例4:某5个数的平均值为60,若把其中一个数改为80,平均值为70,这个数是________ .例5:A、B、C、D四个数,每次去掉一个数,将其余下的三个数求平均数,这样计算了4次,得到下面4个数.23, 26, 30, 33 A、B、C、D 4个数的平均数是多少例6:有5个抽屉,分别有图书33本、42本、20本、53本和32本,平均每个抽屉里有图书多少本?例7:小明参加了四次数学测验,平均成绩是88分,他想再通过一次数学测验将五次的平均成绩提高到最少90分,那么在下次测验中,至少要得多少分?例8:四个数的平均值是30,若把其中一个改为50,平均值就变为40,这个数原来是多少?例9:有甲、乙、丙三个数,甲数和乙数的平均数是42,甲数和丙数的平均数是46,乙数和丙数的平均数是47,求甲、乙、丙三个数各是多少?例10:某人沿一条长为12千M的路上山,又从原路返回,上山的速度是2千M/小时,下山的速度是6千M/小时。
那么,他在上山和下山的全过程当中的平均速度是多少千M每小时?例11:若不选择教材中的引入问题,也可以替换成更贴近学生学习生活中的实例,下举一例可供借鉴参考。
某校初二年级共有4个班,在一次数学考试中参考人数和成绩如下:求该校初二年级在这次数学考试中的平均成绩?二、众数:在一组数据中出现次数最多的数据叫做这一组数据的众数.一组数据中的众数有时不唯一.众数着眼于对各数出现的次数的考察,这就告诉我们在求一组数据的众数时,既不需要排列,又不需要计算,只要能找出样本中出现次数最多的那一个(或几个)数据就可以了.当一组数据中有数据多次重复出现时,它的众数也就是我们所要关心的一种集中趋势.注:众数是数据中出现次数最多的数据,是一组数据中的原数据,而不是相应的次数.众数有可能不唯一,注意不要遗漏.例12:在一次数学测验中,甲、乙、丙、丁四位同学的分数分别是90、x 、90、70,若这四个同学得分的众数与平均数恰好相等,则他们得分的中位数是【 】A 、100B 、90C 、80D 、70例13:当5个整数从小到大排列,其中位数是4,如果这组数据的唯一众数是6,则5个整数可能的最大的和是【 】A 、21B 、22C 、23D 、24例14:10名工人,某天生产同一零件,生产达到件数是:15,17,14,10,15,19,17,16,14,12,则这一组数据的众数是【 】A 、15B 、17 15C 、14D 、17 15 14 例15:某鞋店销售了9双鞋,各种尺码的销售量如下:(1)计算这9双鞋尺码的平均数、中位数和众数.(2)哪一个指标是鞋厂最感兴趣的指标?哪一个指标是鞋厂最不感兴趣的?三、中位数:是将一组数据按大小顺序排列后,处在最中间的一个数(或处在最中间的两个数的平均数).一组数据中的中位数是唯一的.注:求中位数要先把数据按大小顺序排列,可以从小到大,也可以从大到小.如果数据个数n 为奇数时,第21+n 个数据为中位数;如果数据个数n 为偶数时,第2n 、12+n个数据的平均数为中位数. 例16:李大伯承包了一个果园,种植了100棵樱桃树,今年已进入收获期.收获时,从中任选并采摘了10棵树的樱桃,分别称得每棵树所产樱桃的质量如下表:据调查,市场上今年樱桃的批发价格为每千克15元.用所学的统计知识估计今年此果园樱桃的总产量与按批发价格销售樱桃所得的总收入分别约为【 】 A .200千克,3000元 B .1900千克,28500元 C . 2000千克,30000元D .1850千克,27750元例17:为了了解某班学生每周做家务劳动的时间,某综合实践活动小组对该班50名学生进行了调查,有关数据如下表:根据上表中的数据,回答下列问题:(1)该班学生每周做家务劳动的平均时间是多少小时?(2)这组数据的中位数、众数分别是多少? (3)请你根据(1)、(2)的结果,用一句话谈谈自己的感受.【知识点2】极差、方差和标准差极差、方差和标准差都是用来研究一组数据的离散程度的,反映一组数据的波动范围或波动大小的量. 一、极差一组数据中最大值与最小值的差叫做这组数据的极差,即极差=最大值-最小值.极差能够反映数据的变化范围,实际生活中我们经常用到极差.如一支足球队队员中的最大年龄与最小年龄的差,一个公司成员中最高收入与最低收入的差等都是极差的例子.极差是最简单的一种度量数据波动情况的量,它受极端值的影响较大. 二、方差方差是反映一组数据的整体波动大小的特征的量.它是指一组数据中各个数据与这组数据的平均数的差的平方的平均数,它反映的是一组数据偏离平均值的情况.方差越大,数据的波动越大;方差越小,数据的波动越小. 求一组数据的方差可以简记先求平均,再求差,然后平方,最后求平均数.一组数据x 1、x 2、x 3、…、x n 的平均数为x ,则该组数据方差的计算公式为:])()()[(1222212x x x x x x nS n -++-+-= .例18:数据0、1、2、3、x 的平均数是2,则这组数据的极差和标准差分别是【 】 A 4,2 B 4,2 C 2,10 D 4,10 三、标准差在计算方差的过程中,可以看出方差的数量单位与原数据的单位不一致,在实际的应用时常常将求出的方差再开平方,此时得到量为这组数据的标准差. 即标准差=方差.例19:数据90,91,92,93的标准差是【 】(A ) 2 (B )54 (C )54 (D )52✪注意:极差、方差、标准差的关系方差和标准差都是用来描述一组数据波动情况的量,常用来比较两组数据的波动大小.两组数据中极差大的那一组并不一定方差也大.在实际问题中有时用到标准差,是因为标准差的单位和原数据的单位一致,且能缓解方差过大或过小的现象.例20:从甲、乙两种玉M 苗中各抽10株,分别测得它们的株高如下:(单位:cm ) 甲: 21 42 39 14 19 22 37 41 40 25 乙: 27 16 40 41 16 44 40 40 27 44(1)根据以上数据分别求甲、乙两种玉M 的极差、方差和标准差.(2)哪种玉M 的苗长得高些。
(3)哪种玉M 的苗长得齐.例21:市体校准备挑选一名跳高运动员参加全市中学生运动会,对跳高运动队的甲、乙两名运动员进行了8次选拔比赛.他们的成绩(单位:m )如下:甲:1.70 1.65 1.68 1.69 1.72 1.73 1.68 1.67 乙:1.60 1.73 1.72 1.61 1.62 1.71 1.70 1.75(1)甲、乙两名运动员的跳高平均成绩分别是多少?(2)哪位运动员的成绩更为稳定?(3)若预测,跳过1.65m 就很可能获得冠军,该校为了获得冠军,可能选哪位运动员参赛?若预测跳过1.70m 才能得冠军呢? 例17简析:(1)该班学生每周做家务劳动的平均时间为1(0212 1.5628 2.512313 3.5443) 2.4450⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=(小时),即该班学生每周做家务劳动的平均时间为2.44小时.(2)由表中的数据我们可以发现这组数据的中位数是2.5(小时),众数是3(小时).(3)只要叙述内容与上述数据有关或与做家务劳动有关,并且态度积极即可.例20分析:本题既是一道和极差、方差和标准差计算有关的问题,又是利用方差解决实际问题的一道题目.要求极差,只要用数据中最大值减去最小值,求到差值即可.利用方差的计算公式可以求到方差,将方差开平方就得标准差.解: 甲的极差: 42-14=28(cm); 乙的极差:44-16=28(cm). 甲的平均值:)()(甲cm x 3025404137221914394221101=+++++++++= 乙的平均值:)(31)44274040441641401627(101cm x =+++++++++=乙 甲的方差:)(2.10410)3025()3042()3021(22222cm S =-++-+-= 甲,乙的方差:)(8.12810)3144()3116()3127(22222cm S =-++-+-= 乙(2)因为甲种玉M 的平均高度小于乙种玉M 的平均高度,所以一种玉M 的苗长的高.(3)因为22乙甲S S ≤,所以甲种玉M 的苗长得整齐.例21解读:本题是一道数据分析有关的实际问题,主要考查数据的平均数、方差的计算方法及处理数据的能力.根据平均数及方差的计算公式可得(1)甲x =)67.165.170.1(81+++ =1.69(m),乙x =)75.173.160.1(81+++ =1.68(m ). (2)])69.167.1()69.165.1()69.170.1[(812222-++-+-= 甲S =0.0006(m 2),])68.175.1()68.173.1()68.160.1[(812222-++-+-= 乙S =0.0035(m 2),因为22s s <乙甲,所以甲稳定.(3)可能选甲参加,因为甲8次成绩都跳过1.65m 而乙有3次低于1.65m 。
可能选乙参加,因为甲仅3次超过1.70m.。