用样本的数字特征估计总体的数字特征 课件
合集下载
用样本的数字特征估计总体的数字特征课件
应用领域
该主题广泛应用于各个领域,如医学 、经济学、生物学等,帮助研究者从 有限的样本数据中推断出总体特征, 从而做出科学决策。
02
总体数字特征
总体均值
总结词
总体均值是总体所有数据之和除以数据 的个数,它反映了总体常重要的数字 特征,它描述了数据的集中趋势。通过计 算总体均值,可以对总体数据有一个大致 的了解。总体均值的计算公式为 $overline{x} = frac{1}{N}sum_{i=1}^{N} x_i$,其中 $N$ 是数据的个数,$x_i$ 是每一个数据 。
样本中位数
样本中位数是将所有样本数据从小到大排列后位于中间位置的数,用于 估计总体中位数。
样本中位数是将一组数据分成相等的两半的数,它对于异常值的影响较 小。通过计算样本中位数,可以对总体中位数进行估计,从而了解总体
数据的分布形态。
应用场景:在金融、医疗、社会学等领域中广泛应用。
04
样本数字特征估计总体数 字特征的方法
估计。
合并样本方差
将多个样本的数值合并后计算 方差,作为总体方差更精确的
估计。
合并样本偏度
将多个样本的数值合并后计算 偏度,作为总体偏度更精确的
估计。
合并样本峰度
将多个样本的数值合并后计算 峰度,作为总体峰度更精确的
估计。
实际应用案例
市场调查
通过收集部分消费者的数据来估 计整体市场的需求、偏好和趋势
随着机器学习和人工智能技术的不断 发展,样本的数字特征将与机器学习 算法相结合,实现更智能的数据分析 和挖掘。
感谢您的观看
THANKS
通过本课件的学习,学生将掌握如何 利用样本的数字特征来估计总体的数 字特征,为后续的统计分析和决策提 供依据。
该主题广泛应用于各个领域,如医学 、经济学、生物学等,帮助研究者从 有限的样本数据中推断出总体特征, 从而做出科学决策。
02
总体数字特征
总体均值
总结词
总体均值是总体所有数据之和除以数据 的个数,它反映了总体常重要的数字 特征,它描述了数据的集中趋势。通过计 算总体均值,可以对总体数据有一个大致 的了解。总体均值的计算公式为 $overline{x} = frac{1}{N}sum_{i=1}^{N} x_i$,其中 $N$ 是数据的个数,$x_i$ 是每一个数据 。
样本中位数
样本中位数是将所有样本数据从小到大排列后位于中间位置的数,用于 估计总体中位数。
样本中位数是将一组数据分成相等的两半的数,它对于异常值的影响较 小。通过计算样本中位数,可以对总体中位数进行估计,从而了解总体
数据的分布形态。
应用场景:在金融、医疗、社会学等领域中广泛应用。
04
样本数字特征估计总体数 字特征的方法
估计。
合并样本方差
将多个样本的数值合并后计算 方差,作为总体方差更精确的
估计。
合并样本偏度
将多个样本的数值合并后计算 偏度,作为总体偏度更精确的
估计。
合并样本峰度
将多个样本的数值合并后计算 峰度,作为总体峰度更精确的
估计。
实际应用案例
市场调查
通过收集部分消费者的数据来估 计整体市场的需求、偏好和趋势
随着机器学习和人工智能技术的不断 发展,样本的数字特征将与机器学习 算法相结合,实现更智能的数据分析 和挖掘。
感谢您的观看
THANKS
通过本课件的学习,学生将掌握如何 利用样本的数字特征来估计总体的数 字特征,为后续的统计分析和决策提 供依据。
用样本的数字特征估计总体的数字特征-课件(共37张PPT)
栏目 导引
第二章 统计
题型二 由频率分布图求众数、中位数、平均数 例2 从高三抽出50名学生参加数学竞赛,由成绩得到如
下的频率分布直方图.
由于一些数据丢失,试利用频率分布直方图求: (1)这50名学生成绩的众数与中位数; (2)这50名学生的平均成绩.
栏目 导引
第二章 统计
【解】 (1)由众数的概念可知,众数是出现次数最多的数. 在直方图中高度最高的小矩形框的中间值的横坐标即为所求, 所以众数应为75. 在频率分布直方图中,中位数的左右两边频数应相等,即频 率也相等,从而小矩形的面积和相等.因此在频率分布直方 图中将频率分布直方图中所有小矩形的面积一分为二的直线 所对应的成绩即为所求. ∵0.004×10+0.006×10+0.02×10=0.3, ∴前三个小矩形面积的和为0.3. 而第四个小矩形面积为0.03×10=0.3,0.3+0.3>0.5, ∴中位数应位于第四个小矩形内, 设其底边为x,高为0.03,∴令0.03x=0.2,得x≈6.7, 故中位数应为70+6.7=76.7.
栏目 导引
第二章 统计
跟踪训练 1.某校甲班、乙班各有49名学生,两班在一次数学测验中的 成绩(满分100分)统计如下表:
(1)请你对下面的一段话给予简要分析: 甲班的小刚回家对妈妈说:“昨天的数学测验,全班平均79 分,得70分的人最多,我得了85分,在班里算是上游了!” (2)请你根据表中数据,对这两个班的测验情况进行简要分析, 并提出教学建议.
第二章 统计
2.2.2 用样本的数字特征估计总体 的数字特征
第二章 统计
新知初探思维启动
1.众数、中位数、平均数 (1)众数、中位数、平均数的概念 ①众数:在一组数据中,出现次数最多的数据(即频率分布 最大值所对应的样本数据)叫这组数据的众数. 若有两个或两个以上的数据出现得最多,且出现的次数一样, 则这些数据都叫众数;若一组数据中每个数据出现的次数一 样多,则没有众数. ②中位数:将一组数据按大小依次排列,把处在最中间位置 的一个数据(或中间两个数据的平均数)叫这组数据的中位数.
第二章 统计
题型二 由频率分布图求众数、中位数、平均数 例2 从高三抽出50名学生参加数学竞赛,由成绩得到如
下的频率分布直方图.
由于一些数据丢失,试利用频率分布直方图求: (1)这50名学生成绩的众数与中位数; (2)这50名学生的平均成绩.
栏目 导引
第二章 统计
【解】 (1)由众数的概念可知,众数是出现次数最多的数. 在直方图中高度最高的小矩形框的中间值的横坐标即为所求, 所以众数应为75. 在频率分布直方图中,中位数的左右两边频数应相等,即频 率也相等,从而小矩形的面积和相等.因此在频率分布直方 图中将频率分布直方图中所有小矩形的面积一分为二的直线 所对应的成绩即为所求. ∵0.004×10+0.006×10+0.02×10=0.3, ∴前三个小矩形面积的和为0.3. 而第四个小矩形面积为0.03×10=0.3,0.3+0.3>0.5, ∴中位数应位于第四个小矩形内, 设其底边为x,高为0.03,∴令0.03x=0.2,得x≈6.7, 故中位数应为70+6.7=76.7.
栏目 导引
第二章 统计
跟踪训练 1.某校甲班、乙班各有49名学生,两班在一次数学测验中的 成绩(满分100分)统计如下表:
(1)请你对下面的一段话给予简要分析: 甲班的小刚回家对妈妈说:“昨天的数学测验,全班平均79 分,得70分的人最多,我得了85分,在班里算是上游了!” (2)请你根据表中数据,对这两个班的测验情况进行简要分析, 并提出教学建议.
第二章 统计
2.2.2 用样本的数字特征估计总体 的数字特征
第二章 统计
新知初探思维启动
1.众数、中位数、平均数 (1)众数、中位数、平均数的概念 ①众数:在一组数据中,出现次数最多的数据(即频率分布 最大值所对应的样本数据)叫这组数据的众数. 若有两个或两个以上的数据出现得最多,且出现的次数一样, 则这些数据都叫众数;若一组数据中每个数据出现的次数一 样多,则没有众数. ②中位数:将一组数据按大小依次排列,把处在最中间位置 的一个数据(或中间两个数据的平均数)叫这组数据的中位数.
用样本的数字特征估计总体的数字特征教学课件
样本标准差的估计
样本标准差
是样本方差的平方根,计算公式 为 $s = sqrt{S^2}$。
总体标准差的估计
当从总体中抽取样本时,可以用样 本标准差来估计总体标准差,即 $sigma = s$。
注意事项
标准差是衡量数据离散程度的重要 指标,与方差具有相同的量纲。
05
实例分析
实例一:用样本均值估计总体均值
方差是一组数据与其均值之间的离散程度的度量,计算方法是每个数据点与均值 的差的平方和的平均值。方差越大,说明数据点越离散;方差越小,说明数据点 越集中。方差可以用来衡量数据的稳定性。
标准差
标准差是方差的平方根,也是用来衡量一组数据离散程度的统计量。
标准差是方差的平方根,它和方差一样,也是用来衡量数据离散程度的。标准差与方差的区别在于, 标准差具有与原始数据相同的单位,因此更适合用于比较不同量纲的数据集。标准差越大,说明数据 点越离散;标准差越小,说明数据点越集中。
实例三:用样本方差估计总体方差
总结词
简单计算简单 易行。然而,当样本量较小时,样本方差可 能会低估总体方差,因此在实际应用中需要 注意这一点。
实例四:用样本标准差估计总体标准差
总结词
与样本方差类似,但考虑了离群值的影响
详细描述
样本标准差是总体标准差的较小估计,与样 本方差类似。然而,样本标准差在计算时考 虑了离群值的影响,因此对于离群值较多的
能力。
了解最新的统计方法和数据分 析工具,跟上时代发展的步伐
。
THANKS
感谢观看
样本方差的估计
样本方差
是样本数据离散程度的度量,计算公 式为 $S^2 = frac{1}{n}sum_{i=1}^{n} (x_i overline{x})^2$。
用样本的数字特征估计总体的数字特征教学课件
05
实例分析
实例一:股票价格波动分析
线性回归模型
通过收集某支股票的历史交易数据, 利用线性回归模型分析股票价格与成 交量、市盈率等数字特征之间的关系 ,并利用样本数据估计总体趋势,为 投资者提供参考。
实例二:消费者行为分析
聚类分析
VS
通过聚类分析方法,将消费者的购买 行为进行分类,并利用样本数据中的 消费者数字特征(如购买频率、购买 金额等)来估计总体消费者的行为特 征,为企业制定营销策略提供依据。
均值是统计学中常用的一个数字特征,它表示一组数据的中 心位置。通过计算一组数据的均值,可以大致了解这组数据 的平均水平。在用样本估计总体时,样本均值可以作为总体 均值的点估计值。
方差
方差是衡量数据离散程度的量,计算的是每个数据点与均 值之间的偏差的平方和。
方差用于描述一组数据的离散程度,即各数值与均值之间 的偏差大小。方差越大,说明数据点越分散;方差越小, 说明数据点越集中。在统计学中,方差是评估数据稳定性 和可靠性时常用的一个数字特征。
估计结果的应用
描述总体“平均水平”
通过样本平均数来估计总体平均水平,了解总体 “平均状况”。
进行统计推断
利用样本数字特征来推断总体的性质,如进行假 设检验、区间估计等。
ABCD
衡量总体“离散程度”
通过样本方差和标准差来估计总体离散程度,了 解数据分布的稳定性。
辅助决策制定
基于样本数字特征对总体状况的估计,为决策者 提供数据支持,辅助制定科学合理的决策。
标准差
标准差是方差的平方根,与方差一样,用于衡量数据的离散程度。
标准差与方差一样,用于描述数据点的离散程度。标准差和方差的区别在于,标 准差将每个数据点与均值之间的偏差进行了开方处理。因此,标准差和方差具有 相同的量纲,即两者都可以用来表示数据点与均值之间的偏差大小。
用样本的数字特征估计总体的数字特征公开课第一课时ppt课件
众数:在一组数据中,出现次数最多的数 据叫做这组数据的众数.
中位数:将一组数据按大小依次排列,把 处在最中间位置的一个数据(或最中间两个数 据的平均数)叫做这组数据的中位数.
平均数: 一组数据的算术平均数,即
X
1 n
( x1
x2
xn )
试一试:
指出下列各组数据的众数、中位数及平均数.
(1)1,2,3,3,6. (2) 1 , 3 , 7, 7 , 5 , 7.
样本数据 频率分布直方图
众数 2.3 2.25
中位数 平均数 2.0 1.973 2.02 2.02
在制作频率分布直方图“丢失”了一些样本数据, 得到的是一个估计值,且所得估计值与数据分组 有关.
三种数字特征的优缺点
特征数 众数
优点
缺点
体现了样本数据的最大 无法客观反映总体
集中点
特征
中位数 不受少数极端值的影响 不受少数极端值的
平均数的估值 = 频率分布直方图中每个小矩形的面积 乘以小矩形底边中点的横坐标之和
频率 组距 0.5 0.4 0.3 0.2 0.1
0.25×0.04+0.75×0.08 +1.25×0.15+1.75×0.22 +2.25×0.25+2.75×0.14 +3.25×0.06+3.75×0.04 +4.25×0.02=2.02(t).
影响有时也是缺点
平均数
与每一个数据有关,更 受少数极端值的影Biblioteka 能反映全体的信息. 响较大,使其在估
计总体时的可靠性 降低.
例题1
根据频率分布直方图(如图)估计 (1)众数;(2)中位数; (3)平均数.
用样本的数字特征估计总体的数字特征(上课用)课件
实例分析和软件操作
通过具体实例演示如何运用软件 工具进行样本数字特征的统计分 析和可视化,提高实际操作能力 。
02
样本与总体
样本与总体的定义
总体
研究对象的全体集合,具有明确 的定义和范围。
样本
从总体中随机抽取的一部分个体 或观测值,用于推断总体的性质 和特征。
样本与总体的关系
样本是总体的代表
通过样本可以推断总体的特征和规律,但样本的代表性、误差和偏差等因素会影 响推断的准确性和可靠性。
在此添加您的文本16字
样本均值是总体均值的无偏估计,即随着样本量的增加, 样本均值会逐渐接近总体均值。
在此添加您的文本16字
样本均值的性质
在此添加您的文本16字
样本均值的计算方法
在此添加您的文本16字
样本均值具有线性性质,即如果 $a$ 和 $b$ 是常数,则 $abar{x} + b$ 也是总体均值的无偏估计。
。
03
数字特征
均值
均值是所有数值的和除以数值的数量,反映数据的平均水平 。
在统计学中,均值是一种常用的数字特征,用于描述一组数 据的中心趋势。它通过将所有数值加起来,然后除以数值的 数量来计算得出。均值的大小受数据中所有数值的影响,数 值越大,对均值的贡献也越大。
中位数
中位数是一组数据按大小顺序排列后处于中间位置的数值 ,反映数据的中心趋势。
下一步学习建议
深入学习更多高级的数字特征和统计方 法,如协方差、相关系数、回归分析等 。
学习如何在实际项目中应用数字特征进 行数据分析和处理,提高实际应用能力 。
了解更多关于数字特征的进化和演化算 法,如遗传算法、粒子群优化算法等。
学习如何在实际问题中更加灵活地应用 数字特征进行数据分析和处理,例如在 机器学习和数据挖掘等领域的应用。
用样本的数字特征估计总体的数字特征 课件
等,即频率也相等,从而小矩形的面积和相等.因此在 频率分布直方图中将频率分布直方图中所有小矩形的面 积一分为二的直线所对应的成绩即为所求.
因为 0.004×10+0.006×10+0.02×10=0.04+0.06 +0.2=0.3,所以前三个小矩形面积的和为 0.3.
而 第 四 个 小 矩 形 面 积 为 0.03×10 = 0.3 , 0.3 + 0.3>0.5,
所以平均成绩为 45×(0.004×10)+55×(0.006×10) + 65×(0.02 × 10) + 75×(0.03×10) + 85×(0.024 × 10) + 95×(0.016×10)=76.2.
所以,这 50 名学生的平均成绩为 76.2.
归纳升华 1.根据有关统计图表求数字特征时,要会识图表, 从图表中找出中位数、众数等,计算平均数要用到频数(率) 分布表. 2.总体的平均数和标准差往往很难求,通常做法就 是用样本的平均数与方差去估计总体的平均数与方差,只 要样本的代表性好,这种做法就合理.
(2)标准差、方差的取值范围是[0,+∞). 3.有关平均数、方差的一些结论. 若数据 x1,x2,…,xn 的平均数为-x ,方差为 s2. (1)ax1,ax2,…,axn 的平均数为 a-x ,方差为 a2s2. (2)数据 mx1+a,mx2+a,…,mxn+a 的平均数为 m-x +a,方差为 m2s2.
众数 示样本数据的中心值 ①在频率分布直方图中,中位数左边和右 边的直方图面积相等,由此可以估计中位
中位数 数的值,但是有偏差 ②表示样本数据所占频率的等分线
①平均数等于每个小长方形的面积乘 以小长方形底边中点的横坐标之和 平均数 ②平均数是频率分布直方图的重心,是 频率分布直方图的平衡点
用样本的数字特征估计总体的数字特征 课件
中位数:样本数据中,累积频率为0.5时所对应的样本数
据值(累积频率:样本数据小于某一数值的频率叫做该数值点
的累积频率);或者定义为:将一组数据按大小顺序排列,把
处在最中间位置的一个数据(或两个数据的平均数)叫这组数据
的中位数.
平均数:样本数据的算术平均数,即
x
=
1 n
(x1+x2+…+
xn).
(2)众数、中位数、平均数与频率分布直方图的关系. 众数在样本数据的频率分布直方图中,就是最高矩形的中 点的横坐标.在样本中,有50%的个体大于或等于中位数.因 此,在频率分布直方图中,中位数左边和右边的直方图的面积 相等,由此可以估计中位数的值.由于样本数据的频率分布直 方图,只是直观地表明分布的形状,但是从直方图本身得不出 原始的数据内容,所以由频率分布直方图得到的中位数估计值 往往与样本的实际中位数值不一致.平均数显然是频率分布直 方图的“重心”.在频率分布直方图中,平均数是直方图的平 衡点.
【解】 x 甲=16×(27+38+30+37+35+31)=1968=33, s2甲=16×[(27-33)2+(38-33)2+…+(31-33)2] =16×94≈15.7, x 乙=16×(33+29+38+34+28+36)=1968=33,
s
2
乙
=
1 6
×[(33-33)2+(29-33)2+…+(36-33)2]=
(3)三种数字特征的优缺点. ①众数体现了样本数据的最大集中点,但显然它对其他数 据信息的忽视使得它无法客观地反映总体特征. ②中位数是样本数据所占频率的等分线,它不受少数几个 极端值的影响,这在某些情况下是优点,但它对极端值的不敏 感有时也会成为缺点.
③由于平均数与每一个样本的数据有关,所以任何一个样 本数据的改变都会引起平均数的改变,这是众数、中位数都不 具备的性质.也正因为这个原因,与众数、中位数比较起来, 平均数可以反映出更多的关于样本数据全体的信息.但平均数 受数据中的极端值的影响较大,使平均数在估计总体时可靠性 降低.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.中位数
(1)定义:一组数据按从小到大的顺序排成一列 ,处于 _中__间___位置的数称为这组数据的中位数.
(2)特征:一组数据中的中位数是_唯__一___的,反映了该组数 据的___集__中__趋__势_____.在频率分布直方图中,中位数左边和右 边的直方图的面积__相__等__.
[破疑点] 中位数不受少数几个极端值的影响,这在某些
[答案] 6 [解析] x =4+6+5-6 8+7+6=6.
3.(2012·陕西卷)对某商店一个月内每天的顾客人数进行
统计,得到样本的茎叶图(如图所示),则该样本的中位数、众
数、极差分别是( )
A.46、45、56
B.46、45、53
C.47、45、56
D.45、47、53
[答案] A
[解析] 本题考查样本数据的中位数、众数及极差.根据
s2乙=110[(2×272+3×162+3×402+2×442)-10×312]= 110×1[答28案8=] 12(18).8乙(c种m2玉).米所的以苗s长2甲<得s高2乙. ,(2)甲种玉米的苗长得 齐.
●探索延拓
频率分布直方图与数字特征的综合应用
(1)(2012·安徽高考)甲、乙两人在一次射击比赛 中各射靶5次,两人成绩的条形统计图如图所示,则( )
(2)假设副董事长的工资从5 000元提升到20 000元,董事长 的工资从5 500元提升到30 000元,那么新的平均数、中位数、 众数又是什么?(精确到1元)
(3)你认为哪个统计量更能反映这个公司职工的工资水平? 结合此问题谈一谈你的看法.
[探究] 平均数、中位数、众数的定义分别是什么?
[解析] (1)平均数是
[知识拓展] 数据组 x1,x2,…,xn 的平均数为 x ,方差 为 s2,标准差为 s,则数据组 ax1+b,ax2+b,…,axn+b(a, b 为常数)的平均数为 a x +b,方差为 a2s2,标准差为 as.
6.用样本估计总体 现实中的总体所包含的个体数往往很多,总体的平均数、 众数、中位数、标准差、方差是不知道的,因此,通常用 _样__本___的平均数、众数、中位数、标准差、方差来估计.这与 上 一 节 用 _样__本___ 的 频 率 分 布 来 近 似 地 代 替 总 体 分 布 是 类 似 的.只要样本的代表性好,这样做就是合理的,也是可以接受 的. [规律总结] 用样本的数字特征估计总体的数字特征分两 类:用样本平均数估计总体平均数;用样本标准差估计总体标 准差,样本容量越大,估计就越精确.
[解析] 看哪种玉米的苗长得高,只要比较甲、乙两种 玉米的苗的均高即可;要比较哪种玉米的苗长得齐,只要看 两种玉米的苗高的方差即可,因为方差是体现一组数据波动 大小的特征数.
(1) x 甲=110(25+41+40+37+22+14+19+39+21+42) =110×300=30(cm),
x 乙=110(27+16+44+27+44+16+40+40+16+40) =110×310=31(cm).
●误区警示
小明是班里的优秀学生,他的历次数学成绩是
96,98,95,93分,但最近的一次考试成绩只有45分,原因是他带 病参加了考试.期末评价时,怎样给小明评价?
[错解] 这五次数学考试的平均分是
96+98+95+93+45 5
= 85.4
,则
按平
均分
给小
明一
个
“良
好”.
[错因分析] 这种评价是不合理的,尽管平均分是反映一 组数据平均水平的重要特征,但任何一个数据的改变都会引起 它的变化,而中位数则不受某些极端值的影响.本题中的5个 成绩从小到大排列为:45,93,95,96,98;中位数是95,较为合理 地反映了小明的数学水平,因而应该用中位数来衡量小明的数 学成绩.
用样本的数字特征估计总体的数 字特征
●知识衔接
1.在初中,我们已经学过平均数描述了数据的__平__均__水 平,定量地反映了数据的集中趋势所处的水平.我们也知道可 以用样本的平均数去估计总体的平均水平,而样本数据的方 差、标准差则反映了数据的离散程度.方差或标准差越 __小____,数据越集中,总体越均衡;方差或标准差越__大____, 数据越分散,总体越不均衡.而中位数则是指样本数据按从小 到大(或从大到小)的顺序排列后,处于__中__间__位置的一个量, 当样本数据个数为奇数时,___中__间__一__个__数__据___就是中位数,它 是样本数据;
≈1 500+1 788=3 288(元). 中位数是 1 500 元,众数是 1 500 元.
(3)在这个问题中,中位数或众数均能反映该公司职工的工 资水平.因为公司中少数人的工资额与大多数人的工资额差别 较大,这样导致平均数偏差较大,所以平均数不能反映这个公 司职工的工资水平.
[规律总结] 关于众数、中位数、平均数的几个问题 (1)一组数据中的众数可能不止一个,如果两个数据出现的 次数相同,并且比其他数据出现的次数都多,那么这两个数据 都是这组数据的众数. (2)一组数据中的中位数是唯一的,求中位数时,必须先将 这组数据按从小到大(或从大到小)的顺序排列. (3)由于平均数与每一个样本的数据有关,所以任何一个样 本数据的改变都会引起平均数的改变,这是众数、中位数都不 具备的性质.
5.方差 (1)定义:标准差的平方, 即s2=____1n_[_(x_1_-__x_)_2_+__(x_2_-__x__)2_+__…__+__(x_n_-__x__)2_]_____. (2)特征:与___标__准__差_____的作用相同,描述一组数据围绕 平均数波动程度的大小. (3)取值范围:_[0_,__+__∞__) ___.
(1)众数:众数一般用频率分布表中频率最高的一小组的组 中值来表示,即在样本数据的频率分布直方图中,最高矩形的 底边中点的横坐标.
(2)中位数:在频率分布表中,中位数是累计频率(样本数 据小于某一数值的频率叫作该数值点的累计频率)为0.5时所对 应的样本数据的值,而在样本中有50%的个体小于或等于中位 数,也有50%的个体大于或等于中位数.因此,在频率分布直 方图中,中位数左边和右边的直方图的面积应该相等.
[探究] 1.如何利用条形图求众数、中位数、平均数? 2.如何利用频率分布直方图求众数、中位数、平均数?
[解析] (1) x 甲=15(4+5+6+7+8)=6, x 乙=15(5×3+6+9)=6, 甲的中位数是 6, 乙的中位数是 5. 甲的成绩的方差为15(22×2+12×2)=2, 乙的成绩的方差为15(12×3+32×1)=2.4.
●互动探究
中位数、众数、平均数的应用
位)如下:
据报道,某公司的33名职工的月工资(以元为单
职务 董事长 副董事长 董事 总经理 经理 管理员 职员
人数 1
1
2
1
5
3
20
工资 5 500 5 000 3 500 3 000 2 500 2 000 1 500
(1)求该公司的职工月工资的平均数、中位数、众数;
(3)平均数:平均数在频率分布表中等于组中值与对应频 率之积的和.又平均数是频率分布直方图的“重心”.我们 知道,n 个样本数据 x1,x2,…,xn 的平均数 x =1n(x1+x2+… +xn),则有 n x =x1+x2+…+xn,也就是把每个 xi(i=1,2,…, n)都用 x 取代后,数据总和保持不变,所以平均数 x 对数据有 “取齐”的作用,代表了一组数据的数值平均水平,在频率 分布直方图中,平均数是直方图的平衡点.
x =1 500+
4 000+3 500+2 000×2+1 500+1 000×5+500×3+0×20 33
≈1 500+591=2 091(元). 中位数是 1 500 元,众数是 1 500 元.
(2)平均数是 x ′=1 500+
28 500+18 500+2 000×2+1 500+1 000×5+500×3+0×20 33
当样本数据个数为偶数时,中位数则是中间两个数据的
_平__均__数_,当这两个数据相等时,中位数是样本数据,否则它不 是 样 本 数 据 , 众 数 则 是 指 在 样 本 数 据 中 出 现 次 数 _最__多___ 的 数 据,众数不一定_唯__一___.
2.(2015·江苏卷)已知一组数据4,6,5,8,7,6,那么这组数据 的平均数为________.
③由图知这次数学成绩的平均分为:
40+50 2
ቤተ መጻሕፍቲ ባይዱ
×0.005×10
+
50+60 2
×0.015×10
+
60+70 2
×0.02×10
+
70+80 2
×0.03×10
+
80+90 2
×0.025×10
+
90+2100×0.005×10=72. [答案] (1)C
[规律总结] 众数、中位数、平均数与频率分布表、频率 分布直方图的关系
甲的极差是 4,乙的极差是 4. 所以 A,B,D 错误,C 正确. (2)①由图知众数为70+2 80=75. ②由图知,设中位数为 x,由于前三个矩形面积之和为 0.4,第四个矩形面积为 0.3,0.3+0.4>0.5,因此中位数位于 第四个矩形内,得 0.1=0.03(x-70),所以 x≈73.3.
茎叶图可知样本总共有30个数据,中位数为46,出现次数最多
的是45,最大数与最小数的差为68-12=56,故选A.
●自主预习
1.众数 (1)定义:一组数据中出现次数__最__多__的数称为这组数据的 众数. (2)特征:一组数据中的众数可能_不__止___一个,也可能没 有,反映了该组数据的__集__中__趋__势____. [破疑点] 众数体现了样本数据的最大集中点,但它对其 他数据信息的忽视使其无法客观地反映总体特征.
A.甲的成绩的平均数小于乙的成绩的平均数 B.甲的成绩的中位数等于乙的成绩的中位数 C.甲的成绩的方差小于乙的成绩的方差 D.甲的成绩的极差小于乙的成绩的极差