2.2.2用样本的数字特征估计总体的数字特征 (第二课时)解析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
如何在频率分布直方图中估计平均数
=2.02
4 8 2 布直方图中每个小矩形的面 x 14 x 512 x 99100 积乘以小矩形底边中点的横 100 100 100 坐标之和。 0 0.5 0.5 1 4 4.5 0.04 0.08 0.02 =2.02 2 2 2
[123,125)
[125,127) [127,129) [129,131]
3
8 4 3
0.15
0.4 0.2 0.15
合计
20
1
(2)
(3)在[125,127)中的数据最多,取这个区间的中点值作 为众数的近似值,得众数 126,事实上,众数的精确值为 5 125.图中虚线对应的数据是 125+2× =126.25,事实上 8 中位数为 125.5.使用“组中值”求平均数:x=122×0.1 + 124×0.15 + 126×0.4 + 128×0.2 + 130×0.15 = 126.3,平均数的精确值为x=125.75.
分别求这些运动员成绩的众数,中位数与平均数 。 解:在17个数据中,1.75出现了4次,出现的次数最多, 即这组数据的众数是1.75. 上面表里的17个数据可看成是按从小到大的顺序排 列的,其中第9个数据1.70是最中间的一个数据,即这组 数据的中位数是1.70; 这组数据的平均数是 1 x (1.50 2 1.60 3 ... 1.90 1) 1.69 米 17 答:17名运动员成绩的众数、中位数、平均数依次是 1.75(米)、1.70(米)、1.69(米)。
(1)、1 ,2,3,3,3,4,6,8,8,8,9,9 中位数是:5 (2)1 ,2,3,3,3,4,8,8,8,9,9 中位数是:4
3、在一次中学生田径运动会上,参加男子跳高的17名 运动员的成绩如下表所示:
成绩(米) 人数 1.50 1.60 2 3 1.65 2 1.70 3 1.75 4 1.80 1 1.85 1 1.90 1
三、 众数、中位数、平均数的简单应用
例1、下表是七位评委给某参赛选手的打分,总分为10分, 你认为如何计算这位选手的最后得分才较为合理?
评委 1号 打分 9.6
2号 9.3
3号 9.3
4号 9.6
5号 9.9
6号 9.3
7号 9.4
提问:1、电视里评委是怎样给选手打分的? 2、为什么这么做?直接取中位数和众数的值不好么?
分组 [0, 0.5) [0.5, 1) [1, 1.5) [1.5, 2) [2, 2.5) [2.5, 3) [3,, 3.5) [3.5, 4) [4,) 4.5]
合计
频率 0.04 0.08 0.15 0.22 0.25 0.14 0.06 0.04 0.02 1
在样本中,中位数的左右各有50%的样本数, 所以反映在频率分布直方图中,中位数左右 两边的直方图的面积相等,各为0.5。
求:(1)高一参赛学生的成绩的众数、中位数. (2)高一参赛学生的平均成绩. 解 (1)由图可知众数为65, 又∵第一个小矩形的面积为0.3, ∴设中位数为60+x,则0.3+x×0.04=0.5,得x=5, ∴中位数为60+5=65. (2)依题意,平均成绩为55×0.3+65×0.4+75×0.15 +85×0.1+95×0.05=67,∴平均成绩约为67.
(一)众数、中位数、平均数
一 众数、中位数、平均数的概念
众数:在一组数据中,出现次数最多的数据叫 做这组数据的众数.
中位数:将一组数据按大小依次排列,把处在 最中间位置的一个数据(或最中间两个数据的 平均数)叫做这组数据的中位数.
平均数:
一组数据的算术平均数,即
1 X ( x1 x2 xn ) n
0.04 0.08 0.15 0.22 0.49
x 0.02
中位数
2 0.02 2.02
可将中位数看作整个直方图面积的“中心”
思考讨论以下问题:
1、2.02这个中位数的估计值,与样本的中 位数值2.0不一样,你能解释其中原因吗? 答:2.02这个中位数的估计值,与样本的中 位数值2.0不一样,这是因为样本数据的 频率分布直方图,只是直观地表明分布的 形状,但是从直方图本身得不出原始的数 据内容,直方图已经损失一些样本信息。 所以由频率分布直方图得到的中位数估计 值往往与样本的实际中位数值不一致.
(1)填写下面的频率分布表:
分组 [121,123) [123,125) [125,127) [127,129) [129,131] 合计 频数 频率
(2)作出频率分布直方图; (3)根据频率分布直方图或频率分布表求这组数据的 众数、中位数和平均数.
解 (1) 分组 [121,123) 频数 2 频率 0.1
- -
规律方法 1.利用频率分布直方图估计数字特征: (1)众数是最高的矩形的底边的中点. (2)中位数左右两侧直方图的面积相等. (3)平均数等于每个小矩形的面积乘以小矩形底边中 点的横坐标之和. 2.利用直方图求众数、中位数、平均数均为估计值, 与实际数据可能不一致.
例3 某中学举行电脑知识竞赛,现将高一参赛学生 的成绩进行整理后分成五组绘制成如图所示的频率 分布直方图,已知图中从左到右的第一、二、三、 四、五小组的频率分别是0.30、0.40、0.15、0.10、 0.05.
思考讨论以下问题:
2、样本中位数不受少数极端值的影响,这 在某些情况下是一个优点,但它对极端值 的不敏感有时也会成为缺点。你能举例说 明吗? 答:优点:对极端数据不敏感的方法能够 有效地预防错误数据的影响。
对极端值不敏感有利的例子:例如当样本数据质 量比较差,即存在一些错误数据(如数据录入错 误、测量错误等)时,用抗极端数据强的中位数 表示数据的中心值更准确。
缺点:(1)出现错误的数据也不知道; (2)对极端值不敏感有弊的例子:某人具 有初级计算机专业技术水平,想找一份收 入好的工作。这时如果采用各个公司计算 机专业技术人员收入的中位数作为选择工 作的参考指标就会冒这样的风险:
很可能所选择公司的初级计算机专业技术水平 人员的收入很低,其原因是中位数对极小的数 据不敏感。这里更好的方法是同时用平均工资 和中位数作为参考指标,选择平均工资较高且 中位数较大的公司就业.
二、众数、中位数、平均数与频率 分布直方图的关系
如何在频率分布直方图中估计众数
频率 组距
众数在样本数据的频率分布直方图中, 就是最高矩形的中点的横坐标。
0.5 0.4 0.3 0.2 0.1
O
0.5
ຫໍສະໝຸດ Baidu
1
1.5
2
2.5
3
3.5
4
4.5
月平均用水量(t)
可将众数看作直方图中面积最大长方形的“中心”
频率 组距
选择平均数更好:因为,此时的众数20万比中位数25万还小, 所以众数代表的是局部的数。中位数代表的虽然是大多数公路 投资的数额,但由于其不受极端值的影响,不能代表全体,因 而此时成了它的缺点。选择平均数较好,能比较好的代表整体 水平,但缺点是仍不能显示出具体的数字特征
特征数 众数 中位数 平均数 去掉一个最高分和 去掉两个最高分 最低分后的平均分 和最低分后的平 均分
特征值
9. 3
9. 4
9.49
9.42
9.44
1.下面是高一(18)班十位同学的数学测试成绩:82, 91,73,84,98,99,101,118,98,110,则该 组数据的中位数是 ( ) A.98 B.99 C.98.5 D.97.5 答案 A
问题1:众数、中位数、平均数这三个数 一般都会来自于同一个总体或样本,它们 能表明总体或样本的什么性质? 众数:反映的往往是局部较集中的数据信息
中位数:是位置型数,反映处于中间部位的 数据信息
平均数:反映所有数据的平均水平
1、求下列各组数据的众数
(1)、1 ,2,3,3,3,5,5,8,8,8,9,9 众数是:3和8 (2)、1 ,2,3,3,3,5,5,8,8,9,9 众数是:3 2、求下列各组数据的中位数
可将平均数看作整个直方图面积的“重心”
1 1 ( x1 x4 ) ( x5 x12 ) ( x99 x100 ) x ( x1 x2 x100 ) 100 100 平均数的估计值等于频率分
规律方法 根据样本频率分布直方图,可以分 别估计总体的众数、中位数和平均数. (1)众数:最高矩形下端中点的横坐标; (2)中位数:直方图面积平分线与横轴交点的 横坐标. (3)平均数:每个小矩形的面积与小矩形底边 中点的横坐标的乘积之和.
如何在频率分布直方图中估计中位数
0.6 0.5 0.4 0.3 0.2 0.1 0
前四个小矩形的 面积和=0.49
后四个小矩形的 面积和=0.26
0.25
0.22
0.15 0.08 0.04 0.5 1 1.5 2 2.5
0.14 0.06 0.04 3 3.5 4 0.02
4.5
2.02
月均用水量/t
解析 将这组数据按从小到大排列为 73,82,84,91,98, 98,99,101,110,118,则最中间的两个数为 98,98,故 1 中位数是 (98+98)=98. 2
频率分布与数字特征的综合应用
例2 已知一组数据:125 129 128 126 121 124 123 125 125 127 127 126 129 122 125 124 128 130 125 126
课堂练习: 1、假设你是一名交通部门的工作人员。你打算向市长报告国 家对本市26条公路项目投资的平均资金数额,其中一条新公 路的建设投资为2 200万元人民币,另外25个项目的投资在 20万与100万.中位数是25万,平均数是100万,众数是20万 元。你会选择哪一种数字特征来表示每一个项目的国家投资? 你选择这种数字特征的缺点是什么?