总体特征数的估计PPT演示文稿(1)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

三、众数、中位数、平均数的简单应用
例1 某工厂人员及工资构成如下:
人员 周工资 人数 经理 2200 1 管理人员 250 6 高级技工 220 5 工人 200 10 学徒 100 1 23 合计
合计
2200
1500
1100
2000
100
6900
(1)指出这个问题中周工资的众数、中位数、 平均数 (2)这个问题中,工资的平均数能客观地反映 该厂的工资水平吗?为什么?
3、平均数是频率分布直方图的“重 心”.
是直方图的平衡点.
n 个样本数据的平均数公式 : 1 X= n ( x1 x 2 x n )
下图显示了居民月均用水量的平均数:x=1.973
频率分布直方图如下:
频率
组距
平均数
0.50
0.40 0.30 0.20 0.10 0.5 1 1.5 2 2.5 3 3.5 4 月均用水量 /t 4.5
答:17名运动员成绩的众数、中位数、平均数依次是 1.75(米)、1.70(米)、1.69(米).
用这些特征数据对总体进行估计的优缺点是什么?
平均数、中位数、众数都是描述数据的“集中趋势” 的“特征数”,它们各自特点如下: 用平均数作为一组数据的代表,比较可靠和稳定,它 与这组数据中的每一个数都有关系.对这些数据所包 含的信息的反映最为充分,因而应用最为广泛,特别 是在进行统计推断时有重要作用,但计算较繁琐,并 且易受极端数据的影响. 用众数作为一组数据的代表,可靠性较差,但众数Βιβλιοθήκη Baidu 受极端数据的影响,并且求法简便,当一组数据中个 别数据变动较大时,适宜选择众数来表示这组数据的 “集中趋势”. 用中位数作为一组数据的代表,可靠性也较差,但中 位数也不受极端数据的影响,也可选择中位数来表示 这组数据的“集中趋势”.
睡眠时间 [6,6.5) [6.5,7)
人 数 5 17
频 率 0.05 0.17
[7,7.5) [7.5,8)
[ 8, 8. 5 ) [ 8. 5 , 9] 合计
33 37
6 2 100
0.33 0.37
0.06 0.02 1
例4.小明班数学平均分是78分,小明考了80 分,老师却说他是倒数几名,你觉得这可能吗?
x1 x 2 x n x n
x
i 1
n
i
n
(加权平均数)
分析:众数为200,中位数为220,平均数为300。
因平均数为300,由表格中所列出的数据可见,只 有经理的周工资在平均数以上,其余的人都在平均数以 下,故用平均数不能客观真实地反映该工厂的工资水平。
例2
例3.下面是某校学 生日睡眠时间的抽样 频率分布表(单位: h),试估计该校学生 的日平均睡眠时间.
怎样用这些数据对重力加速度进行估计?
知识新授:
一、众数、中位数、平均数的概念
一般地,n个数据按大小顺序排列,处于最中间 位置的一个数据(或最中间两个数据的平均数)叫做 这组数的中位数(median). 一组数据中出现次数最多的那个数据叫做这组数 的众数(mode). 算术平均数是指资料中各观测值的总和除以观 测值个数所得的商,简称平均数或均数. 用这些特征数据对总体进行估计的优缺点是什么?
频率分布直方图如下:
频率 组距
中位数
0.50
0.40
0.30
0.20 0.10 0.5 1 1.5 2 2.5 3 3.5 4 月均用水量 /t 4.5
说明:
2.03这个中位数的估计值,与样本 的中位数值2.0不一样,这是因为样本数 据的频率分布直方图,只是直观地表明 分布的形状,但是从直方图本身得不出 原始的数据内容,所以由频率分布直方 图得到的中位数估计值往往与样本的 实际中位数值不一致.
问题引入:
某校高一(1)班同学在老师的布置下,用单摆进行测试, 以检验重力加速度.全班同学两人一组,在相同条件 下进行测试,得到下列实验数据(单位:m/s2): 9.62 9.5 9.78 9.94 10.01 9.66 9.88 9.68 10.32 9.76 9.45 9.99 9.81 9.56 9.78 9.72 9.93 9.94 9.65 9.79 9.42 9.68 9.70 9.84 9.90
任何一个样本数据的改变都会引起平均数的改 变.这是中位数、众数都不具备的性质,也正是这个 原因,与众数、中位数比较起来,平均数可以反映 出更多的关于样本数据全体的信息.
我们常用算术平均数
1 n ai n i 1
(其中ai(i=1,2,…,n)为n个实验数据)作为 重力加速度的近似值,它的依据是什么呢?
练习: 在一次中学生田径运动会上,参加 男子跳高的17名运动员的成绩如下表所示:
成绩 (单位:米)
1.50 2
1.60 3
1.65 2
1.70 3
1.75 4
1.80 1
1.85 1
1.90 1
人数
分别求这些运动员成绩的众数,中位数与平均数
解:在17个数据中,1.75出现了4次,出现的次数最 多,即这组数据的众数是1.75. 上面表里的17个数据可看成是按从小到大的顺序 排列的,其中第9个数据1.70是最中间的一个数据,即 这组数据的中位数是1.70; 这组数据的平均数是
课堂小结:
一、众数、中位数、平均数的概念
一般地,n个数据按大小顺序排列,处于最中间 位置的一个数据(或最中间两个数据的平均数)叫做 这组数的中位数(median).
二 、众数、中位数、平均数与频率分布直方图的关系
1、众数在样本数据的频率分布直方图 中,就是最高矩形的中点的横坐标。 例如,在上一节调查的100位居民的月 均用水量的问题中,从这些样本数据的频 率分布直方图可以看出,月均用水量的众 数是2.25t.如图所示:
频率分布直方图如下:
频率
组距
众数(最高的矩形的中 点)
0.50
0.40 0.30 0.20 0.10 0.5 1 1.5 2 2.5 3 3.5 4 月均用水量 /t 4.5
2、在样本中,有50%的个体小于或等于 中位数,也有50%的个体大于或等于中位 数。
因此,在频率分布直方图中,中位数左边 和右边的直方图的面积应该相等,由此可 以估计中位数的值。下图中虚线代表居民 月均用水量的中位数的估计值,此数据值 为2.03t.
相关文档
最新文档