用样本估计总体2
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
因平均数为300,由表格中所列出的数据可见,只 有经理的周工资在平均数以上,其余的人都在平均数以 下,故用平均数不能客观真实地反映该工厂的工资水平。 用这些特征数据对总体进行估计的优缺点是什么?
平均数、中位数、众数都是描述数据的“集中趋势” 的“特征数”,它们各自特点如下:
用平均数作为一组数据的代表,比较可靠和稳定,它 与这组数据中的每一个数都有关系.对这些数据所包 含的信息的反映最为充分,因而应用最为广泛,特别 是在进行统计推断时有重要作用,但计算较繁琐,并 且易受极端数据的影响.
第五步: 画频率分布直方图(在频率分布表的基础上绘制,横
坐标为样本数据尺寸,纵坐标为频率/组距.)
茎叶图、频率分布表与频率分布直方图的比较
(1)都是用来描述样本数据的分布情况的。
(2)茎叶图由所有的样本数据构成,没有损失任何样本 信息;同时,茎叶图中的数据可以随时记录,随时添加, 方便记录与表示(这对于教练员发现运动员现场状态特 别有用).但当样本的数据较多时,枝叶就会很长,茎 叶图就显得不太方便;
绘制频率分布直方图步骤?
第一步: 求极差: (数据组中最大值与最小值的差距) 第二步: 决定组距与组数: (取整)
组距:指每个小组的两个端点的距离,组距
组数:将数据分组,当数据在100个以内时,
按数据多少常分5-12组。
组数=
极差 组距
4.1 0.5
8.2
第三步: 将数据分组 ( 给出组边界)
第四步: 列频率分布表. (包括分组、频数、频率、频率/组距)
用众数作为一组数据的代表,可靠性较差,但众数不 受极端数据的影响,并且求法简便,当一组数据中个 别数据变动较大时,适宜选择众数来表示这组数据的 “集中趋势”.
用中位数作为一组数据的代表,可靠性也较差,但中 位数也不受极端数据的影响,也可选择中位数来表示 这组数据的“集中趋势”.
二 、众数、中位数、平均数与频率分布直方图 的关系
0.5
1 1.5 2 2.5 3
3.5 4
月均用水量 /t
4.5
2、在样本中,有50%的个体小于或等于中 位数,也有50%的个体大于或等于中位数.
频率分布直方图如下:
频率 组距
0.50 0.40 0.30 0.20 0.10
0.5
中Βιβλιοθήκη Baidu数 2.03
1 1.5 2 2.5 3 3.5 4
月均用水量 /t
经理 管理人员 高级技工 工人 学徒 合计
2200 250
220
200 100
16
5
10 1 23
2200 1500
1100
2000 100 6900
(1)指出这个问题中周工资的众数、中位数、 平均数
(2)这个问题中,工资的平均数能客观地反映 该厂的工资水平吗?为什么?
(加权平均数)
分析:众数为200,中位数为220,平均数为300。
频率分布直方图如下:
频率 组距
0.50 0.40 0.30 0.20 0.10
0.5
平均数 1.973
1 1.5 2 2.5 3 3.5 4
月均用水量 /t
4.5
问题:
有两位射击运动员在一次射击测试中 各射靶十次,每次命中的环数如下: 甲 7 8 7 9 5 4 9 10 7 4 乙9578768 6 77
(3)频率分布表与频率分布直方图则损失了样本的一些 信息,必须在完成抽样后才能制作。
2.2.2 用样本估计总体(2)
1、用样本频率分布估计总体分布 2、用样本数字特征分布估计总体数字特征
问题:
高二某班同学在老师的布置下,用单摆进行测试, 以检验重力加速度.全班同学两人一组,在相同条件 下进行测试,得到下列实验数据(单位:m/s2): 9.62 9.5 9.78 9.94 10.01 9.66 9.88 9.68 10.32 9.76 9.45 9.99 9.81 9.56 9.78 9.72 9.93 9.94 9.65 9.79 9.42 9.68 9.70 9.84 9.90
4.5
说明:
2.03这个中位数的估计值,与样本的 中位数值2.0不一样,这是因为样本数据 的频率分布直方图,只是直观地表明分 布的形状,但是从直方图本身得不出原 始的数据内容,所以由频率分布直方图 得到的中位数估计值往往与样本的实 际中位数值不一致.
3、平均数是频率分布直方图的“重 心”,是直方图的平衡点.
1、众数在样本数据的频率分布直方图 中,就是最高矩形的中点的横坐标。
例如,在上一节调查的100位居民的月 均用水量的问题中,从这些样本数据的频 率分布直方图可以看出,月均用水量的众 数是2.25t.如图所示:
频率分布直方图如下:
频率 组距
众数(最高的矩形的中点)2.25
0.50 0.40 0.30 0.20 0.10
上面表里的17个数据可看成是按从小到大的顺序 排列的,其中第9个数据1.70是最中间的一个数据,即 这组数据的中位数是1.70;
这组数据的平均数是
答:17名运动员成绩的众数、中位数、平均数依次是 1.75(米)、1.70(米)、1.69(米).
例1 某工厂人员及工资构成如下:
人员 周工资 人数 合计
练习: 在一次中学生田径运动会上,参加 男子跳高的17名运动员的成绩如下表所示:
成绩 (单位:米)
1.50
1.60
1.65
1.70
1.75
1.80
1.85
1.90
人数 2 3 2 3 4 1 1 1
分别求这些运动员成绩的众数,中位数与平均数
解:在17个数据中,1.75出现了4次,出现的次数最 多,即这组数据的众数是1.75.
如果你是教练,你应当如何对这次射击情 况作出评价?如果这是一次选拔性考核,你应 当如何作出选择?
两人射击 的平均成绩是一样的. 那么两个 人的水平就没有什么差异吗?
频率 0.3
0.2
0.1 频率
4 5 6 7 8 9 10
(甲)
0.4 0.3 0.2 0.1
4 5 6 7 8 9 10 (乙)
怎样用这些数据对重力加速度进行估计?
一、众数、中位数、平均数的概念
一般地,n个数据按大小顺序排列,处于最中间 位置的一个数据(或最中间两个数据的平均数)叫做 这组数的中位数(median).
一组数据中出现次数最多的那个数据叫做这组数 的众数(mode).
平均数(算术平均数)是指资料中各观测值的 总和除以观测值个数所得的商,简称平均数或均数.
平均数、中位数、众数都是描述数据的“集中趋势” 的“特征数”,它们各自特点如下:
用平均数作为一组数据的代表,比较可靠和稳定,它 与这组数据中的每一个数都有关系.对这些数据所包 含的信息的反映最为充分,因而应用最为广泛,特别 是在进行统计推断时有重要作用,但计算较繁琐,并 且易受极端数据的影响.
第五步: 画频率分布直方图(在频率分布表的基础上绘制,横
坐标为样本数据尺寸,纵坐标为频率/组距.)
茎叶图、频率分布表与频率分布直方图的比较
(1)都是用来描述样本数据的分布情况的。
(2)茎叶图由所有的样本数据构成,没有损失任何样本 信息;同时,茎叶图中的数据可以随时记录,随时添加, 方便记录与表示(这对于教练员发现运动员现场状态特 别有用).但当样本的数据较多时,枝叶就会很长,茎 叶图就显得不太方便;
绘制频率分布直方图步骤?
第一步: 求极差: (数据组中最大值与最小值的差距) 第二步: 决定组距与组数: (取整)
组距:指每个小组的两个端点的距离,组距
组数:将数据分组,当数据在100个以内时,
按数据多少常分5-12组。
组数=
极差 组距
4.1 0.5
8.2
第三步: 将数据分组 ( 给出组边界)
第四步: 列频率分布表. (包括分组、频数、频率、频率/组距)
用众数作为一组数据的代表,可靠性较差,但众数不 受极端数据的影响,并且求法简便,当一组数据中个 别数据变动较大时,适宜选择众数来表示这组数据的 “集中趋势”.
用中位数作为一组数据的代表,可靠性也较差,但中 位数也不受极端数据的影响,也可选择中位数来表示 这组数据的“集中趋势”.
二 、众数、中位数、平均数与频率分布直方图 的关系
0.5
1 1.5 2 2.5 3
3.5 4
月均用水量 /t
4.5
2、在样本中,有50%的个体小于或等于中 位数,也有50%的个体大于或等于中位数.
频率分布直方图如下:
频率 组距
0.50 0.40 0.30 0.20 0.10
0.5
中Βιβλιοθήκη Baidu数 2.03
1 1.5 2 2.5 3 3.5 4
月均用水量 /t
经理 管理人员 高级技工 工人 学徒 合计
2200 250
220
200 100
16
5
10 1 23
2200 1500
1100
2000 100 6900
(1)指出这个问题中周工资的众数、中位数、 平均数
(2)这个问题中,工资的平均数能客观地反映 该厂的工资水平吗?为什么?
(加权平均数)
分析:众数为200,中位数为220,平均数为300。
频率分布直方图如下:
频率 组距
0.50 0.40 0.30 0.20 0.10
0.5
平均数 1.973
1 1.5 2 2.5 3 3.5 4
月均用水量 /t
4.5
问题:
有两位射击运动员在一次射击测试中 各射靶十次,每次命中的环数如下: 甲 7 8 7 9 5 4 9 10 7 4 乙9578768 6 77
(3)频率分布表与频率分布直方图则损失了样本的一些 信息,必须在完成抽样后才能制作。
2.2.2 用样本估计总体(2)
1、用样本频率分布估计总体分布 2、用样本数字特征分布估计总体数字特征
问题:
高二某班同学在老师的布置下,用单摆进行测试, 以检验重力加速度.全班同学两人一组,在相同条件 下进行测试,得到下列实验数据(单位:m/s2): 9.62 9.5 9.78 9.94 10.01 9.66 9.88 9.68 10.32 9.76 9.45 9.99 9.81 9.56 9.78 9.72 9.93 9.94 9.65 9.79 9.42 9.68 9.70 9.84 9.90
4.5
说明:
2.03这个中位数的估计值,与样本的 中位数值2.0不一样,这是因为样本数据 的频率分布直方图,只是直观地表明分 布的形状,但是从直方图本身得不出原 始的数据内容,所以由频率分布直方图 得到的中位数估计值往往与样本的实 际中位数值不一致.
3、平均数是频率分布直方图的“重 心”,是直方图的平衡点.
1、众数在样本数据的频率分布直方图 中,就是最高矩形的中点的横坐标。
例如,在上一节调查的100位居民的月 均用水量的问题中,从这些样本数据的频 率分布直方图可以看出,月均用水量的众 数是2.25t.如图所示:
频率分布直方图如下:
频率 组距
众数(最高的矩形的中点)2.25
0.50 0.40 0.30 0.20 0.10
上面表里的17个数据可看成是按从小到大的顺序 排列的,其中第9个数据1.70是最中间的一个数据,即 这组数据的中位数是1.70;
这组数据的平均数是
答:17名运动员成绩的众数、中位数、平均数依次是 1.75(米)、1.70(米)、1.69(米).
例1 某工厂人员及工资构成如下:
人员 周工资 人数 合计
练习: 在一次中学生田径运动会上,参加 男子跳高的17名运动员的成绩如下表所示:
成绩 (单位:米)
1.50
1.60
1.65
1.70
1.75
1.80
1.85
1.90
人数 2 3 2 3 4 1 1 1
分别求这些运动员成绩的众数,中位数与平均数
解:在17个数据中,1.75出现了4次,出现的次数最 多,即这组数据的众数是1.75.
如果你是教练,你应当如何对这次射击情 况作出评价?如果这是一次选拔性考核,你应 当如何作出选择?
两人射击 的平均成绩是一样的. 那么两个 人的水平就没有什么差异吗?
频率 0.3
0.2
0.1 频率
4 5 6 7 8 9 10
(甲)
0.4 0.3 0.2 0.1
4 5 6 7 8 9 10 (乙)
怎样用这些数据对重力加速度进行估计?
一、众数、中位数、平均数的概念
一般地,n个数据按大小顺序排列,处于最中间 位置的一个数据(或最中间两个数据的平均数)叫做 这组数的中位数(median).
一组数据中出现次数最多的那个数据叫做这组数 的众数(mode).
平均数(算术平均数)是指资料中各观测值的 总和除以观测值个数所得的商,简称平均数或均数.