数学231《总体特征数的估计》苏教必修3 ppt课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
怎样用这些数据对重力加速度进行估计?
8
我们常用算术平均数
(其中ai(i=1,2,n1…in,1 ani )为n个实验数据)作为
重力加速度的“最理想”的近似值,它的依据 是什么呢?
9
处理实验数据的原则是使这个近似值与实验数 据之间的离差尽可能地小.
(i=1设,2这…个…近n)似的值离为差x分,那别么为它x-与a1n,x个-a实2,x验-a数…据x-aain, 由于上述离差有正有负,故不宜直接相加.故我们 考虑离差的平方和
(x-a1)2+(x-a2)2+…+(x-an)2, 当x为何值时,此和最小.
(x-a1)2+(x-a2)2+…+(x-an)2 =nx2-2(a1+a2+…+an)x+ a12+a22+…+an2.
所以当x= 1n(a1 a2 an) 时
离差的平方和最小.
10
故可用x= 1n(a1 a2 an) 作为表示这个物理量的理想近似值, 称其为这n个数据a1,a2,…,an的平均 数或均值一般记为:
合计
人数 频率 5 0.05 17 0.17 33 0.33 37 0.37 6 0.06 2 0.02
100 1
14
例2.下面是某校学生日睡眠时间的抽样 频率分布表(单位:h),试估计该校学生
的日平均睡眠时间.
分析:要确定这100名学生的平均睡眠时间, 就必须计算其总睡眠时间.由于每组中的 个体睡眠时间只是一个范围,可以用各组区间 的组中值近似地表示.
(h). 答:估计该校学生的日平均睡眠时间约为7.39h.
(加权平均数)
一般地若取值为x1,x2,…xn 的频率分别是p1,p2,…pn, 则其平均数为x1p1+x2p2+…+xnpn.
16
例3.某单位年收入在10000到15000、15000 到20000、20000到25000、25000到30000、 30000到35000、35000到40000及40000到 50000元之间的职工所占的比分别为10%,15 %,20%,25%,15%,10%和5%,试估计 该单位职工的平均年收入.
4
这组数据的平均数是
答:17名运动员成绩的众数、中位数、平均数依次是 1.75(米)、1.70(米)、1.69(米). 用这些特征数据对总体进行估计的优缺点是什么?
5
平均数、中位数、众数都是描述数据的“集中趋势” 的“特征数”,它们各自特点如下:
用平均数作为一组数据的代表,比较可靠和稳定,它 与这组数据中的每一个数都有关系.对这些数据所包 含的信息的反映最为充分,因而应用最为广泛,特别 是在进行统计推断时有重要作用,但计算较繁琐,并 且易受极端数据的影响.
用众数作为一组数据的代表,可靠性较差,但众数不 受极端数据的影响,并且求法简便,当一组数据中个 别数据变动较大时,适宜选择众数来表示这组数据的 “集中趋势”.
用中位数作为一组数据的代表,可靠性也较差,但中 位数也不受极端数据的影响,也可选择中位数来表示 这组数据的“集中趋势”.
6
任何一个样本数据的改变都会引起 平均数的改变.这是中位数、众数都不 具备的性质,也正是这个原因,与众 数、中位数比较起来,平均数可以反 映出更多的关于样本数据全体的信息.
解法1:总睡眠时间约为
6.25×5+6.75×17+7.25×33+7.75×37
+8.25×6+8.75×2=739(h).
故平均睡眠时间约为7.39h.
15
解法2:求组中值与对应频率之积的和 原式=6.25×0.05+6.75×0.17+7.24×0.33 +7.75×0.37+8.25×0.06+8.75×0.02=7.39
7
问题引入:
某校高一(1)班同学在老师的布置下,用单摆进行测试, 以检验重力加速度.全班同学两人一组,在相同条件
下进行测试,得到下列实验数据(单位:m/s2): 9.62 9.5 9.78 9.94 10.01 9.66 9.88 9.68 10.32 9.76 9.45 9.99 9.81 9.56 9.78 9.72 9.93 9.94 9.65 9.79 9.42 9.68 9.70 9.84 9.90
一组数据中出现次数最多的那个数据叫做这组数 的众数(mode).
算术平均数是指资料中各观测值的总和除以观 测值个数所得的商,简称平均数或均数.
用这些特征数据对总体进行估计的优缺点是什么?
3
例: 在一次中学生田径运动会上,参加男 子跳高的17名运动员的成绩如下表所示:
成绩 (单位:米)
1.50
1.60
1.65
1.70
Leabharlann Baidu1.75
1.80
1.85
1.90
人数 2 3 2 3 4 1 1 1
分别求这些运动员成绩的众数,中位数与平均数
解:在17个数据中,1.75出现了4次,出现的次数最 多,即这组数据的众数是1.75.
上面表里的17个数据可看成是按从小到大的顺序 排列的,其中第9个数据1.70是最中间的一个数据,即 这组数据的中位数是1.70;
aa1a2 an n
故根据实验数据估计重力加速度的 最佳近似值为9.774m/s2
11
例1
12
例1 某校高一年级的甲、乙两个班级 (均为50人)的语文测试成绩如下 (总分:150分),试确定这次考试中, 哪个班的语文成绩更好一些.
分析:我们可用一组数据的平均数衡量这组 数据的水平,因此,分别求得甲、乙两个 班级的平均分即可.
解:用科学计算器分别求得
甲班的平均分为101.1, 乙班的平均分为105.4, 故这次考试乙班成绩要好于甲班.
13
例2.下面是某校学 生日睡眠时间的抽样 频率分布表(单位: h),试估计该校学生 的日平均睡眠时间.
睡眠时间 [6,6.5) [6.5,7) [7,7.5) [7.5,8) [8,8.5) [8.5,9]
1
整体介绍:
用样本的有关情况去估计总体的相应情况, 这种估计大体分为两类,一类是用样本频率分 布估计总体分布,一类是用样本的某种数字特 征(例如平均数、方差等)去估计总体的相应 数字特征。
在数学中,通常把能反映总体某种特征的量 称为总体特征数.
2
概念:
一、众数、中位数、平均数的概念
一般地,n个数据按大小顺序排列,处于最中间 位置的一个数据(或最中间两个数据的平均数)叫做 这组数的中位数(median).
8
我们常用算术平均数
(其中ai(i=1,2,n1…in,1 ani )为n个实验数据)作为
重力加速度的“最理想”的近似值,它的依据 是什么呢?
9
处理实验数据的原则是使这个近似值与实验数 据之间的离差尽可能地小.
(i=1设,2这…个…近n)似的值离为差x分,那别么为它x-与a1n,x个-a实2,x验-a数…据x-aain, 由于上述离差有正有负,故不宜直接相加.故我们 考虑离差的平方和
(x-a1)2+(x-a2)2+…+(x-an)2, 当x为何值时,此和最小.
(x-a1)2+(x-a2)2+…+(x-an)2 =nx2-2(a1+a2+…+an)x+ a12+a22+…+an2.
所以当x= 1n(a1 a2 an) 时
离差的平方和最小.
10
故可用x= 1n(a1 a2 an) 作为表示这个物理量的理想近似值, 称其为这n个数据a1,a2,…,an的平均 数或均值一般记为:
合计
人数 频率 5 0.05 17 0.17 33 0.33 37 0.37 6 0.06 2 0.02
100 1
14
例2.下面是某校学生日睡眠时间的抽样 频率分布表(单位:h),试估计该校学生
的日平均睡眠时间.
分析:要确定这100名学生的平均睡眠时间, 就必须计算其总睡眠时间.由于每组中的 个体睡眠时间只是一个范围,可以用各组区间 的组中值近似地表示.
(h). 答:估计该校学生的日平均睡眠时间约为7.39h.
(加权平均数)
一般地若取值为x1,x2,…xn 的频率分别是p1,p2,…pn, 则其平均数为x1p1+x2p2+…+xnpn.
16
例3.某单位年收入在10000到15000、15000 到20000、20000到25000、25000到30000、 30000到35000、35000到40000及40000到 50000元之间的职工所占的比分别为10%,15 %,20%,25%,15%,10%和5%,试估计 该单位职工的平均年收入.
4
这组数据的平均数是
答:17名运动员成绩的众数、中位数、平均数依次是 1.75(米)、1.70(米)、1.69(米). 用这些特征数据对总体进行估计的优缺点是什么?
5
平均数、中位数、众数都是描述数据的“集中趋势” 的“特征数”,它们各自特点如下:
用平均数作为一组数据的代表,比较可靠和稳定,它 与这组数据中的每一个数都有关系.对这些数据所包 含的信息的反映最为充分,因而应用最为广泛,特别 是在进行统计推断时有重要作用,但计算较繁琐,并 且易受极端数据的影响.
用众数作为一组数据的代表,可靠性较差,但众数不 受极端数据的影响,并且求法简便,当一组数据中个 别数据变动较大时,适宜选择众数来表示这组数据的 “集中趋势”.
用中位数作为一组数据的代表,可靠性也较差,但中 位数也不受极端数据的影响,也可选择中位数来表示 这组数据的“集中趋势”.
6
任何一个样本数据的改变都会引起 平均数的改变.这是中位数、众数都不 具备的性质,也正是这个原因,与众 数、中位数比较起来,平均数可以反 映出更多的关于样本数据全体的信息.
解法1:总睡眠时间约为
6.25×5+6.75×17+7.25×33+7.75×37
+8.25×6+8.75×2=739(h).
故平均睡眠时间约为7.39h.
15
解法2:求组中值与对应频率之积的和 原式=6.25×0.05+6.75×0.17+7.24×0.33 +7.75×0.37+8.25×0.06+8.75×0.02=7.39
7
问题引入:
某校高一(1)班同学在老师的布置下,用单摆进行测试, 以检验重力加速度.全班同学两人一组,在相同条件
下进行测试,得到下列实验数据(单位:m/s2): 9.62 9.5 9.78 9.94 10.01 9.66 9.88 9.68 10.32 9.76 9.45 9.99 9.81 9.56 9.78 9.72 9.93 9.94 9.65 9.79 9.42 9.68 9.70 9.84 9.90
一组数据中出现次数最多的那个数据叫做这组数 的众数(mode).
算术平均数是指资料中各观测值的总和除以观 测值个数所得的商,简称平均数或均数.
用这些特征数据对总体进行估计的优缺点是什么?
3
例: 在一次中学生田径运动会上,参加男 子跳高的17名运动员的成绩如下表所示:
成绩 (单位:米)
1.50
1.60
1.65
1.70
Leabharlann Baidu1.75
1.80
1.85
1.90
人数 2 3 2 3 4 1 1 1
分别求这些运动员成绩的众数,中位数与平均数
解:在17个数据中,1.75出现了4次,出现的次数最 多,即这组数据的众数是1.75.
上面表里的17个数据可看成是按从小到大的顺序 排列的,其中第9个数据1.70是最中间的一个数据,即 这组数据的中位数是1.70;
aa1a2 an n
故根据实验数据估计重力加速度的 最佳近似值为9.774m/s2
11
例1
12
例1 某校高一年级的甲、乙两个班级 (均为50人)的语文测试成绩如下 (总分:150分),试确定这次考试中, 哪个班的语文成绩更好一些.
分析:我们可用一组数据的平均数衡量这组 数据的水平,因此,分别求得甲、乙两个 班级的平均分即可.
解:用科学计算器分别求得
甲班的平均分为101.1, 乙班的平均分为105.4, 故这次考试乙班成绩要好于甲班.
13
例2.下面是某校学 生日睡眠时间的抽样 频率分布表(单位: h),试估计该校学生 的日平均睡眠时间.
睡眠时间 [6,6.5) [6.5,7) [7,7.5) [7.5,8) [8,8.5) [8.5,9]
1
整体介绍:
用样本的有关情况去估计总体的相应情况, 这种估计大体分为两类,一类是用样本频率分 布估计总体分布,一类是用样本的某种数字特 征(例如平均数、方差等)去估计总体的相应 数字特征。
在数学中,通常把能反映总体某种特征的量 称为总体特征数.
2
概念:
一、众数、中位数、平均数的概念
一般地,n个数据按大小顺序排列,处于最中间 位置的一个数据(或最中间两个数据的平均数)叫做 这组数的中位数(median).