2.2.2用样本的数字特征估计总体的数字特征 (第二课时)解析
2.2.2用样本的数字特征估计总体的数字特征 (2)
复习回顾 1. 对一个未知总体,我们常用样本的频率分布估 计总体的分布,其中表示样本数据的频率分布的 基本方法有哪些?
频率分布表 频率分布条形图
频率分布直方图 频率分布折线图
茎叶图
2.众数、中位数与平均数
3.如何根据频率分布直方图估计出众数、中位数与平均数
C.-x 1=-x 2,s1=s2
D.-x 1<-x 2,s1>s2
例 2.(1)已知一组数据 x1,x2,…,xn 的方差是 a,求另一组数据 x1-2,x2-2,…,xn-2 的方差;
(2)设一组数据 x1,x2,…,xn 的标准差为 sx,另一组数据 3x1 +a,3x2+a,…,3xn+a 的标准差为 sy,求 sx 与 sy 的关系.
1.0
x5
0.8
s0
0.6
0.4
0.2
O 12345678
(1)
频率பைடு நூலகம்
1.0
x5
0.8
s 0.82
0.6
0.4
0.2
O1 2 3 4 5 6 7 8
(2)
例1 画出下列四组样本数据的条形图,说明他们的异同点. (3) 3,3,4,4,5,6,6,7,7; (4) 2,2,2,2,5,8,8,8,8.
频率
1.0 0.8 0.6 0.4 0.2
O 12345678
(3)
例1 画出下列四组样本数据的条形图,说明他们的异同点. (3) 3,3,4,4,5,6,6,7,7; (4) 2,2,2,2,5,8,8,8,8.
频率
1.0 0.8 0.6 0.4 0.2
O 12345678
课件4:2.2.2 用样本的数字特征估计总体的数字特征
利用频率分布直方图求数字特征 (1)众数是最高的矩形的底边的中点. (2)中位数左右两侧直方图的面积相等. (3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐 标. (4)利用直方图求众数、中位数、平均数均为近似值,往往与实 际数据得出的不一致.但它们能粗略估计其众数、中位数和平 均数.
2.(1)(2016·福建检测)为了普及环保知识,增强环 保意识,某大学随机抽取 30 名学生参加环保知识测试,得分(十 分制)如图所示,假设得分值的中位数为 me,众数为 m0,平均 值为-x ,则( D )
2.标准差与方差 (1)标准差:标准差是样本数据到平均数的一种平均距离,一般 用 s 表示,计算时通常用公式
s=__________________________________________ 显然,标准差越大,数据的离散程度越大;标准差越小,数据 的离散程度越小. (2)方差:标准差 s 的平方 s2,即 s2= _n1_[_(x_1_-__-_x_)_2+__…__+__(_x_n_-__-x__)2_]_____叫做这组数据的方差,同标准 差一样,方差也是用来测量样本数据的分散程度的特征数.
3.平均数受样本中的每一个数据的影响,“越离群”的数据, 对平均数的影响也越大.与众数和中位数相比,平均数代表了 数据更多的信息.当样本数据质量比较差时,使用平均数描述 数据的中心位置可能与实际情况产生较大的误差.可以利用计 算机模拟样本,向学生展示错误数据对样本平均数的影响程 度.在体育、文艺等各种比赛的评分中,使用的是平均数.计 分过程中采用“去掉一个最高分,去掉一个最低分”的方法, 就是为了防止个别裁判的人为因素而给出过高或过低的分数对 选手的得分造成较大的影响,从而降低误差,尽量保证公平性.
合计
2.2.2 用样本的数字特征估计总体的数字特征(2)
x甲 x乙
∴乙种玉米的苗长得高.
(2)由方差公式得:
1 s甲= [(25-30)2+(41-30)2+…+(42-30)2]=104.2, 10
2
2 同:乙种玉米苗长得高,甲种玉米苗长得齐.
2
2
课后作业
1.甲、乙两种水稻试验品种连续 5 年的平均单位面积产量如 下(单位:t/hm2),试根据这组数据估计哪一种水稻品种的产 量比较稳定.
课堂练习
1.如图是某校举行的元旦诗歌朗诵比赛中, 七位评委为某位选手打出分数的茎叶统计图 ,
去掉一个最高分和一个最低分,所剩数据
的平均数和方差分别为( (A)84,4.84 (B)84,1.6 )
(C)85,1.6
(D)85,0.4
【解析】选C.得分是79,84,84,86,84,87,93,最高分是93,最低分 是79,则去掉一个最高分和一个最低分后该选手得分是84,84, 86,84,87,计算得平均数是85,方差是1.6.
(2)因平均数为300,由表格中所列出的数据可见,只有经理 在平均数以上,其余的人都在平均数以下,故用平均数不能 客观真实地反映该工厂的工资水平.
因此,在例子中的解答过程可表述为: 解:由数据可得:
1 1 7 x甲 (7 8 7 4) 7, x乙 (9 5 7 7) 10 10
x甲 x乙
∴从平均成绩看甲、乙二人的成绩无明显差异。
1 7 72 8 72 4 72 2 s甲 10
|x1- x |+|x2- x |+„+|xn- x | S= .由于上式含有绝对值, n
运算不太方便,因此,通常改用如下公式来计算标准差:
s= 1 2 2 2 [ x - x + x - x +„+ x - x ]. 2 n n 1
2.2.2用样本的数字特征估计总体的数字特征(2)
| x1 x |
| x2 x | n
| xn
x|
含有绝对值,运算不方便
思考4:反映样本数据的分散程度的大小,最常用的统计 量是标准差,一般用s表示.假设样本数据x1,x2,…,xn 的平均数为 x ,则标准差的计算公式是:
s
(x 1 x )
2
(x 2 x ) n
2
(x n x )
2
那么标准差的取值范围是什么?标准差为0的样本数据有 何特点? s≥0,标准差为0的样本数据都相等.
(甲)
频率
(乙)
0.4 0.3 0.2 0.1 4 5 6 7 8 9 10 环数 O
4 5 6 7 8 9 10 环数
甲的成绩比较分散,极差较大,
乙的成绩相对集中,比较稳定.
思考3:对于样本数据x1,x2,…,xn,设想通过各数据到 其平均数的平均距离来反映样本数据的分散程度,那么这 个平均距离如何计算?
2.2.2
用样本的数字特征估计
总体的数字特征(2)
1.理解样本数据方差、标准差的意义,会计算方差、
标准差;
2.会用样本的基本数字特征(平均数、标准差)估计
总体的基本数字特征;
3.体会用样本估计总体的思想.
复习回顾
知识点一 众数
新知探究 点点落实
定义 在一组数据中,出现次数最多的数据叫做这组数据的众数. 特点 (1)众数是这组数据中出现次数最多的数; (2)众数可以有一个或多 个;(3) 众数大致的值就是样本数据的频率分布直方图中最高矩形的中点 的横坐标. (4) 用众数代表一组数据,可靠性较差,不过,众数不受极端数 据的影响,并且求法简便 .在一组数据中,如果个别数据有很大的变动, 而某一数据出现次数又较多时,选择众数表示这组数据的“集中趋势”就 比较适合.
2.2.2 用样本的数字特征估计总体的数字特征标准差
标准差
平均数向我们提供了样本数据的重要信息,但是 平均数向我们提供了样本数据的重要信息 但是 平均有时也会使我们作出对总体的片面判断. 平均有时也会使我们作出对总体的片面判断.因 为这个平均数掩盖了一些极端的情况, 为这个平均数掩盖了一些极端的情况,而这些极 端情况显然是不能忽的.因此, 端情况显然是不能忽的.因此,只有平均数还难 以概括样本数据的实际状态. 以概括样本数据的实际状态. 如:有两位射击运动员在一次射击测试中各 射靶10次 每次命中的环数如下: 射靶 次,每次命中的环数如下:
考察样本数据的分散程度的大小, 考察样本数据的分散程度的大小,最常用的统计量是 标准差. 标准差. 标准差是样本平均数的一种平均距离,一般用s表示 表示. 标准差是样本平均数的一种平均距离,一般用 表示. 所谓“平均距离” 其含义可作如下理解: 所谓“平均距离”,其含义可作如下理解: 假设样本数据是 x1 , x 2 ,⋅ ⋅ ⋅, x n , x 表示这组数据的平均 的距离是: 数,则 x i 到 x 的距离是: 则 的平均距离是: 于是样本数据 x1 , x 2 ,⋅ ⋅ ⋅, x n 到 x 的平均距离是:
甲 25.46, 25.32, 25.45, 25.39, 25.36 25.34, 25.42, 25.45, 25.38, 25.42 25.39, 25.43, 25.39, 25.40, 25.44 乙 25.40, 25.42, 25.35, 25.41, 25.39 25.40, 25.43, 25.44, 25.48, 25.48 25.47, 25.49, 25.49, 25.36, 25.34 25.33, 25.43, 25.43, 25.32, 25.47 25.31, 25.32, 25.32, 25.32, 25.48
我的课件——2.2.2用样本的数字特征估计总体的数字特征.(2)
解:四组样本数 据的条形图是:
x5
S=0.00
1 2 3 4 5 (1)
6 7 8
频率
频率
1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 o
x5
S=0.82
1 2 3 45 (2)
6 7 8
四组数据的平均数都是5.0,标准 差分别是0.00,0.82,1.49,2.83.虽 然它们有相同的平均数,但是它 们有不同的标准差,说明数据的 分散程度是不一样的.
环数 (甲)
甲的环数极差=10-4=6
乙的环数极差=9-5=4.
它们在一定程度上表明了样 本数据的分散程度,与平均数一 起,可以给我们许多关于样本数 据的信息.显然,极差对极端值非 常敏感,注意到这一点,我们可以 得到一种“去掉一个最高分,去 掉一个最低分”的统计策略. 环数
0.4 0.3 0.2
0.1Байду номын сангаас
4 5 6 7 8 (乙) 9 10
考察样本数据的分散程度的大小,最常用的统计量是 标准差.标准差是样本平均数的一种平均距离,一般 用s表示. 所谓“平均距离”,其含义可作如下理解:
假设样本数据是 1 , x2 ,...xn , x 表示这组数据的平均数 i到 x 的距离是: x 。x
xi x ( i 1, 2, , n).
乙
从生产的零件内径的尺寸来看,谁生产的质量较高?
解:用计算器计算可得:
x甲 25.4005 x乙 25,4008 , ; s甲 0.038 s乙 0.074 ,
从样本平均数看,甲生产的零件内径比乙生产 的更接近内径标准(25.40mm),但是差异很小;从 样本标准差看,由于
课件5:2.2.2 用样本的数字特征估计总体的数字特征
[归纳升华] (1)平均数计算方法 ①定义法:n 个数据 a1,a2,…,an 的平均数 a=a1+a2+n …+an. ②利用加权平均数公式: 在 n 个数据中,如果 x1 出现 f1 次,x2 出现 f2 次,…,xk 出现 fk 次(f1+f2+… +fk=n),则这 n 个数的平均数为:x=x1f1+x2f2+n …+xkfk. ③当数据较大时,用公式 x=x′+a 简化计算.
s2乙
=
1 6
[(99
-100)2+(100
-100)2+(102
-100)2
+
(99
-100)2
+
(100
-
100)2+
(100-100)2]=1.
(2)两台机床所加工零件的直径的平均数相同,又 s2甲>s乙2 ,所以乙机床加工
零件的质量更稳定.
[归纳升华] 1.计算标准差的方法 (1)算出样本数据的平均数. (2)算出每个样本数据与样本平均数的差 xi- x (i=1,2,…,n). (3)算出(xi- x )2(i=1,2,…,n). (4)算出(xi- x )2(i=1,2,…,n)这 n 个数的平均数,即为样本方差 s2. (5)算出方差的算术平方根,即为样本标准差 s.
[126.5,128.5)
[128.5,130.5]
(2)作出频率分布直方图;
(3)根据频率分布直方图或频率分布表求这组数据的众数、中位数和平均数.
课件3:2.2.2 用样本的数字特征估计总体的数字特征
A.1196
图 2-2-14
B.376
C.36
D.6 7 7
解析:∵由题意知去掉一个最高分和一个最低分后,所剩 的数据是87,90,90,91,91,94,90+x.
答案:B
[方法·规律·小结] 1.用样本平均数估计总体平均数 (1)平均数描述了数据的平均水平,定量地反映了数据的集中趋 势所处的水平. (2)两次从总体中抽取容量相同的样本,分别求出样本的平均数, 两个样本的平均数一般是不同的,所以用样本平均数去估计总 体平均数时,样本平均数只是总体平均数的近似值.
答案:343.6
2.在广雅中学“十佳学生”评选的演讲比赛中,图2-2-13 是七位评委为某学生打出的分数的茎叶图,去掉一个最高 分和一个最低分后,所剩数据的众数和中位数分别为(C )
A.85,85 C.84,85
图 2-2-13
B.84,86 D.85,86
题型 2 平均数、方差的应用 例2 有甲、乙两种钢筋,现从中各抽取10个样本检查它 们的抗拉强度(单位: 若某校高一年级8个班参加合唱比赛的得分如图 2-2-12所示的茎叶图,则这组数据的中位数和平均数分别 是(A )
A.91.5 和 91.5 C.91 和 91.5
图 2-2-12
B.91.5 和 92 D.92 和 92
2.用样本标准差估计总体标准差
(1)统计量标准差的作用是考察样本数据的_分__散_程度的大小.
2.平均数与方差、标准差的实际应用
在实际应用中,若对平均数相同的两组数据评价好坏, 要结合方差、标准差进行分析.方差较小的数据体现了 该组数据的总体稳定性较好;方差较大的数据,体现 了该组数据的总体波动较大.
谢谢!!!
甲 110 120 130 125 120 125 135 125 135 x 乙 115 100 125 130 115 125 125 145 125 y
2.2.2用样本的数字特征估计总体的数字特征
件中各抽出20件, 量得其内径尺寸如下 (单位: mm):
甲 分25析.46: 评25定.3两2 人2所5.4生5产2零5.件39的质25量.36高低, 主要是看
是否符25合.34规定25尺.4寸2 . 2与5.规45定尺25寸.38偏离25很.42小, 则质量高;
与规定2255尺..3490寸的2255偏..44离32 大22,55..33则95 质22量55..低4401.
1.0
0.9
0.8 0.7
x5
①求平均数. 平均数相同.
(2) 4, 4, 4, 5, 5, 5, 6, 6, 6;
0.6 s0.00
0.5
②求标准差
(3) 3, 3, 4由, 4标, 5准, 6差, 6看, 出7, (71;)组均匀00程..34 度最好, (4)组最差.
(4) 2, 2, 2, 2, 5, 8, 8, 8, 8.
25.44 25.39
乙 检25测.40偏离25程.4度3 的2大5.4小4, 2就5.要48计算25其.48标准差.
25.47 25.49 25.49 25.36 25.34
25.33 25.43 25.43 25.32 25.47
25.31 25.32 25.32 25.32 25.48
从生产的零件内径尺寸看, 谁生产的质量较高?
上例中两运动员射击成绩的条形图如图:
频率
频率
0.4
0.4
0.3
0.3
0.2
0.2
0.1
0.1
4 5 6 7 8 9 10 环数
(甲)
4 5 6 7 8 9 10 环数
(乙)
频率
例1. 画出下列四组样本数据 的条形图, 说明它们的异同点. (1) 5, 5, 5, 5, 5, 5, 5, 5, 5;
山东省高中数学《2.2.2 用样本的数字特征估计总体的数字特征》教案2 新人教A版必修3
第2课时标准差导入新课思路1平均数为我们提供了样本数据的重要信息,但是,有时平均数也会使我们作出对总体的片面判断.某地区的统计显示,该地区的中学生的平均身高为176 cm,给我们的印象是该地区的中学生生长发育好,身高较高.但是,假如这个平均数是从五十万名中学生抽出的五十名身高较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身体素质.因此,只有平均数难以概括样本数据的实际状态.所以我们学习从另外的角度来考察样本数据的统计量——标准差.(教师板书课题)思路2在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员:7,8,7,9,5,4,9,10,7,4;乙运动员:9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥得更稳定些吗?如果你是教练,选哪位选手去参加正式比赛?我们知道,x甲=7,x乙=7.两个人射击的平均成绩是一样的.那么,是否两个人就没有水平差距呢?从上图直观上看,还是有差异的.很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们从另外的角度来考察这两组数据——标准差.推进新课新知探究提出问题(1)如何通过频率分布直方图估计数字特征(中位数、众数、平均数)?(2)有甲、乙两种钢筋,现从中各抽取一个标本(如下表)检查它们的抗拉强度(单位:kg/mm2),通过计算发现,两个样本的平均数均为125.甲110 121312512125135125135125乙115 112513115125125145125145哪种钢筋的质量较好?(3)某种子公司为了在当地推行两种新水稻品种,对甲、乙两种水稻进行了连续7年的种植对比实验,年亩产量分别如下:(千克)甲:600, 880, 880, 620, 960, 570, 900(平均773)乙:800, 860, 850, 750, 750, 800, 700(平均787)请你用所学统计学的知识,说明选择哪种品种推广更好?(4)全面建设小康社会是我们党和政府的工作重心,某市按当地物价水平计算,人均年收入达到1.5万元的家庭即达到小康生活水平.民政局对该市100户家庭进行调查统计,它们的人均收入达到了1.6万元,民政局即宣布该市民生活水平已达到小康水平,你认为这样的结论是否符合实际?(5)如何考查样本数据的分散程度的大小呢?把数据在坐标系中刻画出来,是否能直观地判断数据的离散程度?讨论结果:(1)利用频率分布直方图估计众数、中位数、平均数:估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点) 估计中位数:中位数把频率分布直方图分成左右两边面积相等.估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. (2)由上图可以看出,乙样本的最小值100低于甲样本的最小值110,乙样本的最大值145高于甲样本的最大值135,这说明乙种钢筋没有甲种钢筋的抗拉强度稳定.我们把一组数据的最大值与最小值的差称为极差(range ).由上图可以看出,乙的极差较大,数据点较分散;甲的极差小,数据点较集中,这说明甲比乙稳定.运用极差对两组数据进行比较,操作简单方便,但如果两组数据的集中程度差异不大时,就不容易得出结论. (3)选择的依据应该是,产量高且稳产的品种,所以选择乙更为合理.(4)不符合实际.样本太小,没有代表性.若样本里有个别高收入者与多数低收入者差别太大.在统计学里,对统计数据的分析,需要结合实际,侧重于考察总体的相关数据特征.比如,市民平均收入问题,都是考察数据的分散程度.(5)把问题(3)中的数据在坐标系中刻画出来.我们可以很直观地知道,乙组数据比甲组数据更集中在平均数的附近,即乙的分散程度小, 如何用数字去刻画这种分散程度呢? 考察样本数据的分散程度的大小,最常用的统计量是方差和标准差.标准差:考察样本数据的分散程度的大小,最常用的统计量是标准差(standard deviation).标准差是样本数据到平均数的一种平均距离,一般用s 表示. 所谓“平均距离”,其含义可作如下理解:假设样本数据是x 1,x 2,…,x n ,x 表示这组数据的平均数.x i 到x 的距离是|x i -x |(i=1,2,…,n).于是,样本数据x 1,x 2,…,x n 到x 的“平均距离”是S=nx x x x x x n ||||||21-++-+- .由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差: s=])()()[(122221x x x x x x nn -++-+- .意义:标准差用来表示稳定性,标准差越大,数据的离散程度就越大,也就越不稳定.标准差越小,数据的离散程度就越小,也就越稳定.从标准差的定义可以看出,标准差s≥0,当s=0时,意味着所有的样本数据都等于样本平均数.标准差还可以用于对样本数据的另外一种解释.例如,在关于居民月均用水量的例子中,平均数x =1.973,标准差s=0.868,所以x +s=2.841,x +2s=3.709; x -s=1.105,x -2s=0.237.这100个数据中,在区间[x -2s,x +2s ]=[0.237,3.709]外的只有4个,也就是说,[x -2s, x +2s ]几乎包含了所有样本数据.从数学的角度考虑,人们有时用标准差的平方s 2——方差来代替标准差,作为测量样本数据分散程度的工具: s 2=n1[(x 1-x )2+(x 2-x )2+…+(x n -x )2].显然,在刻画样本数据的离散程度上,方差与标准差是一样的.但在解决实际问题时,一般多采用标准差.需要指出的是,现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道的.如何求得总体的平均数和标准差呢?通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.这与前面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.两者都是描述一组数据围绕平均数波动的大小,实际应用中比较广泛的是标准差.如导入中的运动员成绩的标准差的计算器计算.用计算器计算运动员甲的成绩的标准差的过程如下:即s 甲=2.用类似的方法,可得s 乙≈1.095.由s 甲>s 乙可以知道,甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙比甲的射击成绩稳定. 应用示例思路1例1 画出下列四组样本数据的条形图,说明它们的异同点. (1)5,5,5,5,5,5,5,5,5; (2)4,4,4,5,5,5,6,6,6; (3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8. 分析:先画出数据的条形图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组数据的标准差.解:四组样本数据的条形图如下:四组数据的平均数都是5.0,标准差分别是:0.00,0.82,1.49,2.83. 它们有相同的平均数,但它们有不同的标准差,说明数据的分散程度是不一样的.例2 甲、乙两人同时生产内径为25.40 mm 的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm): 甲25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.45 25.38 25.42 25.39 25.43 25.39 25.40 25.44 25.40 25.42 25.35 25.41 25.39 乙25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.49 25.36 25.3425.33 25.43 25.43 25.32 25.47 25.31 25.32 25.32 25.32 25.48从生产的零件内径的尺寸看,谁生产的质量较高?分析:每一个工人生产的所有零件的内径尺寸组成一个总体.由于零件的生产标准已经给出(内径25.40 mm),生产质量可以从总体的平均数与标准差两个角度来衡量.总体的平均数与内径标准尺寸25.40 mm 的差异大时质量低,差异小时质量高;当总体的平均数与标准尺寸很接近时,总体的标准差小的时候质量高,标准差大的时候质量低.这样,比较两人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数与标准差的大小即可.但是,这两个总体的平均数与标准差都是不知道的,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本的平均数、标准差,以此作为两个总体之间差异的估计值. 解:用计算器计算可得甲x ≈25.401,乙x ≈25.406;s 甲≈0.037,s 乙≈0.068.从样本平均数看,甲生产的零件内径比乙的更接近内径标准(25.40 mm),但是差异很小;从样本标准差看,由于s 甲<s 乙,因此甲生产的零件内径比乙的稳定程度高得多.于是,可以作出判断,甲生产的零件的质量比乙的高一些.点评:从上述例子我们可以看到,对一名工人生产的零件内径(总体)的质量判断,与所抽取的零件内径(样本数据)直接相关.显然,我们可以从这名工人生产的零件中获取许多样本.这样,尽管总体是同一个,但由于样本不同,相应的样本频率分布与平均数、标准差等都会发生改变,这就会影响到我们对总体情况的估计.如果样本的代表性差,那么对总体所作出的估计就会产生偏差;样本没有代表性时,对总体作出错误估计的可能性就非常大.这也正是我们在前面讲随机抽样时反复强调样本代表性的理由.在实际操作中,为了减少错误的发生,条件许可时,通常采取适当增加样本容量的方法.当然,关键还是要改进抽样方法,提高样本的代表性. 变式训练某地区全体九年级的3 000名学生参加了一次科学测试,为了估计学生的成绩,从不同学校的不同程度的学生中抽取了100名学生的成绩如下:100分12人,90分30人,80分18人,70分24人,60分12人,50分4人.请根据以上数据估计该地区3 000名学生的平均分、合格率(60或60分以上均属合格). 解:运用计算器计算得:100450126024701880309012100⨯+⨯+⨯+⨯+⨯+⨯=79.40,(12+30+18+24+12)÷100=96%,所以样本的平均分是79.40分,合格率是96%,由此来估计总体3 000名学生的平均分是79.40分,合格率是96%.思路2例1 甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm 2),试根据这组数据估计哪一种水稻品种的产量比较稳定.品种 第1年 第2年 第3年 第4年 第5年 甲 9.8 9.9 10.1 10 10.2 乙9.410.310.89.79.8解:甲品种的样本平均数为10,样本方差为 [(9.8-10)2 +(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]÷5=0.02. 乙品种的样本平均数也为10,样本方差为 [(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]÷5=0.24. 因为0.24>0.02,所以,由这组数据可以认为甲种水稻的产量比较稳定.例2 为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换.已知某校使用的100只日光灯在必须换掉前的使用天数如下,试估计这种日光灯的平均使用寿命和标准差.天数151—180 181—210 211—240 241—270 271—300 301—330 331—360 361—390灯泡数1111820251672分析:用每一区间内的组中值作为相应日光灯的使用寿命,再求平均寿命. 解:各组中值分别为165,195,225,255,285,315,345,375,由此算得平均数约为165×1%+195 ×11%+225×18%+255×20%+285×25%+315×16%+345×7%+375×2%=267.9≈268(天). 这些组中值的方差为1001×[1×(165-268)2+11×(195-268)2+18×(225-268)2+20×(255-268)2+25×(285-268)2+16×(315-268)2+7×(345-268)2+2×(375-268)2]=2 128.60(天2). 故所求的标准差约6.2128≈46(天).答:估计这种日光灯的平均使用寿命约为268天,标准差约为46天. 知能训练 (1)在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为____________.(2)若给定一组数据x 1,x 2,…,x n ,方差为s 2,则ax 1,ax 2,…,ax n 的方差是____________. (3)在相同条件下对自行车运动员甲、乙两人进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:甲 27 38 30 37 35 31 乙 33 29 38 34 28 36试判断选谁参加某项重大比赛更合适? 答案:(1)9.5,0.016 (2)a 2s 2(3)甲x =33,乙x =33,33734722=>=乙甲s s ,乙的成绩比甲稳定,应选乙参加比赛更合适. 拓展提升某养鱼专业户在一个养鱼池放入一批鱼苗,一年以后准备出售,为了在出售以前估计卖掉鱼后有多少收入,这个专业户已经了解到市场的销售价是每千克15元,请问,这个专业户还应该了解什么?怎样去了解?请你为他设计一个方案.解:这个专业户应了解鱼的总重量,可以先捕出一些鱼(设有x 条),作上标记后放回鱼塘,过一段时间再捕出一些鱼(设有a 条),观察其中带有标记的鱼的条数,作为一个样本来估计总体,则鱼塘中鱼的总条数鱼的条数鱼塘中所有带有标记的条鱼中带有标记的条数)(x aa =这样就可以求得总条数,同时把第二次捕出的鱼的平均重量求出来,就可以估计鱼塘中的平均重量,进而估计全部鱼的重量,最后估计出收入. 课堂小结1.用样本的数字特征估计总体的数字特征分两类:用样本平均数估计总体平均数,平均数对数据有“取齐”的作用,代表一组数据的平均水平.用样本标准差估计总体标准差.样本容量越大,估计就越精确,标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度. 2.用样本估计总体的两个手段(用样本的频率分布估计总体的分布;用样本的数字特征估计总体的数字特征),需要从总体中抽取一个质量较高的样本,才能不会产生较大的估计偏差,且样本容量越大,估计的结果也就越精确. 作业习题2.2A 组4、5、6、7,B 组1、2.设计感想统计学科,最大的特点就是与现实生活的密切联系,也是新教材的亮点.仅仅想借助“死记硬背一些概念及公式,简单模仿课本例题”来学习,是绝对不行的.用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差,其原因在于样本的随机性.这种偏差是不可避免的.虽然我们从样本数据得到的分布、均值和标准差并不是总体的真正分布、均值和标准差,而只是总体的一个估计,但这种估计是合理的,特别是当样本的容量很大时,它们确实反映了总体的信息.教师建议:亲身经历“提出问题,收集数据,分析数据,并作出合理决策”过程,在此过程中不仅可以加深对概念等知识的深刻理解,更重要的是发展了思维,培养了分析及解决问题能力,同时在情感、意志等领域也得到了协调发展,这才是学校学习的科学而全面的目标,习题设置有层次,尽量源于教材,又高于教材,这也是高考命题原则.。
2.2.2用样本的数字特征估计总体的数字特征2
a_x___b_,标准差为a_s_ ,方差为_a_2_s_2.
湖南省长沙市一中卫星远程学校
课堂小结
1. 用样本的众数、中位数、平均数和标准差等 统计数据,估计总体相应的统计数据.
课堂小结 1. 用样本的众数、中位数、平均数和标准差等
湖南省长沙市一中卫星远程学校
二、讲授新课
例:有两位运动员在一次射击测试中各射靶 10 次,每
次命中的环数如下:
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
如果你是教练,你应当如何对这次射击情况作出评
价?如果这是一次选拔性考核,你应当如何作出选择?
x甲=x乙 7
s甲2 s乙2,所以乙比甲的射击成绩稳定。
湖南省长沙市一中卫星远程学校
二、讲授新课
平均数、标准差和方差的运算性质:
如果数据 x1, x2 , x3 xn 的平均数为 x , 标准差为 s,方差为s,2 则 (1)新数据 x1 b, x2 b,xn b 的平均数为_x___b_. 标准差为_s_,方差为_s_2. (2)新数据 ax1, ax2,axn 的平均数为_a_x___. 标准差为_a_s ,方差为_a_2_s_2.
统计数据,估计总体相应的统计数据.
2. 平均数对数据有“取齐”的作用,代表一 组数据的平均水平.
课堂小结
1. 用样本的众数、中位数、平均数和标准差等 统计数据,估计总体相应的统计数据.
2. 平均数对数据有“取齐”的作用,代表一 组数据的平均水平.
3. 标准差描述一组数据围绕平均数波动的幅 度.在实际应用中,我们常综合样本的多个 统计数据,对总体进行估计,为解决问题 作出决策.
【数学】2.2.2 用样本的数字特征估计总体的数字特征 课件2(人教A版必修3)
例3 以往招生统计显示,某所大学录取的新生高考总 分的中位数基本稳定在550分,若某同学今年高考得了 520分,他想报考这所大学还需收集哪些信息?
要点:(1)查往年录取的新生的平均分数.若平均数小于中位数 很多,说明最低录取线较低,可以报考; (2)查往年录取的新生高考总分的标准差.若标准差较大,说明 新生的录取分数较分散,最低录取线可能较低,可以考虑报考.
频率 组距
0.5 0.4 0.3 0.2 0.1 O 0.5 1 1.5 2 2.5 3 3.5 4 4.5
0.25,0.75,1.25,1.75,2.25, 2.75,3.25,3.75,4.25.
月均用水量/t
思考6:根据统计学中数学期望原理,将频率分布直方图 中每个小矩形的面积与小矩形底边中点的横坐标之积相加, 就是样本数据的估值平均数. 由此估计总体的平均数是什 么? 0.25×0.04+0.75×0.08+1.25×0.15+1.75×0.22+2.25 ×0.25+2.75×0.14+3.25× 0.06+3.75×0.04+4.25×0.02=2.02(t). 平均数是2.02.
(3)
O
1 2 3 4 5 6 7 8
(4)
例2 甲、乙两人同时生产内径为25.40mm的一种零件, 为了对两人的生产质量进行评比,从他们生产的零件中 各随机抽取20件,量得其内径尺寸如下(单位:mm): 甲 : 25.46 25.45 25.44 乙: 25.40 25.49 25.47
25.32 25.38 25.40 25.43 26.36 25.31
1 2
标准差越大离散程度越大,数据较分散;标准差越小离 散程度越小,数据较集中在平均数周围. 知识补充
2.2用样本数字特征估计总体数字特征-2——众数中位数
(4) 2 , 2 , 2 , 2, 5 , 8 , 8 , 8 , 8 ;
解: 四组样本数据的 直方图是:
频率
1.0 0.9 0.8
x5
0.7
0.6
0.5 S=0.00
0.4
0.3
0.2
0.1
o 1 2 3 45
(1)
678
频率
(1) 5, 5, 5, 5, 5, 5, 5, 5, 5; 1.0
解: (1) 分别计算这两组数据的平均数
(2)图形观察
(3)除了解平均水平外,还需要了解它们的波动情况 (即偏离平均数的大小) ,即方差 或标准差
从0.026>0.008可以比较出,机床甲生产比机床乙 生产的直径波动要大, 即甲的稳定性差.
例1 已知两组数据:
分别计算这两组数据的方差.
分析 (1)求平均数
练习B、求这三组数据的平均数、方差和标准差。
平均数
方差
标准差
1、2、3、4、5
3
11、12、13、14、15
13
3、6、9、12、15
9
2
2
2
2
18
32
能从中发现哪些有趣的结论?
练习C 请你用发现的结论来解决以下的问题
已知数据a1,a2,a3,…,an的平均数为X,方差Y, 标准差Z, 则
①数据a1+3,a2 + 3,a3 +3 ,…,an +3平均数为-X---+---3-,方差为---Y----,
答: 方差和标准差分别用S 2和s表示.用x
表示一组数据的平均数,x1、x2、… xn 表示n个数据,则这组数据方差的 计算公式就是
2.2.2 用样本的数字特征估计总体的数字特征
配人教版 数学 必修3
2.某农场在同一块实验田中种植的某种农作物,连续8年
的亩产量如下:(单位:kg)
450,430,460,440,450,440,470,460.
则其方差为( )
A.120
B.80
必修3
【答案】D 【解析】连续 8 年的亩产量的平均数为 x =18×(450+430 +460+440+450+440+470+460)=450,∴其方差为 s2=18 ×[(450 - 450)2 + (430 - 450)2 + (460 - 450)2 + (440 - 450)2 + (450-450)2+(440-450)2+(470-450)2+(460-450)2]=150.故 选 D.
配人教版 数学 必修3
2.2.2 用样本的数字特征估计总体的数字特征
配人教版 数学 必修3
目标定位
重点难点
1.会求样本的众数、中位 重点:根据实际问题从样本数据
数、平均数、标准差、方 中提取基本的数据特征并作出合
差.
理解释,估计总体的基本数字特
2.理解用样本的数字特征 征;体会样本数字特征具有随机
配人教版 数学 必修3
(2)甲的方差是 s2甲=110×[(25-30)2+(41-30)2+(40-30)2
+…+(42-30)2]=104.2(cm2),
乙的方差是
s
2
乙
=
1 10
×[2×(27
-
31)2
+
3×(16
-
31)2
+
3×(40-31)2+2×(44-31)2]=128.8(cm2),
配人教版 数学 必修3
【答案】D 【解析】当样本选取恰当,样本的代表性好,就可以用样 本的数字特征估计总体的数字特征,而与样本容量的大小无 关.故选D.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
频率分布与数字特征的综合应用
例2 已知一组数据:125 129 128 126 121 124 123 125 125 127 127 126 129 122 125 124 128 130 125 126
如何在频率分布直方图中估计平均数
=2.02
4 8 2 布直方图中每个小矩形的面 x 14 x 512 x 99100 积乘以小矩形底边中点的横 100 100 100 坐标之和。 0 0.5 0.5 1 4 4.5 0.04 0.08 0.02 =2.02 2 2 2
(1)填写下面的频率分布表:
分组 [121,123) [123,125) [125,127) [127,129) [129,131] 合计 频数 频率
(2)作出频率分布直方图; (3)根据频率分布直方图或频率分布表求这组数据的 众数、中位数和平均数.
解 (1) 分组 [121,123) 频数 2 频率 0.1
求:(1)高一参赛学生的成绩的众数、中位数. (2)高一参赛学生的平均成绩. 解 (1)由图可知众数为65, 又∵第一个小矩形的面积为0.3, ∴设中位数为60+x,则0.3+x×0.04=0.5,得x=5, ∴中位数为60+5=65. (2)依题意,平均成绩为55×0.3+65×0.4+75×0.15 +85×0.1+95×0.05=67,∴平均成绩约为67.
课堂练习: 1、假设你是一名交通部门的工作人员。你打算向市长报告国 家对本市26条公路项目投资的平均资金数额,其中一条新公 路的建设投资为2 200万元人民币,另外25个项目的投资在 20万与100万.中位数是25万,平均数是100万,众数是20万 元。你会选择哪一种数字特征来表示每一个项目的国家投资? 你选择这种数字特征的缺点是什么?
问题1:众数、中位数、平均数这三个数 一般都会来自于同一个总体或样本,它们 能表明总体或样本的什么性质? 众数:反映的往往是局部较集中的数据信息
中位数:是位置型数,反映处于中间部位的 数据信息
平均数:反映所有数据的平均水平
1、求下列各组数据的众数
(1)、1 ,2,3,3,3,5,5,8,8,8,9,9 众数是:3和8 (2)、1 ,2,3,3,3,5,5,8,8,9,9 众数是:3 2、求下列各组数据的中位数
(一)众数、中位数、平均数
一 众数、中位数、平均数的概念
众数:在一组数据中,出现次数最多的数据叫 做这组数据的众数.
中位数:将一组数据按大小依次排列,把处在 最中间位置的一个数据(或最中间两个数据的 平均数)叫做这组数据的中位数.
平均数:
一组数据的算术平均数,即
1 X ( x1 x2 xn ) n
选择平均数更好:因为,此时的众数20万比中位数25万还小, 所以众数代表的是局部的数。中位数代表的虽然是大多数公路 投资的数额,但由于其不受极端值的影响,不能代表全体,因 而此时成了它的缺点。选择平均数较好,能比较好的代表整体 水平,但缺点是仍不能显示出具体的数字特征
思考讨论以下问题:
2、样本中位数不受少数极端值的影响,这 在某些情况下是一个优点,但它对极端值 的不敏感有时也会成为缺点。你能举例说 明吗? 答:优点:对极端数据不敏感的方法能够 有效地预防错误数据的影响。
对极端值不敏感有利的例子:例如当样本数据质 量比较差,即存在一些错误数据(如数据录入错 误、测量错误等)时,用抗极端数据强的中位数 表示数据的中心值更准确。
- -
规律方法 1.利用频率分布直方图估计数字特征: (1)众数是最高的矩形的底边的中点. (2)中位数左右两侧直方图的面积相等. (3)平均数等于每个小矩形的面积乘以小矩形底边中 点的横坐标之和. 2.利用直方图求众数、中位数、平均数均为估计值, 与实际数据可能不一致.
例3 某中学举行电脑知识竞赛,现将高一参赛学生 的成绩进行整理后分成五组绘制成如图所示的频率 分布直方图,已知图中从左到右的第一、二、三、 四、五小组的频率分别是0.30、0.40、0.15、0.10、 0.05.
0.04 0.08 0.15 0.22 0.49
x 0.02
中位数
2 0.02 2.02
可将中位数看作整个直方图面积的“中心”
思考讨论以下问题:
1、2.02这个中位数的估计值,与样本的中 位数值2.0不一样,你能解释其中原因吗? 答:2.02这个中位数的估计值,与样本的中 位数值2.0不一样,这是因为样本数据的 频率分布直方图,只是直观地表明分布的 形状,但是从直方图本身得不出原始的数 据内容,直方图已经损失一些样本信息。 所以由频率分布直方图得到的中位数估计 值往往与样本的实际中位数值不一致.
三、 众数、中位数、平均数的简单应用
例1、下表是七位评委给某参赛选手的打分,总分为10分, 你认为如何计算这位选手的最后得分才较为合理?
评委 1号 打分 9.6
2号 9.3
3号 9.3
4号 9.6
5号 9.9
6号 9.3
7号 9.4
提问:1、电视里评委是怎样给选手打分的? 2、为什么这么做?直接取中位数和众数的值不好么?
[123,125)
[125,127) [127,129) [129,131]
3
8 4 3
Hale Waihona Puke 0.150.4 0.2 0.15
合计
20
1
(2)
(3)在[125,127)中的数据最多,取这个区间的中点值作 为众数的近似值,得众数 126,事实上,众数的精确值为 5 125.图中虚线对应的数据是 125+2× =126.25,事实上 8 中位数为 125.5.使用“组中值”求平均数:x=122×0.1 + 124×0.15 + 126×0.4 + 128×0.2 + 130×0.15 = 126.3,平均数的精确值为x=125.75.
二、众数、中位数、平均数与频率 分布直方图的关系
如何在频率分布直方图中估计众数
频率 组距
众数在样本数据的频率分布直方图中, 就是最高矩形的中点的横坐标。
0.5 0.4 0.3 0.2 0.1
O
0.5
1
1.5
2
2.5
3
3.5
4
4.5
月平均用水量(t)
可将众数看作直方图中面积最大长方形的“中心”
频率 组距
分别求这些运动员成绩的众数,中位数与平均数 。 解:在17个数据中,1.75出现了4次,出现的次数最多, 即这组数据的众数是1.75. 上面表里的17个数据可看成是按从小到大的顺序排 列的,其中第9个数据1.70是最中间的一个数据,即这组 数据的中位数是1.70; 这组数据的平均数是 1 x (1.50 2 1.60 3 ... 1.90 1) 1.69 米 17 答:17名运动员成绩的众数、中位数、平均数依次是 1.75(米)、1.70(米)、1.69(米)。
分组 [0, 0.5) [0.5, 1) [1, 1.5) [1.5, 2) [2, 2.5) [2.5, 3) [3,, 3.5) [3.5, 4) [4,) 4.5]
合计
频率 0.04 0.08 0.15 0.22 0.25 0.14 0.06 0.04 0.02 1
在样本中,中位数的左右各有50%的样本数, 所以反映在频率分布直方图中,中位数左右 两边的直方图的面积相等,各为0.5。
如何在频率分布直方图中估计中位数
0.6 0.5 0.4 0.3 0.2 0.1 0
前四个小矩形的 面积和=0.49
后四个小矩形的 面积和=0.26
0.25
0.22
0.15 0.08 0.04 0.5 1 1.5 2 2.5
0.14 0.06 0.04 3 3.5 4 0.02
4.5
2.02
月均用水量/t
特征数 众数 中位数 平均数 去掉一个最高分和 去掉两个最高分 最低分后的平均分 和最低分后的平 均分
特征值
9. 3
9. 4
9.49
9.42
9.44
1.下面是高一(18)班十位同学的数学测试成绩:82, 91,73,84,98,99,101,118,98,110,则该 组数据的中位数是 ( ) A.98 B.99 C.98.5 D.97.5 答案 A
缺点:(1)出现错误的数据也不知道; (2)对极端值不敏感有弊的例子:某人具 有初级计算机专业技术水平,想找一份收 入好的工作。这时如果采用各个公司计算 机专业技术人员收入的中位数作为选择工 作的参考指标就会冒这样的风险:
很可能所选择公司的初级计算机专业技术水平 人员的收入很低,其原因是中位数对极小的数 据不敏感。这里更好的方法是同时用平均工资 和中位数作为参考指标,选择平均工资较高且 中位数较大的公司就业.
可将平均数看作整个直方图面积的“重心”
1 1 ( x1 x4 ) ( x5 x12 ) ( x99 x100 ) x ( x1 x2 x100 ) 100 100 平均数的估计值等于频率分
规律方法 根据样本频率分布直方图,可以分 别估计总体的众数、中位数和平均数. (1)众数:最高矩形下端中点的横坐标; (2)中位数:直方图面积平分线与横轴交点的 横坐标. (3)平均数:每个小矩形的面积与小矩形底边 中点的横坐标的乘积之和.
(1)、1 ,2,3,3,3,4,6,8,8,8,9,9 中位数是:5 (2)1 ,2,3,3,3,4,8,8,8,9,9 中位数是:4
3、在一次中学生田径运动会上,参加男子跳高的17名 运动员的成绩如下表所示:
成绩(米) 人数 1.50 1.60 2 3 1.65 2 1.70 3 1.75 4 1.80 1 1.85 1 1.90 1