高中数学第2章统计2.3总体特征数的估计互动课堂学案苏教版必修3
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.3 总体特征数估计
互动课堂
疏导引导
〔1〕平均数定义
假设给定一组数据x 1,x 2,…,x n ,那么称x =
n
1
∑
=n
i 1
x i (i=1,2,3,…,n)
为这组数据x 1,x 2,…,x n ∑=n
i 1
x i =n
1(x 1+x 2+……x n ).平均数反映了一组
数据集中趋势,我们常用一组数据平均数来衡量这组数据水平. 当一组数据中重复数据过多时,假设用上面公式求这组数据平均数,其过程就会显得比拟复杂与冗长,为了简化计算过程,我们引入下面这种计算平均数方法:
一般地,假设取值为x 1,x 2,…,x n 频率分别为p 1,p 2, …,p n ,那么其平均数为x 1p 1+x 2p 2+…+x n p n .这一公式实质上就是公式一个变形,它主要用于含有重复数据数据组求平均数.
除此之外,当所给数据在某一常数a 上下波动时,我们也可利用公式
:
x
=
'
x +a,其中
'
x =
n
1(x 1′+x 2′+…
+x n ′),x 1′=x 1-a,x 2′=x 2-a,x 3′=x 3-a,…,x n ′=x n -a ;常数a 通常取接近于这组数据平均数较“整〞数.
例如:求数据70,71,72,73平均数时,我们可以先求出0,1,2,3平均数,然后将此平均数加上70即得该组数据平均数. 〔2〕平均数性质
①假设给定一组数据x 1,x 2,…,x n 平均数为x ,那么ax 1,ax 2, …,ax n 平
均数为a x;
②假设给定一组数据x1,x2, …,x n平均数为x,那么ax1+b,ax2+b, …,ax n+b平均数为a x+b;
(3〕用样本平均数估计总体平均数
从一个总体中随机抽取一个容量一定包含大量数据样本,利用样本平均数计算公式求出样本平均数,由此得出总体平均数就是所求样本平均数.
在这里两次从总体中抽取容量相等样本,分别求出样本平均数,
两个样本平均数会不一样,所以用样本平均数估计总体平均数时,样本平均数只是总体平均数近似值.
案例1 下面是某一个工厂所有工作人员在某个月工资,总经理6 000元,技术工人甲900元,技术工作人员乙800元,杂工640元,效劳员甲700元,效劳员乙640元,会计820元.
(1)计算所有工作人员平均工资.
(2)去掉总经理后,再计算平均工资.
(3)在(1)与(2)中两种平均工资哪一种能代表一般工人收入水平,为什么?
【探究】计算平均工资是用工资总数除以领工资人数即可.
1(6 【解析】(1)所有工作人员平均工资为x=
7 000+900+800+640+700+640+820)=1 500(元).
(2)去掉总经理后平均工资为
1(900+800+640+700+640+820)=750(元).
'x=
6
(3)能代表一般工人收入水平是去掉总经理后平均工资750元.因为除去总经理之外,工作人员工资均在900元以下,因此不能以1 500元来代表职工平均工资水平.
规律总结 一般地,在一组数据中,平均数、众数、中位数能够反映该组数据集中趋势与平均水平,但有时需要去掉极端值(极大值或极小值),这样计算平均数那么更能反映平均水平,这就是有些比赛活动中往往会去掉一个最大值与一个最小值再去计算平均成绩原因. 设一组样本数据x 1,x 2,…,x n ,其平均数为x ,那么称
s 2
=
n
1∑
=n
i 1
(x i -x )2
为这个样本方差,其算术平方根s=为样本标准差,分别简称样本方差、样本标准差.
疑难疏引 〔1〕为了更好地比拟两组数据集中程度,我们可以利用这两组数据方差对两组数据进展比拟.方差较大数据波动较大;方差较小数据波动较小.当所给数据有单位时,所求得平均数与原数据单位一样,不要漏写单位.方差单位为所给数据单位平方,方差算术平方根称作标准差,它与原数据单位一样,因而能更好地刻画数据离散程度. 〔2〕方差性质
①假设给定一组数据x 1,x 2,…,x n ,方差为s 2,那么ax 1,ax 2,…,ax n 方差为a 2s 2;
②假设给定一组数据x 1,x 2,…,x n ,方差为s 2,那么ax 1+b,ax 2+b,…,ax n +b 方差为a 2s 2,特别地,当a=1时,那么有x 1+b,x 2+b,…,x n +b 方差为s 2,这说明将一组数据每一个数据都减去
一样一个常数,其方差是不变,即不影响这组数据波动性;
③方差刻画了数据相对于均值平均偏离程度.对于不同数据集,当离散程度越大时,方差越大;
④方差单位是原始测量数据单位平方,对数据中极值较为敏感. 〔3〕我们可以通过计算样本方差与标准差对总体方差与标准差进展估计,也可以通过对两个总体样本方差大小差异情况,对两个总体波动
情况进展推断与比拟,当甲x =,2甲s <2
乙s 时,甲为优秀.
〔4〕样本方差.标准差计算简化. 方差计算公式s 2可简化为:
〔Ⅰ〕s 2=n 1
[21x +22x +…+2n x ]-nx 2,或写成s 2=n
1(21x +22x +…2n x )-x 2.即方差等于原数据平方平均数减去平均数平方.
〔Ⅱ〕s 2=n
1[(2'1x +2'2x +…+2'n x )-n 2
'x ].
当一组数据中数据较大时,直接计算它们方差那么比拟麻烦,如果数据相互比拟接近,为了减少参与计算数据,可仿照简化平均数计算方法,将每个数据同时减去一个与它们平均数接近常数a,得到一组新数据x 1′=x 1-a,x 2′=x 2-a,…,x n ′=x n -a,那么,s 2=
n
1[(2'2x +2
'2x +…+2'n x )-n 2
'x ]也可写成s 2=n
1
(2'1x +2
'2x +…+2'n x )-2
'x .即方差等于新数据平
方平均数减去新数据平均数平方. 原
数
据
x 1,x 2,
…
,x n
方
差
与
新
数
据
x′1=x 1-a,x′2=x 2-a, …,x′n =x n -a 方差相等,即x′1,x′2…,x′n 方差s′2=n
1·[(x′1-'x )2+(x′2-'x )2+…+(x′n -'x )2]等于原数据x 1,x 2,…,x n 方差s 2.
案例2 某班40人随机平均分成两组,两组学生一次考试成绩情况如下表:
组别 统计量
平均 标准差
第一组 90 6 第二组
80
4
求全班平均成绩与标准差. 【探究】设第一组20名学生成绩为 x i (i=1,2…,20),
第二组20名学生成绩为y i =(i=1,2,…,20), 依题意有:90=20
1
(x 1+x 2+…+x 20), 80=
201
(y 1+y 2+…+y 20),故全班平均成绩为: 401〔x 1+x 2+…+x 20+y 1+y 2+…+y 20〕=40
1
(90×20+80×20)=85; 又设第一组学生成绩标准差为s 1,第二组学生成绩标准差为s 2,那么21s =
20
1(21x +22s +…+2
20x -20x 2), 22s =
20
1(y 12+y 22+…+2
20y -20y 2)(此处,x =90,x =80) 又设全班40名学生标准差为s,平均成绩为z (z =85), 故有s 2=40
1(21x +22x +…+2
20x +y 12+y 22+…+220y -40z 2) =
401
(2021s +20x 2+2022s +20y 2-40z 2) =2
1
(62+42+902+802-2×852)=51. s=51.
规律总结 平均数与方差,都是重要数字特征数,是对总体一种简明描述,它们所反映情况有着重要实际意义,所以,不仅需要掌握其计算公
式与方法,还要学会通过这些数据分析其含义,从而为正确决策提供依据.
案例3 某校拟派一名跳高运发动参加一项校际比赛,对甲、乙两名跳高运发动进展了8次选拔比赛,他们成绩(单位:m)如下: 甲:1.70,1.65,1.68,1.69,1.72,1.73,1.68,1.67; 乙:1.60,1.73,1.72,1.61,1.62,1.71,1.70,1.75.
经预测,跳高1.65 m 就很可能获得冠军.该校为了获取冠军,可能选哪位选手参赛?假设预测跳高1.70 m 方可获得冠军呢?
【探究】参加比赛选手成绩得突出,且成绩稳定,这就需要比拟这两名选手平均成绩与成绩方差. 甲平均成绩与方差如下:
甲x =81
(1.70+1.65+1.68+1.69+1.72+1.73+1.68+1.67)=1.69,
2
甲s =8
1[(1.70-1.69)2+(1.65-1.69)2+…+(1.67-1.69)2]=0.000 6.
乙平均成绩与方差如下:
乙x =81
(1.60+1.73+1.72+1.61+1.62+1.71+1.70+1.75)=1.68,
2
乙s =8
1[(1.60-1.68)2+(1.73-1.68)2+…+(1.75-1.68)2]=0.003 15.
显然,甲平均成绩好于乙平均成绩,而且甲方差小于乙方差,说明甲成绩比乙稳定.由于甲平均成绩高于乙,且成绩稳定,所以假设跳高1.65 m1.70 m 以上,虽然乙平均成绩不如甲,成绩稳定性也不如甲,假设跳高1.70 m 方可获得冠军时,应派乙参加比赛.
规律总结 在实际问题中,仅靠平均数不能完全反映问题,还要研究其偏离平均值离散程度〔即方差或标准差〕.方差〔标准差〕大,说明取
值分散性大,方差〔标准差〕小,说明取值分散性小或说取值比拟集中、稳定. 活学巧用
1.(2004北京春季高考,理10文10)期中考试以后,班长算出了全班40个人数学成绩平均分为M.如果把M 当成一个同学分数,与原来40个分数一起,算出这41个分数平均值为N,那么M∶N 为〔 〕 A.
4140 B.1 C.40
41
解析:考察阅读理解能力,分析问题、解决问题能力及统计初步知识. 设40位同学成绩为x i (i=1,2,…,40), 那么M=, N=
故M∶N=1. 答案:B
2.某工人在30天中加工一种零件日产量有2天是51件,3天是52件,6天是53件,8天是54件,7天是55件,3天是56件,1天是57件.计算该工人30天平均日产量.
解:在上面30个数据中,51出现2次,52出现3次,53出现6次,54出现8次,55出现7次,56出现3次,57出现1次.由于这组数据都比50稍大一点,故将数据51,52,53,54,55,56,57同时减去50,得到1,2,3,4,5,6,7.
它们出现次数依次是2,3,6,8,7,3,1. 那么,这组新数据平均数是
'x =
30
118
30173221=
⨯++⨯+⨯ ≈4, ∴x ='x +a≈54〔件〕,
即这个工人30天平均日产量为54件.
点评:“同时减去50〞改为“同时减去53〞更方便.
3.某餐厅共有8名员工,某月工资如以下图所示,那么以下说法中不正确是〔 〕
A.该餐厅员工工资一般水平不是1 125元,尽管平均数是1 125
B.因为众数为320元,所以该餐厅员工工资一般水平是320元
C.因为中位数为410元,所以该餐厅员工工资一般水平是410元
D.去掉一个最大数6 000元,去掉一个最小数320元,剩下6个数平均数为447元,该餐厅员工工资一般水平一定是477元 答案:D
4.某班一次数学测验成绩如下:得100分6人,得90分15人,得80分18人,得70分6人,得60分3人,得50分2人,试计算这次测验全班平均成绩. 解
法一:
x =
50
1
(6×100+15×90+18×80+6×70+3×60+2×50)=81.8(分).
解法二:取a=80,将原数据都减去80得新数据及出现次数为 新数据 20 10 0 -10 -20 -30 出现次数 6 15 18 6 3 2 ∴'x =
50
1
[6×20+15×10+18×0+6×(-10)+3×(-20)+2×(-30)]
=1.8.
∴x ='x +a=1.8+80=81.8(分),
即这次测验全班平均成绩为81.8分.
5.计算下面数据方差〔结果保存到小数点后第1位〕: 3,-1,2,1,-3,3.
解析:这组数据平均数不是整数,选用公式s 2=n
1
[(21x +22x +…+2n x )-n x 2]比拟方便.
s 2=6
1[32+(-1)2+22+12+(-3)2+32-6×()2]
=61[9+1+4+1+9+9-6×(65)2]
=61×33-36
25
≈5.5-0.7=4.8. 6.在去年足球甲A 联赛上,一队每场比赛平均失球数是1.5,全年比赛失球个数标准差为1.1;二队每场比赛平均失球数为2.1,全年比赛失球个数标准差为0.4.你认为以下说法中哪一种是正确? 〔1〕平均说来一队比二队技术好; 〔2〕二队比一队技术水平更稳定;
〔3〕一队有时表现很差,有时表现又非常好; 〔4〕二队很少不失球.
解:此题主要考察对平均数与标准差概念理解.平均数反映了一组数据平均水平,而方差那么反映了一组数据波动性大小.一队每场比赛平均失球数比二队每场比赛平均失球数少,说明一队技术比二队技术好;一队全年比赛失球个数标准差较大,说明一队表现时好时坏,起伏较大;二队平均失球数多,全年比赛失球个数标准差很小,说明二队表
现较稳定,经常失球.
答案:〔1〕〔2〕〔3〕〔4〕都正确
7.(2005山东青岛第二次质量检测)对于一组数据x i (i=1,2,3…,n),如果将它们改变为x i -c(i=1,2,3, …,n),其中c≠0,那么下面结论中正确是( )
B.平均数变了,而方差保持不变
C.平均数不变,而方差变了
解析:x =
n 1∑
=n
i 1
x i ,'x =
n
1
∑
=n
i 1
(x i -c)=
n
1
∑
=n
i 1
x i -
n
1
·nc=x -c,而s 2
=
n
1∑
=n
i 1
(x-x i )2,s′2
=
n
1
∑
=n
i 1
['x -(x i -c)]2
=
n
1
∑
=n
i 1
[x -c-(x i -c)]2
=
n
1
∑
=n
i 1
(x -x i )2=s 2,所以其平均数
变了,而方差保持不变.应选B. 答案:B
8.(2005江苏南通调研考试)一组数据中每一个数据都减去80,得一组新数据,假设这组数据平均数是1.2,方差是4.4,那么原来一组数据平均数与方差分别是〔 〕
B.78.8, C 解析:由平均数与方差公式:x =,
s 2
=n
x x x x x x n 2
2221)()()(+++-+- 知,在每一个数都减去80后,平均数
也减去80,而方差不变,所以选A. 答案:A
9.某班有48名学生,在一次考试中统计出平均分为70分,方差为75,后来发现有2名同学成绩有误,甲实得80分却记为50分,乙实得70分却记为100分,更正后平均分与方差分别是〔 〕
A.70,25
B.70,50 C D.65,25 解析:易得x 没有改变,x =70, 而s 2=48
11[]48[〔21x +22x +…+502+1002+…+2
48x 〕-48x 2]=75, s′2=48
1[(21x +22x +…+802+702+…+2
48x )-48x 2] =
48
1[〔75×48+48x 2-12 500+11 300〕-48x 2] =75-48
1200 =75-25=50. 答案:B
10.甲、乙两台机床同时生产直径为40㎜零件.为了检验产品质量,从两台机床生产产品中各抽取10件进展了测量,结果如下: 甲/mm 乙/mm 甲/mm 乙/mm
能用几种方法比拟这两台机床性能?
分析:经简单计算可以得出:甲、乙两台机床生产这10件产品直径平均数都为40 mm.所以,不能从平均数这一角度来比拟这两台机床性能,即不能从数据平均水平上来比拟,只能从数据离散程度上进展比拟.要从数据离散程度上进展比拟,常见方法有以下几种:
解法一:利用初中所学折线统计图.由折线统计图我们可以直观地表示
出这两组数据离散程度,甲机床生产产品波动幅度比乙大.所以,乙机
床性能好于甲.
解法二:利用这两组数据极差进展比拟.甲:40.2-39.8=0.04;
乙:40.1-39.9=0.02.显然,乙组数据极差小于甲组数据极差.所以,乙
机床性能好于甲.
解法三:2
s=0.026(mm2),标准差为s甲=0.161(mm);乙方差为
甲
2
s=0.006(mm2),标准差为s乙=0.077(mm).由上可知:不管是方差还乙
是标准差甲均比乙大,这就说明乙机床生产产品要更标准些.所以,乙
机床性能好于甲.。