第20章 数据的整理与初步处理

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第20章 数据的整理与初步处理
12n 12n 别求下列各组新数据的平均数:
(1)51x ,52x ,…,5n x ;
(2)1x -1y ,2x -2y ,…,n x -n y ; (3)1x ,1y ,2x ,2y ,…,n x ,n y ;
2.先阅读下面的问题:
在实际生活中常见到求平均数的问题.例如:问题某校初一级篮球队12名同学的身高(厘米)分别如下:171,168,170,173,165,178,166,161,176,172,176,176. 求全队同学的平均身高.
解:分别将各数减去170,得1,-2,0,3,-5,8,-4,-9,6,2,6,6. 这组数的平均数为:(1-2+0+3-5+8-4-9+6+2+6+6)÷12=12÷12=1,则已知数据的平均数为:170+1=171.
答:全队同学的平均身高为171厘米.
通过阅读上面解决问题的方法,请利用它解决下面的问题:
(1)10筐苹果称重(千克)如下:32,26,32.5,33,29.5,31.5,33,29,30,27.5问这10筐苹果的平均重量是多少
(2)若有一组数为:a-1,a+5,a-1,a-2,a-4,a+1,a+2,这组数的平均数为多少?
专题二 综合应用问题 综合应用题
3.(要点 残缺说理类题型)为了从甲、乙两名同学中选拔一人参加射击比赛,在同等的条件下,教练给甲、乙两名同学安排了一次射击测验,每人打10发子弹.下表是甲、乙两人各自的射击情况记录(其中乙的记录表上射中9、10环的子弹数被墨水污染看不清楚,但教练记得乙射中9、10环的子弹总数为,且均不为0).
(2)根据这次测验的情况,如果你是教练,你认为选谁参加比赛比较合适,并说明理由.
4. 进取中学八年级9班学生小若,在学习了统计图的制作和变量的关系的知识后,想给自己制作一张反映自己学习成绩成长趋势的统计图,以了解自己学习成绩的变化趋势.于是,他请教了数学老师,数学老师给了他两个建议:
(1)制作什么统计图才能反映成绩的变化趋势;
(2)试卷有难有易,试题难时,分数低不一定表示退步,如何才能客观地、较正确地反映自己的成绩的变化趋势?
小若回家后经过仔细思索,认为应制作 统计图才能反映成绩的变化趋势;其次,应把自己每次考试成绩与班级平均分比较,即:每次考试成绩X 减去班级平均分Y ,为
避免出现负分,再加上60分,称为成长分值A ,用公式表示为:A=X-Y+60这个关系式里有几个变量,因变量是 .
小若兴冲冲地把自己的想法告诉了数学老师,数学老师高度表扬了小若,认为小若是个爱动脑筋且能活学活用、有创新意识的孩子,如果能够持之以恒,前途不可限量.小若很快从老师那儿拿到了自己的各次考试成绩,以及相应的班级各次平均分,请你帮小若算出他的各次成长分值,以及帮小若画出他的成长趋势图.
(3)填 出上表的各 章 考 试 的成长分值,并 画 出 小若 的 成 长 趋 势 图:
(4)按照小若的成长趋势,请你预测小若第五章的成长分值A 是 ,理由是: .
1.解:(1)∵
n 1(51x +52x +…+5n x )=n
5
(1x +2x +…+n x )=5x ,∴第一组中各数据正好是原来数据的5倍,平均数也是原来的5倍,故这组数据的平均数为5x ;
(2)∵n 1(1x -1y +2x -2y +…+n x -n y )=n 1
〔(1x +2x +…+n x )-(1y +2y +…
+n y )〕=n 1(1x +2x +…+n x )-n
1
(1y +2y +…+n y )=x -y ,∴第二组中各数据正好是
原来两组数据的差,平均数也是原来两组数据的差,故这组数据的平均数为x -y ;
(3)∵n 21(1x +1y +2x +2y +…+n x +n y )=n
21
〔(1x +2x +…+n x )+(1y +2y +…+n y )〕
=n 21(1x +2x +…+n x )+n
21
(1y +2y +…+n y )=2y x ,∴第三组中各数据正好是把原来
两组数据合在一起,数据的个数正好是原来一组数据的2倍,因此平均数也是原来两组数
据平均数之和的一半,这组数据的平均数为
2
y
x -. 2.解答:(1)分别将各数减去以30,得+2,-4,+2.5,+3,-0.5,+1.5,+3,-1,0,-2.5.由题意可得:+2-4+2.5+3-0.5+1.5+3-1+0-2.5=4,则原数据的平均数=30+4÷10=30.4(kg ).
(2)分别将各数减去以a ,得-1、+5、-1、-2、-4、+1、+2,则这组数据的平均数为0,则已知数据的平均数为a+0=a .
答:(1)10筐苹果的平均重量是30.4kg ;(2)平均数为a . 3.解答:(1)甲同学在这次测验中平均每次射中的环数是:(5×4+6×1+8×3+9×1+10×1)÷10=6.9.
(2)①若乙同学击中9环的子弹为2发,则击中10环的为2发.乙同学在这次测验中平均每次射中的环数是:(5×2+6×3+7×2+9×1+10×2)÷10=7.1.因7.1>6.9,故在这次测验中乙同学的成绩比甲同学的成绩好,这时应选择乙参加比赛.
②若乙同学击中9环的子弹为2发,则击中10环的子弹为1发.乙同学在这次测验中平均每次射中的环数是:(5×2+6×3+7×2+9×2+10×1)÷10=7.0.因7.0>6.9,故在这次测验中乙同学的成绩比甲同学的成绩好,这时应选择乙参加射击比赛. 综上所述,应选择乙参加射击比赛.
4.
解答:(1)折线图;(2)折线图,成长分值A .表格中从左向右依次填70,75,80,85.(3)如图所示.
(4)小若第五章的成长分值A 是90分,由以上几章的成绩和折线统计图知,每一章比前一章的成长分值A 都高5分.
状元笔记
【知识要点】
1、平均数的两个计算公式: ①算术平均数:()n x x x n
x +++=
211
②加权平均数:()n k n f f f f f f f x f x f x x k k
k
k ≤=+++++++++=
,21212211
【温馨提示】
(1)计算平均数时要仔细、认真,特别是当一组数据中数据较大或个数较多时,更要防止发生计算错误.
(2)平均数与一组数据中的每个数据都有关系,它容易受数据组中个别极大或极小数据的影响,这是它的缺点.在实际运用中,为了克服这个缺点,常常将个别极大(或极小)值去掉,再求平均数,如在比赛中,常常去掉评分中的一个最高分和一个最低分,再以剩余数据的平均分作为选手的参赛成绩.
【方法技巧】
当所给数据都在某一个常数a 上下波动时,一般采用下面的简化方法计算平均数: (1)把各数据都减去常数a ,得出一组绝对值较小的新数据:x ′1=x 1-a ,x ′2=x 2-a ,…,x ′n =x n -a ;
(2)计算新数据组的平均数:x ′=1
n
(x ′1+x ′2+…+x ′n );
(3)得出原数据组的平均数:x =x ′+a.
20.2 数据的集中趋势
专题一 有关的图表信息题
1、四川雅安发生地震灾害后,某中学九(1)班学生积极捐款献爱心,如图所示是该班50名学生的捐款情况统计,求他们捐款金额的众数、中位数和平均数.
2、A ,B ,C 三名大学生竞选系学生会主席,他们的笔试成绩和口试成绩(单位:分)分别
(1)请将表一和图一中的空缺部分补充完整.
(2)竞选的最后一个程序是由本系的300名学生进行投票,三位候选人的得票情况如图二(没有弃权票,每名学生只能推荐一个),请计算每人的得票数.
(3)若每票计1分,系里将笔试、口试、得票三项测试得分按4:3:3的比例确定个人成绩,请计算三位候选人的最后成绩,并根据成绩判断谁能当选.
专题二 特征数据的选择
3、三个生产日光灯管的厂家在广告中宣称,他们生产的日光灯管在正常情况下,灯管的使
用寿命为12个月.工商部门为了检查他们宣传的真实性,从三个厂家各抽取11只日光灯管进行检测,灯管的使用寿命(单位:月)如下:
试问:(1)这三个厂家的广告,分别利用了统计中的哪一个特征数(平均数、中位数、众
数)进行宣传?
(2)如果三种产品的售价一样,作为顾客的你选购哪个厂家的产品?请说明理由.
(1)求这10个专卖店该月销售额的平均数、众数、中位数;
(2)为了调动各专卖店经营的积极性,该厂决定实行目标管理,即确定月销售额,并以此对超额销售的专卖店进行奖励.如果想确定一个较高的销售目标,你认为月销售额定为多少合适?并说明理由.
5、某同学进行社会调查,随机抽查了某个地区的20个家庭的收入情况,并绘制了统计图.请你根据统计图给出的信息回答:
(1) 填写完成下表:
(2)这20个家庭的年平均收入为_____ _万元;
(3)样本中的中位数是_____ _万元,众数是____ __万元;
(4)在平均数、中位数两数中,_____ _更能反映这个地区家庭的年收入水平.
【知识要点】
1、众数:一组数据中出现次数最多的数据;
2、中位数:将一组数据按大小排列后,中间的数据或中间两个数的平均数;
【温馨提示】
1、一组数据的众数可能不止一个;当一组数据中如果有两个数据出现的次数一样多,且是最多的,那这两个数据都是这组数据的众数.
2、一组数据的中位数只有一个,可以和平均数是同一数据.
3、求中位数一定要将数据按大小排列.
4.平均数、中位数、众数的联系与区别
(1)联系:平均数、中位数、众数都是描述一组数据集中趋势的统计量.
(2)区别:①个数不同:一组数据的平均数、中位数只有1个,众数可能不止1个,有时也可能没有众数.
②统计意义不同:平均数体现了一组数据的“平均水平”.平均数能充分利用各个数
25% 20% 15% 10% 5%
)
所占户数比
据提供的信息,即在计算一组数据的平均数时,所有数据都参与运算,所以它易受极端值的影响.
中位数体现了一组数据的”中等水平”.中位数的计算受极大值或极小值的影响较小,它不能充分利用各个数据的信息.当一组数据中个别数据变动较大时,可用它来描述其集中趋势.
众数体现一组数据的“多数水平”.一组数据的众数只与各数据出现的频数有关,当一组数据中有不少数据多次重复出现时,众数往往能很好地说明问题;但当各数据重复出现的次数相等时,它往往没有特别意义.
【方法技巧】
1.中位数的求法:一般地,排序后设数据个数为n ,当n 为奇数时,第2
1
+n 个数据即为该组数据的中位数,当n 为偶数时,第
2
n 和22+n 两个数据的平均数为该组数据的中位数.
2.平均数、中位数、众数从不同的侧面反映了一组数据的特征,因此在解决实际问题时,
往往要注意结合问题的实际情境,灵活地选择这些统计量来解决问题. 答案:
1、解析:由图可知:交10元的人数最多,因此众数是10元;全班50人,捐款数按从小到大排列后,第25、26两个数都是20元,因此中位数是20元;
元)
(6.3050
6
1009501520161045=⨯+⨯+⨯+⨯+⨯=x 因而,这组数据的众数是10元,中位数是20元,平均数是30.6元. 2、解析:
(1)A 大学生的口试成绩为90;补充后的图如图所示:
(2)A 的票数为300×35%=105, B 的票数为300×40%=120, C 的票数为300×25%=75; (3)A 的成绩为
=92.5(分)
B 的成绩为=98(分)
C 的成绩为=84(分)
故B 应当选.
3、解析:(1)甲厂的广告利用了统计中的平均数.
乙厂的广告利用了统计中的众数. 丙厂的广告利用了统计中的中位数.
(2) 选用甲厂的产品. 因为它的平均数较真实地反映灯管的使用寿命
或选用丙厂的产品.因为丙厂有一半以上的灯管使用寿命超过12个月. 4、解析:(1)这组数据的平均数:293234338248255
3910
++⨯+⨯+⨯+=;
这组数据的中位数:
3438
362
+=; 这组数据的众数是:34.
(2)这个目标可以定为每月39万元(平均数).因为从样本数据看,在平均数、中位数和众数中,平均数最大,可以认为,月销售额定为每月39万元是一个较高目标.
(2)万元)
(6.120
==
x 即年平均收入为1.6万元;
(3)由上表可知,第10、11两个数都是1.2万元,因而中位数是1.2万元;在20个数据中,1.3万元出现的次数最多,因此众数是1.3万元;
(4)因为这组数中,数据的大小相差较大,所以平均数不能能反映这个地区家庭的年收入水平;而中位数较接近多数家庭的年收入水平.
20.3 数据的离散程度
专题一 求一组数据的方差
1、若样本1,2,3,x 的平均数为5,又样本1,2,3,x ,y 的平均数为6,
则样本1,2,3,x ,y 的方差是_______.
2、已知一组数据0,1,2,3,4的方差为2,则数据20,21,22,23,24的方差为_____. 3
那么被遮盖的两个数据依次是( )
A .80,2
B .80
C .78,2
D . 78
专题二 方差统计意义
4、市运会举行射击比赛,校射击队从甲、乙、丙、丁四人中选拔一人参赛.在选拔赛中,
每人射击10次,计算他们10发成绩的平均数(环)及方差如下表.请你根据表中数据选一人参加比赛,最合适的人选是 .
5、省射击队为从甲、乙两名运动员中选拔一人参加全国比赛,对他们进
)根据表格中的数据,计算出甲的平均成绩是 环,乙的平均成绩是 环; (2)分别计算甲、乙六次测试成绩的方差; (3)根据(1)、(2)计算的结果,你认为推荐谁参加全国比赛更合适,请说明理由. (计算方差的公式:s 2=
[])
6、某市篮球队到市一中选拔一名队员.教练对王亮和李刚两名同学进行5次3分投篮测试,每人每次投10个球,下图记录的是这两名同学
5次投篮中所投中的个数.
(1)请你根据图中的数据,填写右表.
(2)你认为谁的成绩比较稳定,为什么?
(3)若你是教练,你打算选谁?简要说明理由.
7、学校为了了解八年级两个班期末数学成绩情况,从
n
12
2221)()()(x x x x x x n -++-+-
王亮 李刚
请你通过计算,估计哪个班学生的成绩比较整齐?
状元笔记
【知识要点】
方差:()()()[]
222212
1
x x x x x x n
s n -++-+-=
; 值越大,离散程度越大.
【方法技巧】
1.方差的求法:①先求各数据的平均数x ;②再求各数据偏离平均数x 的差值,即x 1-x ,x 2-x ,…,x n -x ;③对各差值平方,即(x 1-x )2,(x 2-x )2,…,(x n -x )2;
④对各平方结果求平均数,即计算S 2=1
n
[(x 1-x )2+(x 2-x )2+…+(x n -x )2].
答案: 1、解析:
()()()()()[]
222222
61061463626151
-+-+-+-+-=
s =()166********
++++
=1305
1

=26.
2、解析:由方差的定义可知:若一组数据与另一组数据每个数据相差相同的数,则这两组数据的方差相等,因此方差为2。

3、解析:设丙数为x ,则81+79+x +80+82=80×5 解之得:x =78
()()()()()[]
2222228082808080788079808151
-+-+-+-+-=
s ()4041151
++++= 1051
⨯=
=2
所以答案为C .
4、解析:从平均数的角度选拔,应考虑甲、丁,从方差的角度考虑应选择丁,两方面综合,应选丁.
5、解析:
(1)9;9.
(2)s 2甲= ==; s 2乙= ==. (3)推荐甲参加全国比赛更合适,理由如下:两人的平均成绩相等,说明实力相当;

甲的六次测试成绩的方差比乙小,说明甲发挥较为稳定,故推荐甲参加比赛更合适.
差.王亮的成绩较稳定.
(3)选王亮的理由是成绩较稳定,选李刚的理由是他具有发展潜力,李刚越到后面投中个数越多.
7、解析:(1)在这10天用电量中,13出现次数最多,因此众数是13度;
由上表可知,第5、6个数据都是13,因此这组数据的中位数是13度;因为15-8=7,所以极差为7度;
(2)∵1(8910213314152)10
x =++⨯+⨯++⨯=12(度) ∴这个班级平均每天的用电量为12度; (3)∵12×20×30=7200(度)
∴估计该校该月总的用电量为7200度.
8、解析:(1)众数是1.0小时;
(2)1(0.515 1.020 1.510 2.05)50
x =⨯+⨯+⨯+⨯ 1.05=(小时)
, []
222222)99()910()98()99()98()910(61-+-+-+-+-+-)011011(6
1+++++32[]
222222)98()99()910()910()97()910(61-+-+-+-+-+-)101141(6
1+++++34
这50名学生这一天平均每人的课外阅读时间是1.05小时;
(3)352000140050
⨯=. 全校学生中这一天课外阅读时间在1.0小时以上(含1.0小时)的约为1400人.
9、解析:
()().2.8374848210
1,84839076101====乙甲++++++ x x ()()()[]2
.1313210
184838490847610
12222===甲⨯-++-+- s ()()()[]36
.266.26310
12.83742.83842.83821012222===
乙⨯-++-+- s 因为两个班平均数接近,且,乙甲22s s 〈
所以甲班学生的成绩比较整齐.。

相关文档
最新文档