20.大数据地分析报告知识点及练习题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
20.数据的分析
知识点:
数据的代表:平均数、众数、中位数、极差、方差
知识点详解:
1.解统计学的几个基本概念
总体、个体、样本、样本容量是统计学中特有的规定,明确所考查的对象是解决有关总体、个体、样本、样本容量问题的关键。
2.平均数
当给出的一组数据,都在某一常数a上下波动时,一般选用简化平均数公式,其中a是取接近于这组数据平均数中比较“整”的数;•当所给一组数据中有重复多次出现的数据,常选用加权平均数公式。
3.众数与中位数
平均数、众数、中位数都是用来描述数据集中趋势的量。
平均数的大小与每一个数据都有关,任何一个数的波动都会引起平均数的波动,当一组数据中有个数据太高或太低,用平均数来描述整体趋势则不合适,用中位数或众数则较合适。
中位数与数据排列有关,个别数据的波动对中位数没影响;当一组数据中不少数据多次重复出现时,可用众数来描述。
4.极差
用一组数据中的最大值减去最小值所得的差来反映这组数据的变化围,用这种方法得到的差称为极差,极差=最大值-最小值。
5.方差与标准差
用“先平均,再求差,然后平方,最后再平均”得到的结果表示一组数据偏离平均值的情况,这个结果叫方差,计算公式是
s2=[(x1-)2+(x2-)2+…+(x n-)2];
方差是反映一组数据的波动大小的一个量,其值越大,波动越大,也越不稳定或不整齐。
课堂练习
一、选择题
1.一组数据3,5,7,m,n的平均数是6,则m,n的平均数是()
A.6
B.7
C. 7.5
D. 15
2.小华的数学平时成绩为92分,期中成绩为90分,期末成绩为96分,若按3:3:4的比例计算总评成绩,则小华的数学总评成绩应为()
A.92 B.93 C.96 D.92.7
3.关于一组数据的平均数、中位数、众数,下列说法中正确的是()
A.平均数一定是这组数中的某个数
B. 中位数一定是这组数中的某个数
C.众数一定是这组数中的某个数
D.以上说法都不对
4.某小组在一次测试中的成绩为:86,92,84,92,85,85,86,94,92,83,则这个小组本次测试成绩的中位数是()
A.85 B.86 C.92 D.87.9
5.某人上山的平均速度为3km/h,沿原路下山的平均速度为5km/h,上山用1h,则此人上下山的平均速度为()
A.4 km/h
B. 3.75 km/h
C. 3.5 km/h
D.4.5 km/h
6.在校冬季运动会上,有15名选手参加了200米预赛,取前八名进入决赛.已知参赛选手成绩各不相同,某选手要想知道自己是否进入决赛,只需要了解自己的成绩以及全部成绩的()
A.平均数
B.中位数
C.众数
D.以上都可以
二、填空题:(每小题6分,共42分)
7.将9个数据从小到大排列后,第个数是这组数据的中位数
8.如果一组数据4,6,x,7的平均数是5,则x = .
9.已知一组数据:5,3,6,5,8,6,4,11,则它的众数是,中位数是 . 10.一组数据12,16,11,17,13,x的中位数是14,则x = .
11
环数7 8 9 10
次数 2 4 1 3
则这组数据的平均数是,中位数是,众数是 .
12.某小组10个人在一次数学小测试中,有3个人的平均成绩为96,其余7个人的平均成绩为86,则这个小组的本次测试的平均成绩为 .
13.为了了解某立交桥段在四月份过往车辆承载情况,连续记录了6天的车流量(单位:千辆/日):3.2,3.4,3,2.8,3.4,7,则这个月该桥过往车辆的总数大约为辆.
14.为了培养学生的环保意识,某校组织课外小组对该市进行空气含尘调查,下
3
(2)如果对大气飘尘的要求为平均值不超过0.025 g/m3,问这天该城市的空气是否符合要求?为什么?
15
(1)A班众数为分,B班众数为分,从众数看成绩较好的是班;
(2)A班中位数为分,B班中位数为分,A班中成绩在中位数以上的(包括中位数)学生所占的百分比是%,B班中成绩在中位数以上的(包括中位数)学生所占的百分比是%,从中位数看成绩较好的是班;
(3)若成绩在85分以上为优秀,则A班优秀率为%,B班优秀率为%,从优秀率看成绩较好的是班.
(4)A班平均数为分,B班平均数为分,从平均数看成绩较好的是班;
16.
(1)
(2)平均月工资能准确反映该酒店员工工资的一般水平吗?若能,请说明理由.若不能,如何才能较准确地反映该酒店员工工资的一般水平?谈谈你的看法.
总结:基本统计量的数学涵:
平均数:把一组数据的总和除以这组数据的个数所得的商。
平均数反映一组数据的平均水平,平均数分为算术平均数和加权平均数。
众数:在一组数据中,出现次数最多的数(有时不止一个),叫做这组数据的众数
中位数:将一组数据按大小顺序排列,把处在最中间的一个数(或两个数的平均数)叫做这组数据的中位数.
极差:是指一组数据中最大数据与最小数据的差。
巧计方法,极差=最大值-最小值。
方差:各个数据与平均数之差的平方的平均数,记作s2 .巧计方法:方差是偏差的平方的平均数。
标准差:方差的算术平方根,记作s 。
课后练习:
一.选择题
1、5名学生的体重分别是41、53、53、51、67(单位:kg),这组数据的极差是()
A、27
B、26
C、25
D、24
2、某校五个绿化小组一天植树的棵树如下:10、10、12、x、8.已知这组数据的众数与平均数相同,那么这组数据的平均数是()
A、12
B、10
C、8
D、9
A、1.56B、1.55C、1.54D、1.57
4、如果一组数据1,2,3,4,5的方差是2,那么一组新数据101,102,103,104,105的方差是()
A、2B、4C、8D、16
5、甲、乙两人在相同的条件下,各射靶10次,经过计算:甲、乙的平均数均是7,甲的方差是1.2。
乙的方差是5.8,下列说法中不正确的是()
A、甲、乙射中的总环数相同。
B、甲的成绩稳定。
C、乙的成绩波动较大
D、甲、乙的众数相同。
6、样本方差的计算式S2=1
20[(x
1
-30)2+(x2-30)2+。
+(x20-30)2]中,数
字20和30分别表示样本中的()
A、众数、中位数
B、方差、标准差
C、样本中数据的个数、平均数
D、样本中数据的个数、中位数
7、某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,那么所求出平均数与实际平均数的差是()
A、3.5
B、3
C、0.5
D、-3
8.某超市购进了一批不同价格的皮鞋,下表是该超市在近几年统计的平均数
皮鞋价(元)160 140 120 100
销售百分率60
%
75
%
83
%
95
%
A.160元
二、填空题
9、-2,-1,0,1,1,2的中位数是,众数是;
10、八年级(2)班为了正确引导学生树立正确的消费观,随机调查了10名同学某日的零花钱情况,其统计图表如下:
零花钱在4元以上(含4元)的学生所占比例数为。
该班学生每日零花钱的平均数大约是元。
11、一组数据中若最小数与平均数相等,那么这组数据的方差为______。
12、小芳测得连续五日最低气温并整理后得出下表:
由于不小心第4日及方差两个数据被墨迹污染,这两个数据分别是和和。
13.已知数据a,c,b,c,d,b,c,a且a<b <c<d,则这组数据的众数为________,中位数为______,
14.在数据-1,0,4,5,8中插入一个数x,使这组数据的中位数为3,则x =
15、某地区100个家庭的收入从低到高是4 800元,…,10 000元各不相同,在输入计算机时,把最大的数据错误地输成100 000元,则依据错误的数字算出的平均值与实际数字的平均值的差是元
三.解答题
日期一二三四五方差平均气温
最低气温132 5 3
16.小凯同学参加数学竞赛训练,近期的五次测试成绩得分情况如图4所示.试分别求出五次成绩的极差和方差.
17.2000年~2005年某市城市居民人均可支配收入情况(如图5所示).
根据图示信息:
(1)求该市城市居民人均可支配收入的中位数;
(2)哪些年份该市城市居民人均可支配收入比上一年增加了1 000元以上?
18、当今,青少年视力水平下降已引起全社会的关注,为了了解某市30000名学生的视力情况,从中抽取了一部分学生进行了一次抽样调查,利用所得数据绘制的频数分布直方图如下:
解答下列问题:
(1)本次抽样调查共抽测了名学生;
(2)参加抽测的学生的视力的众数在围;
中位数在围;
(3)若视力为4.9及以上为正常,试估计该市学生的视力正常的人数约为多少?
19、一养鱼专业户为了估计池塘里有多少条鱼,先捕上100条做上标记,然后放回池塘里,过了一段时间,待带标记的一混合于鱼群后,再捕捞3次,记录如下:第一次共捕捞95条,平均重量是2.1千克,有标记的有6条;第二次捕捞107条,平均重量是2.3千克,,带有标记的有7条;第三次捕捞98条,平均重量是1.9千克,带有标记的有7条;
(1)问他鱼塘大约有多少条鱼?
(2)问他鱼塘大约有多少千克的鱼?
20、某篮球队对运动员进行3分球投篮成绩测试,每人每天投3分球10次,对
经过计算,甲进球的平均数为x
甲=8,方差为2 3.2
s
甲
.
(1)求乙进球的平均数x
乙和方差2s
乙
;
(2)现在需要根据以上结果,从甲、乙两名队员中选出一人去参加3分球投篮大赛,你认为应该选哪名队员去?为什么?。