数据分析初步-复习讲义
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章数据分析初步
项目一知识概要
1. 平均数、中位数、众数的概念及举例
一般地,对于n个数x1,x2,…,x n,我们把,叫做这n个数的算术平均数,简称平均数。
一般地,n个数据按大小顺序排列,处于的一个数据(或)叫做这组数据的中位数。
一组数据中出现次数的那个数据叫做这组数据的众数。
2. 平均数、中位数、众数的特征
(1)平均数、中位数、众数都是表示一组数据“平均水平”的特征数。
(2)平均数能充分利用数据提供的信息,在生活中较为常用,但它容易受极端数字的影响,且计算较繁。
(3)中位数的计算简单,受极端数字影响较小,但不能充分利用所有数字的信息。当一组数据中个别数据变动较大时,可选择中位数来表示这组数据的“集中趋势”。
(4)众数的可靠性较差,它不受极端数据的影响,求法简便。当一组数据中某些数据多次重复出现时,众数是我们关心的一种统计量。
3. 加权平均数
例1:统计一名射击运动员在某次训练中15次射击的中靶环数,获得如下数据:6,
7,8,7,7,8,10,9,8,8,9,9,8,10,9,求这次训练中该运动员射击的平均成绩。
4、方差与标准差
在一组数据中,各数据与它们平均数的差的平方的平均数(即“先平均,再求差,然后平方,最后再平均”)得到的数叫方差,公式是
标准差公式是
项目二例题精讲
【例1】.为了了解学生参加体育活动的情况,学校对学生进行随机抽样调查,其中一个问题是“你平均每天参加体育活动的时间是多少?”,共有4个选项:
A.1.5小时以上B.1~1.5小时
C.0.5—1小时D.0.5小时以下
图1、2是根据调查结果绘制的两幅不完整的统计图,请你根据统计图提供的信息,解答以下问题:
(1)本次一共调查了多少名学生?
(2)在图1中将选项B的部分补充完整;
(3)若该校有3000名学生,你估计全校可能有多少名学生平均每天参加体育活动的时间在0.5小时以下.
图1 图2
【例2】:某商场一天中售出李宁牌运动鞋16双,其中各种尺码的鞋销售如下表所示鞋的尺码(cm)23.52424.52526
销售量(双)13462
这组数据的众数和中位数各是多少?
【例3】.我市部分学生参加了2004年全国初中数学竞赛决赛,并取得优异成绩. 已知竞赛成绩分数都是整数,试题满分为140分,参赛学生的成绩分数分布情况如下:
(1) 全市共有多少人参加本次数学竞赛决赛?最低分和最高分在什么分数范围?
(2) 经竞赛组委会评定,竞赛成绩在60分以上(含60分)的考生均可获得不同等级的奖励,求我市参加本次竞赛决赛考生的获奖比例;
(3) 决赛成绩分数的中位数落在哪个分数段内?
(4) 上表还提供了其他信息,例如:“没获奖的人数为105人”等等. 请你再写出两条此表提供的信息.
【例4】:某班甲小组有6人,数学平均成绩为80分,乙小组有8人,数学平均成绩为75分,这两个小组的平均成绩是多少?
【例5】:求数据1,3,8,4,9,7,5的中位数。
【例6】:某次数学测验满分100分,某班的平均成绩为75分,方差为10,若把每位同学的成绩按满分120分进行换算,则换算后的平均成绩与方差分别为()和()。
项目三冲刺必练
一、判断题
1、若一组数据的众数是5,则这组数据中出现次数最多的是5。()
2、一组数据的平均数、众数、中位数有可能相同。 ( )
3、一组数据的平均数一定大于其中的每一个数据。 ( )
4、一组数据中处于最中间位置的一个数据,叫做这组数据的中位数。( )
5、某产品的销量占某城市同类产品销量的40%,由此可判断该产品在国内同类产品的销量占40%。 ( )
二、填空题
1、某班45名学生中,14岁的15人,15岁的18人,16岁的11人,17岁的1人,则这个班学生的平均年龄是 岁(保留两个有效数字)。
2、一组数据1、
3、6、a 、b 的平均数是4,则a 与b 的和是 。
3、某公司招聘推销人员,小亮的成绩是:形象84分,语言能力78分,应变能力88分,这三种成绩平均分是 ,若三种成绩依次按3:4:3的比例来计算,那么这三种测试的平均分是 。
4、样本数据10、10、x 、8的众数与平均数相同,那么这组数据的中位数是 。
5、已知某次测验的最高分、最低分、平均分、中位数,同学甲要知道自己的成绩,属于班级中较高的一半还是较低的一半,应利用上述数据中的_________。
6、如果样本方差s 2=1
4[(x 1-2)2+(x 2-2)2+(x 3-2)2+(x 4-2)2],那么这个样本的平均数
为__________,样本容量为________.
三、选择题
1、若一组数据x1、x
2、x
3、x4 、x5的平均数是a,则另一组数据x1、x2+1、x3+2、x4+3、x5+4的平均数是()
(A)a (B)a+2 (C)a+5/2 (D)a +10
2、当五个整数从小到大排列,其中位数为4,若这组数中的惟一众数为6,则这5个整数可能的最大和为()
(A)21 (B)22 (C)23 (D)24
3、在共有15人参加的“讲诚信”演讲比赛中,参赛选手的成绩各不相同,因此选手要想知道自己是否进入前8名,只需要了解自己的成绩以及全部成绩的()(A)平均数(B)中位数
(C)众数(D)以上答案都不正确
4、某校在预防“非典型肺炎”过程中,坚持每日检查体温,下表是该校八年级四班同学一天的体温数据统计表,则该班40名学生体温的中位数是()
(A)36.8℃(B)36.5 ℃(C)36.6℃(D)36.4℃