第12讲 数据的收集、整理与描述

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据的收集、整理与描述
一、统计调查的一般过程:收集数据-整理数据-描述数据-分析数据
1、数据的收集与整理
(1)收集数据的一般步骤:①明——明确调查问题;②定——确定调查对象;③选——选择调查方法和调查形式;④展——展开调查;⑤理——整理调查结果;⑥得——得出结论。

(2)收集数据的方法:a、民意调查:如投票选举
b、实地调查:如现场进行观察、收集、统计数据
c、媒体调查:报纸、电视、电话、网络等调查都是媒体调查。

注意:选择收集数据的方法,要掌握两个要点:①是要简便易行,②要真实、
全面。

(3)为了更清楚地了解数据所蕴含的规律,需要对数据进行整理,统计中经常用表格整理数据,整理数据时常划“正”字,这就是所谓的划记法
2、数据的描述
描述数据的方法有两种:统计表和统计图
(1)统计表:利用表格将要统计的数据填入相应的表格内,统计表中的数据比较明确、详实,可以清楚地反映各个量的真实情况,但信息表达不够直观。

(2)统计图:统计图主要有条形图和扇形图等,统计图的最大优点是将表格中的数据所呈现出来的信息直观化。

①条形统计图:用线段的长度表示数据,根据数据的多少画成长短不同的长方形直条,然后按顺序把这些直条排列起来,条形统计图很容易看出数据的大小,便于比较,但不能清楚的反映各部分占总体的百分比。

制作条形统计图的一般步骤:
a.根据具体情况,画出两条互相垂直的射线;
b.在水平射线上,适当分配条形的宽度、位置及间隔;
c.在与水平射线垂直的射线上,根据数据大小的具体情况,确定单位长度;
d.按照数据的大小,画出长短不同的直条并注明数量。

②扇形统计图:扇形统计图是用整个圆表示总数,用圆内各个扇形的大小表示各部分数量占总数的百分比,从扇形图中,我们可以很容易的看出各部分的
数量与总数的百分比以及他们的大小关系,但不能清楚的反映各部分数量的多少。

制作扇形统计图的一般步骤:
a.先算出各部分数量占总数量的百分数;
b.再算出各部分数量的扇形的圆心角度数;
c.取适当的半径画圆,在圆内画出各个扇形;
d.在各个扇形中标出数量名称和所占的百分比。

例1、某音乐行出售三种音乐CD ,即古典音乐、流行音乐、民族音乐,为了表示这三种音乐唱片的销售量的百分比,应该用( )
A.扇形统计图 B.折线统计图 C.条形统计图 D.以上都可以: 例2:在一次抽样调查中收集了一些数据,对数据进行分组,绘制了下面的频数分布表:
⑴已知最后一组(-)出现的频率为15 %,则这一次抽样调查的容量是________ .
⑵第三小组(-)的频数是_______,频率是________.
例3:某班有50人,其中三好学生10人,优秀学生干部5人,在扇形统计图上表示三好学生和优秀学生干部人数的圆心角分别是( )
A.72°,36° B.100°,50° C.120°,60°D.80°,40°
二、全面调查与抽样调查
1、调查方式有两种:一种是全面调查,另一种是抽样调查
(1)全面调查:考察全体对象的调查叫做全面调查。

全面调查的优点是可靠,真实,抽样调查的优点是省时、省力,减少破坏性。

(2)抽样调查:只抽取一部分调查对象,然后根据调查数据推断全体对象
的情况。

为了获得较为准确的调查结果,抽样时要注意样本的广泛性和代表性,即采取随机抽查的方法。

例4:请指出下列哪些调查的样本缺乏代表性。

(1)从具有不同层次文化的市民中,调查市民的法治意识;
(2)在大学生中调查我国青年的上网情况;
(3)抽查电信部门的家属,了解市民对曜服务的满意程度。

小结:只有选择具有代表性的样本进行抽样调查,才能了解总体的面貌
和特征。

2、总体和样本
总体:要考查的全体对象对象称为总体。

个体:组成总体的每一个考察对象称为个体。

样本:从总体当中抽出的所有实际被调查的对象组成一个样本。

样本容量:样本中抽取单位的数目叫样本容量(不带单位)。

例5:要了解某校全体学生早晨用餐情况,抽出其中三个班做调查。


体是;样本是;个体是。

例6:为了了解某县七年级2000名学生的身高,从中抽取500名学生
进行测量,对这个问题,下面说法正确的是()
A、2000名学生是总体
B、每个学生是个体
C、抽取500名学生是所抽的一个样本
D、每个学生的身高是个体
分析:要明白统计调查中研究的对象是什么,不要错看对象。

3、抽样调查中样本的抽取和处理
抽样调查的关键是样本的抽取,如果抽取的样本得当,就能很好地反映总体的情况,否则,抽样调查的结果会偏离总体情况。

(1)抽取的学生数目要适当。

如果抽取的学生数太少,那么样本就不能很好地反映总体的情况;如果抽取的学生人数太多,那么达不到省时省力的目的。

我们可以取100名学生作为一个样本。

(2)要尽量使每一个学生抽取到的机会相等。

例如,可以在2000名学生的注册学号中,用电脑随机抽取100个学号,调查这些学号对应的100名学生。

你还能想出使每个学生都有相等机会被抽到的方法吗?
从2000名学生的注册学号中,用电脑抽取能被5整除的100个学号,调查这些学号对应的学生;放学或上学时在校门口随机访问100名学生,等等。

这种总体中的每一个个体都有相等机会被抽到的抽样方法是一种简单随机
抽样。

4、抽样调查中的分层抽样
例7:某地区有500万电视观众,要想了解他们对新闻、体育、动画、娱乐四类节目的喜爱情况。

(1)能不能用问题2中对学生的调查数据去估计整个地区电视观众的情况呢?为什么?不能。

一是样本容量太小;二是学生、成年人、老年人喜欢的电视节目往往有明显不同.
所以要了解整个地区观众的情况,需要在更大范围内抽取样本。

(2)如果抽取一个容量为1000的样本进行调查,你会怎样调查?
由于各年龄段对节目爱好有明显的不同,而同一个年龄段对节目的喜爱又存在共性,因此可以对青少年、成年人、老年人各人群分别独立进行简单随机抽样,使每个年龄段都能抽取一定的人数来代表所在的人群,然后汇总调查结果。

这里还有一个问题,每个年龄段抽取的人数怎么确定呢?
可以根据各年龄段实际人口的比例分配,以确保每一个年龄段都有相应比例的代表。

如果青少年、成年人、老年人的人数比例为2︰5︰3,那么各年龄段抽取的人数分别是多少?
先将总体分成几个年龄段(层),然后再在各年龄段(层)中进行简单随机抽样,这是一种分层抽样。

分层抽取的样本与这个地区所有观众的年龄结构基本相同,与在整个地区直接进行简单随机抽样相比,更具有代表性。

5、课堂作业
(1)为了了解某初中学校学生的视力情况,需要抽取部分学生进行调查.下列抽取学生的方法最合适的是()
A、随机抽取该校一个班级的学生
B、随机抽取该校一个年级的学生
C、随机抽取该校一部分男生
D、分别从该校初一、初二、初三
年级中各随机抽取10%的学生
(2)为了了解某市八年级学生的肺活量,从中抽样调查了500名学生的肺活量,这项调查中的样本是()
A、某市八年级学生的肺活量
B、从中抽取的500名学生的肺活量
C、从中抽取的500名学生
D、500
(3)下列调查中,适合用普查方式的是()
A.了解一批炮弹的杀伤半径
B. 了解扬州电视台《关注》栏目的收视率
C. 了解长江中鱼的种类
D. 了解某班学生对“扬州精神”的知晓率(4)某地区有8所高中和22所初中.要了解该地区中学生的视力情况,下列抽样方式获得的数据最能反映该地区中学生视力情况的是()A.从该地区随机选取一所中学里的学生
B.从该地区30所中学里随机选取800名学生
C.从该地区一所高中和一所初中各选取一个年级的学生
D.从该地区的22所初中里随机选取400名学生
(5)下列调査中,适合采用全面调査(普査)方式的是()
A.对綦江河水质情况的调査B.对端午节期间市场上粽子质量情况的调査C.对某班50名同学体重情况的调査D.对某类烟花爆竹燃放安全情况的调査(6)下列调查中,适宜采用抽样调查方式的是( )
A.调查我市中学生每天体育锻炼的时间
B.调查某班学生对“五个重庆”的知晓率
C.调查一架“歼20”隐形战机各零部件的质量
D.调查广州亚运会100米决赛参赛运动员兴奋剂的使用情况
(7)下列说法正确的是()
A.打开电视机,正在播放新闻
B.给定一组数据,那么这组数据的中位数一定只有一个
C.调查某品牌饮料的质量情况适合普查
D.盒子里装有2个红球和2个黑球,搅匀后从中摸出两个球,一定一红一黑三、直方图
1、频数分布直方图
为了直观地表示一组数据的分布情况,可以以频数分布表为基础,绘制
分布直方图。

(1)频数分布直方图简称直方图,它是条形统计图的一种。

(2)直方图的结构:直方图由横轴、纵轴、条形图的三部分组成。

(3)作直方图的步骤:
①计算最大值与最小值的差
在给出的一组数据中,找出数值最大的数据和数值最小的数据,并计算它们的差,确定数据的变化范围。

②决定组距与组数
为了绘制直方图,需要对所给的数据进行分组,可根据最大值与最小值的差决定组距的大小。

组距就是每个小的两个端点之间的距离。

组距和组数没有固定的标准,一般数据越多,分的组数也就越多。

当数据的个数不超过50个时,一般分5~7组;当数据在50~100之间时,一般分8~12组。

在实际分组时,往往要有个尝试的过程,最后选择一个比较合适的组数。

③确定分点
确定分点的办法有多种,可采用半闭半开区间的办法,为了保持组距相等,往往会把最小值减去一点作为最左端的分点,把最大值加大一点作为最右端的分点。

当然,这也不是绝对的,也可以把分点取多一位小数,并把第一组的起点稍减小一点。

④列频数分布表
频数分布表一般有三部分组成,一是数据分组,二是划记,三是频数。

列出频数分布表以后,就可以知道这些数据在各个小组内的分布情况了。

⑤画频数分布直方图
频数分布直方图的横轴由数据组成,纵轴由频数组成,各个条形之间是连续的,而不应该有间隔,当各组的组距相等时,所画的各个条形的宽度也应该是相同的。

例8:为了了解某地区八年级学生的身高情况,现随机抽取了60名八
年级男生,测得他们的身高(单位:cm)分别为
156 162 163 172 160 141 152 173 180 174 157 174 145 16 153 165 156 167 161 172 178 156 166 155 140 157 167 156 168 150 164 163 155 162 160 168 147 161 157 162 165 160 166 164 154 161 158 164 151 169 169 162 158 163 159 164 162 148 170 161
(1)将数据适当分组,并绘制相应的频数分布直方图;
(2)如果身高在cm
≤的学生身高为正常,试求落在正常
155≤cm
x170
身高范围内学生的百分比。

小结:画频数分布直方图可按以下步骤:①计算数差;②确定组距与组数;③确定组限;④列频数分布表;⑤画频数分布直方图。

其中组距和组数的确定没有固定标准,要凭借经验和研究的具体问题决定。

一般来说,组数越多越好,但实际操作比较麻烦,当数据在100个以内时,根据数据的特征通常分成5~~12组。

2、课堂作业
(1)下列调查用全面调查方式最合适的是()
A、调查中小学生学习负担是否过重
B、调查中小学生课外资料花费情况
C、调查某种组奶粉的合格率
D、调查禽流感病例在各省市的分布情况(2)为了了解一批电视机的寿命,从中抽取100台电视机进行试验,这个问题中的样本是()
A、这批电视机的寿命
B、抽取的100台电视机
C、100
D、抽取的100台电视机的寿命
(3)某商场随机抽查了某月6天的营业额,结果分别如下(单位:万元):2.8,3.2,3.4,3.7,3.0,3.1,则这6天的平均营业额为万元,估算该商场这个月(30天)的总营业额是万元。

(3)某校学生在“暑假社会实践”活动中组织学生进行社会调查,并组织评委对学生写出的调查报告进行统计,绘制了统计图如图所示,请根据该图回答下列问题:
①学生会共抽取了份调查报告;
②若等第A为优秀,则优秀率为;
③学生会共收到调查报告1000份,请
估计该校有多少份调查报告的等第为E?
分析:调查报告的总份数等于各小组
频数之和.
《数据的收集、整理与描述》单元检测
一、选择题:(本题共10小题,每小题4分,满分40分)
1.下列统计中,能用“全面调查”的是()
A、某厂生产的电灯使用寿命
B、全国初中生的视力情况
C、某校七年级学生的身高情况
D、“娃哈哈”产品的合格率
2.下列调查中,用全面调查方式收集数据的是().
①为了了解全校学生对任课教师的意见,学校向全校学生进行问卷调查
②为了了解初中生上网情况,某市团委对10所初中的部分学生进行调查
③某班学生拟组织一次春游活动,为了确定春游的地点,向同学进行调查
④了解全班同学的作业完成情况,对学号为奇数的学生进行调查
A、①③
B、①②
C、②④
D、②③
3.某校公布了该校反映各年级学生体育达标情况的两张统计图,该校七、八、九三个年级共有学生800人。

甲、乙、丙三个同学看了这两张统计图后,甲说:“七年级的体育达标率最高。

”乙说:“八年级共有学生264人。

”丙说:“九年级的体育达标率最高。

”甲、乙、丙三个同学中,说法正确的是()
A、甲和乙
B、乙和丙
C、甲和丙
D、甲和乙及丙
4.依据某校九年级一班在体育毕业考试中全班所有学生成绩,制成的频数分布直方图如图(学生成绩取整数),则成绩在21.5~24.5这一分数段的频数和频率分别是()
A、4,0.1
B、10,0.1
C、10,0.2
D、20,
5. 在频数分布直方图中,有11个小长方形,若中间一个小长方形的面积等于其
它10个小长方形面积的和的1
4
,且数据有160个,则中间一组的频数为()
A、32
B、0.2 C
6.某班主任老师想了解本班学生平均每月有多少零用钱,随机抽取了10名同学进行调查,他们每月的零用钱数目是(单位:元)10,20,20,30,20,30,10,10,50,100,则该班学生每月平均零用钱约为()
A、10元
B、20元
C、30元
D、40元
7.今年我市有9万名初中毕业生参加升学考试,为了了解9万名考生的数学成绩,从中抽取2000名考生数学成绩进行统计分析.在这个问题中总体是()
A、9万名考生
B、2000名考生
C、9万名考生的数学成绩
D、2000名考生的数学成绩
8.某市社会调查队对城区内一个社区居民的家庭经济状况进行调查. 调查的结果是, 该社区共有500户, 高收入、中等收入和低收入家庭分别有125户、280户和95户. 已知该市有100万户家庭下列表述正确的是 ( )
A、该市高收入家庭约25万户
B、该市中等收入家庭约56万户
C、该市低收入家庭业19万户
D、因城市社区家庭经济状况好,所以不能据此估计全市所有家庭经济状况9.某校为了了解九年级全体男生的身体发育情况,对20名男生的身高进行了测量(测量结果均为整数,单位:厘米).将所得的数据整理后,列出频率分布表,如下表所示:
分组频
数频率
3 156.5~ 2
则下列结论中:(12)频率分布表中的数据a =0.30;(3)身高167cm (包括167cm )的男生有9人,正确的有( )
A 、(1)(2)(3)
B 、(
1)(2) C 、(1)(3) D 、(2)(3)
10. 某市股票七个月之内增长率的变化状况如图,从图上看,下列结论错误的是( )
A 、2~6月股票月增长率逐渐减少
B 、7月份股票月增长率开始回升
C 、这七个月中,每月的股票不断上涨
D 、这七个月,股票有涨有跌
二、填空题
11. 已知小明家五月份总支出共计1200元,各项支出如图所示,那么其中用于教育上的支出是____________元。

衣服10%其他
24%18%教育
36%
食物
12%医疗
12. 某地区有一条长100千米,宽的防护林.有关部门为统计该防护林的树林量,从中选出5块防护林( 每块长1 千米,宽 颗树.
13. 在扇形统计图中,有两个扇形的圆心角度数之比为3∶4,且较小扇形表示24本课本书,则较大扇形表示________本课本书.
14.一组数据共50个,分别落在5个小组内 ,第一、二、三、四组的数据分别为2、8、15、20,则第五小组的频数和频率分别为________、_________。

15. 对某班最近一次数学测试成绩(得分取整数)进行统计分析,将所有成绩由低到高分成五组,并绘制成如图4所示的频数分布直方图,根据直方图提供的信息,在这次测试中,成绩为A 等(80分以上,不含80分)的百分率为 。

50.560.570.580.590.5100.5
5791015人数成绩(分)
16.一家电脑生产厂家在某城市三个经销本厂产品的大商场调查,产品的销量占这三个大商场同类产品销量的40%.由此在广告中宣传,他们的产品在国内同类产品的销售量占40%.请你根据所学的统计知识,判断该宣传中的数据是否可靠:________,理由是___________.
17. 某班50名学生右眼视力的检查结果如下表:
(1)视力为1.5的有_____人,视力为1.0的有______人,视力小于1.0的有______人.
(2)视力在1.0以上(包括1.0)的为正常,则视力正常的有_____人,视力正常的人数占全班人数的___________;
(3)该班学生视力情况________(选填“好”“一般”“差”)
18、(2007年辽宁12市)如图,整个圆表示某班参加课外活动的总人数,跳绳的人数占30%,表示踢毽的扇形圆心角是60°,踢毽和打篮球的人数比是1∶2,那么表示参加“其它”活动的人数占总人数的_________%.
踢毽篮球
跳绳其它
19、(2007年贵州黔南)机关作风整顿领导小组为了了解某单位早上8点准时上班情况,随机调取了该单位某天早上10人的上班时间,得到如下数据: 7∶50 8∶00 8∶02 8∶04 7∶56 8∶00 8∶02 8∶03 8∶03 请回答下列问题
(1)该抽样调查的样本容量是 . (2)这10人的平均上班时间是 .
(3)如果该单位共有50人,请你估计有 人上班迟到.
20、(2007年福建宁德)育才中学现有学生2870人,学校为了进一步丰富学生课余生活,拟调整兴趣活动小组,为此进行一次抽样调查.根据采集到的数据绘制的统计图(不完整)如下:
请你根据图中提供的信息,完成下列问题:
(1)图1中“电脑”部分所对应的圆心角为 度; (2)在图2中,将“体育”部分的图形补充完整;
(3)爱好“书画”的人数占被调查人数的百分数是 ; (4)估计育才中学现有的学生中,有 人爱好“书画” 三、解答题
21.下面是1998年参加国际教育评估的15个国家学生的数学平均成绩的统计图: (1) 哪一个图能很好地说明一半以上国家的学生成绩在60≤x <69之间? (2)哪一个图能很好地说明学生成绩在70≤x <80的国家多于在50≤x <60的国家?
书画
电脑
35%
音乐 体育
图1 图2
22.下图表示的是某班同学衣服上口袋的数目:
(1)从图中是否能够得出以下信息?
①只有4个人的衣服上有4个口袋;
②只有1个人的衣服上有8个口袋;
③只有3个人的衣服上有5个口袋;
(2)根据上图填写下面的频数分布表,并绘制频数分布直方图.
口袋数目1≤x<
3
3≤x<
5
5≤x<
7
7≤x<
9
x≥
9
频数记



23.某高速公路检测点抽测了200辆汽车的车速,并将检测结果绘制成如下频数分布直方图:
20406080100120140160车速(千米/时)
6119.5
以上
109.5 ~119.599.5~109.589.5~99.579.5~89.569.5~79.569.5以下
5
8
15
28
126
12
车辆数(辆)
(1)按规定,车速在70千米/时-110千米/时范围内为正常行驶,试计算正常行驶的车辆所占的百分比;
(2)按规定:车速在110千米/时以上时为超速行驶。

如果该路段每天的平均车流量约为1万辆,试估计每天超速行驶的车辆数。

24. 将某雷达测速区监测到的一组汽车的时速数据整理,得到其频数及频率如下表(未完成):
注:30~40为时速大于等于30千米而小于40千米,其它类同. (1)请你把表中的数据填写完整; (2)补全频数分布直方图;
(3)如果此地汽车时速不低于60千米即为违章,则违章车辆共有多少辆?
25. 2007年上半年,全国猪肉价格持续上涨.针对这种现象,我市某校数学课外兴趣小组的同学对当地上半年猪肉价格和小明一家对肉类食品的消费情况进行了调查,并将收集的数据进行分析整理,绘制了如下统计图表.请结合图表,回答下列问题.
数据段 频数 频率 30~40 10 40~50 36 50~60 60~70
70~80 20 总 计
1
(1)试求2007年1~6月份猪肉价格的极差;
(2)若小明一家每月对肉类食品的消费金额为200元,则小明一家一月份、三月份、五月份的猪肉消费金额分别为多少元;
(3)根据所求数据,并结合统计图表,你能获得什么信息.
时间(月)
邵阳市某地2007年上半年猪肉价格折线统计图
猪肉
45%
猪肉
35%
猪肉
20%
其它肉 类食品
30%
其它肉 类食品
35%
其它肉 类食品
42%

25%

30%

38%
小明一家2007年一月份 对肉类食品消费扇形统计图
小明一家2007年三月份 对肉类食品消费扇形统计图
小明一家2007年五月份 对肉类食品消费扇形统计图。

相关文档
最新文档