高考数学二轮复习 统计2
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高考数学二轮复习 统计2
【知识归纳】
1.在统计中,为了考察一个总体的情况,通常是从总体中抽取一个样本,用样本的有关情况去估计总体的相应情况。
这种估计大体分为两类,一类是,一类是.
2.总体平均数(又称为总体期望值)描述了一个总体的平均水平。
对很多总体来说,它 的平均数不易求得,常用容易求得的样本平均数:x =对它进行估计.
方差和标准差计算公式:样本方差:2
s =;样本标准差:s =。
方差和标准差的意义:描述一个样本和总体的的特征数,标准差大说明波动大. 3.用样本频率分布估计总体分布
由于总体分布通常不易知道,我们往往用样本的频率分布去估计的分布.一般地,样本的容量越大,估计越精确.
(1) 当总体中个体取不同数值很少时,其频率分布表由所取样本的不同数值及相应频率表 示,其几何表示就是相应的条形图.
(2) 当总体中个体取不同数值很多时,用频率分布直方图来表示相应样本的频率分布.
4.一般地,设一个总体的个体总数为N ,如果通过逐个抽取的方法从中抽取样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为。
这种抽样方法有两种,即、。
一般地,可以证明:用这种抽样的方法从个体数为N 的总体中逐次抽取一个容量为n 的样本,那么在整个抽样过程中每个个体被抽到概率都等于
N
n . 5.当总体中的个体数较多时,采用简单随机抽样显得较为费事,这时可将总体分成均匀的几部分,然后按照预先定出的规则,从每一部分抽取一个个体,得到所需的样本,这种抽样叫做。
当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽取叫做 . 【例题精选】
1.☆☆从5名男生、1名女生中随机抽取3人,检查他们的英语口语水平.
在整个抽样过程中,这名女生“第一次、第二次均未被抽到,第三次被抽到”的概率是( A )
A .
16 B .13 C .12 D .2
3
【变式】☆☆用简单随机抽样的方法从含有10个个体的总体中,抽取一个容量为2的样本,则某
个个体a “第一次被抽到的概率”, “第一次未被抽到,第二次被抽到的概率”,“在整个过程中被抽到的概率”分别是
111,,10105
. 【思想方法回顾】准确地化归为等可能事件的概率
2.☆为了分析高三年级的8个班400名学生第一次高考模拟考试的数学成绩,决定在8个班中每班随机抽取12份试卷进行分析,这个问题中样本容量是 ( C )
A .8
B .400
C .96
D .96名学生的成绩 3. ☆(06某某卷)甲校有3600名学生,乙校有5400名学生,丙校有1800名学生,为统计三校学生某方面的情况,计划采用分层抽样法,抽取一个容量为90人的样本,应在这三校分别抽取学生 ( B ) (A )30人,30人,30人(B )30人,45人,15人 (C )20人,30人,10人(D )30人,50人,10人
4.☆在频率分布直方图中,各个长方形的面积表示 (B )
(A)落在相应各组的数据的频数 (B)相应各组的频率 (C)该样本所分成的组数 (D)该样本的样本容量
5.☆(06年某某卷)某人5次上班途中所花的时间(单位:分钟)分别为x ,y ,10,11,9.☆☆已知这组数据的平均数为10,方差为2,则|x -y |的值为 ( D ) (A )1 (B )2 (C )3 (D )4
【解析】由题意可得:x+y=20,(x-10)2
+(y-10)2
=8,解这个方程组需要用一些技巧,因为不要直接求出x 、y ,只要求出y x -,设x=10+t, y=10-t, 24x y t -==,选D 6. ☆已知样本:
10 8 6 10 13 8 10 12 11 7
8 9 11 9 12 9 10 11 12 12
那么频率为0.3的X 围是 ( B ) (A)5.5~7.5(B)7.5~9.5(C)9.5~11.5(D)11.5~13.5
7.☆心理辅导员为研究班上的男女生心理状况,对某班50名学生(其中男生30名,女生20名)采取分层抽样的法案方法,抽取一个容量为10的样本进行研究,则抽取情况的总数为 ( B ) (A)6
4
10
302010C C A (B)6
4
3020C C (C)6
4
3020C A (D)6
4
3020A A 8.☆设n 个实数,12,,
n x x x 的算术平均数是x ,若a x ≠,
设22212()()()n p x x x x x x =-+-+-,22212()()()n q x a x a x a =-+-+-
则一定有 ( B )
(A )p q > (B )p q < (C )p q = (D )p =9.☆某一计算机网络,有n 个终端,每个终端在一天中使用的概率p ,则这个网络中一天平均使用的终端个数为 ( B )
(A) np(1-p) (B) np (C) n (D) p(1- p)
10.☆☆为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况, 得到频率分布直方图,如右,由于不慎将部分数据丢失,但知道前4组的频数成等比数列, 后6组的频数成等差数列,设最大频率为a ,视力在4.6到5.0之间的学生数为b ,则a , b 的值分别为 (A ) A .0.27,78 B .0.27,83 C .2.7,78 D .2.7,83
【解析】由条件得前4组的频率成等比数列,,又前2组的频率为0.01,0.03,得第三、四组的频
率为0.09,0.27,所以后六组的频率之和为1-(0.01+0.03+0.09)=0.87,由
6(0.27)
0.872
x +=
,得x=0.02,所以视力在4.6~5.0之间的频率之和为0.78,学生数为
0.78×100=78,最大的频率为第四组的频率,故等于0.27. 【思想方法回顾】正确理解频率分布直方图的结构特征.
11. ☆(2003年全国高考某某卷14)某公司生产三种型号的轿车,产量分别为1200辆,6000辆和2000辆.为检验该公司的产品质量,现用分层抽样的方法抽取46辆进行检验,这三种型号的轿车依次应抽取6,30,10辆.
12.☆一总体由差异明显的三部分数据组成,分别有m 个、n 个、p 个,现要从中抽取a 个数据作为样本考虑总体的情况,各部分数据应分别抽取___am m n p ++_____、 _an
m n p
++_____、
____
ap
m n p
++___.
13. ☆ (06年某某调研卷)假设要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,先将800袋牛奶按000,001,002,…,799.进行编号,如果从随机第8行第18列的数开始向右读,请你依次写出最先检验的5袋牛奶的编号719,050,717,
512,358.(下面摘取了一随机数表的第7行至第9行)
……
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76 63 01 63 78 59 16 95 56 67 19 98 10 50 71 75 12 86 73 58 07 44 39 62 58 79 73 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54 ……
【思想方法回顾】正确理解随机数表的结构和用法
14.☆☆一个总体中的100个个体为0,1,2,…,99,并依次将其分为10个小组,要用系统抽样方法抽取一个容量为10的样本,规定:如果在第一组(为0~9)随机抽取的为m,那么依次错位地得到后面各组的,即第k 组中抽取的个数为m+k -1或m+k -11(如果m+k ≥11).若第6组抽取的为52,,则m=7 .
【解析】当k=6时,,则m+6-1=2或m+6-11=2(m+6≥11),即m=-3(舍去)或m=7(m+6≥11).
15.☆若样本a 1,a 2,a 3的方差是2,则样本2a 1+3,2a 2+3,2a 3+3的方差是8.
16. ☆为了科学地比较考试的成绩,有些选拔 性考试常常会将考试分数标准分,转化关系为:x x
z s
-=
(其中x 是某位学生的考试分数,x 是该次考试的平均分,s 是该次考试的标准差,z 称为这 位学生的标准分).转化成标准分后可能出现小数或负数,因此,又常常再将z 分数作线性变 换转化成其它分数.例如某次学业选拔考试采用的是T 分数,线性变换公是:4060T z =+
.已知在这次考试中某位考生的考试分数是86,而他的T 分数则为100.若这次考试的平均分是70,则这次考试的方差是256 .
17. ☆☆抽样本检查是产品检查的常用方法.分为返回抽样和不返回抽样两种具体操作方案.现
有100只外型相同的电路板,其中有40只A 类版后60只B 类板.问在下列两种情况中“从100只抽出3只,3只都是B 类”的概率是多少?
(1) 每次取出一只,测试后放回,然后再随机抽取下一只(称为返回抽样);
(2) 每次取出一只,测试后不放回,在其余的电路板中,随意取下一只(称为不返回抽
样)
【解析】(1)31327()5125p ==;(2)360231005133
0.2223765
A p A ==≈.
18. ☆某农场为了从三种不同的西红柿品种中选取高产稳定的西红柿品种,分别在5块试验田上
问:哪一种的西红柿既高产又稳定? 【解析】第一种西红柿品种.
统计量 组别 平均 标准差 第一组 90 6 第二组 80 4
19.☆☆有一容量为50的样本,数据的分组及各组的频数如下:
[10,15),4;[30,35),9;[15,20),5;[35,40),8;
[20,25),10;[40,45),3;[25,30),11;
(1) 列出样本的频率分布表; (2) 画出频率分布直方图.
【解析】(1)由所给的数据,不难得出以下样本的频率分布表:
数据段 [10,15) [15,20) [20,25) [25,30) [30,35) [35,40) [40,45) 总计 频数 4 5 10 11 9 8 3 50 频率 0.08 0.10 0.20 0.22 0.18 0.16 0.06 1.00
(2)频率分布直方图(如图).
20. ☆☆对某一工件进行了三次测量,测得的数据分别是123,,x x x ,对于函数
2221231
[()()()]3
y x x x x x x =-+-+-,当x 取何值时,函数值y 取得最小值?并求出最小值.
【解析】当1233x x x x ++=时,有y 最小值,2222
1231()3
y x x x x =++-最小值.
21. ☆☆某班40人随机平均分成两组,两组学生一次考试的成绩情况如下表:
求全班的平均成绩和标准差
. 【解析】设第一组学生的成绩为1220,,x x x ,第二组学生的成绩为212240,,x x x ,则由
209020808540x ⨯+⨯==,20222120(690)i i x ==⨯+∑,40
22221
20(480)i i x ==⨯+∑,得
4022
21
1(40)40i i s x x ==-∑,得51s =.
【思想方法回顾】熟悉方差的变形公式
22
2
11()n i i s x nx n ==-∑.
【课后作业】
1.☆☆某校为了了解学生的课外阅读情况,随机调查了50名 学生,得到他们在某一天各自课外阅读所用时间的数据,结果 用右侧的条形图表示.根据条形图可得这50名学生这一天平 均每人的课外阅读时间为 ( B )
(A)0.6小时 (B)0.9小时 (B)1.0小时 (D)1.5小时 【解析】每人一天平均阅读时间为
050.520 1.010 1.510 2.05
50
x ⨯+⨯+⨯+⨯+⨯=
0.9()=小时
2.☆若M 个数的平均数是X, N 个数的平均数是Y,则这M+N 个数的平均数是( C )
(A)
2X Y +(B)X Y M N ++ (C) MX NY M N ++ (D)MX NY
X Y
++ 3.☆下面哪有个数不为总体特征数的是 ( D ) (A) 总体平均数 (B) 总体方差 (C) 总体标准差 (D) 总体样本
4.☆一个年级有12个班,每个班有50名学生,随机编为1~50号,为了了解他们在课外的兴趣爱好要求每班是40号学生留下来进行问卷调查,这里运用的抽样方法是( D )
(A) 分层抽样 (B) 抽签法 (C) 随机数表法 (D) 系统抽样法 5.☆在简单随机抽样中,某一个个体被抽到的可能性是 ( C )
(A) 与第几次抽样有关,第一次抽的可能性最大 (B) 与第几次抽样有关,第一次抽的可能性最小 (C) 与第几次抽样无关,每次抽到的可能性相等 (D) 与第几次抽样无关,与抽取几个样本有关
6.☆要完成下列2项调查:①从某社区125户高收入家庭,280户中等收入家庭,95户低收入家庭中选出100户调查社会购买力的某项指标;②从某中学高一年级的12名体育特长生中选出3人调查学习负担情况。
应采用的抽样方法是 ( B )
(A) ①用随机抽样法②用系统抽样法 (B) ①用分层抽样法②用随机抽样法 (C) ①用系统抽样法②用分层抽样法 (D) ①、②都用分层抽样法
7.☆甲、乙两个小组各10名同学进行英语口语会话练习,各练5次,,他们每个同学合格的次数分别如下:
甲组:4,1,2,2,1,3,3,1,2,1; 乙组:4,3,0,2,1,3,3,0,1,3.
如果把合格3次以上(含3次)作为及格标准,则 ( B ) (A)甲组的口语会话及格率高, 乙组口语会话合格次数比较稳定; (B)乙组的口语会话及格率高, 甲组口语会话合格次数比较稳定; (C)甲组的口语会话及格率高, 甲组口语会话合格次数比较稳定; (D)乙组的口语会话及格率高, 乙组口语会话合格次数比较稳定;
8.☆(06年某某卷)某地区有300家商店,其中大型商店有30家 ,中型商店有75家,小型商店有195家。
为了掌握各商店的营业情况,要从中抽取一个容量为20的样本。
若采用分层抽样的方法,抽取的中型商店数是 ( C ) (A )2 (B )3 (C )5 (D )13
9.☆(06年某某卷)为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg) ,得到频率分布直方图如下:
0.0005300035000.00030.0004200015000.00020.0001
4000
25001000月收入(元)
频率/组距
根据上图可得这100名学生中体重在〔56.5,64.5〕的学生人数是 ( C ) (A)20 (B)30 (C)40 (D )50 10.☆已知样本123,,,
,n x x x x 的平均数是x ,标准差为s ,那么样本
123350,350,350,,350n x x x x ----的平均数和标准差分别是 ( D )
(A),x s (B)3,3x s (C)350,350x s -- (D)350,3x s -
11.☆(06年某某卷)某学校共有师生2400人,现用分层抽样的方法,从所有师生中抽取一个容量为160的样本,已知从学生中抽取的人数为150,那么该学校的教师人数是150. 12.☆(06年全国II )一个社会调查机构就某地居民
的月收入调查了10 000人,并根据所
得数据画了
样本的频率分布直方图(如右图).为 了分析居民的收入与年龄、学历、职 业等方面的关系,要从这10 000人中 再用分层抽样方法抽出100人作进一 步调查,则在[2500,3000)(元)月 收入段应抽出25人.
13.☆甲、乙两种棉花,各抽取50根棉花纤维检验长度,样本方差分别是s 2甲=1.32,s 2乙=0.93,这两种棉花质量较好的是乙 .
14.☆某校要从两名短跑运动员中选拔一名代表学校去省运动会参赛,为此对甲、乙两名运动员进行了6次短跑成绩测验,结果表明两运动员平均成绩相同,但甲成绩的方差为0.008,乙成绩的方差为0.027,由此可以估计___甲___的成绩比__乙____的成绩稳定,学校应选派__甲____运动员去参加省运动会为佳.
15.☆已知一个容量为40的样本,把它分成六组:第一组到第四组的频数分别是:5,6,7,10,第五组的频率是0.2,那么第六组的频数是4,频
率为0.1.
16.☆据新华社2002年3月12日电,1985年 到2000年间,我国农村人均居住面积如图 所示,其中从 1995 年到 2000 年的五年间增长最快.
17.☆☆某人有资金10万元,准备用于投资经
营
获利(万元) 2 3 -1 概率 0.4 0.3 0.3
获利(万元)
1 4 -
2 概率 0.6
0.2
0.2
甲,乙两种商品,根据统计资料:
经营甲 经营乙
问:应该选择经营哪种商品? 【解析】3
1
1.4i
i i x x
p ==
=∑甲,3
1
1.0i i i x x p ===∑乙.故选甲商品.
18.☆ 甲、乙两学生连续五次数学测验成绩如下,甲:80、75、80、90、70;乙:70、
70、75、80、65。
问哪一位同学的数学成绩比较稳定? 【解析】244s
=甲
,2
26s =乙,故乙稳定.
19.☆某欲调查网民对当前网页的满意程度,在登录的所有网民中,收回有效帖子共50000份,
其中持各种态度的份数如下表所示:
很满意
满意
一般
不满意
10800 12400 15600 11200
为了了解网民的具体想法和意见,以便决定如何更改才能使网页更完美,打算从中抽选500份,为使样本更具有代表性,每类中各应抽选出多少份? 【解析】108,124,156,112.
20.☆☆100名学生分4个小组参加课外活动,其中参加足球小组有30人,参加篮球小组有27人,参加排球小组有23人,参加乒乓球小组有20人. (1)列出学生参加运动小组的频率分布表; (2)画出表示频率分布的条形图.
【解析】(1) 学生参加运动小组的频率分布表如下: 类别 频数 频率
足球小组①
30 0.30 篮球小组②
27 0.27 排球小组③
23 0.23 乒乓球小组④
20 0.20 合计
100 1.00 (2)所求作的频率分布条形图如图所示:
21.☆☆有同一型号的汽车100辆.为了解这种汽车每耗油1L 所行走路程的情况,现从中随机抽出10辆在同一条件下进行耗油1L 所行路程试验,得到如下样本数据(单位:km):13.7, 12.7, 14.4,
13.8, 13.3, 12.5, 13.5, 13.6, 13.1, 13.4.并分组如下:
分组频数频率
[12.45,12.95)
[12.95,13.45)
[13.45,13.95)
[13.95,14.45)
合计10 1.0
(1)完成上面频率分布表;
(2)根据上表,在给定坐标系中画出频率分布直方图,并根据样本估计总体数据落在
[12.95,13.95)中的概率;
(3)根据样本,对总体的期望值进行估计.
【解析】(1)频率分布表:
分组频数频率
[12.45,12.95) 2 0.2
[12.95,13.45) 3 0.3
[13.45,13.95) 4 0.4
[13.95,14.45) 1 0.1
合计10 1.0
(2)频率分布直方图:
估计总体数据落在[12.95,13.95)中的概率约为0.7;
x ,因此估计总体的期望值约为
(3)可求出13.4
13.4.
【解题回顾】
1.抽样问题涉及到概率知识时,要会转化为概率模型来解决;
2.了解三种随机抽样的操作流程和要求,才能正确解决有关抽样问题;
3.理解频率分布表结构和频率分布直方图的流程,记住样本平均数和方差及标准差的计算公
式是正确解决此类问题的根本之道.
【老师点评】
统计一章的考试要求:
1.了解简单随机抽样、系统抽样、分层抽样的概念,要求会用抽样方法从总体中抽取样本;2.会概率知识解决与随机抽样的概率问题;
3.会用样本平均数估计总体期望值, 会用样本方差估计总体方差,会求样本平均数、样本方差和标准差;
4.通过统计案例,会用样本频率分布估计总体分布;了解频率分布表和频率分布直方图的绘制. 统计一章命题特点:
1.随机抽样与概率的综合性问题;
2.会对简单实际问题进行抽样分析;
3.读直方图或对抽样的数据进行分析.。