贵州省贵阳市高考数学复习 专题 统计2
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计
【专题要点】
1.能够区分三种抽样方法,对不同情况能合理选择抽样方法,并遵循各种抽样方法的步骤
逐步进行。
2.通过具体问题掌握列频率分布表的方法。
学会用频率分布表作频率直方图和频率折线
图,会用频率直方图对总体分布规律进行估计。
3.掌握茎叶图的意义及画法,并能在实际问题中用茎叶图进行数据统计。
4.理解数据标准差的意义和作用,学会计算平均数,标准差;会用样本的数字特征估计总
体的数字特征。
5.理解相关关系,能够区分两变量间是相关关系还是函数关系。
6.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立象形回归方程。
7.理解回归分析的基本思想,通过具体案例,理解进行残差分析的必要性,以及相关指数
对回归模型的刻画。
8.理解独立性检验的基本思想和步骤。
能够用的计算及临界值的比较判断事件的相关与无
关
【考纲要求】
统计部分要求不太高,主要是考抽样方法与正态分布有关的问题,最多一个小题(选择或填空)属容易题,但应充分注意以统计为载体、问题实质涉及期望与方差计算的综合解答题.
【知识纵横】
1.抽样
(1)简单随机抽样
简单随机抽样是一种最简单、最基本的抽样方法.抽样中选取个体的方法有两种:放回和不放回.我们在抽样调查中用的是不放回抽取.
(2)系统抽样
系统抽样与简单随机抽样之间存在着密切联系,即在将总体中的个体均分后的每一段中进行抽样时,采用的是简单随机抽样.
系统抽样的分段间隔k,当N
n
(N为总体中的个体数,n为样本容量)是整数时,
N
k
n
=;
当N
n
不是整数时,从总体中剔除一些个体使剩下的个体个数'
N能被n整除,这时N
k
n
'
=.
(3)分层抽样
当总体由明显差别的几部分组成时,为了使抽样更好地反映总体情况,将总体中各个个体按某种特征分成若干个互不重叠的部分,每一部分叫层;在各层中按层在总体中所占比例进行简单随机抽样.
2.用样本估计总体
样本分布反映了样本在各个范围内取值的概率,我们常常使用频率分布直方图来表示相应样本的频率分布,有时也利用茎叶图来描述其分布,然后用样本的频率分布去估计总体分布,总体一定时,样本容量越大,这种估计也就越精确.
①用样本频率分布估计总体频率分布时,通常要对给定一组数据进行列表、作图处理.作频率分布表与频率分布直方图时要注意方法步骤.画样本频率分布直方图的步骤:求全距→决定组距与组数→分组→列频率分布表→画频率分布直方图.
②茎叶图刻画数据有两个优点:一是所有的信息都可以从图中得到;二是茎叶图便于记录和表示,但数据位数较多时不够方便.
③平均数反映了样本数据的平均水平,而标准差反映了样本数据相对平均数的波动程度,其计算公式为21
1()n
i i s x x n ==-∑. 3.两个变量之间的关系
求回归直线方程的步骤:
第一步:先把数据制成表,从表中计算出21
1
n
n
i i i i i x y x y x ==∑∑,,,;
第二步:计算回归系数的a ,b ,公式为
111
22
11()()()
n n n
i i i i i i i n n
i i i i n x y x y b n x x a y bx =====⎧
-⎪
⎪=⎪⎨-⎪⎪=-⎪⎩∑∑∑∑∑,;
第三步:写出回归直线方程$
y bx a =+. 4.独立性检验
①22⨯列联表:列出的两个分类变量X 和Y ,它们的取值分别为12{,}x x 和12{,}y y 的样本频数表称为22⨯列联表分类 y 1
y 2
总计
x 1
a b
a b +
x 2
c
d
c d +
总计 a c + b d +
a b c d +++
构造随机变量2
2
()()()())
n ad bc K a b c d a c b d -=++++(其中n a b c d =+++)
得到2
K 的观察值k 常与以下几个临界值加以比较:
如果 2.706k >,就有0090的把握因为两分类变量X 和Y 是有关系;
如果 3.841k > 就有0095的把握因为两分类变量X 和Y 是有关系; 如果 6.635k > 就有0099的把握因为两分类变量X 和Y 是有关系; 如果低于 2.706k ≤,就认为没有充分的证据说明变量X 和Y 是有关系.
【学法导航】
1.一般情况下,在尚未断定两个变量之间是否具有线性相关关系的情况下,应先进行
相关性检验.在确认其具有线性相关关系后,再求其回归直线方程;由部分数据得到的回归
直线,可以对两个变量间的线性相关关系进行估计,这实际上是将非确定性的相关关系问
题转化成确定性的函数关系问题进行研究.由于回归直线将部分观测值所反映的规律性进行
了延伸,它在情况预报、资料补充等方面有着广泛的应用。
2.对卡方统计量的表达式的由来,学生只需要了解,作为探究问题可以在课后学习。
统计的基本思维模式是归纳的,它的特征之一是通过部分数据来推测全体数据的性质,
因此,统计推断可能是错误的,也就是说,我们从数据上体现的只是统计上的关系,而不是
因果关系。
【典例精析】
1.线性相关性检验
例1.一个工厂在某年里每月产品的总成本y(万元)与该月产量x(万件)之间由如
下一组数据:
x 1.08 1.12 1.19 1.28 1.36 1.48 1.59 1.68 1.80 1.87 1.98 2.07 y 2.25 2.37 2.40 2.55 2.64 2.75 2.92 3.03 3.14 3.26 3.36 3.50 1)画出散点图;2)检验相关系数r的显著性水平;3)求月总成本y与月产量x之间的
回归直线方程.
i 1 2 3 4 5 6 7 8 9 10 11 12
xi 1.08 1.12 1.19 1.28 1.36 1.48 1.59 1.68 1.80 1.87 1.98 2.07
yi 2.25 2.37 2.40 2.55 2.64 2.75 2.92 3.03 3.14 3.26 3.36 3.50
xiyi 2.43 2.264 2.856 3.264 3.590 4.07 4.643 5.090 5.652 6.096 6.653 7.245
=,==2.8475,=29.808,=99.2081,=54.243
1)画出散点图:
2)
r=
=
在“相关系数检验的临界值表”查出与显著性水平0.05及自由度12-2=10相应的相关数临界值r0.05=0.576<0.997891, 这说明每月产品的总成本y(万元)与该月产量x(万件)之间存在线性相关关系。
3)设回归直线方程,
利用
,
计算a,b,得b≈1.215, a=≈0.974,
∴回归直线方程为:
2.独立性检验
例2.为了探究患慢性气管炎是否与吸烟有关,调查了339名50岁以上的人,调查结果如下表所示:
患慢性气管炎未患慢性气管炎合计吸烟43 162 205
不吸烟13 121 134
合计56 283 339
试问:50岁以上的人患慢性气管炎与吸烟习惯有关吗? 解析:由公式469.7283
56134205)
1316212143(3392
=⨯⨯⨯⨯-⨯⨯=
K ,因为7.469>6.635,所以我们
有99%的把握说:50岁以上的人患慢性气管炎与吸烟习惯有关。
3.独立的概念及应用
例3.(2009山东卷理)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的 产品净重(单位:克)数据绘制的频率分布直方图,其中产品 净重的范围是[96,106],样本数据分组为[96,98),[98,100), [100,102),[102,104),[104,106],已知样本中产品净重小于 100克的个数是36,则样本中净重大于或等于98克并且 小于104克的产品的个数是 ( ). A.90 B.75 C. 60 D.45 答案 A
解析 产品净重小于100克的概率为(0.050+0.100)×2=0.300, 已知样本中产品净重小于100克的个数是36,设样本容量为n , 则
300.036
=n
,所以120=n ,净重大于或等于98克并且小于 104克的产品的概率为(0.100+0.150+0.125)×2=0.75,所以样本 中净重大于或等于98克并且小于104克的产品的个数是 120×0.75=90.故选A. 4.随机变量的分布列
例4.(2009全国卷Ⅱ理)(本小题满分12分)某车间甲组有10名工人,其中有4名女工人;
乙组有5名工人,其中有3名女工人,现采用分层抽样方法(层内采用不放回简单随机抽样)从甲、乙两组中共抽取3名工人进行技术考核。
(1)求从甲、乙两组各抽取的人数;
(I2)求从甲组抽取的工人中恰有1名女工人的概率;
(3)记ξ表示抽取的3名工人中男工人数,求ξ的分布列及数学期望。
分析 (1)这一问较简单,关键是把握题意,理解分层抽样的原理即可。
另外要注意 此分层抽样与性别无关。
(2)在第一问的基础上,这一问处理起来也并不困难。
从甲组抽取的工人中恰有1名女工人的概率11
462
108
15
C C P C ⋅== 96 98 100 102 104 106 0.150 0.125 0.100 0.075 0.050
克
频率/组距
第8题图
(3)ξ的可能取值为0,1,2,3
1234211056(0)75C C P C C ξ==⋅=,1112146342212110510528
(1)75
C C C C C P C C C C ξ==⋅+⋅=
, 21622110510
(3)75
C C P C C ξ==⋅=
,31(2)1(0)(1)(3)75P P P P ξξξξ==-=-=-== 分布列及期望略. 5.随机变量的均值
例5.(1)(2009湖南卷文) 一个总体分为A ,B 两层,用分层抽样方法从总体中抽取一个容量为10的样本.已知B 层中每个个体被抽到的概率都为1
12
,则总体中的个体数为 .
答案 120
解析 设总体中的个体数为x ,则
101
120.12
x x =⇒= (2)(2009四川卷文)设矩形的长为a ,宽为b ,其比满足b ∶a =
618.02
1
5≈-,这种矩形给人以美感,称为黄金矩形。
黄金矩形常应用于工艺品设计中。
下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本: 甲批次:0.598 0.625 0.628 0.595 0.639 乙批次:0.618 0.613 0.592 0.622 0.620
根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是 A.甲批次的总体平均数与标准值更接近 B.乙批次的总体平均数与标准值更接近 C.两个批次总体平均数与标准值接近程度相同 D.两个批次总体平均数与标准值接近程度不能确定 答案 A
解析 甲批次的平均数为0.617,乙批次的平均数为0.613
6.随机变量的方差
例6.甲、乙两名工人加工同一种零件,两人每天加工的零件数相等,所得次品数分别为ε、η,ε和η的分布列如下:
ε
1
2
η
1
2
P
106 101 10
3 P
105 103 10
2 试对这两名工人的技术水平进行比较。
分析:一是要比较两名工人在加工零件数相等的条件下出次品数的平均值,即期望;二是要看出次品数的波动情况,即方差值的大小。
解析:工人甲生产出次品数ε的期望和方差分别为:
7.010
3
210111060=⨯+⨯+⨯
=εE , 891.010
3
)7.02(101)7.01(106)7.00(222=⨯-+⨯-+⨯-=εD ;
工人乙生产出次品数η的期望和方差分别为:
7.010
2
210311050=⨯+⨯+⨯
=ηE , 664.0102
)7.02(103)7.01(105)7.00(222=⨯-+⨯-+⨯-=ηD ;
由E ε=E η知,两人出次品的平均数相同,技术水平相当,但D ε>D η,可见乙的技术
比较稳定。
7.正态分布
例7.2009全国卷Ⅱ文)(本小题满分12分)某车间甲组有10名工人,其中有4名女工人; 乙组有10名工人,其中有6名女工人。
现采用分层抽样(层内采用不放回简单随即抽样)从甲、乙两组中共抽取4名工人进行技术考核。
(1)求从甲、乙两组各抽取的人数;
(2)求从甲组抽取的工人中恰有1名女工人的概率; (3)求抽取的4名工人中恰有2名男工人的概率。
解析 本题考查概率统计知识,要求有正确理解分层抽样的方法及利用分类原理处理事件概率的能力,第一问直接利用分层统计原理即可得人数,第二问注意要用组合公式得出概率,第三问关键是理解清楚题意以及恰有2名男工人的具体含义,从而正确分类求概率.
解 (1)由于甲、乙两组各有10名工人,根据分层抽样原理,要从甲、乙两组中共抽 取4名工人进行技术考核,则从每组各抽取2名工人.
(2)记A 表示事件:从甲组抽取的工人中恰有1名女工人,则158
)(2
10
1
614==C C C A P (3)i A 表示事件:从甲组抽取的2名工人中恰有i 名男工人,210,,=i
j B 表示事件:从乙组抽取的2名工人中恰有j 名男工人,210j ,,
=
B 表示事件:抽取的4名工人中恰有2名男工人。
i A 与j B 独立,210,,,=j i ,且021120B A B A B A B ⋅+⋅+⋅= 故)()(021120B A B A B A P B P ⋅+⋅+⋅=
)()()()()()(021120B P A P B P A P B P A P ⋅+⋅+⋅=
210262102628141621016142102
4
21024C C C C C C C C C C C C C C ⋅+⋅+⋅=
【专题突破】
1. 12名同学合影,站成前排4人后排8人,现摄影师要从后排8人中抽2人调整到前排,若其他人的相对顺序不变,则不同调整方法的总数是( ) A .2
2
83C A
B .26
86C A
C .22
86C A
D .22
85C A
2.设两个正态分布2
111()(0)N μσσ>,和
2
222()(0)N μσσ>,的密度函数图像如图所示。
则有( )
A .1212,μμσσ<<
B .1212,μμσσ<>
C .1212,μμσσ><
D .1212,μμσσ>>
3.在正方形ABCD 内任取一点P ,求0
120>∠APB 的概率.
4.某气象站天气预报的准确率为80%,计算(结果保留到小数点后面第2位) (1)5次预报中恰有2次准确的概率;(4分) (2)5次预报中至少有2次准确的概率;(4分)
(3)5次预报中恰有2次准确,且其中第3次预报准确的概率;(4分) 5..随机抽取某厂的某种产品200件,经质检,其中有一等品126件、二等品50件、三等品20件、次品4件.已知生产1件一、二、三等品获得的利润分别为6万元、2万元、1万元,而1件次品亏损2万元.设1件产品的利润(单位:万元)为ξ. (1)求ξ的分布列;(2)求1件产品的平均利润(即ξ的数学期望);
(3)经技术革新后,仍有四个等级的产品,但次品率降为1%,一等品率提高为70%.如果此时要求1件产品的平均利润不小于4.73万元,则三等品率最多是多少?
【专题突破】答案 1.C 解析:从后排8人中选2人共2
8C 种选法,这2人插入前排4人中且保证前排人的顺序不变,则先从4人中的5个空挡插入一人,有5种插法;余下的一人则要插入前排5人的空挡,有6种插法,故为2
6A ;综上知选C 。
2.A 解析:根据正态分布),(2
σμN 函数的性质:正态分布曲线是一条关于μ=x 对称,
在μ=x 处取得最大值的连续钟形曲线;σ越大,曲线的最高点越底且弯曲较平缓,正态分布越分散;反过来,σ越小,曲线的最高点越高且弯曲较陡峭,选A 。
3.解析:在正方形外作等腰三角形△AOB ,使0
120=∠APB ,以O 为圆心,OA 为半径作圆,在正方形内的圆弧AB ,如图7所示.设AB 与边AB 围成的弓形为区域D .则当点P
在区域内D 时,0
120>∠APB . 设1=OA ,则3=
AB .弧AB 的长为
3
2π
,扇形的面积为
3
13221π
π=⨯⨯,△AOB 的面积为4323121=⨯
⨯, 所以区域D 的面积4
33
-
=
π
S .正方形ABCD 的面积3'
=S , 所以所求概率为12
39'-==
πS S P 4.解析:(1)2
3
25
441611100.055525125p C ⎛⎫
⎛⎫
=-=⨯⨯≈ ⎪
⎪
⎝⎭⎝⎭
(2)4
1
5441110.00640.9955P C ⎛⎫=-⨯-=-≈ ⎪⎝⎭
(3)3
14
444
10.02555
P C ⎛⎫=⨯-⨯≈ ⎪⎝⎭
5.解析:ξ的所有可能取值有6,2,1,-2;126(6)0.63200P ξ===,50
(2)0.25200
P ξ=== 20(1)0.1200P ξ==
=,4
(2)0.02200
P ξ=-== 故ξ的分布列为:
ξ 6 2 1 -2 P
0.63
0.25
0.1
0.02
(2)60.6320.2510.1(2)0.02 4.34E ξ=⨯+⨯+⨯+-⨯= (3)设技术革新后的三等品率为x ,则此时1件产品的平均利润为
()60.72(10.70.01)(2)0.01 4.76(00.29)E x x x x =⨯+⨯---+-⨯=-≤≤
依题意,() 4.73E x ≥,即4.76 4.73x -≥,解得0.03x ≤ 所以三等品率最多为3%。