概率统计(文科)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

概率统计(文科)
【考点透析】概率统计的考点主要有:概率与统计包括随机事件,等可能性事件的概率,互斥事件有一个发生的概率,古典概型,几何概型,方差、平均数、,抽样方法,总体分布的估计,正态分布,线性回归等.
【例题解析】
题型1 抽样方法
【例1】在1000个有机会中奖的号码(编号为000999-)中,在公证部门监督下按照随机抽取的方法确定后两位数为的号码为中奖号码,该抽样运用的抽样方法是 ( )
A .简单随机抽样
B .系统抽样
C . 分层抽样
D .以上均不对
分析:实际“间隔距离相等”的抽取,属于系统抽样.
解析:题中运用了系统抽样的方法采确定中奖号码,中奖号码依次为:088,188,288,388,488,588,688,788,888,988.答案B .
点评:关于系统抽样要注意如下几个问题:(1)系统抽样是将总体分成均衡几个部分,然按照预先定出的规则从每一部分抽取一个个体,得到所需要的样本的一种抽样方法.(2) 系统抽样的步骤:①将总体中的个体随机编号;②将编号分段;③在第一段中用简单随机抽样确定起始的个体编号;④按事先研究的规则抽取样本.(3)适用范围:个体数较多的总体.
例2(2008年高考广东卷理3)某校共有学生2000名,各年级男、女生人数如表.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为( )
A .24
B .18
C .16
D .12
占全校学生总数的19%,解析:C 二年级女生20000.19380x =⨯=,即这样一年级和二年级学生的总数是3733773803701500+++=,三年级学生有500人,用分层抽样抽取的三年级学生应是64500162000
⨯=.答案C . 点评:本题考查概率统计最基础的知识,还涉及到一点分析问题的能力和运算能力,题目以抽样的等可能性为出发点考查随机抽样和分层抽样的知识.
例3.(2009江苏泰州期末第2题)一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本的频率分布直方图(如下图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10000人中再用分层抽样方法抽出100人作进一步调查,则在[)2500,3500(元)月收入段应抽出 人.
分析:实际上是每100人抽取一人,只要把区间内的人数找出来即可.
解析:根据图可以看出月收入在[)2500,3500的人数的频率是
()0.00050.00035000.4+⨯=,
故月收入在[)2500,3500人数是100000.44000⨯=, 故抽取25人.
点评:本题把统计图表和抽样方法结合起来,主要目的是考查识图和计算能力. 题型2统计图表问题
例4从某校高三年级随机抽取一个班,对该班50名学生的高校招生体检表中视力情况进行统计,其结果的频率分布直方图如右图:若某高校A 专业对视力的要求在0.9以上,则该班学生中能报A 专业的人数为
A .10
B .20
C .8
D .16
分析:根据图找出视力在0.9以上的人数的频率即可.
解析:B . 视力住0.9以上的频率为(10.75.025)0.20.4++⨯=,人数为0.45020⨯=. 点评:在解决频率分别直方图问题时容易出现的错误是认为直方图中小矩形的高就是各段的频率,实际上小矩形的高是频率除以组距.
例5 (2009年杭州市第一次高考科目教学质量检测理科第13题)某篮球运动员在一个赛季的40场比赛中的得分的茎叶图如图所示,则这组数据的中位数是 ;众数是 .
分析:根据茎叶图和中位数、众数的概念解决.
解析:由于中位数是把样本数据按照由小到大的顺序排列起来,处在中间位置的一个(或是最中间两个数的平均数),故从茎叶图可以看出中位数是23;而众数是样本数据中出现次数最多的数,故众数也是23.
点评:一表(频率分布表)、三图(频率分布直方图、频率折线图、茎叶图)、三数(众数、中位数、众数)和标准差,是高考考查统计的一个主要考点.
例5(2008高考广东文11)为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量.产品数量的分组区间为[)45,55,[)[)[)55,65,65,75,75,85,
[)85,95由此得到频率分布直方图如图,则这20名工人中一天生产该产品数量在[)55,75 的人数是 .
分析:找出频率即可.
解析: ()200.0400.00251013⨯+⨯=⎡⎤⎣⎦.
点评:本题考查频率分布直方图,解题的关键是明确这个直方图上的纵坐标是频率/组距,得出生产数量在[)55,75的人数的频率.
题型3 平均数、标准差(方差)的计算问题
例6 (2008高考山东文9)从某项综合能力测试中抽取100人的成绩,统计如表,则这100 人成绩的标准差为( )
A 3
B .2105
C .3
D .85
分析:根据标准差的计算公式直接计算即可.
解析: 平均数是5204103302301103100
⨯+⨯+⨯+⨯+⨯=,
标准差是 ()()()()()222222053104330333023101310080103040821010055
s ⨯-+⨯-+⨯-+⨯-+⨯-=+++===.
答案B .
点评:本题考查数据组的平均数和标准差的知识,考查数据处理能力和运算能力.解题的关键是正确理解统计表的意义,会用平均数和标准差的公式,只要考生对此认识清楚,解答并不困难.
例7.若数据123,,,,n x x x x 的平均数5x =,方差22σ=,则数据12331,31,31,,31n x x x x ++++的平均 数为 ,方差为 .
分析:根据平均数与方差的性质解决.
解析:16,18
例8.(浙江宁波市2008学年度第一学期期末理科第3题)如图是2009年元旦晚会举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为
A . 84,4.84
B .84,1.6
C . 85,1.6
D .85,4 解析:C
题型4 用样本估计总体
例8(2008高考湖南文12)从某地区15000位老人中随机抽取500人,其生活能否自理的情况如下表所示:
则该地区生活不能自理的老人中男性比女性约多_____________人.
解析:60 由上表得23211500023060.500
-⨯=⨯= 点评:考查样本估计总体的思想.
题型5.线性回归分析
例9.(2007高考广东)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据
3
6 2.5
4.5 (1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y bx a =+;
(3)已知该厂技术改造前100吨甲产品能耗为90吨标准煤;试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技术改造前降低多少吨标准煤?
分析:本题中散点图好作,本题的关键是求y 关于x 的线性回归方程y bx a =+,它既可以由给出的回归系数公式直接计算,也可以遵循着最小二乘法的基本思想――即所求的直线应使残差平方和最小,用求二元函数最值的方法解决.
解析:
(1)散点图如右

(2)方法一:设线性回归方程为y bx a =+,则 222222222(,)(3 2.5)(43)(54)(6 4.5)42(1814)(3 2.5)(43)(54)(6 4.5)f a b b a b a b a b a a a b b b a b =+-++-++-++-=+-+-+-+-+-
∴79 3.5 4.52
b a b -==-时, (,)f a b 取得最小值2222(1.51)(0.50.5)(0.50.5)(1.51)b b b b -+-+-+-,
即22250.5[(32)(1)]572b b b b -+-=-+,∴0.7,0.35b a ==时(),f a b 取得最小值.
所以线性回归方程为0.70.35y x =+.
方法二:由系数公式可知,266.54 4.5 3.566.5634.5, 3.5,0.75864 4.5x y b -⨯⨯-===
==-⨯ 93.50.70.352
a =-⨯=,所以线性回归方程为0.70.35y x =+. (3)100x =时,0.70.3570.35y x =+=,所以预测生产100吨甲产品的生产能耗比技术改造前降低19.65吨标准煤.
点评:本题考查回归分析的基本思想.求线性回归方程的方法一这实际上是重复了回归系数公式的推导过程,这里的另一个解决方法是对(),f a b 我们再按b 集项,即
()()()()()2222
2,86(36133) 2.534 4.5f a b b a b a a a a =+-+-+-+-+-,而这个
时候,当13336172
a b -=时(),f a b 有最小值,结合上面解法中 3.5 4.5a b =-时(),f a b 有最小值,组成方程组就可以解出a ,b 的值;方法二前提是正确地使用回归系数的计算公式,一般考试中都会给出这个公式,但要注意各个量的计算;最后求出的19.65是指的平均值或者是估计值,不是完全确定的值.对于本题我们可以计算题目所给的数据组的相关系数0.9899r =,相关指数20.98R =.这说明x ,y 具有很强的线性相关性,说明解释变量对预报变量的贡献率是98%,即耗煤量的98%是来自生产量,只有约2%来自其它因素,这与我们的直观感觉是十分符合的.本题容易用错计算回归系数的公式,或是把回归系数和回归常数弄颠倒了.
例10.(江苏扬州市2008-2009学年度第一学期期未调研测试第17题)为了分析某个高三学生的学习状态,对其下一阶段的学习提供指导性建议.现对他前7次考试的数学成绩x 、物理成绩y 进行分析.下面是该生7次考试的成绩.
(1)他的数学成绩与物理成绩哪个更稳定?请给出你的证明;
(2)已知该生的物理成绩y 与数学成绩x 是线性相关的,若该生的物理成绩达到115分,请你估计他的数学成绩大约是多少?并请你根据物理成绩与数学成绩的相关性,给出该生在学习数学、物理上的合理建议.
分析:成绩的稳定性用样本数据的方差判断,由物理成绩估计数学成绩由回归直线方程解决.
解析:(1)12171788121001007
x --+-++=+
=; 69844161001007
y --+-+++=+=; 2994==1427S ∴数学,2250=7S ∴物理, 从而22
S S >数学物理,所以物理成绩更稳定.
(2)由于x 与y 之间具有线性相关关系,根据回归系数公式得到 497ˆˆ0.5,1000.510050994
b a ===-⨯=, ∴线性回归方程为0.550y x =+.当115y =时,130x =.
建议:进一步加强对数学的学习,提高数学成绩的稳定性,将有助于物理成绩的进一步提高.
点评:《考试大纲》在必修部分的统计中明确指出“①会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.②了解最小二乘法的思想,能根据给出的线
性回归方程系数公式建立线性回归方程”.2007年广东就以解答题的方式考查了这个问题,在复习备考时不可掉一轻心.
题型6 古典概型与几何概型计算问题
例11 (2008高考江苏2)一个骰子连续投2次,点数和为4的概率 .
分析:枚举基本事件总数和随机事件所包含的基本事件的个数后,根据古典概型的计算公式计算.
解析:点数和为4,即()()()1,3,2,2,3,1,基本事件的总数是36,故这个概率是31369
=.或是数形结合处理. 点评:古典概型的计算是一个基础性的考点,高考中除了以解答题的方式重点考查概率的综合性问题外,也以选择题、填空题的方式考查古典概型的计算.
例12.(2009年福建省理科数学高考样卷第4题)如图,边长为2的正方形内有一内切圆.在图形上随机投掷一个点,则该点落到圆内的概率是
A .4π
B .4π
C .44π-
D .π
分析:就是圆的面积和正方形面积的比值.
解析:根据几何概型的计算公式,这个概率值是4
π,答案A . 点评:高考对几何概型的考查一般有两个方面,一是以选择题、填空题的方式有针对性地考查,二是作为综合解答题的一部分和其他概率计算一起进行综合考查.
例13.(2008高考山东文18)现有8名奥运会志愿者,其中志愿者123A A A ,,通晓日语,123B B B ,,通晓俄语,12C C ,通晓韩语.从中选出通晓日语、俄语和韩语的志愿者各1名,组 成一个小组.
(1)求1A 被选中的概率;
(2)求1B 和1C 不全被选中的概率.
分析:枚举的方法找出基本事件的总数,结合着随机事件、对立事件的概率,用古典概型的计算公式解决.
解析:(1)从8人中选出日语、俄语和韩语志愿者各1名,其一切可能的结果组成的基本事件空间
Ω={111112121()()()A B C A B C A B C ,,,
,,,,,,122131()()A B C A B C ,,,,,, 132()A B C ,,,211212221()()()A B C A B C A B C ,,,,,,,,,222()A B C ,,, 231()A B C ,,,232()A B C ,,,311312321()()()A B C A B C A B C ,,,,,,,,,
322331332()()()A B C A B C A B C ,,,,,,,,}
由18个基本事件组成.由于每一个基本事件被抽取的机会均等,因此这些基本事件的发生是等可能的.
用M 表示“1A 恰被选中”这一事件,则
M ={111112121()()()A B C A B C A B C ,,,
,,,,,, 122131132()()()A B C A B C A B C ,,,,,,,,}
事件M 由6个基本事件组成,因而61()183
P M ==. (2)用N 表示“11B C ,不全被选中”这一事件,则其对立事件N 表示“11B C ,全被选中”这一事件, 由于N ={111211311()()()A B C A B C A B C ,,,,,,,,},事件N 有3个基本事件组成, 所以31()186P N ==,由对立事件的概率公式得15()1()166
P N P N =-=-=. 点评:本题考查古典概率、对立事件等概率的基础知识,考查分类讨论、“正难则反”等数学思想方法,考查分析问题解决问题的能力.
【专题训练与高考预测】
一、选择题
1.从某鱼池中捕得120条鱼,做了记号之后,再放回池中,经过适当的时间后,再从池中
捕得100条鱼,若其中有记号的鱼为10条,试估计鱼池中共有鱼的条数为
( )
A .1000
B .1200
C .130
D .1300
2.已知x 与y 之间的一组数据:
则y 与x 的线性回归方程为y a bx =+必过点
( )
A .()2,2
B .()1.5,0
C .()1,2
D .()1.5,4
4.根据某医疗研究所的调查,某地区居民血型的分布为:O 型50%,A 型15%,B 型30%,
AB 型5%.现有一血液为A 型病人需要输血,若在该地区任选一人,那么能为病人输血的概率为 ( )
A .15%
B .20%
C .45%
D .65%
5.4张奖券中只有1张能中奖,现分别由4名同学无放回地抽取.若已知第一名同学没有
抽到中奖券,则最后一名同学抽到中奖奖券的概率是 ( )
A .14
B .13
C .12
D .1 6.有如下四个游戏盘,如果撒一粒黄豆落在阴影部分,则可中奖.小明希望中奖,他应选
择的游戏盘是 ( )
二、填空题 7.归直线方程为0.50.81y x =-,则25x =时,y 的估计值为 .
8.若由一个2*2列联表中的数据计算得2
4.013K =,那么有 把握认为两个变
量有关系.
9.一工厂生产了某种产品180件,它们来自甲、乙、丙3条生产线,为检查这批产品的质
量,决定采用分层抽样的方法进行抽样,已知甲、乙、丙三条生产线抽取的个体数组成一个等差数列,则乙生产线生产了 件产品.
10.如图:M 是半径为R 的圆周上一个定点,在圆周上等可能的任取一点N ,连接MN ,
则弦MN 的长度超过2R 的概率是 .
三、解答题
11.一个质地均匀的正方体玩具的六个面上分别写着数字1,2,3,4,5,6,现将这个正方体玩
具向桌面上先后投掷两次,记和桌面接触的面上的数字分别为,a b ,曲线
:1x y C a b
+=. (1)曲线C 和圆221x y +=有公共点的概率;
(2)曲线C 所围成区域的面积不小于50的概率.
(2)如果某家庭年收入为9万元,预测其年饮食支出.
【参考答案】
1.解析:B 根据用样本估计总体的思想,池中有记号的鱼的频率是
1
10,故鱼池中鱼的条数是1200条.
2.解析:D 过样本中心点.选D .
3.解析:C
任何个体被抽到的概率都相等,且是2007
50. 4.解析:D 只有O 型和A 型,根据互斥事件的概率加法得结论为65%. 5.解析:B 相当于在3张奖券中
1张有奖,3人抽取,最后一人抽到中奖奖券的概率是
13. 6.解析:A 选择游戏盘的原则是中奖的概率大,A 中中奖的概率是
38,B 中中奖的概率是13,C 中中奖的概率是44π-,B 中中奖的概率是1π
,比较大小即知. 7.解析:11.69 0.5250.8111.69⨯-=
8.解析:95%
11.解析:基本事件的总数是.
(1),a b 1≤,即22111a b
+≥,逐个检验, ()()()()()()()()()()()()1,1,1,2,1,3,1,4,1,5,1,6,2,1,2,1,3,1,4,1,5,1,6,1,随机事件:曲线C 和圆221x y +=有公共点的概率包含着11个基本事件,故所求的概率是1136;
(2)曲线C 所围成的区域的面积是2ab ,即求25ab ≥的概率,基本事件只能是()5,5,()5,6,()6,5,()6,6,故所求的概率是41369=. 12.解析:(1)由题意知,年收入x 为解释变量,年饮食支出y 为预报变量,作散点图(如
图所示).
从图中可以看出,样本点呈条状分布,年收入和年饮食支出有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系.
6x =∵, 1.83y =,1021406i i x ==∑,102135.13i i y ==∑,10
1117.7i i i x y ==∑,
0.172b ≈∴, 1.830.17260.798a y bx =-=-⨯=.
从而得到回归直线方程为0.1720.798y x =+.
(2)0.17290.798 2.346y =⨯+=万元.。

相关文档
最新文档