概率统计题型

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

概率统计解答题
频率分布直方图
1.(2015•安徽)某企业为了解下属某部门对本企业职工的服务情况,随机访问50名职工,根据这50名职工对该部门的评分,绘制频率分布直方图(如图所示),其中样本数据分组区间为[40,50],[50,60],…,[80,90],[90,100]
(1)求频率分布图中a的值;
(2)估计该企业的职工对该部门评分不低于80的概率;
(3)从评分在[40,60]的受访职工中,随机抽取2人,求此2人评分都在[40,50]的概率.
【线性回归方程】Array
2.(2007•广东)
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x 的线性回归方程;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100
吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
【独立性检验】 3.(2014•辽宁)某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表
”;
(Ⅱ)已知在被调查的北方学生中有5名数学系的学生,其中2名喜欢甜品,现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率. 附:X 2
=

【茎叶图】 4.(2013•新课标Ⅰ)为了比较两种治疗失眠症的药(分别成为A 药,B 药)的疗效,随机地选取20位患者服用A 药,20位患者服用B 药,这40位患者服用一段时间后,记录他们日平均增加的睡眠时间(单位:h )实验的观测结果如下:
服用A 药的20位患者日平均增加的睡眠时间:
0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4 服用B 药的20位患者日平均增加的睡眠时间:
3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4 1.6 0.5 1.8 0.6 2.1
1.1
2.5 1.2 2.7 0.5 (Ⅰ)分别计算两种药的平均数,从计算结果看,哪种药的疗效更好? (Ⅱ)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?
【频率分布直方图】
1.(2014•新课标I)从某企业生产的产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数
(2)估计这种产品质量指标的平均数及方差(同一组中
的数据用该组区间的中点值作代表);
(3)根据以上抽样调查数据,能否认为该企业生产的这
种产品符合“质量指标值不低于95的产品至少要占全部
产品80%”的规定?
【解】(1)频率分布直方图如图所示:
(2)
(3)
2.(2015•广东)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220.240),[240,260),[260,280),[280,300)分组的频率分布直方图如图.
(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;
(3)在月平均用电量为,[220,240),[240,260),[260,280),[280,300)的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220.240)的用户中应抽取多少户?
【解】(1)
(2)
(3)
3.(2015•新课标II)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表
(不要求计算出具体值,给出结论即可)
(Ⅱ)
【线性回归方程】
(Ⅰ)求y关于t的回归方程=t+.
(Ⅱ)用所求回归方程预测该地区2015年(t=6)的人民币储蓄存款.
附:回归方程=t+中.
【解】(Ⅰ)
(Ⅱ)
(Ⅰ)求y关于t的线性回归方程;
(Ⅱ)利用(Ⅰ)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.
附:回归直线的斜率和截距的最小二乘估计公式分别为:=,=﹣.
【解】(Ⅰ)
(Ⅱ)
3.(2013•重庆)从某居民区随机抽取10个家庭,获得第i个家庭的月收入x i(单位:千元)与月储蓄y i(单位:千元)的数据资料,算得,,,.
(Ⅰ)求家庭的月储蓄y对月收入x的线性回归方程y=bx+a;
(Ⅱ)判断变量x与y之间是正相关还是负相关;
(Ⅲ)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.
附:线性回归方程y=bx+a中,,,其中,为样本平均值,线性回归方程也可写为

【解】(Ⅰ)
(Ⅱ)
(Ⅲ)
【独立性检验】
1.(2012•辽宁)电视传媒公司为了了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.如图是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图;将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.
“体育迷”与性别有关?
”,已知“超级体育迷”中有2名女性,若从“超人,求至少有1名女性观众的概率.
附.
【解】(I)
(II)
2.(2010•新课标)为调查某地区老人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年
(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?
(3)根据(2)的结论,能否提供更好的调查方法来估计该地区老年人中,需要志愿帮助的老年人的比例?说明理由.附:
【解】(1)
(2)
(3)
3.(2013•福建)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分为5
(Ⅰ)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(Ⅱ)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成列联表,并判断是否有90%的把
握认为“生产能手与工人所在的年龄组有关”?附:k2=。

【解】(I)
(II)
【茎叶图】
1.(2011•北京)以下茎叶图记录了甲、乙两组各四名同学的植树棵树.乙组记录中有一个数据模糊,无法确认,在图中以X表示.
(1)如果X=8,求乙组同学植树棵树的平均数和方差;(注:方差,
其中的平均数)
(2)如果X=9,分别从甲、乙两组中随机选取一名同学,求这两名同学的植树总棵数为19的概率.
【解】(1)
(2)
2.(2013•安徽)为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,现从这两个学校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如下:
(Ⅰ)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);
(Ⅱ)设甲、乙两校高三年级学生这次联考数学平均成绩分别为、,估计﹣的值.
【解】(I)
(II)
3.(2009•广东)随机抽取某中学甲乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图.
(1)根据茎叶图判断哪个班的平均身高较高;
(2)计算甲班的样本方差;
(3)现从乙班这10名同学中随机抽取两名身高不低于173cm的同学,求身高为176cm的同学被抽中的概率.
【解】(1)
(2)
(3)
名工人年龄数据如下表:
(1)求这20名工人年龄的众数与极差;
(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(3)求这20名工人年龄的方差.
【解】(1)
(2)
(3)
答案【频率分布直方图】
1.(2014•新课标I)从某企业生产的产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数
(2)估计这种产品质量指标的平均数及方差(同一组中的数据用该组区间的中点值作代表);
(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?
【解答】解:(1)频率分布直方图如图所示:
(2)质量指标的样本平均数为=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100,
质量指标的样本的方差为S2=(﹣20)2×0.06+(﹣10)2×0.26+0×0.38+102×0.22+202×0.08=104,
这种产品质量指标的平均数的估计值为100,方差的估计值为104.
(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68,
由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.
2.(2015•广东)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220.240),[240,260),[260,280),[280,300)分组的频率分布直方图如图.
(1)求直方图中x的值;
(2)求月平均用电量的众数和中位数;
(3)在月平均用电量为,[220,240),[240,260),[260,280),[280,300)的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220.240)的用户中应抽取多少户?
【解答】解:(1)由直方图的性质可得(0.002+0.0095+0.011+0.0125+x+0.005+0.0025)×20=1,解方程可得x=0.0075,∴直方图中x的值为0.0075;
(2)月平均用电量的众数是=230,∵(0.002+0.0095+0.011)×20=0.45<0.5,∴月平均用电量的中位数在
[220,240)内,设中位数为a,由(0.002+0.0095+0.011)×20+0.0125×(a﹣220)=0.5可得a=224,∴月平均用电量的中位数为224;
(3)月平均用电量为[220,240)的用户有0.0125×20×100=25,月平均用电量为[240,260)的用户有0.0075×20×100=15,月平均用电量为[260,280)的用户有0.005×20×100=10,月平均用电量为[280,300)的用户有0.0025×20×100=5,
∴抽取比例为=,∴月平均用电量在[220,240)的用户中应抽取25×=5户
3.(2015•新课标II)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表
(不要求计算出具体值,给出结论即可)
【解答】解:(Ⅰ)
通过两个地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值,
B 地区的用户满意度评分的比较集中,而A地区的用户满意度评分的比较分散.
(Ⅱ)A地区用户的满意度等级为不满意的概率大.
记C A表示事件:“A地区用户的满意度等级为不满意”,C B表示事件:“B地区用户的满意度等级为不满意”,
由直方图得P(C A)=(0.01+0.02+0.03)×10=0.6
得P(C B)=(0.005+0.02)×10=0.25
∴A地区用户的满意度等级为不满意的概率大.
【线性回归方程】
1.(2015•重庆)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)
(Ⅰ)求y关于t的回归方程=t+.
(Ⅱ)用所求回归方程预测该地区2015年(t=6)的人民币储蓄存款.
【解答】解:(Ⅰ)由题意,=3,=7.2,=55﹣5×32=10,=120﹣5×3×7.2=12,∴=1.2,=7.2﹣1.2×3=3.6,∴y关于t的回归方程=1.2t+3.6.
(Ⅱ)t=6时,=1.2×6+3.6=10.8(千亿元).
(Ⅱ)利用(Ⅰ)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.
【解答】解:(Ⅰ)由题意,=×(1+2+3+4+5+6+7)=4,=×(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,
∴=
==0.5,=﹣=4.3﹣0.5×4=2.3.∴y关于t的线性回归方程为=0.5t+2.3;
(Ⅱ)由(Ⅰ)知,b=0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将2015年的年份代号t=9代入=0.5t+2.3,得:=0.5×9+2.3=6.8,
故预测该地区2015年农村居民家庭人均纯收入为6.8千元.
3.(2014•安徽)某高校共有学生15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300名学生每周平均体育运动时间的样本数据(单位:小时).
(Ⅰ)应收集多少位女生的样本数据?
(Ⅱ)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12],估计该校学生每周平均体育运动时间超过4
小时的概率;
(Ⅲ)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列
【解答】解:(Ⅰ)300×=90,∴应收集90位女生的样本数据;
(Ⅱ)由频率分布直方图得1﹣2×(0.100+0.025)=0.75,∴该校学生每周平均体育运动时间超过4小时概率为0.75;
(Ⅲ)由(Ⅱ)知,300位学生中有300×0.75=225人每周平均体育运动时间超过4小时,75人每周平均体育运动时间不超过4小时,又因为样本数据中有210份是关于男生的,90份是关于女生的,所以每周平均体育运动时间与性
∴K2=≈4.762>3.841,
∴有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.
4.(2013•重庆)从某居民区随机抽取10个家庭,获得第i个家庭的月收入x i(单位:千元)与月储蓄y i(单位:千元)的数据资料,算得,,,.
(Ⅰ)求家庭的月储蓄y对月收入x的线性回归方程y=bx+a;(Ⅱ)判断变量x与y之间是正相关还是负相关;(Ⅲ)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.
【解答】解:(Ⅰ)由题意可知n=10,===8,===2,
故l xx==720﹣10×82=80,l xy==184﹣10×8×2=24,故可得b=═=0.3,a==2﹣0.3×8=﹣0.4,故所求的回归方程为:y=0.3x﹣0.4;
(Ⅱ)由(Ⅰ)可知b=0.3>0,即变量y随x的增加而增加,故x与y之间是正相关;
(Ⅲ)把x=7代入回归方程可预测该家庭的月储蓄为y=0.3×7﹣0.4=1.7(千元).
【独立性检验】
1.(2012•辽宁)电视传媒公司为了了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.如图是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图;将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.
“体育迷”与性别有关?
”,已知“超级体育迷”中有2名女性,若从“超人,求至少有1名女性观众的概率.
附.
将2×2列联表中的数据代入公式计算,得
==≈3.03
因为3.03<3.841,所以没有理由认为“体育迷”与性别有关…6分
(II)由频率分布直方图知,“超级体育迷”为5人,从而一切可能结果所的基本事件空间为
Ω={(a1,a2),(a1,a3),(a2,a3),(a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3,b2),(b1,b2)}
其中a i 表示男性,i=1,2,3,b i 表示女性,i=1,2…9分
Ω由10个基本事件组成,而且这些基本事件的出现是等可能的.用A 表示事件“任选2人,至少有1人是女性”.则 A={(a 1,b 1),(a 1,b 2),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2),(b 1,b 2)} 事件A 有7个基本事件组成,因而P (A )=
…12分
2.(2010•新课标)为调查某地区老人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年
(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?
(3)根据(2)的结论,能否提供更好的调查方法来估计该地区老年人中,需要志愿帮助的老年人的比例?说明理由.附:
【解答】解:(1)∵调查的500位老年人中有40+30=70位需要志愿者提供帮助,∴该地区老年人中需要帮助的老年人的比例的估算值为.
(2)根据列联表所给的数据,代入随机变量的观测值公式,

∵9.967>6.635,∴有99%的把握认为该地区的老年人是否需要帮助与性别有关.
(3)由(
2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好.
【点评】本题主要考查统计学知识,考查独立性检验的思想,考查利用数学知识研究实际问题的能力以及相应的运算能力. 3.(2013•福建)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分为5
(Ⅰ)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;
(Ⅱ)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?附:(注:此公式也可以写成
k2=)
(I)由已知可得,样本中有25周岁以上组工人100×=60名,25周岁以下组工人100×=40【解答】解:
名,所以样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),25周岁以下组工人有40×0.05=2(人),故从中随机抽取2名工人所有可能的结果共=10种,其中至少1名“25周岁以下组”工人的结果共+=7种,故所求的概率为:;
(II)由频率分布直方图可知:在抽取的100名工人中,“25周岁以上组”中的生产能手有60×0.25=15(人),
所以可得==≈1.79,
因为1.79<2.706,所以没有90%的把握认为“生产能手与工人所在的年龄组有关”.
【茎叶图】
2.(2011•北京)以下茎叶图记录了甲、乙两组各四名同学的植树棵树.乙组记录中有一个数据模糊,无法确认,在图中以X表示.
(1)如果X=8,求乙组同学植树棵树的平均数和方差;(注:方差,其中的平均数)
(2)如果X=9,分别从甲、乙两组中随机选取一名同学,求这两名同学的植树总棵数为19的概率.
【解答】解:(1)当X=8时,由茎叶图可知乙组同学的植树棵树是8,8,9,10,
∴平均数是,方差是+=.
(2)由题意知本题是一个等可能事件的概率.
若X=9,分别从甲、乙两组中随机选取一名同学,共有16种结果,满足条件的事件是这两名同学的植树总棵数为19,包括:(9,10),(11,8),(11,8),(9,10)共有4种结果,∴根据等可能事件的概率公式得到P=.
3.(2013•安徽)为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,现从这两个学校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如下:
(Ⅰ)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);
(Ⅱ)设甲、乙两校高三年级学生这次联考数学平均成绩分别为、,估计﹣的值.
【解答】解:(I)设甲校高三年级总人数为n,则=0.05,∴n=600,
又样本中甲校高三年级这次联考数学成绩的不及格人数为5,
∴估计甲校高三年级这次联考数学成绩的及格率1﹣=;
(II)设样本中甲、乙两校高三年级学生这次联考数学平均成绩分别为a1,a2,
由茎叶图可知,
30(a1﹣a2)=(7﹣5)+55+(2﹣8)+(5﹣0)+(5﹣6)+…+92=15,
∴a1﹣a2==0.5.
∴利用样本估计总体,故估计x1﹣x2的值为0.5.
4.(2009•广东)随机抽取某中学甲乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图.(1)根据茎叶图判断哪个班的平均身高较高;(2)计算甲班的样本方差;(3)现从乙班这10名同学中随机抽取两名身高不低于173cm的同学,求身高为176cm的同学被抽中的概率.
【解答】解:(1)由茎叶图可知:甲班身高集中于160~169之间,而乙班身高集中于170~180之间.
因此乙班平均身高高于甲班
(2),
甲班的样本方差为
+(170﹣170)2+(171﹣170)2+(179﹣170)2+(179﹣170)2+(182﹣170)2]=57.
(3)设身高为176cm的同学被抽中的事件为A;
从乙班10名同学中抽中两名身高不低于173cm的同学有:(181,173)(181,176)
(181,178)(181,179)(179,173)(179,176)(179,178)(178,173)
(178,176)(176,173)共10个基本事件,而事件A含有4个基本事件.∴.(12分)
名工人年龄数据如下表:
(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;
(3)求这20名工人年龄的方差.
【解答】解:(1)这这20名工人年龄的众数为30,极差为40﹣19=21;(2)茎叶图如下:
(3)年龄的平均数为:=30.这20名工人年龄的方差为S2=[(19﹣30)2+3×(28﹣30)2+3×(29﹣30)2+5×(30﹣30)2+4×(31﹣30)2+3×(32﹣30)2+(40﹣30)2]=12.6.。

相关文档
最新文档