高考文科数学常考题型训练统计概率
文科《概率与统计》高考常考题型专题训练
文科《概率与统计》高考常考题型专题训练1.流行性感冒(简称流感)是流感病毒引起的急性呼吸道感染,是一种传染性强、传播速度快的疾病.其主要通过空气中的飞沫、人与人之间的接触或与被污染物品的接触传播.流感每年在世界各地均有传播,在我国北方通常呈冬春季流行,南方有冬春季和夏季两个流行高峰.儿童相对免疫力低,在幼儿园、学校等人员密集的地方更容易被传染.某幼儿园将去年春期该园患流感小朋友按照年龄与人数统计,得到如下数据:(1)求y 关于x 的线性回归方程;(2)计算变量x 、y 的相关系数r (计算结果精确到0.01),并回答是否可以认为该幼儿园去年春期患流感人数与年龄负相关很强?(若[]0.75,1r ∈,则x 、y 相关性很强;若[)0.3,0.75r ∈,则x 、y 相关性一般;若[]0,0.25r ∈,则x 、y 相关性较弱.)57.47≈.参考公式:()()()1122211ˆn niii ii i nniii i x x y y x y nxybx x xnx====---==--∑∑∑∑,相关系数()()niix x y y r --=∑.1.【解析】(1)由题意得,2345645x ++++==,2222171410175y ++++==,()()()()()()()()()51522222212515001327ˆ 3.221012iii ii x x y y b x x ==---⨯+-⨯+⨯+⨯-+⨯-===--+-+++-∑∑,ˆ17 3.2429.8a y bx=-=+⨯=, 故y 关于x 的线性回归方程为 3.229.8y x =-+;(2)()()()()1221132160.9710108330niii n niii i x x y y r x x y y ===----===≈-⨯-⋅-∑∑∑,0r ∴<,说明x 、y 负相关,又[]0.75,1r ∈,说明x 、y 相关性很强.因此,可以认为该幼儿园去年春期患流感人数与年龄负相关很强.2.为推进中小学体育评价体系改革,某调研员从一中学4000名学生中按照男女学生比例采用分层抽样的方法,从中随机抽取了400名学生进行某项体育测试(满分100分),记录他们的成绩,将记录的数据分成7组:(]30,40,(]40,50,(]50,60,(]60,70,(]70,80,(]80,90,(]90,100,并整理得到如图频率分布直方图.(1)根据该频率分布直方图,估计样本数据的中位数及4000名学生的平均成绩(同一组中的数据用该组区间的中点值作代表)(精确到0.01);(2)已知样本中有三分之二的男生分数高于60分,且分数高于60分的男女人数相等,试估计该校男生和女生人数的比例;(3)若测试成绩2x x s <-(其中x 是成绩的平均值,s 是标准差),则认为该生测试成绩不达标,试估计该中学测试成绩不达标人数. 参考公式:()221ni i i s x x p ==-∑(i p 是第i 组的频率)2 1.4≈11710.8≈.2.【解析】(1)前4组的频率和为0.050.10.10.20.45+++=,故中位数为0.055707071.670.033+=+≈ 4000名学生的平均成绩为:0.05350.1450.1550.2650.3750.2850.059569⨯+⨯+⨯+⨯+⨯+⨯+⨯=;(2)由频率分布直方图得样本中高于60分的人数占总人数的0.75, 又因为分数高于60分的男女人数相等,故高于60分的男生、女生人数均为4000.750.5150⨯⨯=人, 又因为样本中有三分之二的男生分数高于60分, 所以样本中共有男生的21502253÷=人,女生175人, 又因为样本是按照男女学生比例采用分层抽样的方法得到, 故该校男生和女生人数的比例为225:1759:7=; (3)()()()2222135690.0545690.1ni i i s x x p ==-=-⨯+-⨯∑()255690.1+-⨯()()2265690.275690.3+-⨯+-⨯()()2285690.295690.05234+-⨯+-⨯=所以234211715.12s ==⨯≈,26915.12238.76x s -=-⨯=故测试成绩2x x s <-占比为0.050.8760.0438⨯=, 该中学测试成绩不达标人数约为0.0438*******⨯≈.3.为了解某中学学生对《中华人民共和国交通安全法》的了解情况,调查部门在该校进行了一次问卷调查(共12道题),从该校学生中随机抽取40人,统计了每人答对的题数,将统计结果分成[)0,2,[)2,4,[)4,6,[)6,8,[)8,10,[]10,12六组,得到如下频率分布直方图.(1)若答对一题得10分,未答对不得分,估计这40人的成绩的平均分(同一组中的数据用该组区间的中点值作代表);(2)若从答对题数在[)2,6内的学生中随机抽取2人,求恰有1人答对题数在[)2,4内的概率. 3.【解析】(1)因为答对题数的平均数约为()10.02530.02550.037570.12590.1875110.1⨯+⨯+⨯+⨯+⨯+⨯27.9⨯=.所以这40人的成绩的平均分约为7.91079⨯=.(2)答对题数在[)2,4内的学生有0.0252402⨯⨯=人,记为A ,B ;答对题数在[)4,6内的学生有0.03752403⨯⨯=人,记为c ,d ,e .从答对题数在[)2,6内的学生中随机抽取2人的情况有(),A B ,(),A c ,(),A d ,(),A e ,(),B c ,(),B d ,(),B e ,(),c d ,(),c e ,(),d e ,共10种,恰有1人答对题数在[)2,4内的情况有(),A c ,(),A d ,(),A e ,(),B c ,(),B d ,(),B e ,共6种, 故所求概率63105P ==. 4.某商店销售某海鲜,统计了春节前后50天海鲜的需求量x ,(1020x ≤≤,单位:公斤),其频率分布直方图如图所示,该海鲜每天进货1次,商店每销售1公斤可获利50元;若供大于求,剩余的削价处理,每处理1公斤亏损10元;若供不应求,可从其它商店调拨,销售1公斤可获利30元.假设商店每天该海鲜的进货量为14公斤,商店的日利润为y 元.(1)求商店日利润y 关于需求量x 的函数表达式; (2)假设同组中的每个数据用该组区间的中点值代替. ①求这50天商店销售该海鲜日利润的平均数;②估计日利润在区间[]580760,内的概率. 4.【解析】(1)商店的日利润y 关于需求量x 的函数表达式为:()()50143014,1420501014,1014x x y x x x ⎧⨯+⨯-≤≤⎪=⎨-⨯-≤<⎪⎩化简得:30280,142060140,1014x x y x x +≤≤⎧=⎨-≤<⎩(2)①由频率分布直方图得:海鲜需求量在区间[)10,12的频率是20.080.16⨯=;海鲜需求量在区间[)12,14的频率是20.120.24⨯=; 海鲜需求量在区间[)14,16的频率是20.150.30⨯=; 海鲜需求量在区间[)16,18的频率是20.100.20⨯=; 海鲜需求量在区间[]18,20的频率是20.050.10⨯=; 这5050天商店销售该海鲜日利润y 的平均数为:()()()(116014100.16136014100.24153020140.301730⨯-⨯⨯+⨯-⨯⨯+⨯+⨯⨯+⨯+)()20140.20193020140.1083.2153.621915885698.8⨯⨯+⨯+⨯⨯=++++=(元)②由于14x =时,30142806014140700⨯+=⨯-=显然30280,142060140,1014x x y x x +≤≤⎧=⎨-≤<⎩在区间[]10,20上单调递增, 58060140y x ==-,得12x =; 76030280y x ==+,得16x =;日利润y 在区间[]580,760内的概率即求海鲜需求量x 在区间[]12,16的频率:0.240.300.54+=5. 2011年,国际数学协会正式宣布,将每年的3月14日设为国际数学节,来源是中国古代数学家祖冲之的圆周率,为庆祝该节日,某校举办数学趣味知识竞赛活动,参与竞赛的文科生与理科生人数之比为1:3,且成绩分布在[]40,100,分数在[)80,90,[)90,100分别获二等奖和一等奖.按文理科用分层抽样的方法抽取200人的成绩作为样本,得到成绩的频率分布直方图.(1)填写下面的22⨯列联表,能否有超过95%的把握认为“获奖与学生的文理科有关”? 文科生 理科生 合计 获奖 5 不获奖(2)将上述调查所得的频率视为概率,现从参赛学生中,通过分层抽样的方法从这些获奖人中随机抽取4人,再从这4人中任意选取2人,求2人均获二等奖的概率. 临界值表:参考格式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.5.【解析】(1)补全22⨯列联表如下表.()2220051153545254.167 3.84150150401606K ⨯⨯-⨯==≈>⨯⨯⨯.所以有超过95%的把握认为“获奖与学生的文理科有关”. (2)由已知可得,分数在[)80,90获二等奖的参赛学生中抽取3人, 分数在[]90,100获一等奖的参赛学生中抽取1人. 记二等奖的3人分别为a ,b ,c ,一等奖的1人为A , 事件E 为“从这4人中抽取2人且这2人均是二等奖”.从这4人中随机抽取2人的基本事件为(),a b ,(),a b ,(),a A ,(),b c ,(),b A ,(),c A ,,共6种,其中2人均是二等奖的情况有(),a b ,(),a b ,(),b c 共3种, 由古典概型的概率计算公式得()3162P E ==.故2人均获二等奖的概率为12. 7.为增强学生法治观念,营造“学宪法、知宪法、守宪法”的良好校园氛围,某学校开展了“宪法小卫士”活动,并组织全校学生进行法律知识竞赛.现从全校学生中随机抽取50人,统计他们的竞赛成绩,并得到如表所示的频数分布表.(Ⅰ)求频数分布表中的m 的值,并估计这50名学生竞赛成绩的中位数(精确到0.1);(Ⅱ)将成绩在[]70,100内定义为“合格”,成绩在[)0,70内定义为“不合格”.请将列联表补充完整.试问:是否有95%的把握认为“法律知识的掌握合格情况”与“是否是高一新生”有关?说明你的理由;(Ⅲ)在(Ⅱ)的前提下,在该50人中,按“合格与否”进行分层抽样,随机抽取5人,再从这5人中随机抽取2人,求恰好2人都合格的概率. 附:22()()()()()n ad bc K a b c d a c b d -=++++,n a b c d =+++.7.【解析】(Ⅰ)50(5151512)3m =-+++=.设成绩的中位数为x ,则515151(70)505002x ++-⨯=,解得17373.33x =+≈. (Ⅱ)补全2×2列联表如下所示:22()()()()()n ad bc K a b c d a c b d -=++++250(1261418)26243020⨯⨯-⨯=⨯⨯⨯ 4.327 3.841≈>, 所以有95%的把握认为“法律知识的掌握合格情况”与“是否是高一新生”有关. (Ⅲ)分层抽样的比例为515010=,故抽取的5人中成绩合格的有130310⨯=(人),分别记为a ,b ,c ;成绩不合格的有120210⨯=(人),分别记为m ,n . 从5人中随机抽取2人的基本事件有ab ,ac ,bc ,am ,an ,bm ,bn ,cm ,cn ,mn ,共10种,2人都合格的基本事件有ab ,ac ,bc ,共3种, 所以恰好2人都合格的概率30.310P ==. 9.某种产品的质量以其质量指标值衡量,质量指标值越大表明质量越好,记其质量指标值为M ,当85M ≥时,产品为一级品;当7585M ≤<时,产品为二级品;当7075M ≤<时,产品为三级品.现用两种新配方(分别称为A 配方和B 配方)做实验,各生产了100件这种产品,并测量了每件产品的质量指标值,得到下面试验结果:A 配方的频数分布表B 配方的频数分布表(1)从A 配方生产的产品中按等级分层抽样抽取5件产品,再从这5件产品中任取3件,求恰好取到1件二级品的频率;(2)若这种新产品的利润率y 与质量指标M 满足如下条件:22,85,5,7585,,7075,t M y t M t M ≥⎧⎪=≤<⎨⎪≤<⎩,其中10,7t ⎛⎫∈ ⎪⎝⎭,请分别计算两种配方生产的产品的平均利润率,如果从长期来看,你认为投资哪种配方的产品平均利润率较大?9.【解析】(1)由题知,按分层抽样抽取的5件产品中有2件为二级品,记为a ,b ,有3件为一级品,记为x ,y ,z ,从5件产品中任取3件共有10种取法,枚举如下:(,,)a b x ,(,,)a b y ,(,,)a b z ,(,,)a x y ,(,,)a x z ,(,,)a y z ,(,,)b x y ,(,,)b x z ,(,,)b y z ,(,,)x y z其中恰好取到1件二级品共有6种取法,所以恰好取到1件二级品的概率为63105=. (2)由题知A 配方生产的产品平均利润率22(1030)5(4020)()20.6100t tE A t t +⨯++==+,B 配方生产的产品平均利润率2225(1015)5(3040)() 1.30.7100t t tE B t t ++⨯++⨯==+,所以2()()0.70.10.1(71)E A E B t t t t -=-=-, 因为107t <<,所以()()E A E B <,所以投资B 配方的产品平均利润率较大. 10.某工厂生产了一批零件,从中随机抽取100个作为样本,测出它们的长度(单位:厘米),按数据分成[]10,15,(]15,20,(]20,25,(]25,30,(]30,355组,得到如图所示的频率分布直方图.(1)估计该工厂生产的这批零件长度的平均值(同一组中的每个数据用该组区间的中点值代替); (2)若用分层抽样的方式从第1组和第5组中抽取5个零件,再从这5个零件中随机抽取2个,求抽取的零件中恰有1个是第1组的概率. 10.【解析】(1)由频率分布直方图可得各组频率依次为0.08,0.18,0.4,0.22,0.12, 则这批零件长度的平均值为12.50.0817.50.1822.50.427.50.2232.50.1223.1x =⨯+⨯+⨯+⨯+⨯=.(2)由题意可知第1组和第5组的零件数分别是0.081008⨯=和0.1210012⨯=, 则应从第1组中抽取582812⨯=+个零件,记为A ,B ;应从第5组中抽取3个零件,记为c ,d ,e .从这5个零件中随机抽取2个的情况有AB ,Ac ,Ad ,Ae ,Bc ,Bd ,Be ,cd ,ce ,de ,共10种,其中符合条件的情况有Ac ,Ad ,Ae ,Bc ,Bd ,Be ,共6种. 故所求概率63105P ==. 11.搪瓷是在金属坯体表面涂搪瓷釉而得到的制品.曾经是人们不可或缺的生活必备品,厨房用具中的锅碗瓢盆;喝茶用到的杯子,洗脸用到的脸盆;婚嫁礼品等,它浓缩了上世纪整整一个时代的记忆.某搪瓷设计公司新开发了一种新型复古搪瓷水杯,将其细分成6个等级,等级系数X 依次3,4,5,6,7,8,该公司交给生产水平不同的A 和B 两个厂生产,从B 厂生产的搪瓷水杯中随机抽取30件,相应的等级系数组成一个样本,数据如图所示.(1)依据图表,若从上述等级系数为7和8的搪瓷水杯中抽取2件,求这两件全部来自等级系数为8的搪瓷水杯的概率;(2)若A 厂生产搪瓷水杯的等级系数的平均值为6,在电商平台上A 厂生产的搪瓷水杯的零售价为36元/件,B 厂生产的搪瓷水杯的零售价为30元/件.设L =产品等级系数的平均值产品零售价,若以L 的值越大,产品越具可购买性为判断标准,根据以上数据,哪个工厂的产品更具可购买性?说明理由. 11.【解析】(1)设等级系数为7的搪瓷水杯为A ,B ,C ,等级系数为8的搪瓷水杯为a ,b ,c ,则从中抽取2件的基本事件为(),A B ,(),A C ,(),A a ,(),A b ,(),A c ,(),B C ,(),B a ,(),B b ,(),B c ,(),C a ,(),C b ,(),C c ,(),a b ,(),a c ,(),b c ,共15种,其中两件全部来自等级系数为8的搪瓷水杯的基本事件为(),a b ,(),a c ,(),b c , 共3种,所以概率为31155=. (2)A 厂的产品更具可购买性,理由如下:将频率视为概率,可得B 厂生产的搪瓷水杯的等级系数的平均值为3946566373834.830X ⨯+⨯+⨯+⨯+⨯+⨯==,即B 厂生产的搪瓷水杯的等级系数的平均值等于4.8,因为A 厂生产搪瓷水杯的等级系数的平均值等于6,价格为36元/件, 所以61366A L ==. 因为B 厂生产的搪瓷水杯的等级系数的平均值等于4.8,价格为30元/件, 所以 4.80.1630B L ==. 因为10.166>,故A 厂生产的搪瓷水杯更具可购买性. 12.为了检测某种抗病毒疫苗的免疫效果,研究人员将疫苗注射到200只小白鼠体内,一段时间后测量小白鼠的某项指标值,按[)0,20,[)20,40,[)40,60,[)60,80,[]80,100分组,绘制频率分布直方图如图所示,并经进一步检测,发现小白鼠体内产生抗体的共有160只,其中该项指标值不小于60的小白鼠有110只.(1)求a 值;(2)求200只小白鼠该项指标值的平均数;(3)填写下面的22⨯列联表,并根据列联表判断是否有95%的把握认为注射疫苗后小白鼠产生抗体与指标值不小于60有关?参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.12.【解析】(1)由各频率之和为1,可得:0.0025200.0062520200.025200.0075201a ⨯+⨯+⨯+⨯+⨯=,解得0.00875a =.(2)200只小白鼠某项指标值的平均数0.002520100.0062520300.0087520x =⨯⨯+⨯⨯+⨯500.02520700.0075209061.5⨯+⨯⨯+⨯⨯=.(3)由频率分布直方图,200只小白鼠某项指标值的数据分布为:在[)0,20内有0.00252020010⨯⨯=个;[)20,40内有0.006252020025⨯⨯=个;[)40,60内有0.008752020035⨯⨯=个;[)60,80内有0.025********⨯⨯=个; []80,100内有0.00752020030⨯⨯=个;由已知,小白鼠体内产生抗体的共有160只,其中指标值不小于60的有110只,故有抗体且指标值小于60的有50只;而指标值小于60的小白鼠共有10253570=++只,所以指标值小于60没有抗体的小白鼠有20,同理,指标值不小于60没有抗体的小白鼠有20只,故列联表如下:由()2220010002200 4.945 3.8411604070130K ⨯-=≈>⨯⨯⨯ 所以有95%的把握认为注射疫苗后小白鼠产生抗体与指标值不小于60有关.13.党的十九大提出,要推进绿色发展,倡导简约适度、绿色低碳的生活方式.天然气作为一种清洁高效能源,不仅可以优化能源结构,缓解供需矛盾,而且对于改善环境、提高人民生活质量和实现可持续发展都起到十分重要的作用.某研究小组为了研究燃气灶烧水如何节省燃气的问题设计了一个实验,并获得了燃气开关旋钮旋转的弧度数x 与烧开一壶水所用时间y 的一组数据,且作了一定的数据处理(如下表),得到了散点图(如图).xyω()2101ii x x =-∑()2101ii ωω=-∑()()101iii x x yy =--∑()()101iii y y ωω=--∑1.4720.6 0.782.35 0.8119.3-16.2表中21i i x ω=,101110i i ωω==∑.(1)根据散点图判断,y a bx =+与2dy c x=+哪一个更适宜作烧水时间y 关于开关旋钮旋转的弧度数x 的回归方程类型?(不必说明理由)并求出y 关于x 的回归方程;(2)若旋转的弧度数x 与单位时间内煤气输出量t 成正比,那么x 为多少时,烧开一壶水最省煤气? 附:对于一组数据()11,u v ,()22,u v ,()33,u v ,…,(),n n u v ,其回归直线v u αβ=+的斜率和截距的最小二乘估计分别为()()()121niii nii v v u u u u β==--=-∑∑,v u αβ=-.13.【解析】(1)2dy c x =+更适宜. 令21xω=,则y c d ω=+. 由公式可得:()()()101102116.2200.81iii ii y y d ωωωω==--===-∑∑, 20.3200.785c y d ω=-=-⨯=,所以所求回归方程为2205y x =+. (2)设t kx =,则煤气用量2202020552520k kS yt kx kx kx k x x x⎛⎫==+=+≥⋅= ⎪⎝⎭, 当且仅当205kkx x=时取“=”,即2x =时,煤气用量最小. 14.加班,系指除法定或者国家规定的工作时间外,即正常工作日延长工作时间或者双休日以及国家法定假期期间延长工作时间.有的工作人员在正常工作日不能积极主动工作,致使有的工作任务要到正常工作日延长工作时间完成,这不能称为“加班”,只有建立合理的考核方案,才能调动广大工作人员的积极性.某劳动组织对“工作时间”的评价标准如下表: 每天的工作时间(单位:小时) [)6,8 [)8,10 [)10,12 []12,14评价级别良好普通加班 严重加班超重加班2019年5月1日,该劳动组织从某单位某个月中随机抽取10天“工作时间”的统计数据绘制出的频率分布直方图如下:(1)若严重加班的天数是普通加班天数的2倍,求m ,n 的值;(2)在(1)条件下,若从这10天中评价级别是“良好”或“普通加班”的天数里随机抽取2天,求“这2天的‘工作时间’属于同一评价级别”的概率.14.【解析】(1)依题意1 322151210 m n nnmm⎧⨯+⨯==⎧⎪⎪⎪⇒⎨⎨=⎪⎪=⎩⎪⎩.(2)由(1)可知这10天中评价级别是“良好”有1210210⨯⨯=天,设为,a b;评价级别是“普通加班”有1210210⨯⨯=天,设为,c d.从中抽取2天,所有可能为,,,,,ab ac ad bc bd cd共6种,其中这2天的“工作时间”属于同一评价级别的为,ab cd共2种,所以“这2天的‘工作时间’属于同一评价级别”的概率为21 63 =.15.搪瓷是在金属坯体表面涂搪瓷釉而得到的制品.曾经是人们不可或缺的生活必备品,厨房用具中的锅碗瓢盆;喝茶用到的杯子;洗脸用到的脸盆;婚嫁礼品等,它浓缩了上世纪整整一个时代的记忆.某搪瓷设计公司新开发了一种新型复古搪瓷水杯,将其细分成6个等级,等级系数X依次3,4,5,6,7,8,该公司交给生产水平不同的A和B两个广生产,从B厂生产的搪瓷水杯中随机抽取30件,相应的等级系数组成一个样本,数据如图所示:(1)依据上表,若从上述等级系数为7和8的搪瓷水杯中抽取2件,求这2件全部来自等级系数为8的搪瓷水杯的概率;(2)下图是5位网友对两厂生产的搪瓷水杯对比评分图,根据图表,利用评分均值和标准差比较两种搪瓷水杯的评分情况,并说明理由.15.【解析】(1)设等级系数为7的搪瓷水杯为A ,B ,C ,等级系数为8的搪瓷水杯为a ,b ,c ,则从中抽取2件的基本事件为(),A B ,(),A C ,(),A a ,(),A b ,(),A c ,(),B C ,(),B a ,(),B b ,(),B c ,(),C a ,(),C b ,(),C c ,(),a b ,(),a c ,(),b c ,共15种,其中2件全部来自等级系数为8的搪瓷水杯的基本事件为(),a b ,(),a c ,(),b c ,共3种, 所以31155P ==. (2)因为()467895 6.8B x =++++÷=,所以B 厂生产的搪瓷水杯的评分平均分为6.8,标准差为()()()()()2222214 6.86 6.87 6.88 6.89 6.8 1.725S ⎡⎤=-+-+-+-+-=⎣⎦, 所以B 厂生产的搪瓷水杯的评分标准差为1.72,因为()56 6.5785 6.5A x =++++÷=,所以A 厂生产的搪瓷水杯的评分平均分为6.5,()()()()()2222215 6.56 6.5 6.5 6.57 6.58 6.515S ⎡⎤=-+-+-+-+-=⎣⎦ 所以A 厂生产的搪瓷水杯的评分标准差为1,综上,B 厂生产的糖瓷水杯的评分的均值较高;A 厂生产的搪瓷水杯的评分的标准差较小,比较稳定.16.新型冠状病毒疫情发生后,口罩的需求量大增,某口罩工厂为提高生产效率,开展技术创新活动,提出两种新的生产方式.为比较两种生产方式的效率,选取80名工人,将他们随机分成两组,每组40人,第一组工人用第一种生产方式,第二组工人用第二种生产方式. 第一种生产方式40名工人完成同一生产任务所用时间(单位:min )如表68 72 85 77 83 82 90 83 89 84 88 87 76 91 79 90 87 91 86 92 88 87 81 76 95 94 63 87 85 71 96637485929987827569第二种生产方式40名工人完成同一生产任务所用时间(单位:min )如饼图所示:(1)填写第一种生产方式完成任务所用时间的频数分布表并作出频率分布直方图; 生产时间 [)60,70[)70,80[)80,90[)90,100频数(2)试从饼图中估计第二种生产方式的平均数;(3)根据频率分布图和饼图判断哪种生产方式的效率更高?并说明理由.16.【解析】(1)根据第一种生产方式40名工人完成同一生产任务所用时间的表格数据,可得:生产时间 [)60,70[)70,80[)80,90[)90,100频数481810则所用时间的频数分布表并作出频率分布直方图:(2)根据平均数的计算公式,试从饼图中估计第二种生产方式的平均数为:⨯+⨯+⨯+⨯=650.25750.5850.2950.0575.5min(3)从频率分布直方图中估计第一种生产方式的平均数为:⨯+⨯+⨯+⨯=650.1750.2850.45950.2583.5min从平均数的角度发现:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟.因此第二种生产方式的效率更高.18.某校为缓解高三学生的高考压力,经常举行一些心理素质综合能力训练活动,经过一段时间的训练后从该年级800名学生中随机抽取100名学生进行测试,并将其成绩分为A、B、C、D、E五个等级,统计数据如图所示(视频率为概率),根据图中抽样调查数据,回答下列问题:(1)试估算该校高三年级学生获得成绩为B的人数;(2)若等级A、B、C、D、E分别对应100分、90分、80分、70分、60分,学校要求当学生获得的等级成绩的平均分大于90分时,高三学生的考前心理稳定,整体过关,请问该校高三年级目前学生的考前心理稳定情况是否整体过关?(3)以每个学生的心理都培养成为健康状态为目标,学校决定对成绩等级为E的16名学生(其中男生4人,女生12人)进行特殊的一对一帮扶培训,从按分层抽样抽取的4人中任意抽取2名,求恰好抽到1名男生的概率.18.【解析】(1)从条形图中可知这100人中,有56名学生成绩等级为B,故可以估计该校学生获得成绩等级为B 的概率为561410025=, 则该校高三年级学生获得成绩等级为B 的人数约有1480044825⨯=. (2)这100名学生成绩的平均分为()1321005690780370260100⨯+⨯+⨯+⨯+⨯ 91.3=(分), 因为91.390>,所以该校高三年级目前学生的“考前心理稳定整体”已过关.(3)按分层抽样抽取的4人中有1名男生,3名女生,记男生为a ,3名女生分别为1b ,2b ,3b .从中抽取2人的所有情况为1ab ,2ab ,3ab ,12b b ,13b b ,23b b ,共6种情况,其中恰好抽到1名男生的有1ab ,2ab ,3ab ,共3种情况,故所求概率12P =. 19.2019年6月25日,《固体废物污染环境防治法(修订草案)》初次提请全国人大常委会审议,草案对“生活垃圾污染环境的防治”进行了专项规定.某小区采取一系列措施,宣传垃圾分类的知识与意义,并采购分类垃圾箱.为了了解垃圾分类的效果,该小区物业随机抽取了200位居民进行问卷调查,每位居民对小区采取的措施给出“满意”或“不满意”的评价.根据调查结果统计并做出年龄分布条形图和持不满意态度的居民的结构比例图,如图,在这200份问卷中,持满意态度的频率是0.65.(1)完成下面的22⨯列联表,并判断能否有95﹪的把握认为“51岁及以上”和“50岁及以下”的居民对该小区采取的措施的评价有差异满意 不满意 总计 51岁及以上的居民 50岁及以下的居民 总计200(2)按“51岁及以上”和“50岁及以下”的年龄段采取分层抽样的方法从中随机抽取5份,再从这5份调查问卷中随机抽取2份进行电话家访,求电话家访的两位居民恰好一位年龄在51岁及以上,另一位年龄在50岁及以下的概率.20()P K k ≥0.050 0.025 0.010 0.005 0.001附表及参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.19.【解析】(1)在这200份问卷中,持满意态度的频数为2000.65130⨯=,持不满意态度和频数为20013070-=,∴22⨯列联表如下:∴222()200(45358535) 4.487 3.841()()()()8012013070n ad bc K a b c d a c b d -⨯⨯-⨯==≈>++++⨯⨯⨯. 故有95﹪的把握认为“51岁及以上”和“50岁及以下”的居民对该小区采取的措施的评价有差异. (2)利用分层抽样的特点可知:“51岁以上”居民抽到2份记为:12,a a ; “50岁以下”居民抽到3份记为:123,,b b b .∴基本事件共有:121112132122(,),(,),(,),(,),(,),(,),a a a b a b a b a b a b 2312(,),(,),a b b b1323(,),(,)b b b b ,共有10个. 满足条件的事件有:11121321(,),(,),(,),(,)a b a b a b a b 2223(,),(,)a b a b ,共有6个.∴求得电话家访的两位居民恰好一位年龄在“51岁以上”,另一位年龄在“50岁以下” 的概率为:63()105P A ==. 20.为贯彻落实党中央全面建设小康社会的战略部署,某贫困地区的广大党员干部深入农村积极开展“精准扶贫”工作.经过多年的精心帮扶,截至2018年底,按照农村家庭人均年纯收入8000元的小康标准,该地区仅剩部分家庭尚未实现小康,2019年6月,为估计该地能否在2020年全面实现小康,统计了该地当时最贫困的一个家庭2019年1至6月的人均月纯收入,作出散点如下:根据盯关性分析,发现其家庭人均月纯收入y 与时间代码x 之间具有较强的线性相关关系(记2019年1月、2月……分别为1x =,2x =,…,依此类推),由此估计该家庭2020年能实现小康生活.但2020年1月突如其来的新冠肺炎疫情影响了奔小康的进展,该家庭2020年第一季度每月的人均月纯收入只有2019年12月的预估值的23. (1)求y 关于x 的线性回归方程;(2)求该家庭2020年3月份的人均月纯收入;(3)如果以该家庭3月份人均月纯收入为基数,以后每月增长率为8%,问该家庭2020年底能否实现小康生活? 参考数据:619310i ii x y==∑,68610x y =,101.08 2.16≈参考公式:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-.20.【解析】(1)依题意得:123456 3.56x +++++==,686104106 3.56x y y x⋅===⨯,62191ii x==∑,619310i i i x y ==∑,所以616222169310861040916 3.56i ii i i x y x yb x x==--===-⨯-∑∑, 41040 3.5270a y bx =-=-⨯=,所以y 关于x 的线性回归方程为40270y x =+.(2)令12x =,得2019年12月该家庭人均月纯收入预估值为4012270750⨯+=元故,2020年3月份该家庭的人均月纯收入为27505003⨯=元. (3)每月的增长率为8%,设从3月开始到12月的纯收入之和为10S , 则()()91050050010.08...50010.08S =+⨯+++⨯+,()105001 1.0872501 1.08⎡⎤⨯-⎣⎦==-,1210100082508000S S =+=>,故到2020年底能如期实现小康.21.某城市100户居民的月平均用电量(单位:度),以[)160,180,[)180,200,[)200,220,[)220,240,[)240,260,[)260,280,[]280,300分组的频率分布直方图如图.(1)求直方图中的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[)220,240,[)240,260,[)260,280,[]280,300的四组用户中,用分层抽样的方法抽取户居民,则月平均用电量在[)220,240的用户中应抽取多少户?21.【解析】 (1)由直方图的性质可得(0.002+0.0095+0.011+0.0125+x +0.005+0.0025)×20=1得:x =0.0075,所以直方图中x 的值是0.0075. ------------- 3分 (2)月平均用电量的众数是2202402+=230. ------------- 5分 因为(0.002+0.0095+0.011)×20=0.45<0.5,所以月平均用电量的中位数在[220,240)内, 设中位数为a ,由(0.002+0.0095+0.011)×20+0.0125×(a-220)=0.5得:a =224,所以月平均用电量的中位数是224. ------------ 8分 (3)月平均用电量为[220,240)的用户有0.0125×20×100=25户,月平均用电量为[240,260)的用户有0.0075×20×100=15户, 月平均用电量为[260,280)的用户有0. 005×20×100=10户,月平均用电量为[280,300]的用户有0.0025×20×100=5户, -------------10分 抽取比例=112515105+++=15,所以月平均用电量在[220,240)的用户中应抽取25×15=5户.-- 12分22.为响应党中央“扶贫攻坚”的号召,某单位指导一贫困村通过种植紫甘薯来提高经济收入.紫甘薯对环境温度要求较高,根据以往的经验,随着温度的升高,其死亡株数成增长的趋势.下表给出了2017年种植的一批试验紫甘薯在温度升高时6组死亡的株数: 温度x (单位:C ) 21 23 24 27 29 32 死亡数y (单位:株) 61120275777经计算:611266i i x x ===∑,611336i i y y ===∑,61()()557i i i x x y y =--=∑,621()84i i x x =-=∑,621()3930ii y y =-=∑,621()23.6ˆ64i i y y=-=∑,8.0653167e ≈,其中i x ,i y 分别为试验数据中的温度和死亡株数,1,2,3,4,5,6i =.(1)若用线性回归模型,求y 关于x 的回归方程^^^y b x a =+(结果精确到0.1);(2)若用非线性回归模型求得y 关于x 的回归方程0.23030.06ˆxye =,且相关指数为20.9522R =.(i)试与(1)中的回归模型相比,用2R 说明哪种模型的拟合效果更好;(ii )用拟合效果好的模型预测温度为35C 时该紫甘薯死亡株数(结果取整数). 附:对于一组数据11(,)u v ,22(,)u v ,,(,)n n u v ,其回归直线ˆˆv u αβ∧=+的斜率和截距的最小二乘估计分别为:121()()()niii ni i u u v v u u β∧==--=-∑∑,a v u β∧∧=-;相关指数为:22121()1()niii niii v v R v v ∧==-=--∑∑.22.【解析】(1)利用回归方程的公式,求得线性回归方程为:ˆy =6.6x −139.4;(2)(i )()()6221621236.641110.06020.93983930ˆi i i i ii y y R y y ==-=-=-≈-=-∑∑,因为0.9398<0.9522,所以回归方程0.2303ˆ0.06x y e =比线性回归方程ˆy =6.6x −138.6拟合效果更好;(ii )当温度35x C =时,。
高考数学专项复习:概率统计综合检测题(文科)
概率统计综合检测题(文科)一、选择题(共12小题,每小题5分,满分60分)1.(5分)某校要从高一、高二、高三共2010名学生中选取50名组成访问团,若采用下面的方法选取:先按简单随机抽样的方法从2010人中剔除10人,剩下的2000人再用分层抽样方法进行,则每个人入选的概率()A.不全相等 B.均不相等C.都相等且为D.都相等且为2.(5分)某学校2009年五四青年节举办十佳歌手赛,如图是七位评委为某选手打出的分数的茎叶图,去掉一个最高分和一个最低分后,所剩数据的平均数与方差分别为()A.83,1.6 B.84,0.4 C.85,1.6 D.86,1.53.(5分)一个单位有职工120人,其中业务人员60人,管理人员40人,后勤人员20人,为了解职工健康情况,要从中抽取一个容量为24的样本,如用分层抽样,则管理人员应抽到的人数为()A.4 B.12 C.5 D.84.(5分)某地2009年2月到6月各(x)月的平均气温y(℃)如表:根据表中数据,用最小二乘法求得平均气温y关于月份x的线性回归方程是()A.=5x﹣11.5 B.=6.5x﹣11.5 C.=1.2x﹣11.5 D.5.(5分)如图,已知正方形的边长为10,向正方形内随机地撒200颗黄豆,数得落在阴影外的黄豆数为114颗,以此实验数据为依据,可以估计出阴影部分的面积约为()A.53 B.43 C.47 D.576.(5分)足球比赛的计分规则是:胜一场得3分,平一场得1分,负一场得0分,那么一个队打14场共得19分的情况有()A.3种B.4种C.5种D.6种7.(5分)将一颗骰子投掷两次,第一次出现的点数记为a,第二次出现的点数记为b,设两条直线l1:ax+by=2,l2:x+2y=2平行的概率为P1,相交的概率为P2,则复数P1+P2i所对应的点P与直线l2:x+2y=2的位置关系()A.P在直线l2的右下方B.P在直线l2的右上方C.P在直线l2上D.P在直线l2的左下方8.(5分)下列命题中,正确命题的个数为()①命题“若,则x=2且y=﹣1”的逆命题是真命题;②P:个位数字为零的整数能被5整除,则¬P:个位数字不是零的整数不能被5整除;③茎叶图中,去掉一个最大的数和一个最小的数后,所剩数据的方差与原来不相同.A.0 B.1 C.2 D.39.(5分)连续掷两次骰子,以先后得到的点数m,n为点P(m,n)的坐标,那么点P在圆x2+y2=17内部的概率是()A.B.C.D.10.(5分)将长度为1米的铁丝随机剪成三段,则这三段能拼成三角形(三段的端点相接)的概率等于()A.B.C.D.11.(5分)为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的学生数为b,则a,b 的值分别为()A.0.27,78 B.0.27,83 C.2.7,78 D.2.7,8312.(5分)已知Ω={(x,y)|},直线y=mx+2m和曲线y=有两个不同的交点,它们围成的平面区域为M,向区域Ω上随机投一点A,点A落在区域M内的概率为P(M),若P(M)∈[,1],则实数m的取值范围()A.[,1]B.[0,] C.[,1] D.[0,1]二、填空题(共4小题,每小题4分,满分16分)13.(4分)200辆汽车经过某一雷达地区,时速频率分布直方图如图所示,则时速不低于60km/h的汽车数量为辆.14.(4分)从集合{(x,y)|x2+y2≤4,x∈R,y∈R}内任选一个元素(x,y),则x,y满足x+y≥2的概率为.15.(4分)用黑白两种颜色的正方形地砖依照图中的规律拼成若干图形,则按此规律第100个图形中有白色地砖块;现将一粒豆子随机撒在第100个图中,则豆子落在白色地砖上的概率是.16.(4分)给出下列命题:①命题“∃x∈R,使得x2+x+1<0”的非命题是“对∀x∈R,都有x2+x+1>0”;②独立性检验显示“患慢性气管炎和吸烟有关”,这就是“有吸烟习惯的人,必定会患慢性气管炎”;③某校有高一学生300人,高二学生270人,高三学生210人,现教育局欲用分层抽样的方法,抽取26名学生进行问卷调查,则高三学生被抽到的概率最小.其中错误的命题序号是(将所有错误命题的序号都填上).三、解答题(共6小题,满分74分)17.(12分)某班50名学生在一次百米测试中,成绩全部都介于13秒到18秒之间,将测试结果按如下方式分成五组,第一组[13,14),第二组[14,15)…第五组[17,18]如图是按上述分组方法得到的频率分布直方图.(1)若成绩大于等于14秒且小于16秒规定为良好,求该班在这次百米测试中成绩为良好的人数.(2)设m,n表示该班两个学生的百米测试成绩,已知m,n∈[13,14)∪[17,18]求事件“|m﹣n|>2”的概率.18.(12分)已知关于x的一元二次函数f(x)=ax2﹣4bx+1.(1)设集合P={1,2,3}和Q={﹣1,1,2,3,4},分别从集合P和Q中随机取一个数作为a和b,求函数y=f(x)在区间[1,+∞)上是增函数的概率;(2)设点(a,b)是区域内的随机点,求y=f(x)在区间[1,+∞)上是增函数的概率.19.(12分)某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种程,再对被选取的2组数据进行检验.(1)求选取的2组数据恰好是不相邻2天数据的概率;(2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出y关于x的线性回归方程;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?20.(12分)某商场举行购物抽奖促销活动,规定每位顾客从装有编号为0,1,2,3四个相同小球的抽奖箱中,每次取出一球记下编号后放回,连续取两次,若取出的两个小球号码相加之和等于6则中一等奖,等于5中二等奖,等于4或3中三等奖.(1)求中三等奖的概率;(2)求中奖的概率.21.(12分)福州某中学高一(10)班男同学有45名,女同学有15名,老师按照性别分层抽样的方法组建了一个由4人组成的课外学习兴趣小组.(Ⅰ)求课外兴趣小组中男、女同学的人数;(Ⅱ)经过一个月的学习、讨论,这个兴趣小组决定从该组内选出2名同学分别做某项试验,求选出的2名同学中恰有1名女同学的概率;(Ⅲ)试验结束后,同学A得到的试验数据为68,70,71,72,74;同学B得到的试验数据为69,70,70,72,74;请问哪位同学的试验更稳定?并说明理由.22.(14分)先后2次抛掷一枚骰子,将得到的点数分别记为a,b.(Ⅰ)设函数f(x)=|x﹣a|,函数g(x)=x﹣b,令F(x)=f(x)﹣g(x),求函数F(x)有且只有一个零点的概率;(Ⅱ)将a,b,5的值分别作为三条线段的长,求这三条线段能围成等腰三角形的概率.概率统计综合检测题(文科)参考答案与试题解析一、选择题(共12小题,每小题5分,满分60分)1.(5分)(2010•沈阳模拟)某校要从高一、高二、高三共2010名学生中选取50名组成访问团,若采用下面的方法选取:先按简单随机抽样的方法从2010人中剔除10人,剩下的2000人再用分层抽样方法进行,则每个人入选的概率()A.不全相等 B.均不相等C.都相等且为D.都相等且为【分析】剔除10人是按照随机抽样进行的,剩下的2000人再用分层抽样方法,也符合随机抽样原理,即每个人入选的概率是样本容量比总体容量【解答】解:剔除10人是按照随机抽样进行的,剩下的2000人再用分层抽样方法,也符合随机抽样原理,即每个人入选的概率是样本容量比总体容量,故为故选C【点评】本题主要考查分层抽样方法.2.(5分)(2012•陆丰市校级模拟)某学校2009年五四青年节举办十佳歌手赛,如图是七位评委为某选手打出的分数的茎叶图,去掉一个最高分和一个最低分后,所剩数据的平均数与方差分别为()A.83,1.6 B.84,0.4 C.85,1.6 D.86,1.5【分析】根据算分的规则,去掉一个最高分和一个最低分有84,84,84,86,87五个数据,把五个数据代入求平均数的公式,得到这组数据的平均数,再代入方差的公式,得到方差.【解答】解:∵由题意知,选手的分数去掉一个最高分和一个最低分有84,84,84,86,87,∴选手的平均分是=85,选手的得分方差是(1+1+1+1+4)=1.6,故选C.【点评】本题考查平均数和方差,对于一组数据通常要求的是这组数据的众数,中位数,平均数,方差,它们分别表示一组数据的特征,这样的问题可以出现在选择题或填空题.3.(5分)(2016春•益阳校级期末)一个单位有职工120人,其中业务人员60人,管理人员40人,后勤人员20人,为了解职工健康情况,要从中抽取一个容量为24的样本,如用分层抽样,则管理人员应抽到的人数为()A.4 B.12 C.5 D.8【分析】根据各个部门存在较大的差异,利用分层抽样方法抽取一个样本,首先根据所给的总人数和样本数,做出每个个体被抽到的概率,利用这个概率乘以管理人员的数目,得到结果.【解答】解:∵一个单位有职工120人,为了解职工健康情况,要从中抽取一个容量为24的样本,∴每个个体被抽到的概率是,∵管理人员40人,∴从管理人员中抽取40×=8故选D.【点评】本题考查分层抽样,这是最典型的一个分层抽样题目,高考卷中曾经考过类似的问题,同学们要认真对待,不能丢分.4.(5分)(2010•锦州二模)某地2009年2月到6月各(x)月的平均气温y(℃)如表:根据表中数据,用最小二乘法求得平均气温y关于月份x的线性回归方程是()A.=5x﹣11.5 B.=6.5x﹣11.5 C.=1.2x﹣11.5 D.【分析】由已知表格中的数据,我们易计算出变量x,y的平均数,及x i,x i y i的累加值,代入回归直线系数公式,即可求出回归直线的系数,进而求出回归直线方程.【解答】解:,所以回归直线方程为故选D.【点评】求回归直线的方程,关键是要求出回归直线方程的系数,由已知的变量x,y的值,我们计算出变量x,y的平均数,及x i,x i y i的累加值,代入回归直线系数公式,即可求出回归直线的系数,进而求出回归直线方程.5.(5分)(2010•辽宁模拟)如图,已知正方形的边长为10,向正方形内随机地撒200颗黄豆,数得落在阴影外的黄豆数为114颗,以此实验数据为依据,可以估计出阴影部分的面积约为()A.53 B.43 C.47 D.57【分析】本题利用几何概型求解.由于是向正方形内随机地撒200颗黄豆,其落在阴影外的概率是阴影外的面积与整个正方形的面积之比,从而可列式求得阴影部分的面积.【解答】解:设阴影外部分的面积为s,则由几何概型的概率公式得:,解得s=57,可以估计出阴影部分的面积约为100﹣57=43.故选B.【点评】本题主要考查了几何概型,以及利用几何意义求面积,属于基础题.简单地说,如果每个事件发生的概率只与构成该事件区域的长度(面积或体积)成比例,则称这样的概率模型为几何概率模型,简称为几何概型.6.(5分)足球比赛的计分规则是:胜一场得3分,平一场得1分,负一场得0分,那么一个队打14场共得19分的情况有()A.3种B.4种C.5种D.6种【分析】本题是一个分类计数问题,需要分别列举出胜平负的所有情况,从胜一场开始,当胜一场时得到3分,平16场才能凑足19分,这样需要打17场,故不合题意,当胜2场时同样可以分析不合题意,再分析胜3,4,5,6场的情况,兼顾所打的场数和所得到分数.【解答】解:由题意知本题是一个分类计数问题,当胜一场时得到3分,平16场才能凑足19分故不合题意,当胜2场时得到6分,平13场,共需15场比赛,不合题意,胜3场时得到9分,平10场,输一场,符合题意.胜4场时得到12分,平7场,输3场,符合题意胜5场时得到15分,平4场,输5场,符合题意胜6场时得到18分,平1场,输6场,符合题意综上所述共有4种结果满足题意,故选B.【点评】本题考查分类计数问题,这是经常出现的一个问题,解题时一定要分清做这件事需要分为几类,每一类包含几种方法,把几个步骤中数字相加得到结果7.(5分)(2010•广东校级模拟)将一颗骰子投掷两次,第一次出现的点数记为a,第二次出现的点数记为b,设两条直线l1:ax+by=2,l2:x+2y=2平行的概率为P1,相交的概率为P2,则复数P1+P2i所对应的点P与直线l2:x+2y=2的位置关系()A.P在直线l2的右下方B.P在直线l2的右上方C.P在直线l2上D.P在直线l2的左下方【分析】据两直线相交斜率不等,求出a,b满足的条件,据古典概型概率公式求出P1,P2,据复数的集合意义求出点P坐标,判断出与直线的关系.【解答】解:易知当且仅当时两条直线只有一个交点,而的情况有三种:a=1,b=2(此时两直线重合);a=2,b=4(此时两直线平行);a=3,b=6(此时两直线平行).而投掷两次的所有情况有6×6=36种,所以两条直线相交的概率;两条直线平行的概率为P1=,P1+P2i所对应的点为P,易判断P在l2:x+2y=2的左下方,故选项为D.【点评】本题融合了直线、线性规划、概率及复数等有关知识,在处理方法上可采用枚举法处理,注意不等忽视了直线重合这种情况,否则会选C.8.(5分)(2010•辽宁模拟)下列命题中,正确命题的个数为()①命题“若,则x=2且y=﹣1”的逆命题是真命题;②P:个位数字为零的整数能被5整除,则¬P:个位数字不是零的整数不能被5整除;③茎叶图中,去掉一个最大的数和一个最小的数后,所剩数据的方差与原来不相同.A.0 B.1 C.2 D.3【分析】写出第一个命题的逆命题x=2且y=﹣1可以推出成立,对个位数字为零的整数能被5整除的否定个位数字为零的整数不能被5整除,去掉一个最大的数和一个最小的数后,所剩数据的方差与原来不相同,得到结果.【解答】解:∵x=2且y=﹣1可以推出,故①正确,∵P:个位数字为零的整数能被5整除,它的¬P:个位数字为零的整数不能被5整除;故②不正确,∵去掉一个最大的数和一个最小的数后,所剩数据的方差与原来不相同故③正确,总上可知有2个命题是正确的,故选C.【点评】本题考查极差、方差与标准差,考查四种命题之间的关系,考查命题的否定,命题的否定与否命题要区别开,这是一个易错题.9.(5分)(2010•上虞市模拟)连续掷两次骰子,以先后得到的点数m,n为点P(m,n)的坐标,那么点P在圆x2+y2=17内部的概率是()A.B.C.D.【分析】连续掷两次骰子,以先后得到的点数结果有36种,构成的点的坐标有36个,把这些点列举出来,检验是否满足x2+y2<17,满足这个条件的点就在圆的内部,数出个数,根据古典概型个数得到结果.【解答】解:这是一个古典概型由分步计数原理知:连续掷两次骰子,构成的点的坐标有6×6=36个,而满足x2+y2<17的有(1,1),(1,2),(1,3),(2,1),(2,2),(2,3),(3,1),(3,2)共有8个,∴P==,故选C.【点评】将数形结合的思想渗透到具体问题中来,用列举法列举基本事件的个数,不仅能让学生直观的感受到对象的总数,而且还能使学生在列举的时候作到不重不漏.比如,列举点的坐标时,我们把横标从小变大挨个列举.10.(5分)(2009•泰安一模)将长度为1米的铁丝随机剪成三段,则这三段能拼成三角形(三段的端点相接)的概率等于()A.B.C.D.【分析】将长度为1米的铁丝随机剪成三段的长度分别为x,y,z,x+y+z=1则求解面积,然后求构成试验的全部区域为所表示的区域的面积,代入几何概率的计算公式可求.【解答】解:设将长度为1米的铁丝随机剪成三段的长度分别为x,y,z,x+y+z=1则构成试验的全部区域为⇒所表示的区域为边长为1的直角三角形,其面积为记“这三段能拼成三角形”为事件A,则构成A的区域⇒为边长为的直角三角形,面积为代入几何概率公式可得P(A)=故选B【点评】本题考查了与面积有关的几何概率的求解,难点是要把题中所提供的条件转化为数学问题,进而求出面积,突破难点的关键是构造与构成三角形的条件,根据线性规划的知识求解面积.11.(5分)(2005•江西)为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的学生数为b,则a,b的值分别为()A.0.27,78 B.0.27,83 C.2.7,78 D.2.7,83【分析】先根据直方图求出前2组的频数,根据前4组成等比数列求出第3和第4组的人数,从而求出后6组的人数,根据直方图可知4.6~4.7间的频数最大,即可求出频率a,根据等差数列的性质可求出公差d,从而求出在4.6到5.0之间的学生数为b.【解答】解:由频率分布直方图知组矩为0.1,4.3~4.4间的频数为100×0.1×0.1=1.4.4~4.5间的频数为100×0.1×0.3=3.又前4组的频数成等比数列,∴公比为3.根据后6组频数成等差数列,且共有100﹣13=87人.从而4.6~4.7间的频数最大,且为1×33=27,∴a=0.27,设公差为d,则6×27+d=87.∴d=﹣5,从而b=4×27+(﹣5)=78.故选:A.【点评】本题考查频率分布直方图的相关知识,以及等差数列和等比数列的应用等有关知识,直方图中的各个矩形的面积代表了频率,所以各个矩形面积之和为1,同时考查分析问题的能力,属于基础题.12.(5分)(2013•东莞一模)已知Ω={(x,y)|},直线y=mx+2m和曲线y=有两个不同的交点,它们围成的平面区域为M,向区域Ω上随机投一点A,点A落在区域M内的概率为P(M),若P(M)∈[,1],则实数m的取值范围()A.[,1]B.[0,] C.[,1] D.[0,1]【分析】画出图形,不难发现直线恒过定点(﹣2,0),结合概率范围可知直线与圆的关系,直线以(﹣2,0)点为中心顺时针旋转至与x轴重合,从而确定直线的斜率范围.【解答】解:画出图形,不难发现直线恒过定点(﹣2,0),圆是上半圆,直线过(﹣2,0),(0,2)时,它们围成的平面区域为M,向区域Ω上随机投一点A,点A落在区域M内的概率为P(M),此时P(M)=,当直线与x轴重合时,P(M)=1;直线的斜率范围是[0,1].故选D.【点评】本题考查直线与圆的方程的应用,几何概型,直线系,数形结合的数学思想,是好题,难度较大.二、填空题(共4小题,每小题4分,满分16分)13.(4分)(2014•市中区校级二模)200辆汽车经过某一雷达地区,时速频率分布直方图如图所示,则时速不低于60km/h的汽车数量为76辆.【分析】先根据“频率=×组距”求出时速不低于60km/h的汽车的频率,然后根据“频数=频率×样本容量”进行求解.【解答】解:时速不低于60km/h的汽车的频率为(0.028+0.01)×10=0.38∴时速不低于60km/h的汽车数量为200×0.38=76故答案为:76【点评】本题考查频率分布直方图的相关知识,直方图中的各个矩形的面积代表了频率,频数=频率×样本容量,属于基础题.14.(4分)(2013•南充一模)从集合{(x,y)|x2+y2≤4,x∈R,y∈R}内任选一个元素(x,y),则x,y满足x+y≥2的概率为.【分析】利用几何概型求解本题中的概率是解决本题的关键.需要作出事件所满足的区域,找出全部事件的区域和所求事件区域,利用二者的面积比求出该题的概率.【解答】解:本题事件所包含的区域如图,全部事件区域是整个圆内部分,事件x+y≥2表示的在圆内并且位于直线x+y=2右侧的部分.因此,所求概率为圆在第一象限位于直线x+y=2右侧的弓形部分面积除以整个圆的面积而得.即为:.故答案为:.【点评】本题考查几何概型求概率的办法,考查不等式满足的可行域问题,考查数形结合的思想和几何图形面积的计算问题.15.(4分)(2010•辽宁模拟)用黑白两种颜色的正方形地砖依照图中的规律拼成若干图形,则按此规律第100个图形中有白色地砖503块;现将一粒豆子随机撒在第100个图中,则豆子落在白色地砖上的概率是.【分析】由第一、二、三个图形寻找白色地砖块数的规律性,易发现构成等差数列,由等差数列的通项公式求出第100个图形中有白色地砖的块数,再由几何概型求概率即可.【解答】解:白色地砖构成等差数列:8,13,18,…,5n+3,a n=5n+3,a100=503,第100个图形中有地砖503+100=603,故所求概率.故答案为:503;【点评】本题考查归纳推理和几何概型知识,考查利用所学知识解决问题的能力.16.(4分)给出下列命题:①命题“∃x∈R,使得x2+x+1<0”的非命题是“对∀x∈R,都有x2+x+1>0”;②独立性检验显示“患慢性气管炎和吸烟有关”,这就是“有吸烟习惯的人,必定会患慢性气管炎”;③某校有高一学生300人,高二学生270人,高三学生210人,现教育局欲用分层抽样的方法,抽取26名学生进行问卷调查,则高三学生被抽到的概率最小.其中错误的命题序号是①②③(将所有错误命题的序号都填上).【分析】据特称命题的否定是全称命题:将存在改为任意,结论否定;得到①错误;独立性检验显示的分类变量有关、无关不是确定关系,故两个分类变量有关时,不能推出一个存在另一个一定存在故②错;在抽样方法中,每种抽样方法都遵循每个个体被抽到的概率相等的特点,故③错.【解答】解:①中原命题的非命题是“对∀x∈R,都有x2+x+1≥0”,所以①错误;②中说法不正确,“患慢性气管炎和吸烟有关”只是说明“患慢性气管炎”和“吸烟”有一定的相关关系,但不是确定关系,所以“有吸烟习惯的人,未必患慢性气管炎”;③中,由于抽样比为=,所以高一学生被抽到的人数为×300=10人,高二学生被抽到的人数为×270=9人,高三学生被抽到的人数为×210=7人,尽管高三学生抽到的人数少,但每个学生被抽到的机会均等,所以“高三学生被抽到的概率最小”这种说法错误.故答案为①②③【点评】本题三个命题重点考查简易逻辑用语、统计案例和统计等基本概念.三、解答题(共6小题,满分74分)17.(12分)(2012•宝鸡模拟)某班50名学生在一次百米测试中,成绩全部都介于13秒到18秒之间,将测试结果按如下方式分成五组,第一组[13,14),第二组[14,15)…第五组[17,18]如图是按上述分组方法得到的频率分布直方图.(1)若成绩大于等于14秒且小于16秒规定为良好,求该班在这次百米测试中成绩为良好的人数.(2)设m,n表示该班两个学生的百米测试成绩,已知m,n∈[13,14)∪[17,18]求事件“|m﹣n|>2”的概率.【分析】(Ⅰ)根据直方图矩形的面积表示频率,可知成绩在[14,16)内的人数;(Ⅱ)成绩在[13,14)的人数有2人,设为a,b.成绩在[17,18]的人数有3人,设为A,B,C;基本事件总数为10,事件“|m﹣n|>2”由6个基本事件组成.根据古典概型公式可求出所求.【解答】解:(Ⅰ)根据直方图可知成绩在[14,16)内的人数为:50×0.18+50×0.38=28人;(5分)(Ⅱ)成绩在[13,14)的人数有:50×0.04=2人,设为a,b.成绩在[17,18]的人数有:50×0.06=3人,设为A,B,C.m,n∈[13,14)时有ab一种情况.m,n∈[17,18]时有AB,AC,BC三种情况.m,n分别在[13,14)和[17,18]时有aA,aB,aC,bA,bB,bC六种情况.基本事件总数为10,事件“|m﹣n|>2”由6个基本事件组成.所以P(|m﹣n|>2)=(13分)【点评】本题主要考查了频率分布直方图,以及古典概型的概率问题、用样本的数字特征估计总体的数字特征等有关知识,属于中档题.18.(12分)(2011•广东三模)已知关于x的一元二次函数f(x)=ax2﹣4bx+1.(1)设集合P={1,2,3}和Q={﹣1,1,2,3,4},分别从集合P和Q中随机取一个数作为a和b,求函数y=f(x)在区间[1,+∞)上是增函数的概率;(2)设点(a,b)是区域内的随机点,求y=f(x)在区间[1,+∞)上是增函数的概率.【分析】(1)本题是一个等可能事件的概率,试验发生包含的事件是3×5,满足条件的事件是函数f(x)=ax2﹣4bx+1在区间[1,+∞)上为增函数,根据二次函数的对称轴,写出满足条件的结果,得到概率.(2)本题是一个等可能事件的概率问题,根据第一问做出的函数是增函数,得到试验发生包含的事件对应的区域和满足条件的事件对应的区域,做出面积,得到结果.【解答】解:(1)由题意知本题是一个等可能事件的概率,∵试验发生包含的事件是3×5=15,函数f(x)=ax2﹣4bx+1的图象的对称轴为,要使f(x)=ax2﹣4bx+1在区间[1,+∞)上为增函数,当且仅当a>0且,即2b≤a若a=1则b=﹣1,若a=2则b=﹣1,1;若a=3则b=﹣1,1;∴事件包含基本事件的个数是1+2+2=5∴所求事件的概率为.(2)由(Ⅰ)知当且仅当2b≤a且a>0时,函数f(x)=ax2﹣4bx+1在区是间[1,+∞)上为增函数,依条件可知试验的全部结果所构成的区域为构成所求事件的区域为三角形部分由得交点坐标为,∴所求事件的概率为.【点评】古典概型和几何概型是我们学习的两大概型,古典概型要求能够列举出所有事件和发生事件的个数,而不能列举的就是几何概型,几何概型的概率的值是通过长度、面积、和体积、的比值得到.19.(12分)(2016•河南模拟)某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验程,再对被选取的2组数据进行检验.(1)求选取的2组数据恰好是不相邻2天数据的概率;(2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出y关于x的线性回归方程;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?【分析】(1)根据题意列举出从5组数据中选取2组数据共有10种情况,每种情况都是可能出现的,满足条件的事件包括的基本事件有6种.根据等可能事件的概率做出结果.(2)根据所给的数据,先做出x,y的平均数,即做出本组数据的样本中心点,根据最小二乘法求出线性回归方程的系数,写出线性回归方程.(3)根据估计数据与所选出的检验数据的误差均不超过2颗,就认为得到的线性回归方程是可靠的,根据求得的结果和所给的数据进行比较,得到所求的方程是可靠的.【解答】解:(1)设抽到不相邻的两组数据为事件A,从5组数据中选取2组数据共有10种情况:(1,2)(1,3)(1,4)(1,5)(2,3)(2,4)(2,5)(3,4)(3,5)(4,5),其中数据为12月份的日期数.每种情况都是可能出现的,事件A包括的基本事件有6种.∴P(A)=.。
(完整word版)统计与概率高考题(文科)
统计与概率【小题训练】1.(2018全国卷Ⅰ,T3)某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:则下面结论中不正确的是 A .新农村建设后,种植收入减少B .新农村建设后,其他收入增加了一倍以上C .新农村建设后,养殖收入增加了一倍D .新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半2.(2018全国卷Ⅱ,T5)从2名男同学和3名女同学中任选2人参加社区服务,则选中的2人都是女同学的概率为 A .0.6 B .0.5C .0.4D .0.33.(2018全国卷Ⅲ,T5)某群体中的成员只用现金支付的概率为0.45,既用现金支付也用非现金支付的概率为0.15,则不用现金支付的概率为 A .0.3B .0.4C .0.6D .0.74.(2017新课标Ⅰ,T2)为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg)分别为1x ,2x ,…,n x ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是A .1x ,2x ,…,n x 的平均数B .1x ,2x ,…,n x 的标准差C .1x ,2x ,…,n x 的最大值D .1x ,2x ,…,n x 的中位数5.(2017新课标Ⅰ,T4)如图,正方形ABCD 内的图形来自中国古代的太极图,正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是A.14B.8πC.12D.4π6.(2017新课标Ⅱ,T11)从分别写有1,2,3,4,5的5张卡片中随机抽取1张,放回后再随机抽取1张,则抽得的第一张卡片上的数大于第二张卡片上的数的概率为A.110B.15C.310D.257.(2017新课标Ⅲ,T3)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是A.月接待游客逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳8.(2016全国I卷,T3)为美化环境,从红、黄、白、紫4种颜色的花中任选2种花种在一个花坛中,余下的2种花种在另一个花坛中,则红色和紫色的花不在同一花坛的概率是A.13B.12C.23D.569.(2016全国II卷,T8)某路口人行横道的信号灯为红灯和绿灯交替出现,红灯持续时间为40秒.若一名行人来到该路口遇到红灯,则至少需要等待15秒才出现绿灯的概率为A.710B.58C.38D.31010.(2016年全国III 卷,T4)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A 点表示十月的平均最高气温约为15℃,B 点表示四月的平均最低气温约为5℃.下面叙述不正确的是A .各月的平均最低气温都在0℃以上B .七月的平均温差比一月的平均温差大C .三月和十一月的平均最高气温基本相同D .平均最高气温高于20℃的月份有5个11.(2016全国III 卷,T5)小敏打开计算机时,忘记了开机密码的前两位,只记得第一位是M ,I ,N 中的一个字母,第二位是1,2,3,4,5中的一个数字,则小敏输入一次密码能够成功开机的概率是 A .815 B .18 C .115 D .130 12.(2016年北京,T6)从甲、乙等5名学生中随机选出2人,则甲被选中的概率为A .15 B .25 C .825 D .92513.(2016年北京,T8)某学校运动会的立定跳远和30秒跳绳两个单项比赛分成预赛和决赛两个阶段.下表为10名学生的预赛成绩,其中有三个数据模糊.在这10名学生中,进入立定跳远决赛的有8人,同时进入立定跳远决赛和30秒跳绳决赛的有6人,则A .2号学生进入30秒跳绳决赛B .5号学生进入30秒跳绳决赛C .8号学生进入30秒跳绳决赛D .9号学生进入30秒跳绳决赛 14.(2015新课标1,T4)如果3个正整数可作为一个直角三角形三条边的边长,则称这3个数为一组勾股数,从1,2,3,4,5中任取3个不同的数,则这3个数构成一组勾股数的概率为 A .310 B .15 C .110 D .12015.(2015新课标2,T3)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论不正确的是A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关16.(2015北京,T4)某校老年,中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体情况,在抽取的样本中,青年教师有320人,则该样本的老年教师人数为A.90 B.100 C.180 D.300类别人数老年教师900中年教师1800青年教师1600合计430017.(2018全国卷Ⅲ,T14)某公司有大量客户,且不同龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________.18、为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区户家庭,得到如下统计数据表:收入(万元)支出(万元)根据上表可得回归直线方程,据此估计,该社区一户收入为万元家庭年支出为()A.万元B.万元C.万元D.万元大题题型题型一:回归分析1、社会在对全日制高中的教学水平进行评价时,常常将被清华北大录取的学生人数作为衡量的标准之一.重庆市教委调研了某中学近五年(年-年)高考被清华北大录取的学生人数,制作了如下所示的表格(设年为第一年).年份(第年)人数(人)(1)试求人数关于年份的回归直线方程;(2)在满足(1)的前提之下,估计年该中学被清华北大录取的人数(精确到个位);(3)教委准备在这五年的数据中任意选取两年作进一步研究,求被选取的两年恰好不相邻的概率.参考公式:.题型二统计图1、某服装店对过去天其实体店和网店的销售量(单位:件)进行了统计,制成频率分布直方图如下:(1)若将上述频率视为概率,已知该服装店过去天的销售中,实体店和网店销售量都不低于件的概率为,求过去天的销售中,实体店和网店至少有一边销售量不低于件的天数;(2)若将上述频率视为概率,已知该服装店实体店每天的人工成本为元,门市成本为元,每售出一件利润为元,求该门市一天获利不低于元的概率;(3)根据销售量的频率分布直方图,求该服装店网店销售量中位数的估计值(精确到).2、某工厂有工人名,记岁以上(含岁)的为类工人,不足岁的为类工人,为调查该厂工人的个人文化素质状况,现用分层抽样的方法从两类工人中分别抽取了人、人进行测试.(1)求该工厂两类工人各有多少人?(2)经过测试,得到以下三个数据图表:图一:分以上两类工人成绩的茎叶图(茎、叶分别是十位和个位上的数字)①先填写频率分布表(表一)中的六个空格,然后将频率分布直方图(图二)补充完整;②该厂拟定从参加考试的分以上(含分)的类工人中随机抽取人参加高级技工培训班,求抽到的人分数都在分以上的概率.题型三独立性分析年全国两会,即中华人民共和国第十二届全国人民代表大会第四次会议和中国人民政治协商会议第十二届全国委员会第四次会议,分别于年月日和月日在北京开幕。
高考文科数学概率与统计题型归纳与训练
高考文科数学概率与统计题型归纳与训练高考文科数学概率与统计题型归纳与训练近年来,随着高考评价重点的转变,我国高考数学概率与统计所占的比重越来越大,也极大地影响了学生的试题解答,特别是对文科类学生而言。
因此,归纳与训练概率与统计的题型对提升高考成绩非常有效。
一、高考概率与统计试题类型1、概率题:(1)概率概念题:要求判断某事件的可能性大小、求概率大小、比较概率大小,以及用中文描述概率大小等概念性问题。
(2)条件概率及贝叶斯公式:求两事件同时发生的条件概率,用贝叶斯公式求解概率问题。
(3)随机变量和概率分布:讨论正态分布、泊松分布等随机变量的概率分布。
2、统计学题:(1)数据的勘误析:把调查所得原始数据准确地归类编单,以便找出这些数据中蕴含的结论。
(2)图表分析:分析调查对象之间的关系,从折线图、饼形图、柱形图等图表中获取相应的数据。
二、概率与统计的训练方法1、理论思考训练:多看有关概率、统计的权威论文和教材,把基本概念牢牢掌握,把常见的概率公式及统计公式及推导式脱口而出。
2、示范练习:对常考的知识点补充示范练习,可以通过复现例题和大量习题来熟悉该知识点,从而深入理解,提高解题能力。
3、联系模拟考试:利用模拟考试把学过的知识点和技巧联系起来,在试题中能够驾轻就熟地掌握各试题技巧,大大提升实力。
4、强化记忆:记忆知识点、公式要选择相应的方法,通过反复记忆和熟习,把重点内容融会贯通,熟练记忆几个重点的式子和结论有助于考试的取得好成绩。
总之,学习概率与统计,除了要用心去理解之外,还需要不断的训练,把一些重点的知识点、公式强化记忆,加深理解,才能在考试中取得较好的成绩。
概率统计(文科)
文科数学《统计与概率》核心知识点与参考练习题一、统计(核心思想:用样本估计总体)1.抽样(每个个体被抽到的概率相等)(1)简单随机抽样:抽签法与随机数表法(2)系统抽样(等距抽样)(3)分层抽样2.用样本估计总体:(1)样本数字特征估计总体:众数、中位数、平均数、方差与标准差(2)样本频率分布估计总体:频率分布直方图与茎叶图3.变量间的相关关系:散点图、正相关、负相关、回归直线方程(最小二乘法)4.独立性检验二、概率(随机事件发生的可能性大小)1.基本概念(1)随机事件A的概率P(A)e(0,1)(2)用随机模拟法求概率(用频率来估计概率)(3)互斥事件(对立事件)2.概率模型(1)古典概型(有限等可能)(2)几何概型(无限等可能)三、参考练习题1•某校高一年级有900名学生,其中女生400名•按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为.2•某学校高一、高二、高三年级的学生人数之比是3:3:4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则该从高二年级抽取名学生.3.某校老年、中年和青年教师的人数见右表,米用分层抽样的方法调查教类另U人数师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年老年教师900教师人数为中年教师1800 4.已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是青年教师1600 5•若1,2,3,4,m这五个数的平均数为3,则这五个数的标准差为•合计4300 6•重庆市2013年各月的平均气温(°C)数据的茎叶图如右图:o吕9则这组数据的中位数是•1252003127•某高校调查了200名学生每周的晚自习时间(单位:小时),制成了如图所示的频率分布直方图,其中晚自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.1408.(2016四川文)我国是世界上严重缺水的国豕,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图的频率分布直方图.(II)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(III)估计居民月均用水量的中位数.0Q.511622.533.544.6月满意度评分低于70分 70分到89分不低于90分 满意度等级不满意满意非常满意A 地区用户满意度评分的频率分布直方司为了解用户对其产品的满意度,从A,B 两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A 地区用户满意度评分的频率分布直方图和B 地区用户满意度评分的频数分布表.(II) 根据用户满意度评分,将用户的满意度分为三个等级:试估计哪个地区用户的满意度等级为不满意的概率大?说明理由.10.(2014安徽文)某高校共有学生15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).(I) 应收集多少位女生的样本数据?(II) 根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(&10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率;满意度评分分组 [50,60) [60,70) [70,80) [80,90) [90,100] 频数 2 8 14 10 6B 地区用户满意度评分的频数分布表 (I)作出B 地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分 的平均值及分散程度(不要求计算出具 体值,给出结论即可);B 地区用户满意度评分的频率分布直方图(III)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体 育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间 与性别有关”.n (ad 一bc\附:尺2步畝+d 儿+枫+d )P (2>k)0.10 0.05 0.01 0.005 k2.7063.8416.6357.8799.(2015全国II 文)某公03511.(2014全国I文)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:(I)在下表中作出这些数据的频率分布直方图: 12.(2014广东文)某车间20名工人年龄数据如下表: 年皤7舁工人執7人1912日329330531斗323401昔讦20(I)求这20名工人年龄的众数与极差;(II)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(III)求这20名工人年龄的方差.13.(2016江苏)将一颗质地均匀的骰子(一种各个面上分别标有1,2,3,4,5,6个点的正方体玩具)先后抛掷2次,则出现向上的点数之和小于10的概率是.14.___________________________________________________ 从甲、乙等5名学生中随机选出2人,则甲被选中的概率为(II)估计这种产品质量指标值的平均数和方差(同一组中的数据用该组区间的中点值作代表);15.(2016全国乙卷文)为美化环境,从红、黄、白、紫4种颜色的花中任选2种花种在一个花坛中,余下的2种花种在另一个花坛中,则红色和紫色的花不在同一花坛的概率是.(III)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95 16.(2016全国丙卷文)小敏打开计算机时,忘记了开机密码的前两位,只记得第一位是M、I、N中的一个字母,第二位是1,2,3,4,5中的一个数字,则小敏输入一次密码能够成功开机的概率是.的产品至少要占全部产品80%”的规定?17. (2016天津文)甲、乙两人下棋,两人下成和棋的概率为1,甲获胜的概率是-,则甲不23输的概率为.18. 已知5件产品中有2件次品,其余为合格品•现从这5件产品中任选2件,恰有一件次品 的概率为.24. 如图,在边长为1的正方形中随机撒1000粒豆子,有180粒落到阴影部分,据此估计阴19.某单位N 名员工参加“社区低碳你我他”活动•他们的年龄在25岁至50岁之间.按年龄分组并得到的频率分布直方图如图所示.下表是年龄的频数分布表.区间 [25,30) [30,35) [35,40) [40,45) [45,50] 人数25 ab5丰25. 为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下: 父亲身高x (cm )174 176 176 176 178 儿子身高y (cm )17517517617717722. ____________________________________________ 在区间[-2,3]上随机选取一个数x ,则x <1的概率为23. ___________________________________ 若将一个质点随机投入如图所示的长方形ABCD 中,其中AB=2,BC=1,则质点落在以AB 为直径的半圆内的概率是.(I )求y 关于t 的回归方程y =bt+a ;(II )利用(I )中的回归方程,分析2011年至2015年该地区城乡居民储蓄存款的变化情4550年龄/驴(I )求正整数a ,b ,N 的值;(II )现要从年龄较小的第1,2,3组中用分层抽样的方法抽取6人,则年龄在第1,2,3组的人数分别是多少?(III )在(2)的条件下,从这6人中随机抽取2人参加社区宣传交流活动,求恰有1人在第3组的概率. 20.(2016全国丨文)某公司的班车在7:30,8:00,8:30发车,小明在7:50至8:30之间到达发车站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10分钟的概率是( A.1B.1C.-D.- 21.(2016全国II 文)某路口人行横道的信号灯为红灯和绿灯交替出现,红灯持续时间为40秒•若一名行人来到该路口遇到红灯,则至少需要等待15秒才出现绿灯的概率为()10 B.5D.—10 则y 对X 的线性回归方程为()A .y =x 一1B .y =x +1C .y =88+-x广告费用x (万元)4 2 35 销售额y (万元)4926395426.某产品的广告费用x 与销售额y 的统计数据如下:D .y =176根据上表可得回归方程y =bx+a 中的b 为9.4,据此模型预报广告费用为6万元时销售额为 A .63.6万元B .65.5万元C .67.7万元D .72.0万元27.随着我国经济的发展,居民的储蓄存款逐年增长•设某地区城乡居民人民币储蓄存款(年 底余额)如下表:年份 2011 2012 2013 2014 2015 时间代号t1 2 3 4 5 储蓄存款y (千亿兀)567810年(1=6)的人民币储蓄存款.V--‘’ty-nty _‘附:回归方程$=几+<2中,,a=y-bt.乙/2-nt 2i=l28.甲、乙两所学校高三年级分别有1200人、1000人,为了了解两所学校全体高三年级学生在该地区六校联考的数学成绩情况,采用分层抽样的方法从两所学校一共抽取了110名学生的数学成绩,并作出了频数分布统计表如下:乙校:(1)计算兀y 的值;况,并 预测 该地 区 2016P^Ki>k)0.10 0.05 0.010 k2.7063.8416.635参考数据与(2)若规定考试成绩在[120,150]内为优秀,请分别估计两所学校数学成绩的优秀率; (3)由以上统计数据填写下面2X2列联表,并判断是否有90%的把握认为两所学校的数学成绩有差异.公式:由列联表中数(a+b)(?+d)C+c)a+d),临界值表:29.—次考试中,5名学生的数学、物理成绩如下表所示:学生 A B C D E 数学成绩兀(分) 89 91 93 95 97 物理成绩y (分)8789899293(1)要从5名学生中选2人参加一项活动,求选中的学生中至少有一人的物理成绩高于90 分的概率;(2 )性回归100名市民,按年龄情况进行统计得到下面的频率分布表和频率分布直方图.0.08°1—r---—r方程(系数精确到0.01).''''(1)求频率分布表中a、b的值,并补全频率分布直方图,再根据频率分布直方图估计有意购车的这500名市民的平均年龄;31.(2016新课标II)某险种的基本保费为a(单位:元),继续购买该险种的投保人称为续保人,续保人的本年度的保费与其上年度的出险次数的关联如下:附:回归直线的方程是:y=bx+a上年度出险次数0 1 2 3 4 >5保费0.85a a 1.25a 1.5a 1.75a2a其中b=㈠(j——,a=y-b x;设该险种一续保人一年内出险次数与相应概率如下:ii=130•为调查市民对汽车品牌的认可度,在秋季车展上,从有意购车的500名市民中,随机抽取一年内出险次数0 1 2 3 4 >5 概率0.30 0.15 0.20 0.20 0.10 0.05(I)求一续保人本年度的保费高于基本保费的概率;32.袋中有形状、大小都相同的4只球,其中1只白球,1只红球,2只黄球,从中一次随机摸出2只球,则这2只球颜色不同的概率为.33.现有6道题,其中4道甲类题,2道乙类题,某同学从中任取2道题解答•试求:(1)所取的2道题都是甲类题的概率;(2)所取的2道题不是同一类题的概率.34.某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A地62 73 81 92 95 85 74 64 53 7678 86 95 66 97 78 88 82 76 89B地区:73 83 62 51 91 46 53 73 64 82 93 48 65 81 74 56 54 76 65 79(I)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);A地区B帥反4567S9。
高中数学:概率统计专题
高三文科数学:概率与统计专题一、选择题:1.为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量单位:kg分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数2.有3个兴趣小组,甲、乙两位同学各自参加其中一个小组,每位同学参加各个小组的可能性相同,则这两位同学参加同一个兴趣小组的概率为A.13B.12C.23D.343、在一组样本数据x1,y1,x2,y2,…,x n,y n n≥2,x1,x2,…,x n不全相等的散点图中,若所有样本点x i,y i i=1,2,…,n都在直线y=错误!x+1上,则这组样本数据的样本相关系数为A-1 B0 C错误! D14.如果3个整数可作为一个直角三角形三条边的边长,则称这3个数为一组勾股数,从1,2,3,4,5中任取3个不同的数,则3个数构成一组勾股数的概率为A103 B15C110D1205.如图,正方形ABCD内的图形来自中国古代的太极图.正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,学科&网则此点取自黑色部分的概率是A.14B.π8C.12D.π46.如图所示的茎叶图表示的是甲、乙两人在5次综合测评中的成绩,其中一个数字被污损,则甲的平均成绩超过乙的平均成绩的概率是二、填空题:7、从1,2,3,4,5中任意取出两个不同的数,其和为5的概率是_______;8、将2本不同的数学书和1本语文书在书架上随机排成一行,则2本数学书相邻的概率为_____.9.某单位为了了解用电量y 度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温,制作了对照表: 由表中数据得回归直线方程错误!=错误!x +错误!中的错误!=-2,预测当气温为-4 ℃时,用电量约为________度. 三、解答题10.某花店每天以每枝5元的价格从农场购进若干枝玫瑰花,然后以每枝10元的价格出售;如果当天卖不完,剩下的玫瑰花做垃圾处理;Ⅰ若花店一天购进17枝玫瑰花,求当天的利润y 单位:元关于当天需求量n 单位:枝,n ∈N 的函数解析式;Ⅱ花店记录了100天玫瑰花的日需求量单位:枝,整理得下表: 日需求量n 14 15 16 17 18 19 20 频数102016161513101假设花店在这100天内每天购进17枝玫瑰花,求这100天的日利润单位:元的平均数;气温℃ 18 13 10 -1 用电量度243438642若花店一天购进17枝玫瑰花,以100天记录的各需求量的频率作为各需求量发生的概率,求当天的利润不少于75元的概率;11. 从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:质量指标值75,85 85,95 95,105 105,115 115,125 分组频数 6 26 38 22 8 I在答题卡上作出这些数据的频率分布直方图:II估计这种产品质量指标值的平均数及方差同一组中的数据用该组区间的中点值作代表;III根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定12. 某地区2009年至2015年农村居民家庭人均纯收入y单位:千元的数据如下表:年份2009201020112012201320142015年份代号t1234567人均纯收入y1求y关于t的线性回归方程;2利用1中的回归方程,分析2009年至2015年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2017年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:错误!=错误!,错误!=错误!-错误!错误!.13.某省会城市地铁将于2017年6月开始运营,为此召开了一个价格听证会,拟定价格后又进行了一次调查,随机抽查了50人,他们的收入与态度如下:1若以区间的中点值为该区间内的人均月收入,求参与调查的人员中“赞成定价者”与“认为价格偏高者”的月平均收入的差距是多少结果保留2位小数;2由以上统计数据填下面2×2列联表分析是否有99%的把握认为“月收入以55百元为分界点对地铁定价的态度有差异”.附:K2=错误!14.为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸单位:cm .下面是检验员在一天内依次抽取的16个零件的尺寸:经计算得16119.9716i i x x ===∑,0.212s==≈,18.439≈,161()(8.5) 2.78i i x x i =--=-∑,其中i x 为抽取的第i 个零件的尺寸,1,2,,16i =⋅⋅⋅.1求(,)i x i (1,2,,16)i =⋅⋅⋅的相关系数r ,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小若||0.25r <,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小.2一天内抽检零件中,如果出现了尺寸在(3,3)x s x s -+之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.ⅰ从这一天抽检的结果看,是否需对当天的生产过程进行检查ⅱ在(3,3)x s x s -+之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.精确到附:样本(,)i i x y (1,2,,)i n =⋅⋅⋅的相关系数()()niix x y y r --=∑,0.09≈.。
高考文科统计概率习题(含答案)汇编
160/3120/3100/360/340/380/320/3频率/组距pm2.5(毫克/立方米)0.1050.1000.0950.0900.0850.0800.0750.0700.0650概率统计习题(文)概率统计习题(文) 1.某中学为了了解学生的课外阅读情况,某中学为了了解学生的课外阅读情况,随机调查了随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用图1的条形图表示。
根据条形图可得这50名学生这一天平均每人的课外阅读时间为均每人的课外阅读时间为A.0.67(小时)(小时) B.0.97(小时)(小时) C.1.07(小时)(小时) D.1.57(小时) 2.有3个兴趣小组,甲、乙两位同学各自参加其中一个小组,每位同学参加各个小组的可能性相同,则这两位同学参加同一个兴趣小组的概率为小组的可能性相同,则这两位同学参加同一个兴趣小组的概率为 A .31 B .21 C .32D .43 3.近年来,随着以煤炭为主的能源.近年来,随着以煤炭为主的能源消耗大幅攀升、机动车保有量急消耗大幅攀升、机动车保有量急 剧增加,我国许多大城市灰霾现剧增加,我国许多大城市灰霾现 象频发,造成灰霾天气的“元凶” 之一是空气中的pm2.5(直径小(直径小于等于2.5微米的颗粒物)微米的颗粒物)..右图是某市某月(按30天计)根据对“pm2.5” 24小时平均浓度值测试的结果画成的频率分布直方图,若规定空气中“pm2.5”24小时平均浓度值不超过0.075毫克/立方米为达标,那么该市当月有立方米为达标,那么该市当月有 天“pm2.5”含量不达标.”含量不达标.4.对某校400名学生的体重(单位:kg )进行统计,得到如图所示的频率分布直方图,则学生体重在60kg 以上的人数为( )A . 300B . 100C . 60D . 205.高三某班学生每周用于数学学习的时间x (单位:小时)与数学成绩y (单位:分)之间有如下数据:之间有如下数据:x 24 15 23 19 16 11 20 16 17 13y 92 79 97 89 64 47 83 68 71 59根据统计资料,该班学生每周用于数学学习的时间的中位数是该班学生每周用于数学学习的时间的中位数是▲ ; 根据上表可得回归方程的斜率为3.53,截距为13.5,若某同学每周用于数学学习的时间为18 小时,则可预测该生数学成绩生数学成绩是 ▲ 分(结果保留整数). 6.记集合{}22(,)|16A x y x y =+£和集合{}(,)|40,0,0B x y x y x y =+-£³³表示的平面区域分别为12,W W ,若在区域1W 内任取一点(,)M x y ,则点M 落在区域2W 内的第12题图题图24小时平均浓度小时平均浓度 (毫克/立方米)0.060 0.0560.0400.034 0组距频率体重(kg )45 50 55 60 65 70 0.010(第4题图)概率为概率为( )A .12pB .1pC .14D .24p p- 7.已知回归直线的斜率的估计值为 1.23,样本点的中心为(4,5),则回归直线方程为( )A .ˆ 1.234y x =+B .ˆ 1.235y x =+C .ˆ 1.230.08y x =+D .ˆ0.08 1.23y x =+8.(本小题满分13分)分) 2012年春节前,有超过20万名广西、四川等省籍的外来务工人员选择驾乘摩托车沿321国道长途跋涉返乡过年,为防止摩托车驾驶人因长途疲劳驾驶,手脚僵硬影响驾驶操作而引发交事故,肇庆市公安交警部门在321国道沿线设立了多个长途行驶摩托车驾乘人员休息站,让过往返乡过年的摩托车驾驶人有一个停车休息的场所。
高考数学必做题--统计概率 (后附参考答案与详解)
统计概率-高考必做题12从这次考试成绩看,①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是.②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是.3交强险是车主必须为机动车购买的险种,若普通座以下私家车投保交强险第一年的费用(基准元,在下一年续保时,实行的是费率浮动机制,保费与上一年度车辆发生道路交通事故的情况相联系,发生交通事故的次数越多,费率就越高,具体浮动情况如表:交强险浮动因素和浮动费率比率表浮动因素浮动比率上一个年度未发生有责任道路交通事故下浮上两个年度未发生有责任道路交通事故下浮上三个及以上年度未发生有责任道路交通事故下浮上一个年度发生一次有责任不涉及死亡的道路交通事故上一个年度发生两次及两次以上有责任道路交通事故上浮上一个年度发生有责任道路交通死亡事故上浮某机构为了解某一品牌普通座以下私家车的投保情况,随机抽取了辆车龄已满三年的该品牌同型号私家车的下一年续保时的情况,统计如下表:45 67 89 1011 12 131415 161718 19 20 212223最近,张师傅和李师傅要将家中闲置资金进行投资理财. 现有两种投资方案,且一年后投资盈亏的情况如下:投资股市:购买基金:2425 26 272829现甲、乙两人分别有分钟和分钟时间用于赶往火车站.30统计概率-高考必做题12从这次考试成绩看,①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是.②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是.2.数学①乙;②按照全年级排名答案为语文靠前,按照班级排名答案为数学靠前.用样本估计总体3交强险是车主必须为机动车购买的险种,若普通座以下私家车投保交强险第一年的费用(基准元,在下一年续保时,实行的是费率浮动机制,保费与上一年度车辆发生道路交通事故的情况相联系,发生交通事故的次数越多,费率就越高,具体浮动情况如表:交强险浮动因素和浮动费率比率表浮动因素浮动比率上一个年度未发生有责任道路交通事故下浮上两个年度未发生有责任道路交通事故下浮上三个及以上年度未发生有责任道路交通事故下浮上一个年度发生一次有责任不涉及死亡的道路交通事故上一个年度发生两次及两次以上有责任道路交通事故上浮4567取有限值的离散型随机变量及其分布列取有限值的离散型随机变量的均值、方差910111213 1415集合与集合的表示方法集合的表示方法不等式与线性规划绝对值不等式绝对值不等式的解法计数原理加法原理、乘法原理两个计数原理的应用排列与组合排列组合的应用16故答案选B.计数原理排列与组合排列组合的应用17181920随机变量的分布列取有限值的离散型随机变量及其分布列取有限值的离散型随机变量的均值、方差21超几何分布取有限值的离散型随机变量的均值、方差计数原理排列与组合排列组合的应用222324事件与概率随机事件的概率随机事件的运算两个互斥事件的概率加法公式2526排列与组合排列、组合的概念2728概率事件与概率随机变量的分布列计数原理29现甲、乙两人分别有分钟和分钟时间用于赶往火车站.30。
文科高考(统计、概率)解答题专项
高考解答题专项训练一——统计、概率1.20名学生某次数学考试成绩(单位:分)的频率分布直方图如下:(1)求频率分布直方图中a的值;(2)分别求出成绩落在[50,60)与[60,70)中的学生人数;(3)从成绩在[50,70)的学生中任选2人,求此2人的成绩都在[60,70)中的概率.2.某校从参加高三模拟考试的学生中随机抽取60名学生,将其数学成绩(均为整数)分成六段[90,100),[100,110),…,[140,150)后得到如下部分频率分布直方图.观察图形的信息,回答下列问题:(1)求分数在[120,130)内的频率,并补全这个频率分布直方图;(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试的平均分;(3)用分层抽样的方法在分数段为[110,130)的学生中抽取一个容量为6的样本,将该样本看成一个总体,从中任取2个,求至多有1人在分数段[120,130)内的概率.3.从某女子跳远运动员的多次测试中,随机抽取20次成绩作为样本,按各次的成绩(单位:cm)分成五组,第一组[490,495),第二组[495,500),第三组[500,505),第四组[505,510),第五组[510,515],相应的样本频率分布直方图如图所示:(1)样本落入第三组[500,505)的频数是多少?(2)现从第二组和第五组的所有数据中任意抽取两个,分别记为m,n,求事件“|m-n|≤5”的概率.4.某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图:(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?5.如图是某市有关部门根据该市干部的月收入情况,作抽样调查后画出的样本频率分布直方图.已知图中第一组的频数为4 000,请根据该图提供的信息解答下列问题:(图中每组包括左端点,不包括右端点,如第一组表示收入在[1 000,1 500))(1)求样本中月收入在[2 500,3 500)的人数;(2)为了分析干部的收入与年龄、职业等方面的关系,必须从样本的各组中按月收入用分层抽样方法抽出100人作进一步分析,则月收入在[1 500,2 000)的这段应抽多少人?(3)试估计样本数据的中位数.6.某高校共有15 000人,其中男生10 500人,女生4 500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).(1)应收集多少位女生样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4个小时的概率.(3)在样本数据中,有60位女生的每周平均体育运动时间超过4个小时.请完成每周平均体育运动时间与性别的列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.附:K2=.7.我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨)、一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5)分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.8.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:(1)作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差(同-组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?9.为了解少年儿童的肥胖是否与常喝碳酸饮料有关,现对30名六年级学生进行了问卷调查得到如下列联表.平均每天喝500 mL以上为常喝,体重超过50 kg为肥胖.已知在全部30人中随机抽取1人,抽到肥胖的学生的概率为.(1)请将上面的列联表补充完整;(2)是否有99.5%的把握认为肥胖与常喝碳酸饮料有关?说明你的理由;(3)设常喝碳酸饮料且肥胖的学生中有2名女生,现从常喝碳酸饮料且肥胖的学生中抽取2人参加电视节目,则正好抽到一男一女的概率是多少?参考数据:参考公式:K2=,其中n=a+b+c+d.10.从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得i=80,i=20,iyi=184,=720.(1)求家庭的月储蓄y对月收入x的线性回归方程y=x+;(2)判断变量x与y之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程y=x+中,=,a=-,其中,为样本平均值,线性回归方程也可写为=x+.11.在每年的春节后,某市政府都会发动公务员参加植树活动,林业部门为了保证树苗的质量,将在植树前对树苗进行检测,现从同一种树的甲、乙两批树苗中各抽测了10株树苗,量出它们的高度如下(单位:cm).甲:37,21,31,20,29,19,32,23,25,33;乙:10,30,47,27,46,14,26,10,44,46.(1)用茎叶图表示上述两组数据,并根据茎叶图对甲、乙两种树苗的高度作比较,写出两个统计结论;(2)分别将两组中高度高于各自平均数的树苗选出并合在一起组成一个新的样本,从这个新的样本中任取两株树苗,求这两株树苗分别来自甲、乙两组的概率.12.某良种培育基地正在培育一种小麦新品种A.将其与原有的一个优良品种B进行对照试验.两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,4 54;品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,4 30.(1)作出数据的茎叶图;(2)用茎叶图处理现有的数据,有什么优点?(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.13.某学生对其亲属30人的饮食习惯进行了一次调查,并用下图所示的茎叶图表示30人的饮食指数.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主)(1)根据以上数据完成下列2×2列联表:(2)能否有99%的把握认为其亲属的饮食习惯与年龄有关?并写出简要分析.14.假设某种设备使用的年限x(年)与所支出的维修费用y(万元)有以下统计资料:参考数据:=90,x iyi=112.3,如果由资料知y对x呈线性相关关系.试求:(1),;(2)线性回归方程=x+;(3)估计使用10年时,维修费用是多少?15.某食品厂为了检查甲、乙两条自动包装流水线的生产情况,随机在这两条流水线上各抽取40件产品作为样本,并称出它们的重量(单位:克),重量值落在[495,510)内的产品为合格品,否则为不合格品.表1是甲流水线样本的频数分布表,图1是乙流水线样本的频率分布直方图.(1)根据上面表1中的数据作出甲流水线样本的频率分布直方图;(2)若以频率作为概率,试估计从两条流水线上分别任取1件产品,该产品恰好是合格品的概率分别是多少;(3)由以上统计数据完成下面2×2列联表,并回答有多大的把握认为产品的包装质量与两条自动包装流水线的选择有关.附:K2=,其中n=a+b+c+d.。
概率统计(文科).pdf
文科数学《统计与概率》核心知识点与参考练习题一、统计(核心思想:用样本估计总体)1.抽样(每个个体被抽到的概率相等)(1)简单随机抽样:抽签法与随机数表法(2)系统抽样(等距抽样)(3)分层抽样2.用样本估计总体:(1)样本数字特征估计总体:众数、中位数、平均数、方差与标准差(2)样本频率分布估计总体:频率分布直方图与茎叶图3.变量间的相关关系:散点图、正相关、负相关、回归直线方程(最小二乘法)4.独立性检验二、概率(随机事件发生的可能性大小)1.基本概念(1)随机事件A的概率1,0AP(2)用随机模拟法求概率(用频率来估计概率)(3)互斥事件(对立事件)2.概率模型(1)古典概型(有限等可能)(2)几何概型(无限等可能)三、参考练习题1.某校高一年级有900名学生,其中女生400名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为_______ .2.某学校高一、高二、高三年级的学生人数之比是3:3:4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则该从高二年级抽取_____名学生.3.某校老年、中年和青年教师的人数见右表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为_______ .4.已知一组数据5.5,4.5,1.5,8.4,7.4,则该组数据的方差是_____.5.若1,2,3,4,m这五个数的平均数为3,则这五个数的标准差为____.6.重庆市2013年各月的平均气温(℃)数据的茎叶图如右图:则这组数据的中位数是________.7.某高校调查了200名学生每周的晚自习时间(单位:小时),制成了如图所示的频率分布直方图,其中晚自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.1408.(2016四川文)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查. 通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照 [0,0.5),[0.5,1),…,[4,4.5] 分成9组,制成了如图的频率分布直方图. (Ⅰ)求直方图中a的值;(Ⅱ)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(Ⅲ)估计居民月均用水量的中位数.类别人数老年教师900中年教师1800青年教师1600合计43009.(2015全国Ⅱ文)某公司为了解用户对其产品的满意度,从A ,B 两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A 地区用户满意度评分的频率分布直方图和B 地区用户满意度评分的频数分布表.A 地区用户满意度评分的频率分布直方图B 地区用户满意度评分的频数分布表满意度评分分组[50,60)[60,70)[70,80)[80,90)[90,100]频数2814106(Ⅰ)作出B 地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);B地区用户满意度评分的频率分布直方图(Ⅱ)根据用户满意度评分,将用户的满意度分为三个等级:试估计哪个地区用户的满意度等级为不满意的概率大?说明理由.10.(2014安徽文)某高校共有学生15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).(Ⅰ)应收集多少位女生的样本数据?(Ⅱ)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率;(Ⅲ)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.附:db c a d cb a bcd a n K22满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意2k KP 0.10 0.05 0.01 0.005 0k 2.7063.8416.6357.87911.(2014全国Ⅰ文)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125] 频数 6 26 38 22 8(Ⅰ)在下表中作出这些数据的频率分布直方图:(Ⅱ)估计这种产品质量指标值的平均数和方差(同一组中的数据用该组区间的中点值作代表);(Ⅲ)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?12.(2014广东文)某车间20名工人年龄数据如下表:(Ⅰ)求这20名工人年龄的众数与极差;(Ⅱ)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(Ⅲ)求这20名工人年龄的方差.13.(2016江苏)将一颗质地均匀的骰子(一种各个面上分别标有1,2,3,4,5,6个点的正方体玩具)先后抛掷2次,则出现向上的点数之和小于10的概率是_______ .14.从甲、乙等5名学生中随机选出2人,则甲被选中的概率为_______ .15.(2016全国乙卷文)为美化环境,从红、黄、白、紫4种颜色的花中任选2种花种在一个花坛中,余下的2种花种在另一个花坛中,则红色和紫色的花不在同一花坛的概率是______ .16.(2016全国丙卷文)小敏打开计算机时,忘记了开机密码的前两位,只记得第一位是M、I、N中的一个字母,第二位是1,2,3,4,5中的一个数字,则小敏输入一次密码能够成功开机的概率是________ .17.(2016天津文)甲、乙两人下棋,两人下成和棋的概率为21,甲获胜的概率是31,则甲不输的概率为_________ . 18.已知5件产品中有2件次品,其余为合格品.现从这5件产品中任选2件,恰有一件次品的概率为_________ .19.某单位N 名员工参加“社区低碳你我他”活动.他们的年龄在25岁至50岁之间.按年龄分组并得到的频率分布直方图如图所示.下表是年龄的频数分布表.区间[25,30)[30,35)[35,40)[40,45)[45,50]人数25ab(Ⅰ)求正整数a ,b ,N 的值;(Ⅱ)现要从年龄较小的第1,2,3组中用分层抽样的方法抽取6人,则年龄在第1,2,3组的人数分别是多少?(Ⅲ)在(2)的条件下,从这6人中随机抽取2人参加社区宣传交流活动,求恰有1人在第3组的概率.20.(2016全国Ⅰ文)某公司的班车在7:30,8:00,8:30发车,小明在7:50至8:30之间到达发车站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10分钟的概率是()A.31 B.21 C.32 D.4321.(2016全国Ⅱ文)某路口人行横道的信号灯为红灯和绿灯交替出现,红灯持续时间为40秒.若一名行人来到该路口遇到红灯,则至少需要等待15秒才出现绿灯的概率为()A.107 B.85 C.83 D.10322.在区间[-2,3]上随机选取一个数x ,则1x 的概率为_____ .23.若将一个质点随机投入如图所示的长方形ABCD 中,其中AB=2,BC=1,则质点落在以AB 为直径的半圆内的概率是_______ .24.如图,在边长为1的正方形中随机撒1000粒豆子,有180粒落到阴影部分,据此估计阴影部分的面积为_________ .25.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y 对x 的线性回归方程为()A.1?x yB.1?x yC.xy 2188? D.176?y26.某产品的广告费用x 与销售额y 的统计数据如下:根据上表可得回归方程axb y ???中的b ?为9.4,据此模型预报广告费用为6万元时销售额为A.63.6万元B.65.5万元C.67.7万元D.72.0万元27.随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份2011 2012 2013 2014 2015 时间代号t 1 2 3 4 5 储蓄存款y (千亿元)567810(Ⅰ)求y 关于t 的回归方程at by ???;(Ⅱ)利用(Ⅰ)中的回归方程,分析2011年至2015年该地区城乡居民储蓄存款的变化情父亲身高x (cm )174 176 176 176 178 儿子身高y (cm )175175176177177广告费用x (万元) 4 2 3 5 销售额y (万元)49263954况,并预测该地区2016年(t =6)的人民币储蓄存款.附:回归方程at b y ???中,t by atn t yt n y t b ni ini ii ??,?1221. 28.甲、乙两所学校高三年级分别有1200人、1000人,为了了解两所学校全体高三年级学生在该地区六校联考的数学成绩情况,采用分层抽样的方法从两所学校一共抽取了110名学生的数学成绩,并作出了频数分布统计表如下:甲校:分组[70,80)[80,90)[90,100)[100,110)频数 3 4 8 15 分组[110,120)[120,130)[130,140)[140,150]频数15x32乙校:分组[70,80)[80,90)[90,100)[100,110)频数 1 2 8 9 分组[110,120)[120,130)[130,140)[140,150]频数1010y3(1)计算y x,的值;(2)若规定考试成绩在[120,150]内为优秀,请分别估计两所学校数学成绩的优秀率;(3)由以上统计数据填写下面2×2列联表,并判断是否有90%的把握认为两所学校的数学成绩有差异.参考数据与公式:由列联表中数据计算db c a d cb abcadn K22;临界值表:29.一次考试中,5名学生的数学、物理成绩如下表所示:学生 A B C D E 数学成绩x (分)89 91 93 95 97 物理成绩y (分)8789899293(1)要从5名学生中选2人参加一项活动,求选中的学生中至少有一人的物理成绩高于90分的概率;甲校乙校总计优秀非优秀总计2k KP 0.10 0.05 0.010 0k 2.7063.8416.635(2)根据上表数据作散点图,求y 与x 的线性回归方程(系数精确到0.01).附:回归直线的方程是:ax b y ???,其中x byaxx y y x x b ni ini i i??,?121;90,93y x ,30,4051251yy x x xx ii i i i.30.为调查市民对汽车品牌的认可度,在秋季车展上,从有意购车的500名市民中,随机抽取100名市民,按年龄情况进行统计得到下面的频率分布表和频率分布直方图.(1)求频率分布表中a 、b 的值,并补全频率分布直方图,再根据频率分布直方图估计有意购车的这500名市民的平均年龄;31.(2016新课标Ⅱ)某险种的基本保费为a (单位:元),继续购买该险种的投保人称为续保人,续保人的本年度的保费与其上年度的出险次数的关联如下:上年度出险次数0 1 2 3 4 5保费0.85aa1.25a1.5a 1.75a 2a设该险种一续保人一年内出险次数与相应概率如下:一年内出险次数0 1 2 3 4 5 概率0.300.150.200.200.100.05(Ⅰ)求一续保人本年度的保费高于基本保费的概率;32.袋中有形状、大小都相同的4只球,其中1只白球,1只红球,2只黄球,从中一次随机分组(岁)频数频数[20,25) 5 0.050 [25,30) 200.200 [30,35) a0.350 [35,40) 30 b [40,45] 10 0.100 合计1001.000摸出2只球,则这2只球颜色不同的概率为____________ .33.现有6道题,其中4道甲类题,2道乙类题,某同学从中任取2道题解答.试求:(1)所取的2道题都是甲类题的概率;(2)所取的2道题不是同一类题的概率.A,两地区分别随机调查了20个用户,得到用34.某公司为了解用户对其产品的满意度,从B户对产品的满意度评分如下:A地区:62 73 81 92 95 85 74 64 53 7678 86 95 66 97 78 88 82 76 89B地区:73 83 62 51 91 46 53 73 64 8293 48 65 81 74 56 54 76 65 79(Ⅰ)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);。
高三文科统计与概率练习题
高三文科统计与概率练习题在高三的学习生涯中,统计与概率是文科学生们需要掌握的重要知识点之一。
为了提高学生的能力,下面将提供一些统计与概率的练习题,帮助学生们巩固知识和提升解题能力。
1. 统计(1)某班级有30名学生,其中20名男生和10名女生,求男生人数占总人数的百分比。
(2)一次考试中,某学生的成绩为75分,超过了总人数的80%。
求该次考试的总人数。
(3)某校体育队中共有60名学生,其中30名男生,体操队由男女学生组成,其中男生占总队员数的40%。
求体操队的女生人数。
2. 概率小明有5件T恤,3条裤子和2双鞋子。
如果他从中随机选择一件衣服和一件裤子,并且随机穿上一双鞋子,那么他穿上的衣服、裤子和鞋子都是同一个颜色的概率是多少?提示:首先计算出小明选择同一颜色的T恤、裤子和鞋子的概率,然后根据全概率公式计算最终结果。
3. 事件的独立性假设A和B是两个相互独立的事件。
已知P(A) = 0.4,P(B) = 0.3,求P(A并B)。
4. 期望值一枚均匀的骰子中有1、2、3、4、5、6六个面,每个面的概率都是1/6。
如果投掷一次骰子,求出投掷结果的期望值。
5. 排列组合在一副扑克牌中,红桃和黑桃各有13张,方块和梅花各有13张。
从中随机选择5张牌,求以下各种情况的概率:(1)5张牌都是红桃;(2)5张牌都是黑桃;(3)5张牌都是方块;(4)5张牌都是梅花;(5)5张牌中有3张红桃和2张黑桃。
通过以上练习题,希望能够帮助高三文科学生们更好地掌握统计与概率的知识点,并提高解题能力。
在备战高考的道路上,坚持练习和不断提升是成功的关键。
祝愿大家取得优异的成绩!。
高三复习文科统计概率(概率专项完整版)练习
高三复习文科统计概率(概率专项)练习必须掌握知识点:○1随机事件的定义;正确理解概率的定义,能理解频率与概率的联系与区别.解析:判断事件是否随机抓住不能确保发生或不发生的事件,通常未发生的不是自然科学规律的事件为随机事件,而已发生、自然科学规律、公式以及定理等确定的事件为必然事件,违背自然科学的未发生的为不可能事件;事件发生的概率通俗讲就是事件发生的可能性大小,故可能发生也可能不发生,如天气预报有雨却没下雨,某人说某事99%的概率发生缺没发生等并不表示天气预报有误也不表示某人说法错误;频率是统计得来,随着试验次数不同而浮动,概率可看着是对频率的固定值估计,是一个定值,但试验次数无限增加时,频率无限趋近该事件的概率.○2掌握对立事件与互斥事件的区别与联系.解析:对立事件与互斥事件都不能同时发生,而互斥事件可以同时不发生,对立事件却必然有事件发生,故对立事件是互斥事件充分不必要条件;互斥事件与对立事件经常作为间接求解使用.○3掌握古典概型和几何概型.解析:古典概型成立的特征需两个条件,条件一是试验的结果是有限的(如抛一枚硬币出现正面、方面两种情况),条件二是试验的所有结果发生可能性相同(如抛一枚硬币出现正面、反面的概率一样),解答古典概型题计算方式为()AP A事件发生的事件总数试验所有可能发生的事件总数;几何概型其实就是一个“量比”的问题,事件发生的概率与试验“器具”的量有关,且为其“量比”(如长度比、面积比、事件比、空间比、数轴比等,典型的如等公交车、过交通岗、设靶、数轴取数、抛黄豆以等).○4独立性检验解析:独立性检验是经常出现在大题当中,固定的考试模式以及固定的求解步骤对考生来说没有难度,需要注意的是几种求问法:(1)是否有不低于99.5%的把握认为吸烟与患肺炎相关;(2)是否能在犯错误的概率不超过0.5%前提下,认为吸烟与患肺炎有关;(3)若低于95%的把握,则认为吸烟与患肺炎无关,反之亦然,从上表统计数据是否能判断吸烟与患肺炎有关,请注明你的结论。
高考文科数学概率及统计题型归纳及训练.docx
2020 年高考文科数学《概率与统计》题型归纳与训练【题型归纳】题型一古典概型例 1从甲、乙等5名学生中随机选出2人,则甲被选中的概率为().A. 1B.2C.8D. 5525925【答案】 B【解析】可设这 5 名学生分别是甲、乙、丙、丁、戊,从中随机选出 2 人的方法有:(甲,乙),(甲,丙),(甲,丁),(甲,戊),(乙,丙),(乙,丁),(乙,戊),(丙,丁),(丙,戊),(丁,戊),共有种选法,其中只有前 4 种是甲被选中,所以所求概率为 . 故选 B.例 2将2本不同的数学书和1 本语文书在书架上随机排成一行,则 2 本数学书相邻的概率为 ________.【答案】23【解析】根据题意显然这是一个古典概型,其基本事件有:数1,数2,语;数1,语,数 2; 数 2,数 1,语 ;数2,语,数1;语,数2,数1;语,数1,数2共有6 种,其中 2 本数学书相邻的有 4 种,则其概率为:p 4 2.6 3【易错点】列举不全面或重复, 就是不准确【思维点拨】直接列举, 找出符合要求的事件个数.题型二几何概型例 1 如图所示,正方形ABCD内的图形来自中国古代的太极图,正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称. 在正方形内随机取一点,则此点取自黑色部分的概率是().A. 1B.πC.1D.π4824【答案】 B【解析】不妨设正方形边长为 a ,由图形的对称性可知,太极图中黑白部分面积相等,即各占圆面积的一半. 由几何概型概率的计算公式得,所求概率为21a22a28.故选B.例 2在区间[0,5]上随机地选择一个数p ,则方程 x2 + 2 px + 3 p - 2 = 0 有两个负根的概率为 ________.【答案】234 p24(3 p2)0【解析】方程 x2 + 2 px + 3p -2 = 0 有两个负根的充要条件是x1 x22p0即x1x2 3 p202p 1, 或 p 2 ,又因为 p[0,5] ,所以使方程x2+ 2 px + 3 p - 2 = 0 有两个负根的p3(1 2) (5 2) 2,故填:2 .的取值范围为 ( 2,1] U [2,5] ,故所求的概率33533【易错点】“有两个负根”这个条件不会转化 .【思维点拨】“有两个负根”转化为函数图像与x 轴负半轴有两个交点.从而得到参数 p 的范围.在利用几何概型的计算公式计算即可.题型三抽样与样本数据特征例 1某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200, 400,300 ,100 件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取________件.【答案】 18【解析】按照分层抽样的概念应从丙种型号的产品中抽取6018(件).3001000例 2已知样本数据 x1, x2,, x n的均值x 5 ,则样本数据2x11, 2x21,,2x n1的均值为.【答案】 11【解析】因为样本数据,,,的均值,又样本数据,,,的和为 2 x1x2 L x n n ,所以样本数据的均值为= 11.例 3 某电子商务公司对10000名网络购物者 2018 年度的消费情况进行统计,发现消费金额(单位:万元)都在区间 [0.3,0.9] 内,其频率分布直方图如图所示.(1)直方图中的a =.(2)在这些购物者中,消费金额在区间[0.5,0.9] 内的购物者的人数为.【答案】 a 3人数为 0.6 10000 6000【解析】由频率分布直方图及频率和等于1,可得0.2 0.1 0.8 0.1 1.5 0.1 2 0.1 2.5 0.1 a 0.1 1 ,解之得 a 3 .于是消费金额在区间0.5,0.9 内频率为 0.2 0.1 0.8 0.1 2 0.1 3 0.10.6 ,所以消费金额在区间0.5,0.9 内的购物者的人数为 0.6 10000 6000.例 4某城市100户居民的月平均用电量(单位:度),以160,180,180,200,200,220,220,240,240,260,260,280,280,300分组的频率分布直方图如图所示.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为220,240,240,260,260,280,280,300的四组用户中,用分层抽样的方法抽取 11户居民,则从月平均用电量在220,240的用户中应抽取多少户?【答案】见解析【解析】(1)由0.002 0.0095 0.011 0.0125x 0.005 0.0025 20 1,得 x0.0075 .220 240(2)由图可知,月平均用电量的众数是230 .2因为 0.002 0.0095 0.011 20 0.450.5 ,又 0.002 0.0095 0.011 0.0125 20 0.70.5 ,所以月平均用电量的中位数在220,240 内.设中位数为 a ,由0.002 0.0095 0.011 20 0.0125 a 2200.5,得 a 224 ,所以月平均用电量的中位数是224 .(3)月平均用电量为220,240的用户有0.0125 20 100 25(户);月平均用电量为 240,260 的用户有 0.0075 20 100 15(户);月平均用电量为 260,280 的用户有 0.005 20 100 10 (户);月平均用电量为280,300 的用户有 0.0025 20 100 5 (户).抽取比例为111051 ,25155所以从月平均用电量在220,240 的用户中应抽取2515 (户).5【易错点】没有读懂题意 , 计算错误 . 不会用函数思想处理问题【思维点拨】根据题意分情况写出函数解析式; 2 牵涉到策略问题 , 一般可以转化为比较两个指标的大小.题型四回归与分析例 1 下图是我国 2008 年至 2014 年生活垃圾无害化处理量(单位:亿吨)的折线图(1)由折线图看出,可用线性回归模型拟合与的关系,请用相关系数加以说明(2)建立关于的回归方程(系数精确到),预测年我国生活垃圾无害化处理量 .参考数据:,,,.参考公式:相关系数回归方程中斜率和截距的最小二乘估计公式分别为:【答案】见解析【解析】(1)由折线图中数据和附注中参考数据得,,,,.因为与的相关系数近似为,说明与的线性相关程度相当高,从而可以用线性回归模型拟合与的关系 .(1)变量与的相关系数,又,,,,,所以,故可用线性回归模型拟合变量与的关系 .(2),,所以,,所以线性回归方程为.当时, . 因此,我们可以预测2016 年我国生活垃圾无害化处理亿吨.【易错点】没有读懂题意 , 计算错误 .【思维点拨】将题目的已知条件分析透彻 , 利用好题目中给的公式与数据 .题型五独立性检验例 1 甲、乙、丙、丁四位同学各自对 A、 B 两变量的线性相关性作试验,并用回归分析方法分别求得相关系数 r 与残差平方和 m如下表:甲乙丙丁rm 115 106 124103则哪位同学的试验结果体现A、B 两变量更强的线性相关性?() A.甲B.乙C.丙D.丁【答案】 D【解析】 D因为r>0且丁最接近1,残差平方和最小,所以丁相关性最高【易错点】不理解相关系数和残差平方和与相关性的关系【思维点拨】相关系数 r 的绝对值越趋向于 1, 相关性越强 . 残差平方和 m越小相关性越强【巩固训练】题型一古典概型1.将一颗质地均匀的骰子(一种各个面上分别标有个点的正方体玩具)先后抛掷次,则出现向上的点数之和小于的概率是.【答案】【解析】将先后两次点数记为,则基本事件共有(个),其中点数之和大于等于有,共种,则点数之和小于共有种,所以概率为.2. 我国数学家陈景润在哥德巴赫猜想的研究中取得了世界领先的成果.哥德巴赫猜想是“每个大于 2 的偶数可以表示为两个素数的和”,如30 723 .在不超过 30 的素数中,随机选取两个不同的数,其和等于30 的概率是().A.1B.1C.1D.1 12141518【答案】 C【解析】不超过 30 的素数有 2、3、5、7、11、13、17、19、23、29,共 10 个,随机选取两数有 45 (种)情况,其中两数相加和为30 的有 7 和 23,11 和 19,31P451513 和 17,共 3 种情况,根据古典概型得.故选C.3.袋中有形状、大小都相同的 4 只球,其中 1只白球, 1只红球, 2 只黄球,从中一次随机摸出 2 只球,则这 2 只球颜色不同的概率为.【答案】P56【解析】 1只白球设为a,1只红球设为b, 2 只黄球设为c,d,则摸球的所有情况为a,b , a, c , a,d , b, c , b,d , c,d ,共6件,足意的事件a,b , a,c , a,d , b,c , b,d ,共5件,故概率P 5 .6型二几何概型1.某公司的班在 7:00 ,8:00 ,8:30 ,学 . 小明在 7:50 至 8:30 之到达站乘坐班,且到达站的刻是随机的,他等不超10 分的概率是().B.D.【答案】 B【解析】如所示,画出.小明到达的会随机的落在中段中,而当他的到达落在段或,才能保他等的不超分 .根据几何概型,所求概率. 故B.2.从区随机抽取 2n个数,,⋯,,,,⋯,,构成n个数,,⋯,,其中两数的平方和小于 1 的数共有m个,用随机模的方法得到的周率的近似().A.B.C.D.【答案】 C【解析】由意得:在如所示方格中,而平方和小于 1 的点均在如所示的阴影中,由几何概型概率计算公式知,所以.故选C.3.下图来自古希腊数学家希波克拉底所研究的几何图形,此图由三个半圆构成,三个半圆的直径分别为直角三角形 ABC 的斜边 BC ,直角边AB, AC ,△ABC的三边所围成的区域记为Ⅰ,黑色部分记为Ⅱ,其余部分记为Ⅲ,在整个图形中随机取一点,此点取自Ⅰ,Ⅱ,Ⅲ的概率分别记为 p1, p2, p3,则A.p1p2B.p1p3C.p2p3D.p1p2p3【答案】 A【解析】概率为几何概型,总区域面积一定,只需比较Ⅰ,Ⅱ,Ⅲ区域面积即可 .设直角三角形ABC 的三个角A,B, C 所对的边长分别为 a ,b, c ,则区域Ⅰ的面积为 S11 ab,2区域Ⅱ的面积为区域Ⅲ的面积为222S21π1c1π1b1ab1π1a1ab ,2222222221 π 1 b21 πa21ab .S3 1 π 1 c1ab2222282显然 p1p2.故选A.题型三抽样与样本的数据特征1. 已知一组数据4,6,5,8,7,6,那么这组数据的平均数为.【答案】 10【解析】平均数 x 1 4658766.62.某电子商务公司对 10000 名网络购物者 2014 年度的消费情况进行统计,发现消费金额(单位:万元)都在区间 [0.3, 0.9] 内,其频率分布直方图如图所示.(Ⅰ)直方图中的a_________;(Ⅱ)在这些购物者中,消费金额在区间[0.5, 0.9] 内的购物者的人数为_________.【答案】 3;6000【解析】频率和等于 1 可得0.2 0.1 0.8 0.1 1.5 0.1 2 0.1 2.50.1a0.1 1 ,解之得 a 3 .于是消费金额在区间 [0.5, 0.9] 内频率为 0.20.10.80.120.1 3 0.1 0.6 ,所以消费金额在区间 [0.5, 0.9] 内的购物者的人数为: 0.6100006000 ,故应填3;6000.3.我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准(吨)、一位居民的月用水量不超过的部分按平价收费,超出的部分按议价收费 . 为了了解居民用水情况,通过抽样,获得了某年位居民每人的月均用水量(单位:吨),将数据按照,,,分成组,制成了如图所示的频率分布直方图.(1)求直方图中的值;(2)设该市有万居民,估计全市居民中月均用水量不低于吨的人数,请说明理由;(3)若该市政府希望使的居民每月的用水量不超过标准(吨),估计的值,并说明理由 .【答案】见解析【解析】(1)由频率分布直方图知,月均用水量在中的频率为,同理,在,,,,,中的频率分别为,,,,,.由,解得 .(2)由( 1),位居民每人月均用水量不低于吨的频率为.由以上样本的频率分布,可以估计全市万居民中月均用水量不低于吨的人数为.(3)因为前组的频率之和为,而前组的频率之和为,所以由,解得 .题型四回归与分析1.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区 5 户家庭,得到如下统计数据表:收入 x(万元)支出 y (万元)根据上表可得回归直线方程???,其中???y bx a b0.76,a y bx ,据此估计,该社区一户收入为 15 万元家庭年支出为()A.万元B.万元C.万元D.万元【答案】 B8.28.610.011.311.9(万元),【解析】由已知得x5106.27.58.0 8.59.88(万元),故 ?8 0.76 10 0.4,5所以回归直线方程为y? 0.76 x 0.4 .当社区一户收入为15 万元,家庭年支出为y? 0.76 150.411.8 (万元).故选B.2.为了研究某班学生的脚长x (单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10 名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为.已知,,.该班某学生的脚长为 24,据此估计其身高为().A.B.C.D.【答案】 C【解析】,,所以,时,.故选C.3.某公司为确定下一年投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y(单位: t )和年利润z(单位:千元)的影响,对近8 年的年宣传费 x i和年销售量y i i 1,2, ,8数据作了初步处理,得到下面的散点图及一些统计量的值.x y w82888x i x2w i w y i yw i w x i x y i y i 1i 1i 1i 1561469 3表中 w i18x i, w w i ,8 i 1(1)根据散点图判断,y a bx 与y c d x 哪一个适宜作为年销售量y关于年宣传费x的回归方程类型(给出判断即可,不必说明理由)?(2)根据( 1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系式为z 0.2 y x,根据( 2)的结果回答下列问题:(ⅰ)年宣传费x49时,年销售量及年利润的预报值是多少?(ⅱ)年宣传费x为何值时,年利润的预报值最大?附:对于一组数据 u1, v1u2,v2,, u n ,v n,其回归直线v u 的斜率和n?u i u v i vi 1?截距的最小二乘估计分别为, ? v u .nu i2ui 1【答案】见解析【解析】(1)由散点图变化情况可知选择y c d x 较为适宜.8w i w y iy(2)由题意知di 182108.8 68 .又 y c d x 一定过点, y ,w i w1.6i 1所以 c y d563 68 6.8 100.6 ,所以 y 与 x 的回归方程为 y 100.6 68 x .(3)(ⅰ)由( 2)知,当 x 49 时, y 100.6 6849 576.6 t ,z 0.2 576.6 49 66.32(千元),所以当年宣传费为 x 49 时,年销售量为 576.6 t ,利润预估为 66.32千元.(ⅱ)由( 2)知, z0.2 y x0.2100.6 68 x x 13.6 x x 20.122x 6.8时,年利润的预估值最大,x 6.86.82 20.12 ,所以当即 x 6.8 2 46.24 (千元). 题型五 独立性检验1. 某医疗研究所为了检验某种血清预防感冒的作用, 把 500 名使用血清的人与另外 500 名未使用血清的人一年中的感冒记录作比较,提出假设 H :“这种血清不能起到预防感冒的作用”,利用 2×2列联表计算的 K 2≈,则下列表述中正确的是( )A .有 95℅的把握认为“这种血清能起到预防感冒的作用”B .若有人未使用该血清,那么他一年中有95℅的可能性得感冒C.这种血清预防感冒的有效率为95℅D.这种血清预防感冒的有效率为5℅【答案】 A【解析】由题可知,在假设 H 成立情况下,P( K23.841)的概率约为,即在犯错的概率不错过的前提下认为“血清起预防感冒的作用”,即有95℅的把握认为“这种血清能起到预防感冒的作用” . 这里的 95℅是我们判断H不成立的概率量度而非预测血清与感冒的几率的量度,故 B 错误. C,D也犯有 B 中的错误.故选 A2. 观察下面频率等高条形图,其中两个分类变量x,y 之间关系最强的是( )A.B.【答案】 D【解析】在频率等高条形图中,C.D.a与c相差很大时,我们认为两个分类变量a b c d有关系,四个选项中,即等高的条形图中x1, x2所占比例相差越大,则分类变量 x, y 关系越强,故选 D .3.淡水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了 100 个网箱,测量各箱水产品的产量(单位:kg )的频率分布直方图如图所示.(1)设两种养殖方法的箱产量相互独立,记 A 表示事件:旧养殖法的箱产量低于 50kg ,新养殖法的箱产量不低于50kg ,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;箱产量箱产量50kg⋯50kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到 0.01).附:P K2⋯kkK 2n( ad bc)2.(a b)(c d )(a c)(b d )【答案】见解析【解析】(1)记:“旧养殖法的箱产量低于50kg ”为事件B,“新养殖法的箱产量不低于50kg”为事件 C,由题图并以频率作为概率得P B0.040 5 0.034 5 0.024 5 0.014 5 0.012 5 0.62,P C0.068 5 0.046 5 0.010 5 0.008 50.66,P A P B P C0.4092 .(2)箱产量50kg箱产量≥50kg 旧养殖法6238新养殖法3466k 220062 6638 342由计算可得 K2的观测值为15.705 ,因为15.705 6.635,所以10010096104P K2≥ 6.6350.001,从而有 99%以上的把握认为箱产量与养殖方法有关.(3)1 5 0.2,0.10.0040.0200.0440.032,0.0320.0688,85 2.35,171750 2.35 52.35,所以中位数为52.35.。
高考文科数学分类概率统计
10 概率与统计一、选择题1.(福建5)某一批花生种子;如果每1粒发芽的概率为45;那么播下3粒种子恰有2粒发芽的概率是( C ) A.12125 B.16125 C.48125 D.961252.(江西11)电子钟一天显示的时间是从00:00到23:59;每一时刻都由四个数字组成;则一天中任一时刻显示的四个数字之和为23的概率为( C )A .1180B .1288C .1360D .14803.9辽宁7)4张卡片上分别写有数字1;2;3;4;从这4张卡片中随机抽取2张;则取出的2张卡片上的数字之和为奇数的概率为( C ) A .13B .12C .23D .344.(山东9) 从某项综合能力测试中抽取100人的成绩;统计如表;则这100人成绩的标准差为( B )分数 5 4 3 2 1 人数20 1030 3010A .3B .2105 C .3D .855.(重庆5)某交高三年级有男生500人;女生400人;为了解该年级学生的健康情况;从男生中任意抽取25人;从女生中任意抽取20人进行调查.这种抽样方法是 ( D )(A)简单随机抽样法(B)抽签法(C)随机数表法(D)分层抽样法6.(重庆9)从编号为1,2,…,10的10个大小相同的球中任取4个;则所取4个球的最大号码是6的概率为 ( B )(A)184(B)121(C)25(D)357.(陕西3 ) 某林场有树苗30000棵;其中松树苗4000棵.为调查树苗的生长情况;采用分层抽样的方法抽取一个容量为150的样本;则样本中松树苗的数量为( C ) A .30 B .25 C .20 D .15二、填空题1.(广东[)45,55;[)[)[)[)55,65,65,75,75,85,85,95;由此得到频率分布直方图如图3;则这20名工人中一天生产该产品数量在[)55,752.(宁夏16)从甲、乙两品种的棉花中各抽测了25根棉花的纤维长度(单位;mm);结果如下;甲品种;271273280285285 287292294295301303303307 3310314319323325325 328331334337352乙品种;284292295304306307312313315315316318318 320322322324327329331333336337343356由以上数据设计了如下茎叶图甲乙3 1 277 5 5 0 28 45 4 2 29 2 58 7 3 3 1 30 4 6 79 4 0 31 2 3 5 5 6 8 88 5 5 3 32 0 2 2 4 7 97 4 1 33 1 3 6 734 32 35 6根据以上茎叶图;对甲、乙两品种棉花的纤维长度作比较;写出两个统计结论;①;②.参考答案;(1)乙品种棉花的纤维平均长度大于甲品种棉花的纤维平均长度(或;乙品种棉花的纤维长度普遍大于甲品种棉花的纤维长度).(2)甲品种棉花的纤维长度较乙品种棉花的纤维长度更分散.(或;乙品种棉花的纤维长度较甲品种棉花的纤维长度更集中(稳定).甲品种棉花的纤维长度的分散程度比乙品种棉花的纤维长度的分散程度更大).(3)甲品种棉花的纤维长度的中位数为307mm;乙品种棉花的纤维长度的中位数为318mm.(4)乙品种棉花的纤维长度基本上是对称的;而且大多集中在中间(均值附近).甲品种棉花的纤维长度除一个特殊值(352)外;也大致对称;其分布较均匀.注;上面给出了四个结论.如果考生写出其他正确答案;同样给分.3.(湖南12)从某地区15000位老人中随机抽取500人;其生活能否自理的情况如下表所示;则该地区生活不能自理的老人中男性比女性约多_____________人。
高三数学概率统计专题测试(文科)
高三文科数学专题练习——概率统计一、选择题1、2009年2月,国家教育部就“文理分科是否取消”等教改问题征集民意之际,某新闻单位从900名家长中抽取15人,1500名学生中抽取25人,300名教师中抽取5人召开座谈会,这种抽样方法是( )A .简单随机抽样B .抽签法C .系统抽样D .分层抽样 2、(2009惠州)某雷达测速区规定:凡车速大于或等于70km/h 的汽车视为“超速”,并将受到处罚,如图是某路段的一个检测 点对200辆汽车的车速进行检测所得结果的频率分布直方 图,则从图中可以看得出将被处罚的汽车大约有( ) A .30辆 B .40辆 C .60辆 D .80辆3、在0,1,2,3,…,9这十个数字中,任取四个不同的数字,那么“这四个数字之和大于5”这一事件是( )A .必然事件B .不可能事件C .随机事件D .不确定是何事件 4、某战士在打靶中,连续射击两次,事件“至少有一次中靶”的对立事件是( ) A .必然事件 B .不可能事件 C .随机事件 D .不确定是何事件5、(2009揭阳)已知函数:c bx x x f ++=2)(,其中:40,40≤≤≤≤c b ,记函数)(x f 满足条件:(2)12(2)4f f ≤⎧⎨-≤⎩为事件为A ,则事件A 发生的概率为( ) A . 14 B . 58 C . 12D .38 二、填空题6、容量为100的样本数据,依次分为8组,如下表:组号 1 2 345 6 7 8 频数10133xx1513129则第三组的频率是 .7、(2009揭阳)某班有学生48人,现用系统抽样的方法,抽取一个容量为4的样本,已知座位号分别 为6,30,42的同学都在样本中,那么样本中另一位同学的座位号应该是 . 8、(2009中山)若数据123,,,,n x x x x 的平均数x =5,方差22σ=,则数据12331,31,31,,31n x x x x ++++的平均数为 ,方差为 .9、(2009惠州)若以连续抛掷两次骰子分别得到的点数m 、n 作为点P 的坐标,则点P 落在圆2216x y += 内的概率为 .10、在一个直径为6的球内随机取一点,则这个点到球面的最近距离大于2的概率为 .三、解答题11、(2009潮州)潮州统计局就某地居民的月收入调查了10000人,并根据所得数据画了样本的频率分布直方图(每个分组包括左端点,不包括右端点,如第一组表示收入在)1500,1000[)。
高考文科数学概率与统计题型归纳与训练
高考文科数学概率与统计题型归纳与训练2020年高考文科数学《概率与统计》题型归纳与训练题型归纳古典概型例1:从甲、乙等5名学生中随机选出2人,则甲被选中的概率为()。
A。
55.B。
25.C。
9.D。
128解析:可设这5名学生分别是甲、乙、丙、丁、戊,从中随机选出2人的方法有:甲,乙),(甲,丙),(甲,丁),(甲,戊),(乙,丙),(乙,丁),(乙,戊),(丙,丁),(丙,戊),(丁,戊),共有10种选法,其中只有前4种是甲被选中,所以所求概率为4/10=2/5.故选B。
例2:将2本不同的数学书和1本语文书在书架上随机排成一行,则2本数学书相邻的概率为________。
解析:根据题意显然这是一个古典概型,其基本事件有:数1,数2,语;数1,语,数2;数2,数1,语;数2,语,数1;语,数2,数1;语,数1,数2共有6种,其中2本数学书相邻的有4种,则其概率为:p=4/6=2/3.易错点:列举不全面或重复,就是不准确。
思维点拨:直接列举,找出符合要求的事件个数。
几何概型例1:如图所示,正方形ABCD内的图形来自中国古代的太极图,正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称。
在正方形内随机取一点,则此点取自黑色部分的概率是()。
解析:不妨设正方形边长为a,由图形的对称性可知,太极图中黑白部分面积相等,即各占圆面积的一半。
由几何概型概率的计算公式得,所求概率为1/2πa^2=π/4a^2.故选B。
例2:在区间[0,5]上随机地选择一个数p,则方程x^2+2px-3p^2=0有两个负根的概率为________。
解析:方程x^2+2px-3p^2=0有两个负根的充要条件是Δ=4p^2-4(3p-2)x<0,即3p^2-x^2<2.因为x^2<p,所以3p^2-p^2<2,即p∈(0,1]∪[2,5],又因为p∈[0,5],所以使方程x^2+2px-3p^2=0有两个负根的p的取值范围为(√3,1]∪[2,5],故所求的概率为(5-√3)/5.220度,中位数是235度。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
常考题型大通关:第19题统计概率1、2018年10月17日是我国第5个扶贫日,也是第26个国际消除贫困日。
射洪某企业员工共500人参加“精准扶贫”活动,按年龄分组:第一组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50],得到的频率分布直方图如图所示.(1)下表是年龄的频数分布表,求正整数a,b的值;(2)根据频率分布直方图,估算该企业员工的平均年龄及年龄的中位数;(3)现在要从年龄较小的第1,2,3组中用分层抽样的方法抽取6人,从这6人中随机抽取2人参加社区宣传交流活动,求至少有1人年龄在第3组的概率.2、某高校在2014年的自主招生考试成绩中随机抽取100名学生的笔试成绩,按成绩分组,得到的频率分布表如下左图所示.(1)请先求出频率分布表中①、②、③、④位置相应的数据,再在答题纸上完成下列频率分布直方图;(2)为了能选拔出最优秀的学生,高校决定在笔试成绩高的第3、4、5组中用分层抽样抽取6名学生进入第二轮面试,求第3、4、5组每组各抽取多少名学生进入第二轮面试?3、随着生活水平的提高,人们对空气质量的要求越来越高,某机构为了解公众对“车辆限行”的态度,随机抽查40人,并将调查情况进行整理后制成下表:年龄(岁) [15,25) [25,35) [35,45) [45,55) [55,60]频数 5 10 10 5 10赞成人数 4 6 8 4 91.完成被调查人员年龄的频率分布直方图,并求被调查人员中持赞成态度人员的平均年龄约为多少岁?15,25,45,55的被调查人员中各随机选取1人进行调查.请写出所有的基2.若从年龄在[)[)本亊件,并求选取2人中恰有1人持不赞成态度的概率.4、某中学为弘扬优良传统,展示80年来的办学成果,特举办“建校80周年教育成果展示月”活动。
现在需要招募活动开幕式的志愿者,在众多候选人中选取100名志愿者,为了在志愿者.组号分组频数频率160,165 5 0.05第1组[)第2组[165,170)0.35第3组[170,175)第4组[175,180)20 0.20第5组[180,185)10合计100 1.001.请补充频率分布表中空白位置相应数据,再完成下列频率分布直方图;2.为选拔出主持人,决定在第3、4、5组中用分层抽样抽取6人上台,求第3、4、5组每组各抽取多少人?3.在2的前提下,主持人会在上台的6人中随机抽取2人表演诗歌朗诵,求第3组至少有一人被抽取的概率?5、某中学组织了一次高三学生数学学业水平模拟测试,学校从测试合格的男、女生中各随机抽取100人的成绩进行统计分析,分别制成了如图所示的男生和女生数学成绩的频率分布直方图.1.若所得分数大于等于80分认定为优秀,求男、女生优秀人数各有多少人?2.在1中的优秀学生中用分层抽样的方法抽取5人,从这5人中任意选取2人,求至少有一名男生的概率.6、某乡镇根据中央文件精神,在2014年通过精准识别确定建档立卡的贫困户共有473户,结合当地实际情况采取多项精准扶贫措施,从2015年至2018年该乡镇每年脱贫户数见下表:年份2015 2016 2017 2018 年份代码x 1 2 3 4脱贫户数y55 69 71 85(1)根据2015-2018年的数据,求出y关于x的线性回归方程$$y bx a=+$;(2)利用(1)中求出的线性回归方程,试判断到2020年底该乡镇的473户贫困户能否全部脱贫.附:$$1221,ni iiniix y nxyb a y bxx nx==-==--∑∑$$7、某农科所对冬季昼夜温差大小与某反季节大豆新品种种子发芽数之间的关系进行分析研究,他们分别记录了12月1日至12月5日每天昼夜温差大小与实验室每天每100颗种子中的发芽数,得到如下数据:该农科所确定的研究方案是:先从这5组数据中随机选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验。
(1)求随机选取的2组数据恰好是不相邻的2天数据的概率;(2)若选取的是12月l 日与12月5日的两组数据,请根据12月2日至12月4日的数据,求y 关于x 的线性回归方程$$;y bx a =+$ (3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠.参考公式:$1221,.ini ii ni x ynxy bay bx xnx==-==--∑∑$$ 8、在一次抽样调查中测得样本的5个样本点,数值如下表:x0.25 0.5 1 2 4 y 1612521(1).根据散点图判断,y a bx =+与k y c x =+哪一个适宜作为y 关于x 的回归方程类型?(给出判断即可,不必说明理由)(2).根据(1)的判断结果试建立y 与x 之间的回归方程.(注意,a b 或,c k 计算结果保留整数) (3).由(2)中所得设z y x =+且[)4,x ∈∞,试求z 的最小值。
参考数据及公式如下:5123i ii x y==∑,55221121.3125,430i i i i x y ====∑∑,()()()1122211nniii ii i nniii i x x yy x ynxyb x x xnx ∧====---==--∑∑∑∑9、某校的研究性学习小组为了研究中学生的身高与性别情况,在该校随机抽出80名17至18周岁的学生,其中身高170≥的男生有30人,女生4人;身高<170的男生有10人。
(1)根据以上数据建立一个22⨯列联表:(2)请问在犯错误的概率不超过0.001的前提下,该校17至18周岁的学生的身高与性别是否有关?参考公式: 22()()()()()n ad bc K a b c d a c b d -=++++参考数据:10、随着共享单车的成功运营,更多的共享产品逐步走入大家的世界,共享汽车、共享篮球、共享充电宝等各种共享产品层出不穷.某公司随机抽取1000人对共享产品对共享产品是否对日常生活有益进行了问卷调查,并对参与调查的1000人中的性别以及意见进行了分类,得到的数据如下表所示:(Ⅰ)根据表中的数据,能否在犯错的概率不超过0.1%的前提下,认为对共享产品的态度与性别有关系?(Ⅱ)现按照分层抽样从认为共享产品增多对生活无益的人员中随机抽取6人,再从6人中随机抽取2人赠送超市购物券作为答谢,求恰有1人是女性的概率.参考公式:()()()()()22n ad bcKa b c d a c b d-=++++.临界值表:答案以及解析1答案及解析:答案:(1)由题设可知,0.085500200a =⨯⨯=,0.02550050b =⨯⨯=. (2)根据频率分布直方图可得,平均年龄为(27.50.0232.50.0237.50.0842.50.0647.50.02)538.5x =⨯+⨯+⨯+⨯+⨯⨯=&估计中位数:0.335538.750.4+⨯=. ` (3)因为第1,2,3组共有50+50+200=300人,利用分层抽样在300名学生中抽取6名学生,每组抽取的人数分别为: 第1组的人数为5061300⨯= 第2组的人数为5061300⨯= 第3组的人数为20064300⨯= 设第1组的1位同学为A ,第2组的1位同学为B ,第3组的4位同学为1234,,,C C C C , 则从六位同学中抽两位同学有:(,)A B ,1(,)A C ,2(,)A C ,3(,)A C ,4(,)A C ,1(,)B C ,2(,)B C ,3(,)B C ,4(,)B C ,12(,)C C ,13(,)C C ,14(,)C C ,23(,)C C ,24(,)C C ,34(,)C C ,共15种可能。
其中2人年龄都不在第3组的有:(,)A B ,共1种可能, 所以至少有1人年龄在第3组的概率为11411515-=. 解析:2答案及解析:答案:(1) ①35②0.300③100④1.000 频率分布直方图如下:(2)因为第3、4、5组共有60名学生,所以利用分层抽样在60名学生中抽取6名学生,每组分别为: 第3组:306360⨯=人, 第4组:206260⨯=人, 第5组:106160⨯=人, 所以第3、4、5组分别抽取3人、2人、1人。
解析:3答案及解析:答案:1.被调查人员年龄的频率分布直方图如图所示:被调查人员持赞成态度人的平均年龄约为42063084045096042.646849x ⨯+⨯+⨯+⨯+⨯=≈++++ (岁).2.设[)15,25中赞成的4人分别为1234,,,A A A A ,不赞成的1人为a ,[)45,55中赞成的4人分别为1234,,,B B B B ,不赞成的1人为b . 基本事件为:()()()()()111213141,,,,,,,,,,A B A B A B A B A b ()()()()()212223242,,,,,,,,,A B A B A B A B A b,()()()()31323334,,,,,,,,A B A B A B A B ()()()()()()3414243444,,,,,,,,,,,A b A B A B A B A B A b ,()()()()()1234,,,,,,,,,a B a B a B a B a b 基本事件共有55?25⨯=个,其中恰有1人持不赞成态度的基本事件为111148++++=个.据古典概型知:恰有1人持不赞成态度的概率825P =. 解析:4答案及解析: 答案:1.第二组的频数为1000.35? 35⨯=,故第三组的频数为100535201030----=,故第三组的频率为,第五组的频率为,补全后频率分布表为:频率分布直方图为:2.第三组、第四组、第五组的频率之比3:2:1,故第三组、第四组、第五组抽取的人数分别为3,2,1.3.设第三组中抽取的三人为123,,,A A A ,第四组中抽取的两人为12,B B ,第五组中抽取的一人为 C ,则6人中任意抽取两人,所有的基本事件如下:12132312212231321212312,,,,,,,,,,,,,A A A A A A A B A B A B A B A B B B AC A C A C B C B C ,故第三组中至少有1人被抽取的概率为124155P ==. 解析:5答案及解析:答案:1.由题可得,男生优秀人数为100(0.010.02)1030⨯+⨯=人, 女生优秀人数为100(0.0150.03)1045⨯+⨯=人. 2.因为样本容量与总体中的个体数的比是51304515=+,所以样本中包含男生人数为130215⨯=人,女生人数为145315⨯=人. 设两名男生为1A ,2A ,三名女生为1B ,2B ,3B .则从5人中任意选取2人构成的所有基本事件为: {}{}{}{}12111213,,,,,,,,A A A B A B A B{}{}{}{}{}{}212223121323,,,,,,,,,,,A B A B A B B B B B B B 共10个,每个样本被抽到的机会均等,因此这些基本事件的出现是等可能的.记事件 C :“选取的2人中至少有一名男生”,则事件 C 包含的基本事件有:{}{}1211,,,,A A A B{}{}{}{}{}1213212223,,,,,,,,,A B A B A B A B A B 共7个.所以7()10P C =, 即选取的2人中至少有一名男生的概率为710. 解析:1.由频率分布直方图可分别得到男生,女生优秀的频率,再乘以总人数100,即可得到男、女生优秀人数;2.构建有序实数对,用枚举法列举所有可能的情形和满足题意的情形,再利用古典概型的计算公式求解即可.6答案及解析: 答案:(1)因为1234 2.54x +++==,556971 85704у+++==,41155 269371 485746i ii x y==⨯+⨯+⨯+⨯=∑,4211491630i i x ==+++=∑,所以27464 2.5709.2304 2.5b -⨯⨯==-⨯$,$$709.2 2.547a y bx =-=-⨯=$. 因此,所求线性回归方程为$9.247y x =+。