2014届高三数学一轮突破单元检测训练:统计(通用版)

合集下载

高三上学期一轮复习数学单元过关检测--- 统计

高三上学期一轮复习数学单元过关检测--- 统计

综合检测一.选择题: (以下题目从4项答案中选出一项,每小题5分,共40分)1. 为了了解1200名学生对学校某项教改试验的意见,打算从中抽取一个容量为30的样本,考虑采用系统抽样,则分段的间隔(抽样距)K 为( )(A)40 (B)30 (C)20 (D)12[解析]A.[抽样距=40301200=] 2. 设有一个回归方程y=2-1.5x ,当变量x 增加一个单位时 ( )A .y 平均增加1.5个单位B .y 平均增加2个单位C .y 平均减少1.5个单位D .y 平均减少2个单位[解析]C3. (08东北师大附中)要完成下列2项调查:① 从某社区125户高收入家庭,280户中等收入家庭,95户低收入家庭中选出100户调查社会购买力的某项指标② 从某中学高一年级的12名体育特长生中选出3人调查学习负担情况. 应采用的抽样方法是A .①用随机抽样法②用系统抽样法B .①用分层抽样法②用随机抽样法C .①用系统抽样法②用分层抽样法D .①、②都用分层抽样法 [解析] B4. 由一组数据),(,),,(),,(2211n n y x y x y x 得到的回归直线bx a y +=ˆ,对于下列说法: ① 直线bx a y+=ˆ必过点),(y x ; ②直线bx a y+=ˆ中的∑∑∑∑∑=====--=n i ni i i n i n i ni i i i i x x n y x y x n b 1122111)())((;③直线bx a y+=ˆ中的a 与b 的关系为x b y a -=. 其中正确的说法有 ( ) A.0个 B.1个 C.2个 D.3个[解析]D5. 为研究变量x 和y 的线性相关性,甲、乙二人分别作了研究,利用线性回归方法得到回归直线方程1l 和2l ,两人计算知x 相同,y 也相同,则1l 与2l 的关系为 ( ) A .重合 B.平行 C .相交于点),(y x D. 无法判断 [解析] C6. 在抽查某产品尺寸的过程中,将其尺寸分成若干组,[]b a ,是其中一组,抽查出的个数在605040302010321参加人数活动次数该组上的频率为m ,该组上的直方图的高为h ,则[]b a -等于( ) (A)hm (B)m h (C)hm(D)与m,n 无关 7. (09四校联考)为了解一片经济林的生长情况,随机测量了其中100株树木的底部周长(单位:cm )。

高考数学一轮复习《统计》练习题(含答案)

高考数学一轮复习《统计》练习题(含答案)

高考数学一轮复习《统计》练习题(含答案)一、单选题1.已知条件p :11x -<<,q :x >m ,若p 是q 的充分不必要条件,则实数m 的取值范围是( ) A .[)1,-+∞B .(),1-∞-C .()1,0-D .(],1-∞-2.下表为随机数表的一部分:08015 17727 45318 22374 21115 78253 77214 77402 43236 00210 45521 64237已知甲班有60位同学,编号为00~59号,规定:利用上面的随机数表,从第1行第4列的数开始,从左向右依次读取2个数,则抽到的第8位同学的编号是( ) A .11B .15C .25D .373.一组数据的方差为()20S S ≥,将该组数据都乘以2,所得到的一组新数据的标准差为( )A .22S B .SC .2SD .2S4.甲、乙两所学校的男女生比例如图所示,已知甲校学生总数为1500,乙校学生总数为1000,下列结论错误的是( )A .甲校女生比乙校女生多B .乙校男生比甲校男生少C .乙校女生比甲校男生少D .甲校女生比乙校男生少5.某校共有学生3000人,为了解学生的身高情况,用分层抽样的方法从三个年级中抽取容量为100的样本,其中高一抽取40人,高二抽取30人,则该校高三学生人数为( ) A .600B .800C .900D .12006.设某高中的男生体重y (单位:kg )与身高x (单位:cm )具有线性相关关系,根据一组样本数据()(12)i i x y i n =,,,,,用最小二乘法建立的回归方程为ˆ0.8580.71y x =-,则下列结论中不正确的是( ) A .y 与x 有正的线性相关关系B .回归直线过样本点的中心(),x yC .若该高中某男生身高增加1cm ,则其体重约增加0.85kgD .若该高中某男生身高为170cm ,则可断定其体重必为63.79kg 7.x 是12100,,,x x x 的平均值,5为4120,,,x x x 的平均值,10为4142100,,,x x x 的平均值,则x =( ) A .8B .9C .15D .1528.某学校有男生400人,女生600人.为调查该校全体学生每天睡眠时间,采用分层抽样的方法抽取样本,计算得男生每天睡眠时间均值为7.5小时,方差为1,女生每天睡眠时间为7小时,方差为0.5.若男、女样本量按比例分配,则可估计总体方差为( ). A .0.45B .0.62C .0.7D .0.769.某样本点)()(,1,2,,i i x y i n =⋅⋅⋅的经验回归方程为ˆ0.50.7yx =+,当8x =时,y 的实际值为4.5,则当8x =时,预测值与实际值的差值为( ). A .0.1B .0.2C .0.3D .0.410.若数据9,m ,6,n ,5的平均数为7,方差为2,则数据11,9,21m -,17,21n -的平均数和方差分别为( ) A .13,4B .14,4C .13,8D .14,811.2021年起,我市将试行“3+1+2”的普通高考新模式,即除语文、数学、外语3门必选科目外,考生再从物理、历史中选1门,从化学、生物、地理、政治中选2门作为选考科目.为了帮助学生合理选科,某中学将高一每个学生的六门科目综合成绩按比例均缩放成5分制,绘制成雷达图.甲同学的成绩雷达图如图所示,下面叙述一定不正确的是( )A .甲的化学成绩领先年级平均分最多.B .甲有2个科目的成绩低于年级平均分.C .甲的成绩最好的前两个科目是化学和地理.D .对甲而言,物理、化学、地理是比较理想的一种选科结果.12.冬末春初,乍暖还寒,人们容易感冒发热,若发生群体性发热,则会影响到人们的身体健康,干扰正常工作生产,某大型公司规定:若任意连续7天,每天不超过5人体温高于37.3℃,则称没有发生群体性发热,下列连续7天体温高于37.3℃人数的统计特征数中,能判定该公司没有发生群体性发热的为( )(1)中位数为3,众数为2 (2)均值小于1,中位数为1(3)均值为3,众数为4 (4)均值为2 A .(1)(3)B .(3)(4)C .(2)(3)D .(2)(4)二、填空题13.某校高一、高二、高三年级的学生人数之比为5:5:4,现按年级用分层抽样的方法抽取若干人,若抽取的高三年级的学生人数为20,则抽取的样本容量为______.14.已知具有线性相关的变量x 、y ,设其样本点为()(1,2,,,8)i i i A x y i =,回归直线方程为1ˆ2yx b =+,若128(6,2)OA OA OA +++=(O 为原点),则b =_______.15.已知一组数据按顺序排列为:12,16,20,n ,46,51,58,60.若这组数据的第30百分位数的两倍与这组数据的第50百分位数相等,则n 的值为___________.16.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:由表中的数据得线性回归方程为y bx a =+,其中20b =-,预测当产品价格定为9.5(元)时,销量约为__________件.三、解答题17.某区政府组织了以“不忘初心,牢记使命”为主题的教育活动,为统计全区党员干部一周参与主题教育活动的时间,从全区的党员干部中随机抽取n 名,获得了他们一周参与主题教育活动时间(单位:h )的频率分布直方图如图所示,已知参与主题教育活动时间在(]12,16内的人数为92.(1)求n 的值;(2)以每组数据所在区间的中点值作为本组的代表,估算这些党员干部参与主题教育活动时间的中位数(中位数精确到0.01).(3)如果计划对参与主题教育活动时间在(]16,24内的党员干部给予奖励,且在(]16,20,(]20,24内的分别评为二等奖和一等奖,那么按照分层抽样的方法从获得一、二等奖的党员干部中选取5人参加社区义务宣讲活动,再从这5人中随机抽取2人作为主宣讲人,求这2人均是二等奖的概率.18.由于疫情影响,今年我们学校开展线上教学,高一年级某班班主任为了了解学生上网学习时间,对本班40名学生某天上网学习时间进行了调查,将数据(取整数)整理后,绘制出如图所示频率分布直方图,已知从左到右各个小组的频率分别是0.15,0.25,0.35,0.20,0.05,则根据直方图所提供的信息:(1)这一天上网学习时间在100~119分钟之间的学生有多少人?(2)估计这40位同学的线上平均学习时间(同一组中的数据用该组区间的中点值为代表)以及中位数分别是多少?(精确到0.1)(3)如果只用这40名学生这一天上网学习时间作为样本去推断该校高一年级全体学生该天的上网学习时间,这样推断是否合理?为什么?19.省政府坚持以习近平新时代中国特色社会主义思想为指导,落实全国、全省教育大会部署,坚持社会主义办学方向,落实立德树人根本任务,发展素质教育,推进育人方式变革,引导全社会树立科学的教育质量观和人才培养观,切实减轻有损中小学生身心健康的过重学业负担,遵循教育教学规律,促进中小学生健康成长,培养德智体美劳全面发展的社会主义建设者和接班人.从某市抽取1000名一年级小学生进行调查,统计他们每周做作业的时长(单位:小时),根据结果绘制的频率分布直方图如下:(1)根据频率分布直方图,求所有被抽查小学生每周做作业的平均时长和中位数;(同一组中的数据用该组区间的中点值作代表)(2)①为了进一步了解,现采用分层抽样的方法从[8,10]和[10,12]组中抽取50名学生,则两组各抽取多少人?②再利用分层抽样从抽取的50人中选5人参加一个座谈会.现从参加座谈会的5名学生中随机抽取两人发言,求[8,10]小组中恰有2人发言的概率?20.为了调查某地区高中女生的日均消费情况,研究人员随机抽取了该地区5000名高中女生作出调查,所得数据统计如下图所示.(1)求a 的值以及这5000名高中女生的日均消费的平均数(同一组数据用该组区间的中间值代替);(2)在样本中,现按照分层抽样的方法从该地区消费在[)15,20与[)20,25的高中女生中随机抽取9人,若再从9人中随机抽取3人,记这3人中消费在[)15,20的人数为X ,求X 的分布列以及数学期望.21.道德与法律的联系:法律、道德都是行为规范,都是为规范人们的行为而规定的行动准则.1.法律需要道德的奠基和撑持;2.道德的实施需要法律的强制保障.某校进行了一次道德与法律的相关测试(满分:100分),并随机抽取了50个统计其分数,得到的结果如下表所示: 成绩/分 [)0,20[)20,40[)40,60[)60,80[)80,100人数/个 44102210(1)若同一组数据用该区间中点值作代表,试估计这次测试的平均分和中位数(所得结果四舍五入保留整数);(2)假设处于[)20,40的4个人的成绩分别为20,26,35,38,求表中成绩的10%分位数; (3)以频率估计概率,若在这个学校中,随机挑选3人,记3人的成绩在[)80,100间的数量为随机变量X ,求X 的分布列和数学期望()E X .22.某校从高三年级学生中随机抽取100名学生的某次数学考试成绩,将其成绩分成[)50,60,[)60,70,[)70,80,[)80,90,[]90,100的5组,制成如图所示的频率分布直方图.(1)求图中x 的值;(2)估计这组数据的平均数;(3)若成绩在[)50,60内的学生中男生占40%.现从成绩在[)50,60内的学生中随机抽取2人进行分析,求2人中恰有1名女生的概率.23.某校从高三学生中选取了50名学生参加数学质量检测,成绩(单位:分)分组及各组的频数如下:[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.(1)列出频率分布表;(2)画出频率直方图及频率折线图.24.某农业科学研究所为检验某农作物种子的培育有效率,进行了如下试验:一是对该农作物的10000粒种子进行培育,发现有20粒种子未发芽;二是将未进行培育的该农作物的2500粒种子种植在5块试验田中,各试验田种植的种子数及未发芽数如下表:(1)求y 关于x 的回归直线方程; (2)在上述试验下,若以1nN-表示该农作物种子的培育有效率,其中n 为进行培育的10000粒种子的未发芽数,N 为依据上述回归方程估算的未进行培育的10000粒种子的未发芽数,请估计该农作物种子的培育有效率(结果保留3位有效数字).参考公式;在回归方程ˆˆˆy bx a =+中,1221ˆni ii nii x y nx ybxnx==-⋅=-∑∑,ˆˆa y bx=-参考答案1.D2.A3.D4.D5.C6.D7.A8.D9.B10.C11.A12.D 13.7014.18-##-0.12515.34 16.6017.(1)由已知可得,0.25(0.02500.04750.05000.0125)0.1150a =-+++=. 则0.1150492n ⨯⨯=,得922000.11504n ==⨯.(2)设中位数为x ,则0.050040.01254(16)0.11500.5x ⨯+⨯+-⨯=,得13.83x ≈.(3)按照分层抽样的方法从(16,20]内选取的人数为0.050540.05000.0125⨯=+,从(20,24]内选取的人数为0.0125510.05000.0125⨯=+.记二等奖的4人分别为a ,b ,c ,d ,一等奖的1人为A ,事件E 为“从这5人中抽取2人作为主宣讲人,且这2人均是二等奖”.从这5人中随机抽取2人的基本事件为(,)a b ,(,)a c ,(,)a d ,(,)a A ,(,)b c ,(,)b d ,(,)b A ,(,)c d ,(,)c A ,(,)d A ,共10种,其中2人均是二等奖的情况有(,)a b ,(,)a c ,(,)a d ,(,)b c ,(,)b d ,(,)c d ,共6种, 由古典概型的概率计算公式得()63105P E ==. 18.(1)因为频数=样本容量⨯频率,一天上网学习时间在100119分钟之间的学生所占频率为0.35,所以一天上网学习时间在100~119分钟之间的学生人数为400.3514⨯=(人) (2)40位同学的线上学习时间估计值为:0.1569.90.2589.90.35109.90.20129.90.05149.9104.9⨯+⨯+⨯+⨯+⨯=分钟在中位数左边和右边的小长方形的面积和是相等的,设在99.9~119.9靠近左侧长度为x ,则0.15+0.25+0.350.5x =解得0.27x ≈; 所以中位数估计值是99.9+0.27=100.17100.2≈(3)因为该样本的选取只在高一某班,不具有代表性,所以这样推断不合理. 19.(1)设抽查学生做作业的平均时长为x ,中位数为y ,0.0510.130.2550.370.1590.1110.0513 6.8x =⨯+⨯+⨯+⨯+⨯+⨯+⨯=, 0.050.10.250.15(6)0.5y y =+++⨯-=,解得203y =即抽查学生做作业的平均时长为6.8,中位数为203. (2)①[8,10]组的人数为10000.15150⨯=人,设抽取的人数为a ,[]10,12组的人数为10000.1100⨯=人, 设抽取的人数为b ,则50150100250a b ==,解得30a =,20b = 所以在[8,10]和[]10,12两组中分别抽取30人和20人,②再抽取5人,其中[8,10]和[]10,12两组中分别抽取3人和2人,将[8,10]组中被抽取的工作人员标记为1A ,2A ,3A ,将[]10,12中的标记为1B ,2B . 设事件C 表示从[8,10]小组中恰好抽取2人,则抽取的情况如下:{}12,A A ,{}13,A A ,{}11,A B ,{}12,A B ,{}23,A A ,{}21,A B ,{}22,A B ,{}31,A B ,{}32,A B ,{}12,B B 共10种情况;其中在[8,10]中恰好抽取2人有3种,则3()10P C =. 20.(1)由题意得,()20.040.080.0651a +++⨯=,解得0.01a =,故所求平均数为17.50.427.50.332.50.0537.50.0524.25⨯0.2+22.5⨯+⨯+⨯++=(元); (2)由题意得,消费在[)15,20,[)20,25的高中女生分别有3人和6人,故X 的可能取值为0,1,2,3,∴()6033395021C C P X C ===,()21633915128C C P X C ===,()1263393214C C P X C ===,()0363391384C C P X C ===, 故X 的分布列为:∴()515310123121281484E X =⨯+⨯+⨯+⨯=; 故答案为:1. 21.(1)估计这次测试的平均分为1043045010702290106250x ⨯+⨯+⨯+⨯+⨯==(分);设这次测试的中位数为0x ,显然()060,80x ∈,则060441022200.550x -+++⋅=,解得066x ≈(分). 即估计这次测试的中位数为66.(2)由于5010%5⨯=,所以表中成绩的10%分位数为2026232+=. (3)X 所有可能取值为0,1,2,3.由表中数据可知,任意挑选一人,成绩在[)80,100间的概率为101505=. 所以()346405125P X ⎛⎫=== ⎪⎝⎭,()21341481C 55125P X ⎛⎫=== ⎪⎝⎭, ()122341122C 55125P X ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭,()31135125P X ⎛⎫=== ⎪⎝⎭, 故X 的分布列为故X 的数学期望()6448121301231251251251255E X =⨯+⨯+⨯+⨯=. 22.(1)由频率分布直方图得()0.0050.0350.0300.010101x ++++⨯=,解得0.020x =, 所以图中x 的值是0.020.(2)由频率分布直方图得这组数据的平均数: (550.005650.020750.03585x =⨯+⨯+⨯+⨯)0.030950.0101077+⨯⨯=, 所以这组数据的平均数为77.(3)数学成绩在[)50,60内的人数为0. 005101005⨯⨯=(人),其中男生人数为540%2⨯=(人),则女生人数为3人,记2名男生分别为1A ,2A ,3名女生分别为1B ,2B ,3B ,从数学成绩在[)50,60内的5人中随机抽取2人进行分析的基本事件为:121112132122A A A B A B A B A B A B ,,,,,,23121323A B B B B B B B ,,,,共10个不同结果,它们等可能, 其中2人中恰有1名女生的基本事件为111213212223,,,,,A B A B A B A B A B A B ,共6种结果, 所以2人中恰有1名女生的概率为为63105=. 23.(1)解:频率分布表如下:(2) 频率直方图及频率折线图如图所示.24. (1)依题意,3004005006007005005x ++++==,2466755y ++++==, 513002400450066006700713700ii i x y ==⋅+⋅+⋅+⋅+⋅=∑, 52222221(34567)100001350000i i x==++++⋅=∑, 于是得512252113700550051200ˆ0.01213500005500100000i ii i i x y nx y b x nx==-⋅-⋅⋅====-⋅-∑∑,ˆˆ50.0125001ay bx =-=-⨯=-, 所以y 关于x 的回归直线方程为ˆ0.0121yx =-; (2)由(1)知,估计未进行培育的10000粒种子的未发芽数N 约为:ˆ0.012100001119y =⨯-=,而已培育的10000粒种子有20粒种子未发芽,即20n =, 所以该农作物种子的培育有效率为209910832119119-=≈。

(全国卷)2014届高考数学 专题阶段评估模拟卷6 概率与统计 文

(全国卷)2014届高考数学 专题阶段评估模拟卷6 概率与统计 文

专题阶段评估(六) 概率与统计—————————————————————————————————【说明】 本试卷分为第Ⅰ、Ⅱ卷两部分,请将第Ⅰ卷选择题的答案填入答题格内,第Ⅱ卷可在各题后直接作答,共150分,考试时间120分钟.第Ⅰ卷 (选择题 共60分)只有一项是符合题目要求的)1.某地区高中分三类,A 类学校共有学生2 000人,B 类学校共有学生3 000人,C 类学校共有学生4 000人,若采取分层抽样的方法抽取900人,则A 类学校中的学生甲被抽到的概率为( )A.110B .920C .12 000D .122.(2013·某某卷)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )A.08 C .02D .013.(2013·全国新课标卷Ⅰ)从1,2,3,4中任取2个不同的数,则取出的2个数之差的绝对值为2的概率是( )A.12 B .13 C .14D .164.在样本的频率分布直方图中,共有11个小长方形,若中间一个长方形的面积等于其他10个小长方形面积和的14,且样本容量为160,则中间一组的频数为( )A .32B .0.2C .40D .0.255.某校为了研究学生的性别和对待某一活动的态度(支持和不支持的两种态度)的关系,运用2×2列联表进行独立性检验,经计算K 2=7.069,则所得到的统计学结论是:有________的把握认为“学生性别与支持该活动有关系”( )附:P (K 2≥k 0)0.100 0.050 0.025 0.010 0.001 k 02.7063.8415.0246.63510.828% B .1% C .99%D .99.9%6.(2013·某某市模拟考试)某苗圃基地为了解基地内甲、乙两块地种植的同一种树苗的长势情况,从两块地各随机抽取了10株树苗,用茎叶图表示上述两组数据,对两块地抽取树苗的高度的平均数x 甲、x 乙和中位数y 甲、y 乙进行比较,下面结论正确的是( )A.x 甲>x 乙,y 甲>y 乙 B .x 甲<x 乙,y 甲<y 乙 C.x 甲<x 乙,y 甲>y 乙D .x 甲>x 乙,y 甲<y 乙7.连续抛掷两枚正方体骰子(它们的六个面分别标有数字1,2,3,4,5,6),记所得朝上的面的点数分别为x ,y ,过坐标原点和点P (x ,y )的直线的倾斜角为θ,则θ>60°的概率为( )A.14 B .34 C .12D .168.下面茎叶图表示的是甲、乙两人在5次综合测评中的成绩,其中一个数字被污损,则甲的平均成绩超过乙的平均成绩的概率为( )A.25 B .710 C .45 D .9109.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程y ∧=3-5x ,变量x 增加一个单位时,y 平均增加5个单位;③线性回归方程y ∧=b ∧x +a ∧必过(x ,y );④在一个2×2列联表中,由计算得K 2=13.079,则有99%的把握确认这两个变量间有关系.其中错误的个数是( ) A .0 B .1 C .2D .3本题可以参考独立性检验临界值表:P (K 2≥k )0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001k 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.87910.82810.由不等式组⎩⎪⎨⎪⎧x -y +5≥0,y ≥t ,0≤x ≤2,围成的三角形区域内有一个内切圆,向该三角形区域内随机投一个点,该点落在圆内的概率是关于t 的函数P (t ),则( )A .P ′(t )>0B .P ′(t )<0C .P ′(t )=0D .P ′(t )符号不确定11.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差12.(2013·某某三市三模)在区间[-π,π]内随机取两个数分别为a ,b ,则使得函数f (x )=x 2+2ax -b 2+π2有零点的概率为( )A .1-π8B .1-π4C .1-π2D .1-3π4第Ⅱ卷 (非选择题 共90分)题 号 第Ⅰ卷 第Ⅱ卷 二 17 18 19 20 21 22 总 分 得 分二、填空题(本大题共4小题,每小题4分,共16分.把答案填在题中的横线上) 13.高三(1)班共有56人,学号依次为1,2,3,…,56,现用系统抽样的办法抽取一个容量为4的样本,已知学号为6,34,48的同学在样本中,那么还有一个同学的学号应为________.14.(2012·某某卷)右图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的X 围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.15.(2013·某某省名校联考)一个袋子中装有六个大小形状完全相同的小球,其中一个编号为1,两个编号为2,三个编号为3.现从中任取一球,记下编号后放回,再任取一球,则两次取出的球的编号之和等于4的概率是________.16.若从集合⎩⎨⎧⎭⎬⎫13,14,3,4中随机抽取一个数记为a ,从集合{-1,1,-2,2}中随机抽取一个数记为b ,则函数f (x )=a x+b (a >0,a ≠1)的图象经过第三象限的概率是________.三、解答题(本大题共6小题,共74分.解答应写出必要的文字说明、证明过程或演算步骤)17.(本小题满分12分)已知A 、B 、C 三个箱子中各装有两个完全相同的球,每个箱子里的球,有一个球标着1,另一个球标着2.现从A 、B 、C 三个箱子中各摸出一个球.(1)若用数组(x ,y ,z )中的x 、y 、z 分别表示从A 、B 、C 三个箱子中摸出的球的,请写出数组(x ,y ,z )的所有情形,并回答一共有多少种;(2)如果请您猜测摸出的这三个球的之和,猜中有奖.那么猜什么数获奖的可能性最大?请说明理由.18.(本小题满分12分)(2013·某某卷)某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示,其中茎为十位数,叶为个位数.(1)根据茎叶图计算样本均值.(2)日加工零件个数大于样本均值的工人为优秀工人.根据茎叶图推断该车间12名工人中有几名优秀工人?(3)从该车间12名工人中,任取2人,求恰有1名优秀工人的概率.19.(本小题满分12分)(2013·某某市质量预测)某高校组织自主招生考试,共有2 000名优秀同学参加笔试,成绩均介于195分到275分之间,从中随机抽取50名同学的成绩进行统计,将统计结果按如下方式分成8组:第1组[195,205),第2组[205,215),…,第8组[265,275].如图是按上述分组方法得到的频率分布直方图,且笔试成绩在260分(含260分)以上的同学进入面试.(1)估计所有参加笔试的2 000名同学中,参加面试的同学人数;(2)面试时,每位同学抽取两个问题,若两个问题全答错,则不能取得该校的自主招生资格;若两个问题均回答正确且笔试成绩在270分以上,则获A 类资格;其他情况下获B 类资格.现已知某中学有两人获得面试资格,且仅有一人笔试成绩为270分以上,在回答两个面试问题时,两人对每一个问题正确回答的概率均为12,求恰有一名同学获得该高校B 类资格的概率.20.(本小题满分12分)(2013·某某市调研)某车间将10名技工平均分成甲、乙两组加工某种零件,在单位时间内每个技工加工的合格零件数如下表:(1)在单位时间内加工的合格零件的方差,并由此分析两组技工的加工水平;(2)质检部门从该车间甲、乙两组中各随机抽取一名技工,对其加工的零件进行检测,若2人加工的合格零件个数之和超过14,则称该车间“质量合格”,求该车间“质量合格”的概率.21.(本小题满分13分)甲、乙两所学校高三年级分别有1 200人,1 000人,为了了解两所学校全体高三年级学生在该地区六校联考的数学成绩情况,采用分层抽样方法从两所学校一共抽取了110名学生的数学成绩,并作出了频数分布统计表如下:甲校:频数15x 3 2乙校:分组[70,80)[80,90)[90,100)[100,110)频数1289分组[110,120)[120,130)[130,140)[140,150]频数1010y 3(1)计算x,y的值;(2)若规定考试成绩在[120,150]内为优秀,请分别估计两所学校数学成绩的优秀率;(3)由以上统计数据填写下面的2×2列联表,并判断能否在犯错误的概率不超过0.10的前提下认为两所学校的数学成绩有差异.甲校乙校总计优秀非优秀总计参考数据与公式:由列联表中数据计算K2=n ad-bc2a+b c+d a+c b+d.临界值表P(K2≥k0)0.100.050.010k0 2.706 3.841 6.63522.(本小题满分13分)设f(x)和g(x)都是定义在同一区间上的两个函数,若对任意x ∈[1,2],都有|f(x)+g(x)|≤8,则称f(x)和g(x)是“友好函数”,设f(x)=ax,g(x)=bx.(1)若a∈{1,4},b∈{-1,1,4},求f(x)和g(x)是“友好函数”的概率;(2)若a∈[1,4],b∈[1,4],求f(x)和g(x)是“友好函数”的概率.详解答案 一、选择题1.A 利用分层抽样,每个学生被抽到的概率是相同的,故所求的概率为9002 000+3 000+4 000=110,故选A.2.D 由随机数表法的随机抽样的过程可知选出的5个个体是08,02,14,07,01,所以第5个个体的编号是01.3.B 从1,2,3,4中任取2个不同的数,有(1,2),(1,3),(1,4),(2,1),(2,3),(2,4),(3,1),(3,2),(3,4),(4,1),(4,2),(4,3),共12种情形,而满足条件“2个数之差的绝对值为2”的只有(1,3),(2,4),(3,1),(4,2),共4种情形,所以取出的2个数之差的绝对值为2的概率为412=13.4.A 设中间的长方形面积为x ,则其他的10个小长方形的面积为4x ,所以可得x +4x =1,得x =0.2;又因为样本容量为160,所以中间一组的频数为160×0.2=32,故选A.5.C 因为7.069与附表中的6.635最接近,所以得到的统计学结论是:有1-0.010=0.99=99%的把握认为“学生性别与支持该活动有关系”.6.B 从茎叶图看出乙地树苗高度的平均数大于甲地树苗高度的平均数,乙地树苗高度的中位数是35.5,甲地树苗高度的中位数是27.7.A 基本事件总数为6×6=36种.θ>60°的必须是y x=tan θ>3,则这样的基本事件有(1,2),(1,3),…,(1,6),(2,4),(2,5),(2,6),(3,6),共9种.所以概率为936=14.8.C 记其中被污损的数字为x ,依题意得甲的5次综合测评的平均成绩是15(80×2+90×3+8+9+2+1+0)=90,乙的5次综合测评的平均成绩是15(80×3+90×2+3+3+7+x +9)=15(442+x ),令90>15(442+x ),由此解得x <8,即x 的可能取值为0~7,因此甲的平均成绩超过乙的平均成绩的概率为810=45.9.B ①根据方差的计算公式可知命题正确;②错,应为减少5个单位;③正确,这是回归直线方程满足的一个重要性质;④结合给出的数表,易知命题正确,故只有②是错误的.10.C 若围成三角形,则只可能恒为等腰直角三角形,内切圆半径r =(7-t )-22(7-t ),∴P (t )=π⎝ ⎛⎭⎪⎫2-2227-t 2127-t 2=π2(2-2)2,该值与t 无关,所以P ′(t )=0. 11.C 由条形统计图知:甲射靶5次的成绩分别为:4,5,6,7,8; 乙射靶5次的成绩分别为:5,5,5,6,9,所以x 甲=4+5+6+7+85=6;x 乙=5+5+5+6+95=6.所以x 甲=x乙.故A 不正确.甲的成绩的中位数为6,乙的成绩的中位数为5,故B 不正确.s 2甲=15[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=15×10=2,s 2乙=15[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=15×12=125,因为2<125,所以s 2甲<s 2乙.故C 正确.甲的成绩的极差为:8-4=4,乙的成绩的极差为:9-5=4, 故D 不正确.故选C.12.B 函数f (x )=x 2+2ax -b 2+π2有零点,需Δ=4a 2-4(-b 2+π2)≥0,即a 2+b 2≥π2成立.而a ,b ∈[-π,π],建立平面直角坐标系,满足a 2+b 2≥π2的点(a ,b )如图阴影部分所示,所求事件的概率为P =2π×2π-π32π×2π=4π2-π34π2=1-π4,故选B.二、填空题13.解析: 从56人中抽取一个容量为4的样本,用系统抽样抽取的间隔为564=14,又因为学号为6,34,48的同学在样本中,可知初次抽取的学号为6,还有一个同学的学号应为6+14=20.答案: 2014.解析: 设样本容量为n ,则n ×(0.1+0.12)×1=11,所以n =50,故所求的城市数为50×0.18×1=9. 答案: 915.解析: 列举可知,共有36种情况,和为4的情况有10种,所以所求概率P =1036=518.答案:51816.解析: (b ,a )的所有可能情况有:⎝ ⎛⎭⎪⎫-1,13,⎝ ⎛⎭⎪⎫-1,14,(-1,3),(-1,4);⎝ ⎛⎭⎪⎫1,13,⎝ ⎛⎭⎪⎫1,14,(1,3),(1,4);…;⎝ ⎛⎭⎪⎫2,13,⎝ ⎛⎭⎪⎫2,14,(2,3),(2,4),共16种.由于函数f (x )的图象经过第三象限,因此,0<a <1,b <-1或a >1,b <0,因此满足条件的(b ,a )有:(-1,3),(-1,4),⎝ ⎛⎭⎪⎫-2,13,⎝ ⎛⎭⎪⎫-2,14,(-2,3),(-2,4),共6种.根据古典概型的概率计算公式可得P =616=38.答案: 38三、解答题17.解析: (1)数组(x ,y ,z )的所有情形为:(1,1,1),(1,1,2),(1,2,1),(1,2,2),(2,1,1),(2,1,2),(2,2,1),(2,2,2),共8种.(2)记“所摸出的三个球的之和为i ”为事件A i (i =3,4,5,6),易知事件A 3的基本结果有1种,事件A 4的基本结果有3种,事项A 5的基本结果有3种,事件A 6的基本结果有1种,所以,P (A 3)=18,P (A 4)=38,P (A 5)=38,P (A 6)=18.所以所摸出的三个球的之和为4,为5的概率相等且最大. 故猜4或5获奖的可能性最大.18.解析: (1)由茎叶图可知,样本数据为17,19,20,21,25,30,则x =16(17+19+20+21+25+30)=22,故样本均值为22.(2)日加工零件个数大于样本均值的工人有2名,故优秀工人的频率为26=13,该车间12名工人中优秀工人大约有12×13=4(名),故该车间约有4名优秀工人.(3)记“恰有1名优秀工人”的事件A ,其包含的基本事件总数为4×8=32,所有基本事件的总数为12×112=66,由古典概型概率公式,得P (A )=3266=1633.所以恰有1名优秀工人的概率为1633.19.解析: (1)设第i (i =1,2,…,8)组的频率为f i ,则由频率分布直方图知f 7=1-(0.004+0.01+0.01+0.02+0.02+0.016+0.008)×10=0.12.所以成绩在260分以上的同学的概率P ≈f 72+f 8=0.14,∴2 000×0.14=280,故这2 000名同学中,取得面试资格的约为280人.(2)不妨设两名同学分别为M ,N ,且M 的笔试成绩在270分以上,则对于M ,答题的可能有M 11,M 10,M 01,M 00,对于N ,答题的可能有N 11,N 10,N 01,N 00,其中角标中的1表示正确,0表示错误,如N 10表示N 同学第一题正确,第二题错误.将两名同学的答题情况列表如下:表中AB 表示M 获A N 没有获得资格. 所以恰有一名同学获得该高校B 类资格的概率为816=12.20.解析: (1)由甲组技工在单位时间内加工的合格零件平均数x 甲=15(4+5+x +9+10)=7,得x =7.由乙组技工在单位时间内加工的合格零件平均数x 乙=15(5+6+7+y +9)=7,得y =8.甲组方差s 2甲=15[(4-7)2+(5-7)2+(7-7)2+(9-7)2+(10-7)2]=5.2.乙组方差s 2乙=15[(5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2]=2.∵x 甲=x 乙,s 2甲>s 2乙,∴两组技工水平基本相当,乙组更稳定些.(2)从甲、乙两组中各随机抽取一名技工,加工的合格零件个数包含的基本事件为(4,5),(4,6),(4,7),(4,8),(4,9),(5,5),(5,6),(5,7),(5,8),(5,9),(7,5),(7,6),(7,7),(7,8),(7,9),(9,5),(9,6),(9,7),(9,8),(9,9),(10,5),(10,6),(10,7),(10,8),(10,9),共25个.而车间“质量合格”包含的基本事件为(7,8),(7,9),(9,6),(9,7),(9,8),(9,9),(10,5),(10,6),(10,7),(10,8),(10,9),共11个,因此,所求概率P =1125,即该车间“质量合格”的概率为1125.21.解析: (1)从甲校抽取110× 1 2001 200+1 000=60(人),从乙校抽取110× 1 0001 200+1 000=50(人),故x =10,y =7.(2)估计甲校数学成绩的优秀率为1560×100%=25%,乙校数学成绩的优秀率为2050×100%=40%.(3)表格填写如图,甲校 乙校 总计 优秀 15 20 35 非优秀 45 30 75 总计6050110K 2的观测值k =110×15×30-20×45260×50×35×75≈2.829>2.706,故在犯错误的概率不超过0.10的前提下认为两个学校的数学成绩有差异. 22.解析: (1)设事件A 表示f (x )和g (x )是“友好函数”, 则|f (x )+g (x )|(x ∈[1,2])所有的情况有:x -1x ,x +1x ,x +4x ,4x -1x ,4x +1x ,4x +4x, 共6种且每种情况被取到的可能性相同. 又当a >0,b >0时,ax +b x 在⎝ ⎛⎭⎪⎫0, b a 上递减, 在⎝ ⎛⎭⎪⎫b a ,+∞上递增;x -1x 和4x -1x在(0,+∞)上递增, ∴对x ∈[1,2]可使|f (x )+g (x )|≤8恒成立的有x -1x ,x +1x ,x +4x ,4x -1x,故事件A包含的基本事件有4种,∴P (A )=46=23,故所求概率是23.(2)设事件B 表示f (x )和g (x )是“友好函数”,∵a 是从区间[1,4]中任取的数,b 是从区间[1,4]中任取的数, ∴点(a ,b )所在区域是长为3,宽为3的矩形区域.要使x ∈[1,2]时,|f (x )+g (x )|≤8恒成立,需f (1)+g (1)=a +b ≤8且f (2)+g (2)=2a +b2≤8, ∴事件B 表示的点的区域是如图所示的阴影部分. ∴P (B )=12×⎝ ⎛⎭⎪⎫2+114×33×3=1924,故所求概率是1924.。

2014届湖南省农业大学附中高考数学一轮复习单元训练:《统计》(新人教A版) Word版含解析

2014届湖南省农业大学附中高考数学一轮复习单元训练:《统计》(新人教A版) Word版含解析

高考数学一轮复习单元训练:统计本试卷分第Ⅰ卷(选择题)和第Ⅱ卷(非选择题)两部分.满分150分.考试时间120分钟.第Ⅰ卷(选择题 共60分)一、选择题 (本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.甲,乙两个工人在同样的条件下生产,日产量相等,每天出废品的情况如下表所列,则有结论( )A .甲的产品质量比乙的产品质量好一些B .乙的产品质量比甲的产品质量好一些C .两人的产品质量一样好D .无法判断谁的质量好一些 【答案】B2.已知一组数1234,,,,x x x x 的平均数是5x =,方差24s =,则数据123421,21,21,21x x x x ++++的平均数和方差分别是( )A .11,8B .10,8C .11,16D .10,16【答案】C3.下列四个判断:①某校高三一班和高三二班的人数分别是,m n ,某次测试数学平均分分别是,a b ,则这两个班的数学平均分为2a b+; ②10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a ,中位数为b ,众数为c ,则有b a c >>;③从总体中抽取的样本11221111(,),(,),,(,),,n nn n i i i i x y x y x y x x y y n n ====∑∑ 若记,则回归直线y =bx a +必过点(,x y )④已知ξ服从正态分布(0N ,2)σ,且(20)0.4P ξ-≤≤=,则(2)0.2P ξ>= 其中正确的个数有( )A .3个B . 2 个C .1 个D .0个【答案】C4.根据三个点(3,10),(7,20),(11,24)的坐标数据,求得的回归直线方程是( )A .75.175.5ˆ+-=x yB .75.175.5ˆ-=x yC .75.575.1ˆ+=x yD . 75.575.1ˆ+-=x y【答案】C5.某工厂生产A 、B 、C 三种不同型号的产品,产品的数量之比依次为2:3:5,现用分层抽样的方法抽出样本容量为80的样本,那么应当从A 型产品中抽出的件数为( ) A . 16 B . 24 C . 40 D . 160 【答案】A6.已知x 与y 之间的几组数据如下表:则y 与x 的线性回归方程 y bx a =+必过( )A .()1,3B .()2,5C .()1.5,4D .()3,7【答案】C7.已知x 、y 的取值如下表所示:若y 与x 线性相关,且ˆ0.95yx a =+,则a =( )A .2.2B .2.9C .2.8D .2.6【答案】D8.人的年龄x 与人体脂肪含量的百分数y 的回归方程为0.5770.448y x ∧=-,如果某人36 岁,那么这个人的脂肪含量( ) A .一定20.3% B .在20.3%附近的可能性比较大 C .无任何参考数据 D .以上解释都无道理 【答案】B9.某单位共有老、中、青职工430人,其中青年职工160人,中年职工人数是老年职工人数的2倍.为了解职工的身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为( ) A .7 B .9 C .18 D .36 【答案】C10.一位母亲记录了她的儿子3~9岁的身高数据,并由此建立身高与年龄的回归模型为y =7.19x+73.93,用这个模型预测她的儿子10岁时的身高,则正确的叙述是( ) A .身高一定是145.83 cm B .身高在145.83 cm 以上 C .身高在145.83 cm 左右 D .身高在145.83 cm 以下 【答案】C11.为了考查两个变量x 和y 之间的线性相关性,甲、乙两位同学各自独立做了13次和26次试验,并利用线性回归方法,求得回归直线分别为1l 和2l ,已知两人所得的数据中,变量x 和y 的数据的平均值均相等,且分别是m ,n ,那么下列说法正确的是( ) A .直线1l 和2l 一定有公共点),(n m B .直线1l 和2l 相交,但交点不一定是),(n m C .必有21//l lD .直线1l 与2l 重合【答案】A12.某学校为了调查高三年级的200名文科学生完成课后作业所需时间,采取了两种抽样调查的方式:第一种由学生会的同学随机抽取20名同学进行调查;第二种由教务处对该年级的文科学生进行编号,从001到200,抽取学号最后一位为2的同学进行调查,则这两种抽样的方法依次为( )A .分层抽样,简单随机抽样B .简单随机抽样, 分层抽样C .分层抽样,系统抽样D .简单随机抽样,系统抽样 【答案】D第Ⅱ卷(非选择题 共90分)二、填空题 (本大题共4个小题,每小题5分,共20分,把正确答案填在题中横线上) 13.为了解学生数学答卷情况,某市教育部门在高三某次测试后抽取了n 名同学的第Ⅱ 卷进行调查,并根据所得数据画出了样本的频率分布直方图(如右图),已知从左到右第三小组(即[70,80)内)的频数是50,则n =______.【答案】12514.已知x 与y 之间的一组数据为则y 与x 的回归直线方程a x b y ˆˆˆ+=为____________75313210yx【答案】12ˆ-=x y15.某班级有50名学生,现要采取系统抽样的方法在这50名学生中抽出10名学生,将这50名学生随机编号1~50号,并分组,第一组1~5号,第二组6~10号,……,第十组46~50号,若在第三组中抽得号码为12的学生,则在第八组中抽得号码为 的学生。

2014高考数学一轮复习单元练习--统计案例

2014高考数学一轮复习单元练习--统计案例

2014高考数学一轮复习单元练习--统计案例I 卷一、选择题1. 在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是( )A .总偏差平方和B .残差平方和C .回归平方和D .相关指数R 2【答案】B2.对于线性相关系数r ,下列说法正确的是( )A .|r |∈(-∞,+∞),|r |越大,相关程度越大;反之,相关程度越小B .|r |≤1,r 越大,相关程度越大;反之,相关程度越小C .|r |≤1,且|r |越接近于1,相关程度越大;|r |越接近于0,相关程度越小D .以上说法都不正确 【答案】C3.某化工厂为预测产品的回收率y ,需要研究它和原料有效成分含量x 之间的相关关系,现取8对观测值计算,得∑i =18x i =52,∑i =18y i =228,∑i =18x 2i =478,∑i =18x i y i =1849,则其回归直线方程为()A .=11.47+2.62xB .=-11.47+2.62xC .=2.62+11.47xD .=11.47-2.62x 【答案】A4.已知两个变量x 和y 之间具有线性相关性,甲、乙两个同学各自独立地做了10次和15次试验,并且利用线性回归的方法求得回归直线分别为l 1和l 2.已知两个人在试验中发现对变量x 的观测数据的平均数都为s ,对变量y 的观测数据的平均数都是t ,则下列说法正确的是( ) A .l 1与l 2可能有交点(s ,t )B .l 1与l 2相交,但交点一定不是(s ,t )C .l 1与l 2必定平行D .l 1与l 2必定重合 【答案】A5. 在画两个变量的散点图时,下面哪个叙述是正确的( )A .预报变量在x 轴上,解释变量在y 轴上B .解释变量在x 轴上,预报变量在y 轴上C .可以选择两个变量中任意一个变量在x 轴上D .可以选择两个变量中任意一个变量在y 轴上【答案】B6.对两个分类变量A 、B 的下列说法中正确的个数为( ) ①A 与B 无关,即A 与B 互不影响;②A 与B 关系越密切,则K 2的值就越大;③K 2的大小是判定A 与B 是否相关的唯一依据A .1B .2C .3D .4 【答案】A7.身高与体重有关系可以用( )分析来分析.( )A .残差B .回归C .二维条形图D .独立检验 【答案】A8.某校举行演讲比赛,9位评委给选手A 打出的分数如茎叶图所示,统计员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清,若统计员计算无误,则数字x 应该是( )A .5B .4C .3D .2【答案】D9. 两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数2R 如下 ,其中拟合效果最好的模型是( )A .模型1的相关指数2R 为0.98 B .模型2的相关指数2R 为0.80 C .模型3的相关指数2R 为0.50D .模型4的相关指数2R 为0.25 【答案】A10.在两个变量y 与x 的回归模型中,分别选择了4个不同的模型,它们的相关指数R 2如下,其中拟合效果最好的模型是( )A .模型1的相关指数R 2为0.98B .模型2的相关指数R 2为0.90C .模型3的相关指数R 2为0.60D .模型4的相关指数R 2为0.25 【答案】A11. 已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线方程为( )A . 1.234y x =+B . 1.235y x =+C . 1.230.08y x =+D . 0.08 1.23y x =+【答案】C12.给出假设0H ,下列结论中不能对0H 成立与否作出明确判断的是( )A . 22.535χ=B . 27.723χ=C . 210.321χ=D . 220.125χ=【答案】AII卷二、填空题13.对于回归方程=4.75x+257,当x=28时,的估计值是________.【答案】39014.下列说法:①回归方程适用于一切样本和总体;②样本取值的范围会影响回归方程的适用范围;③回归方程得到的预报值,是预报变量的精确值.其中正确的是________.【答案】②15①种子经过处理跟是否生病有关;②种子经过处理跟是否生病无关;③种子是否经过处理决定是否生病.【答案】①②③16【答案】95%三、解答题17.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表.试问能以多大把握认为婴儿的性别与出生时间有关系?【答案】K2=89×(24×26-31×8)255×34×32×57≈3.689<3.841,所以有90%的把握认为“婴儿的性别与出生时间有关”.18.某农场对单位面积化肥用量x(kg)和水稻相应产量y(kg)的关系作了统计,得到数据如下:如果x与y之间具有线性相关关系,求出回归直线方程,并预测当单位面积化肥用量为32kg时水稻的产量大约是多少?(精确到0.01kg)【答案】列表如下:x=17×210=30y=17×2795≈399.3=87175-7×30×399.37000-7×302≈4.746=399.3-4.746×30=256.92y对x的回归直线方程为=256.92+4.746x当x=32时,=256.92+4.746×32≈408.79答:回归直线方程为=256.92+4.746x,当单位面积化肥用量为32kg时,水稻的产量约为408.79kg. 19.为了研究三月下旬的平均气温(x)与四月二十号前棉花害虫化蛹高峰日(y)的关系,某地区观察了2005年至2010年的情况,得到下面的数据:据气象预测,该地区在2011年三月下旬平均气温为27℃,试估计2011年四月化蛹高峰日为哪天?【答案】x=16∑i=16x i=19.13,y=16∑i=16y i=7.5,=5130.92,∑i =16x i y i =1222.6,∴=∑i =16x i y i -6x y∑i =16x 2i -6x2=-2.2,=y -x =7.5-(-2.2)×29.13=71.6.∴回归直线方程=-2.2x +71.6.当x =27时,=-2.2×27+71.6=12.2.据此,可估计该地区2011年4月12日或13日为化蛹高峰日. 20. 假设关于某设备的使用年限x 和所支出的维修费用y (万元),有如下的统计资料:若由资料可知y 对x 呈线性相关关系试求: (1)线性回归方程;(2)估计使用年限为10年时,维修费用是多少? 【答案】(1)列表如下:于是23.145905453.112552251251=⨯-⨯⨯-=--=∑∑==xx yx yx bi i i ii ,08.0423.15=⨯-=-=bx y a∴线性回归方程为:08.023.1^+=+=x a bx y (2)当x=10时,38.1208.01023.1^=+⨯=y (万元)即估计使用10年时维修费用是1238万元21.在研究某种新措施对猪白痢的防治效果问题时,得到了以下数据:试判断新措施对防治猪白痢是否有效?【答案】由列联表可知,a=132,b=18,c=114,d=36,a+b=150,c+d=150,a+c=246,b+d=54,n=300,代入K2=n(ad-bc)2(a+b)(a+c)(c+d)(b+d),得K2=300×(132×36-18×114)2150×150×54×246≈7.317,由于K2≈7.317>6.635,因此我们有99%的把握认为新措施对预防猪白痢是有效的.22.某中学将100名高一新生分成水平相同的甲、乙两个“平行班”,每班50人.陈老师采用A、B两种不同的教学方式分别在甲、乙两个班级进行教改实验.为了了解教学效果,期末考试后,陈老师分别从两个班级中各随机抽取20名学生的成绩进行统计,作出茎叶图如下.记成绩不低于90分者为“成绩优秀”.(1)在乙班样本中的20个个体中,从不低于86分的成绩中随机抽取2个,求抽出的两个均“成绩优秀”的概率;(2)由以上统计数据填写下面列联表,并判断是否有90%的把握认为:“成绩优秀”与教学方式有关.附:χ2=n n11n22-n12n212 n1+n2+n+1n+2【答案】(1)设“抽出的两个均‘成绩优秀’”为事件A.从不低于86分的成绩中随机抽取2个的基本事件为(86,93),(86,96),(86,97),(86,99),(86,99),(93,96),(93,97),(93,99),(93,99),(96,97),(96,99),(96,99),(97,99),(97,99),(99,99),共15个.而事件A包含基本事件:(93,96),(93,97),(93,99),(93,99),(96,97),(96,99),(96,99),(97,99),(97,99),(99,99),共10个.所以所求概率为P(A)=1015=23.(2)由已知数据得根据列联表中数据,χ2=40×1×15-5×1926×34×20×20≈3.137,由于3.137>2.706,所以有90%的把握认为“成绩优秀”与教学方式有关.。

交通大学附中高考数学一轮复习 统计单元训练

交通大学附中高考数学一轮复习 统计单元训练

北京交通大学附中2014届高考数学一轮复习单元精品训练:统计本试卷分第Ⅰ卷(选择题)和第Ⅱ卷(非选择题)两部分.满分150分.考试时间120分钟.第Ⅰ卷(选择题共60分)一、选择题 (本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.为调查中学生近视情况,测得某校男生150名中有80名近视,女生140名中有70名近视.在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( )A.期望与方差B.排列与组合C.独立性检验D.概率【答案】C2.某小区有125户高收入家庭、280户中等收入家庭、95户低收人家庭.现采用分层抽样的方法从中抽取100户,对这些家庭社会购买力的某项指标进行调查,则中等收入家庭中应抽选出的户数为( )A.70 户B.17 户C.56 户D.25 户【答案】C3.设两个变量x与y之间具有线性相关关系,它们的相关系数为r,y关于x的回归直线的斜率是b,纵截距是a,那么必有( )A.b与r的符号相同B.a与r的符号相同C.b与r的符号相反D.a与r的符号相反【答案】A4.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg) ,得到频率分布直方图如下:根据上图可得这100名学生中体重在〔56.5,64.5〕的学生人数是( ) A.20 B.30 C.40 D.50【答案】C5.某学校课题组为了研究学生的数学成绩和物理成绩之间的关系,随机抽取高三年级20名学生某次考试成绩统计如表所示:有多少的把握认为学生的数学成绩与物理成绩之间有关系( )A. 99.9% B. 99% C. 97.5% D. 95%【答案】B6.在抽查产品的尺寸过程中,将其尺寸分成若干组,),[b a 是其中的一组,抽查出的个体在该组上的频率为m ,该组在频率分布直方图的高为h ,则|a -b|等于( )A .mhB .m hC .m h +D .hm【答案】A7.某单位共有老、中、青职工430人,其中青年职工160人,中年职工人数是老年职工人数的2倍。

2014年高考一轮复习数学教案:12.3 统 计

2014年高考一轮复习数学教案:12.3 统 计

2013年,2014年,高考第一轮复习,数学教案集12.3 统 计●知识梳理 1.抽样当总体中的个体较少时,一般可用简单随机抽样;当总体中的个体较多时,一般可用系统抽样;当总体由差异明显的几部分组成时,一般可用分层抽样,而简单随机抽样作为一种最简单的抽样方法,又在其中处于一种非常重要的地位.实施简单随机抽样,主要有两种方法:抽签法和随机数表法.系统抽样适用于总体中的个体数较多的情况,因为这时采用简单随机抽样就显得不方便,系统抽样与简单随机抽样之间存在着密切联系,即在将总体中的个体均匀分后的每一段进行抽样时,采用的是简单随机抽样;与简单随机抽样一样,系统抽样也属于等概率抽样.分层抽样在内容上与系统抽样是平行的,在每一层进行抽样时,采用简单随机抽样或系统抽样,分层抽样也是等概率抽样.2.样本与总体用样本估计总体是研究统计问题的一种思想方法.当总体中的个体取不同数值很少时,其频率分布表由所取样本的不同数值及其相应的频率来表示,其几何表示就是相应的条形图,当总体中的个体取不同值较多,甚至无限时,其频率分布的研究要用到初中学过的整理样本数据的知识.用样本估计总体,除在整体上用样本的频率分布去估计总体的分布以外,还可以从特征数上进行估计,即用样本的平均数去估计总体的平均数,用关于样本的方差(标准差)去估计总体的方差(标准差).3.正态分布正态分布在实际生产、生活中有着广泛的应用,很多变量,如测量的误差、产品的尺寸等服从或近似服从正态分布,利用正态分布的有关性质可以对产品进行假设检验.4.线性回归直线设x 、y 是具有相关关系的两个变量,且相应于n 组观察值的n 个点大致分布在一条直线的附近,我们把整体上这n 个点最接近的一条直线叫线性回归直线.特别提示 在三种抽样中,简单随机抽样是最简单、最基本的抽样方法,其他两种抽样方法是建立在它的基础上的.三种抽样方法的共同点是:它们都是等概率抽样,体现了抽样的公平性.三种抽样方法各有其特点和适用范围,在抽样实践中要根据具体情况选用相应的抽样方法. ●点击双基1.一个总体中共有10个个体,用简单随机抽样的方法从中抽取一容量为3的样本,则某特定个体入样的概率是A.310C 3B.89103⨯⨯C.103 D.101 解析:简单随机抽样中每一个体的入样概率为Nn . 答案:C2.(2004年江苏,6)某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示.根据条形图可得这50名学生这一天平均每人的课外阅读时间为A.0.6 hB.0.9 hC.1.0 hD.1.5 h 解析:一天平均每人的课外阅读时间应为一天的总阅读时间与学生数的比,即 5050.2105.1100.1205.050⨯+⨯+⨯+⨯+⨯=0.9 h.答案:B3.一个年级有12个班,每个班有50名同学,随机编号为1~50号,为了了解他们在课外的兴趣爱好,要求每班的33号学生留下来参加阅卷调查,这里运用的抽样方法是A.分层抽样法B.抽签法C.随机数表法D.系统抽样法 答案:D4.如果随机变量ξ~N (μ,σ2),且E ξ=3,D ξ=1,则P (-1<ξ≤1)等于 A.2Φ(1)-1 B.Φ(4)-Φ(2) C.Φ(2)-Φ(4) D.Φ(-4)-Φ(-2)解析:对正态分布,μ=E ξ=3,σ2=D ξ=1,故P (-1<ξ≤1)=Φ(1-3)-Φ(-1-3)=Φ(-2)-Φ(-4)=Φ(4)-Φ(2).答案:B现要使销售额达到6万元,则需广告费用为______.(保留两位有效数字) 解析:先求出回归方程yˆ=bx +a ,令y ˆ=6,得x =1.5万元. 答案:1.5万元●典例剖析【例1】 某批零件共160个,其中,一级品48个,二级品64个,三级品32个,等外品16个.从中抽取一个容量为20的样本.请说明分别用简单随机抽样、系统抽样和分层抽样法抽取时总体中的每个个体被取到的概率均相同.剖析:要说明每个个体被取到的概率相同,只需计算出用三种抽样方法抽取个体时,每个个体被取到的概率.解:(1)简单随机抽样法:可采取抽签法,将160个零件按1~160编号,相应地制作1~160号的160个签,从中随机抽20个.显然每个个体被抽到的概率为16020=81. (2)系统抽样法:将160个零件从1至160编上号,按编号顺序分成20组,每组8个.然后在第1组用抽签法随机抽取一个号码,如它是第k 号(1≤k ≤8),则在其余组中分别抽取第k +8n (n =1,2,3,…,19)号,此时每个个体被抽到的概率为81.(3)分层抽样法:按比例16020=81,分别在一级品、二级品、三级品、等外品中抽取48×81=6个,64×81=8个,32×81=4个,16×81=2个,每个个体被抽到的概率分别为486,648,324,162,即都是81. 综上可知,无论采取哪种抽样,总体的每个个体被抽到的概率都是81.评述:三种抽样方法的共同点就是每个个体被抽到的概率相同,这样样本的抽取体现了公平性和客观性.思考讨论现有20张奖券,已知只有一张能获奖,甲从中任摸一张,中奖的概率为201,刮开一看没中奖.乙再从余下19张中任摸一张,中奖概率为191,这样说甲、乙中奖的概率不一样,是否正确?【例2】 将温度调节器放置在贮存着某种液体的容器内,调节器设定在d ℃,液体的温度ξ(单位:℃)是一个随机变量,且ξ~N (d ,0.52).(1)若d =90°,求ξ<89的概率;(2)若要保持液体的温度至少为80 ℃的概率不低于0.99,问d 至少是多少?(其中若η~N (0,1),则Φ(2)=P (η<2)=0.9772,Φ(-2.327)=P (η<-2.327)=0.01).剖析:(1)要求P (ξ<89)=F (89),∵ξ~N (d ,0.5)不是标准正态分布,而给出的是Φ(2),Φ(-2.327),故需转化为标准正态分布的数值.(2)转化为标准正态分布下的数值求概率p ,再利用p ≥0.99,解d .解:(1)P (ξ<89)=F (89)=Φ(5.09089-)=Φ(-2)=1-Φ(2)=1-0.9772=0.0228. (2)由已知d 满足0.99≤P (ξ≥80),即1-P (ξ<80)≥1-0.01,∴P (ξ<80)≤0.01. ∴Φ(5.080d-)≤0.01=Φ(-2.327). ∴5.080d-≤-2.327. ∴d ≤81.1635.故d 至少为81.1635.评述:(1)若ξ~N (0,1),则η=σμξ-~N (0,1).(2)标准正态分布的密度函数f (x )是偶函数,x <0时,f (x )为增函数,x >0时,f (x )为减函数.深化拓展在实际生活中,常用统计中假设检验的思想检验产品是否合格,方法是:(1)提出统计假设:某种指标服从正态分布N (μ,σ2);(2)确定一次试验中的取值a ;(2)作出统计推断:若a ∈(μ-3σ,μ+3σ),则接受假设,若a ∈(μ-3σ,μ+3σ),则拒绝假设.如:某砖瓦厂生产的砖的“抗断强度”ξ服从正态分布N (30,0.8),质检人员从该厂某一天生产的1000块砖中随机抽查一块,测得它的抗断强度为27.5 kg/cm 2,你认为该厂这天生产的这批砖是否合格?为什么?分析:由于在一次试验中ξ落在区间(μ-3σ,μ+3σ)内的概率为0.997,故ξ几乎必然落在上述区间内.于是把μ=30,σ=0.8代入,算出区间(μ-3σ,μ+3σ)=(27.6,32.4),而27.5∉(27.6,32.4).∴据此认为这批砖不合格. 【例3】 已知测量误差ξ~N (2,100)(cm ),必须进行多少次测量,才能使至少有一次测量误差的绝对值不超过8 cm 的频率大于0.9?解:设η表示n 次测量中绝对误差不超过8 cm 的次数,则η~B (n ,p ).其中P =P (|ξ|<8)=Φ(1028-)-Φ(1028--)=Φ(0.6)-1+Φ(1)=0.7258-1+0.8413=0.5671.由题意,∵P (η≥1)>0.9,n 应满足P (η≥1)=1-P (η=0)=1-(1-p )n >0.9,∴n >)5671.01lg()9.01lg(--=4329.0lg 1-=2.75.因此,至少要进行3次测量,才能使至少有一次误差的绝对值不超过8 cm 的概率大于0.9. ●闯关训练 夯实基础1.对总数为N 的一批零件抽取一个容量为30的样本,若每个零件被抽取的概率为0.25,则N 等于A.150B.200C.120D.100解析:∵N30=0.25,∴N =120. 答案:C2.设随机变量ξ~N (μ,σ),且P (ξ≤C )=P (ξ>C ),则C 等于 A.0 B.σ C.-μ D.μ 解析:由正态曲线的图象关于直线x =μ对称可得答案为D. 答案:D3.(2003年全国,14)某公司生产三种型号的轿车,产量分别为1200辆、6000辆和2000辆,为检验该公司的产品质量,现用分层抽样的方法抽取46辆进行检验,这三种型号的轿车依次应抽取______辆、______辆、______辆.解析:因总轿车数为9200辆,而抽取46辆进行检验,抽样比例为920046=2001,而三种型号的轿车有显著区别.根据分层抽样分为三层按2001比例分别有6辆、30辆、10辆. 答案:6 30 104.某厂生产的零件外直径ξ~N (8.0,1.52)(mm ),今从该厂上、下午生产的零件中各随机取出一个,测得其外直径分别为7.9 mm 和7.5 mm ,则可认为A.上、下午生产情况均为正常B.上、下午生产情况均为异常C.上午生产情况正常,下午生产情况异常D.上午生产情况异常,下午生产情况正常 解析:根据3σ原则,在8+3×1.5=8.45(mm )与8-3×1.5=7.55(mm )之外时为异常. 答案:C5.随机变量ξ服从正态分布N (0,1),如果P (ξ<1)=0.8413,求P (-1<ξ<0). 解:∵ξ~N (0,1),∴P (-1<ξ<0)=P (0<ξ<1)=Φ(1)-Φ(0)=0.8413-0.5=0.3413.6.公共汽车门的高度是按照确保99%以上的成年男子头部不跟车门顶部碰撞设计的,如果某地成年男子的身高ξ~N (173,72)(cm ),问车门应设计多高?解:设公共汽车门的设计高度为x cm ,由题意,需使P (ξ≥x )<1%.∵ξ~N (173,72),∴P (ξ≤x )=Φ(7173-x )>0.99. 查表得7173-x >2.33,∴x >189.31,即公共汽车门的高度应设计为190 cm ,可确保99%以上的成年男子头部不跟车门顶部碰撞.培养能力7.一投资者在两个投资方案中选择一个,这两个投资方案的利润x (万元)分别服从正态分布N (8,32)和N (6,22),投资者要求利润超过5万元的概率尽量地大,那么他应选择哪一个方案?解:对第一个方案,有x ~N (8,32),于是P (x >5)=1-P (x ≤5)=1-F (5)=1-Φ(385-)=1-Φ(-1)=1-[1-Φ(1)]=Φ(1)=0.8413. 对第二个方案,有x ~N (6,22),于是P (x >5)=1-P (x ≤5)=1-F (5)=1-Φ(265-)=1-Φ(-0.5)=Φ(0.5)=0.6915. 相比之下,“利润超过5万元”的概率以第一个方案为好,可选第一个方案. 探究创新(1)完成上表;(2)画出频率分布直方图和累积频率分布图;(3)根据累积频率分布图,总体中小于22的样本数据大约占多大的百分比?(2)频率分布直方图及累积频率分布图如下:(3)在这个累积频率分布图上, 横坐标为22,落在21~24的区间内,折线图在这段区间上的线段所在的直线方程是y -0.3=21243.051.0--(x -21),即y =0.07x -1.17.当x =22时,y =1.54-0.17=0.37.因此,总体中小于22的数据大约占37%. ●思悟小结2.总体分布估计的两种情况比较以上两种情况的不同之处在于前者的频率分布表中列出的是几个不同数值的频率,相应的条形图是用其高度来取各个值的频率的;后者的频率分布表中列出的是在各个不同区间内取值的频率,相应的直方图是用图形面积的大小来表示在各个区间内取值的频率.●教师下载中心 教学点睛简单随机抽样,有以下特点:(1)它要求被抽取样本的总体的个体数有限.这样,就便于对其中各个个体被抽取的概率进行分析.(2)它是从总体中逐个地进行抽取,这样,就便于在抽样实践中进行操作.(3)它是一种不放回抽样.由于抽样实践中多采用不放回抽样,使其具有较广泛的实用性,而且由于所抽取的样本中没有被重复抽取的个体,便于进行有关的分析和计算.(4)它是一种等概率抽样.不仅每次从总体中抽取一个个体时,各个个体被抽取的概率相等,而且在整个抽样过程当中,各个个体被抽取的概率相等,从而保证了这种抽样方法的公平性.频率分布随着样本容量的增大更加接近总体分布,当样本容量无限增大且分组的组距无限缩小时,频率分布直方图就会演变成一条光滑曲线——反映总体分布的频率密度曲线,基于频率分布与相应的总体分布的关系,且通常我们并不知道一个总体的分布,因此,我们往往是从总体中抽取一个样本,用样本的频率分布去估计相应的总体分布.统计中假设检验的基本思想是:根据小概率事件在一次试验中几乎不可能发生的原理和从总体中抽测的个体的数值,对事先所作的统计假设作出判断:是拒绝假设,还是接受假设.拓展例题【例题】 设有一样本x 1,x 2,…,x n ,其标准差为s x ,另有一样本y 1,y 2,…,y n ,其中y i =3x i +2(i =1,2,…,n ),其标准差为s y ,求证:s y =3s x .证明:∵x =nx x x n++21,∴y =ny y y n++21=nx x x n )23()23()23(21++++++=n n x x x n 2)(321+++ =3x +2.∴s y 2=n1[(y 12+y 22+…+y n 2)-n y 2]=n1[(3x 1+2)2+(3x 2+2)2+…+(3x n +2)2-n (3x +2)2] =n1[9(x 12+x 22+…+x n 2)+12(x 1+x 2+…+x n )+4n -n (9x 2+12x +4)] =n 9[(x 12+x 22+…+x n 2)-n x 2] =9s x 2.∵s x ≥0,s y ≥0, ∴s y =3s x .。

【创新设】内蒙古大学附中2014版高考数学一轮复习 统计单元能力提升训练

【创新设】内蒙古大学附中2014版高考数学一轮复习 统计单元能力提升训练

某某大学附中2014版《创新设》高考数学一轮复习单元能力提升训练:统计本试卷分第Ⅰ卷(选择题)和第Ⅱ卷(非选择题)两部分.满分150分.考试时间120分钟.第Ⅰ卷(选择题 共60分)一、选择题 (本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图,则该样本的中位数、众数分别是( )A .45,56B .46,45C .47,45D .45,47【答案】B2.调查某医院某段时间内婴儿出生的时间与性别的关系,由22⨯列联表得出6889232.≈K ,故有( )把握认为婴儿的性别与出生时间有关系(利用下表解决问题)A .%100B .%90C .%80D .%10 【答案】B3.设有一个回归方程y=3-5x 则变量x 增加一个单位时( )A . y 平均减少5个单位B . y 平均增加3个单位.C . y 平均减少3个单位D . y 平均增加5个单位. 【答案】A 4.某调查机构对本市小学生课业负担情况进行了调查,设平均每人每天做作业的时间为x 分钟.有1000名小学生参加了此项调查,调查所得数据用程序框图处理,若输出的结果是680,则平均每天做作业的时间在0~60分钟内的学生的频率是( )A . 680B . 320C . 0.68D . 0.32 【答案】D5.某初级中学有学生270人,其中初一年级108人,初二、三年级各有81人,现要利用抽样方法取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按初一、二、三年级依次统一编号为1,2,...,270;使用系统抽样时,将学生统一随机编号为1,2,...,270,并将整个编号依次分为10段.如果抽得(10个)有下列四种情况:①7,34,61,88,115,142,169,196, 223, 250; ②5,9,100,107,111,121,180,195, 200,265; ③11,38,65,92,119,146,173,200, 227,254; ④30,57,84,111,138,165,192,219,246,270; 关于上述样本的下列结论中,正确的是( )A .②、③都不能为系统抽样B .②、④都不能为分层抽样C .①、④都可能为系统抽样D .①、③都可能为分层抽样 【答案】B6.变量X 与Y 相对应的一组数据为(10, 1), (11.3, 2), (11.8, 3), (12.5, 4), (13, 5);变量U 与V 相对应的一组数据为(10,5), (11.3, 4), (11.8, 3), (12.5, 2), (13, 1),1r 表示变量Y 与X 之间的线性相关系数,2r 表示变量V 与U 之间的线性相关系数,则( )A .012<<r rB . 120r r <<C . 120r r <<D . 12r r = 【答案】C 7.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg) ,得到频率分布直方图如下:根据上图可得这100名学生中体重在〔56.5,64.5〕的学生人数是( ) A.20 B.30 C.40 D.50【答案】C8.为防止某种疾病,今研制一种新的预防药.任选取100只小白鼠作试验,得到如下的列联表:2 3.2079K的观测值为,则在犯错误的概率不超过( )的前提下认为“药物对防止某种疾病有效”。

高三中职数学一轮复习《统计》单元专项练习题

高三中职数学一轮复习《统计》单元专项练习题

中职数学拓展模块一(下册)单元专项练习(第十章统计)一、集中趋势与离散程度1、集中趋势定义:是指一组数据,反映这组数据中心点的位置所在。

算术平均数(算术均值)x。

=2、加权算术平均数若一组数据为x,2x,...,n x,它们出现的频数分别为1f,2f,...,n f1x。

k f也称为样本数据k x的权重。

=4、中位数定义:一组数据按大小顺序排列后,位于或者位于称为中位数,记为M。

e5、众数一组数据中出现次数的数值。

6、离散程度定义:数据远离的程度。

常用反映数据离散程度的统计量有极差、方差、标准差和离散系数等。

7、极差①定义:一组数据的和之差称为极差,也称全距。

②用极差来评价数据离散程度时,极差值越小,数据的离散程度 ,数据越 ,算术平均数的代表性 。

8、方差和标准差方差=2S 。

标准差=S 。

①方差(或标准差)描述了一组数据围绕 波动的程度,与极差相比,能更好地反映数据的离散程度。

②平均数相同,方差和标准差 ,数据的离散程度 。

9、离散系数①定义:组数据的 与其 的比称为这组数据的离散系数,也称为标准差系数。

计算公式为 =s V 。

②离散系数反映了 的离散程度。

③当两组数据的算术平均数或计量单位不同时,常用离散系数比较这两组数据的离散程度。

离散系数大,说明该组数据的离散程度 。

数据的离散程度越小,集中趋势的代表性就 。

二、一元线性回归1、回归直线:对于具有线性相关 关系的两个变量x 和y ,其散点图可以唯一地确定一条直线。

3、回归直线方程:=∧y =∧b (回归系数)=∧a 三、习题配备1.求下列各组数据的算术平均数、中位数和众数。

(1)1,2,4,2,5;(2)12,22,16,22,20,22;(3)6,6,6,7,7,7,8,8,8;(4)0.4,1.8,2.0,0.7,1.6,1.3,0.7,0.4,1.5,2.2。

2.调查某部门的10名员工的年龄,具体情况见下表求该部门员工年龄的算术平均数、中位数和众数。

高三数学一轮复习统计与统计案例知识点知识点突破训练含答案解析

高三数学一轮复习统计与统计案例知识点知识点突破训练含答案解析

第十章⎪⎪⎪统计与统计案例 第一节 统 计突破点(一) 随机抽样基础联通 抓主干知识的“源”与“流”1.简单随机抽样(1)定义:设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N ),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样的方法:抽签法和随机数法. 2.系统抽样在抽样时,将总体分成均衡的几个部分,然后按照事先确定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样方法叫做系统抽样(也称为机械抽样).3.分层抽样在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.4.三种抽样方法的比较 类别 共同点各自特点 相互联系 适用范围 简单随机抽样均为不放回抽样,且抽样过程中每个个体被抽取的机会相等 从总体中逐个抽取 是后两种方法的基础总体中的个数较少系统抽样将总体均分成几部分,按事先确定的规则在各部分中抽取在起始部分抽样时采用简单随机抽样 元素个数很多且均衡的总体抽样分层抽样将总体分成几层,分层按比例进行抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成本节主要包括2个知识点: 1.随机抽样; 2.用样本估计总体.考点贯通抓高考命题的“形”与“神”简单随机抽样1.抽签法的步骤第一步,将总体中的N个个体编号;第二步,将这N个号码写在形状、大小相同的号签上;第三步,将号签放在同一不透明的箱中,并搅拌均匀;第四步,从箱中每次抽取1个号签,连续抽取k次;第五步,将总体中与抽取的号签的编号一致的k个个体取出.2.随机数法的步骤第一步,将个体编号;第二步,在随机数表中任选一个数开始;第三步,从选定的数开始,按照一定抽样规则在随机数表中选取数字,取足满足要求的数字就得到样本的号码.[例1](1)以下抽样方法是简单随机抽样的是()A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见D.用抽签方法从10件产品中选取3件进行质量检验(2)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()7816657208026314070243699728019832049234493582003623486969387481A.08 B.07C.02 D.01[解析](1)选项A、B不是简单随机抽样,因为抽取的个体间的间隔是固定的;选项C 不是简单随机抽样,因为总体的个体有明显的层次;选项D是简单随机抽样.(2)由题意知前5个个体的编号为08,02,14,07,01.[答案](1)D(2)D系统抽样系统抽样的步骤(1)先将总体的N 个个体编号;(2)确定分段间隔k (k ∈N *),对编号进行分段.当N n (n 是样本容量)是整数时,取k =Nn ;(3)在第1段用简单随机抽样确定第1个个体编号l (l ≤k );(4)按照一定的规则抽取样本.通常是将l 加上间隔k 得到第2个个体编号(l +k ),再加k 得到第3个个体编号(l +2k ),依次进行下去,直到获取整个样本.[例2] (1)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( )A .11B .12C .13D .14(2)中央电视台为了解观众对《中国好歌曲》的意见,准备从502名现场观众中抽取10%进行座谈,现用系统抽样的方法完成这一抽样,则在进行分组时,需剔除________个个体,抽样间隔为________.[解析] (1)由系统抽样定义可知,所分组距为84042=20,每组抽取一人,因为包含整数个组,所以抽取个体在区间[481,720]的数目为(720-480)÷20=12.(2)把502名观众平均分成50组,由于502除以50的商是10,余数是2,所以每组有10名观众,还剩2名观众,采用系统抽样的方法抽样时,应先用简单随机抽样的方法从502名观众中抽取2名观众,这2名观众不参加座谈;再将剩下的500名观众编号为1,2,3,…,500,并均匀分成50段,每段含50050=10个个体.所以需剔除2个个体,抽样间隔为10. [答案] (1)B (2)2 10 [易错提醒]用系统抽样法抽取样本,当Nn 不为整数时,取k =⎣⎡⎦⎤N n ,即先从总体中用简单随机抽样的方法剔除(N -nk )个个体,且剔除多余的个体不影响抽样的公平性.分层抽样进行分层抽样的相关计算时,常利用以下关系式巧解:(1)样本容量n 总体的个数N =该层抽取的个体数该层的个体数; (2)总体中某两层的个体数之比=样本中这两层抽取的个体数之比.[例3](1)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为()类别人数老年教师900中年教师 1 800青年教师 1 600合计 4 300A.90 B.100C.180 D.300(2)(2016·东北三校联考)某工厂生产甲、乙、丙三种型号的产品,产品数量之比为3∶5∶7,现用分层抽样的方法抽出容量为n的样本,其中甲种产品有18件,则样本容量n=() A.54 B.90C.45 D.126(3)某学校三个兴趣小组的学生人数分布如下表(每名同学只参加一个小组)(单位:人).篮球组书画组乐器组高一4530a高二151020学校要对这三个小组的活动效果进行抽样调查,按小组分层抽样的方法,从参加这三个兴趣小组的学生中抽取30人,结果篮球组被抽出12人,则a的值为________.[解析](1)设该样本中的老年教师人数为x,由题意及分层抽样的特点得x900=3201 600,故x=180.(2)依题意得33+5+7×n=18,解得n=90,即样本容量为90.(3)由题意知1245+15=3045+15+30+10+a+20,解得a=30.[答案](1)C(2)B(3)30[方法技巧]分层抽样的解题策略(1)分层抽样中分多少层,如何分层要视具体情况而定,总的原则是:层内样本的差异要小,两层之间的样本差异要大,且互不重叠.(2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同.(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样.(4)抽样比=样本容量总体容量=各层样本数量各层个体数量.能力练通 抓应用体验的“得”与“失”1.[考点一]某工厂的质检人员对生产的100件产品,采用随机数法抽取10件检查,对100件产品采用下面的编号方法①1,2,3,…,100; ②001,002,…,100; ③00,01,02,…,99; ④01,02,03,…,100. 其中正确的序号是( ) A .②③④ B .③④ C .②③D .①②解析:选C 根据随机数法编号可知,①④编号位数不统一.2.[考点三]为了调查老师对微课堂的了解程度,某市拟采用分层抽样的方法从A ,B ,C 三所中学抽取60名教师进行调查,已知A ,B ,C 三所学校中分别有180,270,90名教师,则从C 学校中应抽取的人数为( )A .10B .12C .18D .24解析:选A 根据分层抽样的特征,从C 学校中应抽取的人数为90180+270+90×60=10.3.[考点二]某班共有52人,现根据学生的学号,用系统抽样的方法,抽取一个容量为4的样本,已知3号、29号、42号学生在样本中,那么样本中还有一个学生的学号是( )A .10B .11C .12D .16解析:选D 从被抽中的3名学生的学号中可以看出学号间距为13,所以样本中还有一个学生的学号是16,故选D.4.[考点三]某市有A 、B 、C 三所学校,共有高三文科学生1 500人,且A 、B 、C 三所学校的高三文科学生人数成等差数列,在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为120的样本,进行成绩分析,则应从B 校学生中抽取________人.解析:设A 、B 、C 三所学校高三文科学生人数分别为x ,y ,z ,由题知x ,y ,z 成等差数列,所以x +z =2y ,又x +y +z =1 500,所以y =500,用分层抽样方法抽取B 校学生人数为1201 500×500=40.答案:405.[考点二]为了了解本班学生对网络游戏的态度,高三(6)班计划在全班60人中展开调查,根据调查结果,班主任计划采用系统抽样的方法抽取若干名学生进行座谈,为此先对60名学生进行编号为:01,02,03,…,60,已知抽取的学生中最小的两个编号为03,09,则抽取的学生中最大的编号为________.解析:由最小的两个编号为03,09可知,抽取时的分段间隔是6.即抽取10名同学,其编号构成首项为3,公差为6的等差数列,故最大编号为3+9×6=57.答案:57突破点(二)用样本估计总体基础联通抓主干知识的“源”与“流”1.频率分布直方图和茎叶图(1)作频率分布直方图的步骤①求极差(即一组数据中最大值与最小值的差);②决定组距与组数;③将数据分组;④列频率分布表;⑤画频率分布直方图.(2)频率分布折线图和总体密度曲线①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.(3)茎叶图的优点茎叶图的优点是可以保留原始数据,而且可以随时记录,这对数据的记录和表示都能带来方便.2.样本的数字特征(1)众数、中位数、平均数数字特征定义与求法优点与缺点众数一组数据中重复出现次数最多的数众数体现了样本数据的最大集中点,不受极端值的影响.但显然它对其他数据信息的忽视使得无法客观地反映总体特征中位数把一组数据按从小到大的顺序排列,处在中间位置的一个数据(或两个数据的平均数)中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点平均数如果有n个数据x1,x2,…,xn ,那么这n个数的平均数x=x1+x2+…+x nn 平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低(2)标准差、方差①标准差:样本数据到平均数的一种平均距离,一般用s表示,s=1n[(x1-x)2+(x2-x)2+…+(x n-x)2].②方差:标准差的平方s2=1n[(x1-x)2+(x2-x)2+…+(x n-x)2],其中x i(i=1,2,3,…,n)是样本数据,n 是样本容量,x是样本平均数.③方差与标准差相比,都是衡量样本数据离散程度的统计量,但方差因为对标准差进行了平方运算,夸大了样本的偏差程度.(3)平均数、方差公式的推广若数据x1,x2,…,x n的平均数为x,方差为s2,则数据mx1+a,mx2+a,…,mx n +a的平均数为m x+a,方差为m2s2.考点贯通抓高考命题的“形”与“神”频率分布直方图[例1](1)(2016·山东高考)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56 B.60 C.120 D.140(2)某地政府调查了工薪阶层1 000人的月工资收入,并根据调查结果画出如图所示的频率分布直方图,为了了解工薪阶层对月工资收入的满意程度,要用分层抽样的方法从调查的1 000人中抽出100人做电话询访,则(30,35](百元)月工资收入段应抽出________人.[解析] (1)由频率分布直方图知200名学生每周的自习时间不少于22.5小时的频率为1-(0.02+0.10)×2.5=0.7,则这200名学生中每周的自习时间不少于22.5小时的人数为200×0.7=140,故选D.(2)月工资收入落在(30,35](百元)内的频率为1-(0.02+0.04+0.05+0.05+0.01)×5=1-0.85=0.15,所以(30,35](百元)月工资收入段应抽出100×0.15=15(人).[答案] (1)D (2)15 [方法技巧]1.绘制频率分布直方图时需注意的两点(1)制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确; (2)频率分布直方图的纵坐标是频率组距,而不是频率.2.与频率分布直方图计算有关的两个关系式 (1)频率组距×组距=频率; (2)频数样本容量=频率,此关系式的变形为频数频率=样本容量,样本容量×频率=频数.茎叶图1.茎叶图的绘制需注意:(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一; (2)重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据. 2.茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.[例2] 某良种培育基地正在培育一小麦新品种A ,将其与原有的一个优良品种B 进行对照试验,两种小麦各种植了25亩,所得亩产数据(单位:千克)如下.品种A :357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454品种B :363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,4 15,416,422,430(1)作出数据的茎叶图;(2)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.[解](1)画出茎叶图如图所示:(2)通过观察茎叶图可以看出:①品种A的亩产平均数(或均值)比品种B高;②品种A 的亩产标准差(或方差)比品种B大,故品种A的亩产稳定性较差.[方法技巧]茎叶图问题的求解策略(1)由于茎叶图完全反映了所有的原始数据,解决由茎叶图给出的统计图表问题时,要充分对这个图表提供的样本数据进行相关的计算或者是对某些问题作出判断.(2)茎叶图不能直接反映总体的分布情况,这就需要通过茎叶图数据求出样本数据的数字特征,进一步估计总体情况.样本的数字特征1.用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.实际应用中,需先计算数据的平均数,分析平均水平,再计算方差(标准差),分析稳定情况.2.若给出图形,一方面可以由图形得到相应的样本数据,计算平均数、方差(标准差);另一方面,可以从图形直观分析样本数据的分布情况,大致判断平均数的范围,并利用数据的波动性比较方差(标准差)的大小.考法(一)与频率分布直方图交汇命题[例3](2016·北京高考)某市居民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图.(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费.[解](1)由用水量的频率分布直方图,知该市居民该月用水量在区间[0.5,1],(1,1.5],(1.5,2],(2,2.5],(2.5,3]内的频率依次为0.1,0.15,0.2,0.25,0.15.所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%.依题意,w至少定为3.(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表如下:组号12345678分组[2,4](4,6](6,8](8,10](10,12](12,17](17,22](22,27] 频率0.10.150.20.250.150.050.050.05 根据题意,该市居民该月的人均水费估计为4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17×0.05+22×0.05+27×0.05=10.5(元).[方法技巧]频率分布直方图与众数、中位数、平均数的关系(1)最高的小长方形底边中点的横坐标为众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.考法(二)与茎叶图交汇命题[例4](1)如图所示的茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分),已知甲组数据的中位数为17,乙组数据的平均数为17.4,则x,y的值分别为()甲组乙组9099y6166x629A.7,8 B.5,7 C.8,5 D.7,7(2)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:8 7 7 941x91则7个剩余分数的方差为________.[解析] (1)甲组数据的中位数为17, 故y =7,乙组数据的平均数为3×10+20+(9+6+6+x +9)5=17.4,解得x =7.(2)由图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x =91×7,解得x =4.s 2=17[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=367.[答案] (1)D (2)367[易错提醒]在使用茎叶图时,一定要观察所有的样本数据,弄清楚这个图中数字的特点,不要漏掉了数据,也不要混淆茎叶图中茎与叶的含义.考法(三) 与优化决策问题交汇[例5] 甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:甲 乙 丙 丁 平均环数x 8.3 8.8 8.8 8.7 方差s 23.53.62.25.4从这四个人中选择一人参加该运动会射击项目比赛,最佳人选是( ) A .甲 B .乙 C .丙D .丁[解析] 由题目表格中数据可知,丙平均环数最高,且方差最小,说明成绩好,且技术稳定,选C.[答案] C [方法技巧]利用样本的数字特征解决优化决策问题的依据(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.能力练通 抓应用体验的“得”与“失”1.[考点一]在样本的频率分布直方图中,共有7个小长方形,若中间一个小长方形的面积等于其他6个小长方形的面积的和的14,且样本容量为80,则中间一组的频数为( )A .0.25B .0.5C .20D .16解析:选D 设中间一组的频数为x ,依题意有x 80=14⎝⎛⎭⎫1-x 80,解得x =16. 2.[考点二]在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示. 131415⎪⎪⎪⎪0 0 3 4 5 6 6 8 8 8 91 1 12 2 23 34 45 5 56 67 80 1 2 2 3 3 3若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是( )A .3B .4C .5D .6解析:选B 35÷7=5,因此可将编号为1~35的35个数据分成7组,每组有5个数据,在区间[139,151]上共有20个数据,分在20÷5=4个小组中,每组取1人,共取4人.3.[考点一]某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],则图中x 的值等于( )A .0.12B .0.012C .0.18D .0.018解析:选D 依题意,0.054×10+10×x +0.01×10+0.006×10×3=1,解得 x =0.018. 4.[考点三·考法(二)]如图是某学校举行的运动会上七位评委为某体操项目打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )7 9 8 4 4 6 4 793A .84,4.84B .84,1.6C .85,1.6D .85,4 解析:选C 依题意,所剩数据的平均数是80+15×(4×3+6+7)=85,所剩数据的方差是15×[3×(84-85)2+(86-85)2+(87-85)2]=1.6.5.[考点三·考法(三)]甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):甲 10 8 9 9 9 乙1010799如果甲、乙两人中只有1人入选,则入选的最佳人选应是________.解析:x -甲=x -乙=9,s 2甲=15×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25, s 2乙=15×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s 2甲,故甲更稳定. 答案:甲6.[考点三·考法(一)](2016·四川高考)我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x (吨),一位居民的月用水量不超过x 的部分按平价收费,超出x 的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a 的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由; (3)若该市政府希望使85%的居民每月的用水量不超过标准x (吨),估计x 的值,并说明理由.解:(1)由频率分布直方图可知,月均用水量在[0,0.5)中的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.由0.04+0.08+0.5×a +0.20+0.26+0.5×a +0.06+0.04+0.02=1,解得a =0.30. (2)由(1)知100位居民每人的月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85,而前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.73<0.85,所以2.5≤x <3.由0.30×(x -2.5)=0.85-0.73,解得x =2.9.所以,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准. 7.[考点三·考法(二)]某车间20名工人年龄数据如下表: 年龄(岁) 工人数(人)19 1 28 3 29 3 30 5 31 4 32 3 40 1 合计20(1)求这20名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图; (3)求这20名工人年龄的方差.解:(1)由题可知,这20名工人年龄的众数是30,极差是40-19=21. (2)这20名工人年龄的茎叶图如图所示:(3)这20名工人年龄的平均数为x =120(19+3×28+3×29+5×30+4×31+3×32+40)=30,∴这20名工人年龄的方差为s 2=120∑20 i =1 (x i -x )2=112+6×22+7×12+5×02+10220=25220=12.6.[全国卷5年真题集中演练——明规律] 1.(2016·全国丙卷)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A 点表示十月的平均最高气温约为15 ℃,B 点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是( )A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个解析:选D由图形可得各月的平均最低气温都在0 ℃以上,A正确;七月的平均温差约为10 ℃,而一月的平均温差约为5 ℃,故B正确;三月和十一月的平均最高气温都在10 ℃左右,基本相同,C正确;故D错误.2.(2013·新课标全国卷Ⅰ)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大,在下面的抽样方法中,最合理的抽样方法是()A.简单随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样解析:选C由于该地区的中小学生人数比较多,不能采用简单随机抽样,排除选项A;由于小学、初中、高中三个学段的学生视力差异性比较大,可采取按照学段进行分层抽样,而男女生视力情况差异性不大,不能按照性别进行分层抽样,排除B和D.故选C.3.(2014·新课标全国卷Ⅰ)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125) 频数62638228(1)作出这些数据的频率分布直方图(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?解:(1)如图所示:(2)质量指标值的样本平均数为x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.4.(2014·新课标全国卷Ⅱ)某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.解:(1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为66+682=67,所以该市的市民对乙部门评分的中位数的估计值是67.(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为550=0.1,850=0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.5.(2013·新课标全国卷Ⅰ)为了比较两种治疗失眠症的药(分别称为A 药,B 药)的疗效,随机地选取20位患者服用A 药,20位患者服用B 药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:服用A 药的20位患者日平均增加的睡眠时间: 0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4 服用B 药的20位患者日平均增加的睡眠时间: 3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好? (2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?A 药B 药 0. 1. 2.3.解:(1)设A 药观测数据的平均数为x -,B 药观测数据的平均数为y -.由观测结果可得 x -=120×(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,y -=120×(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.由以上计算结果可得x ->y -,因此可看出A 药的疗效更好. (2)由观测结果可绘制如下茎叶图:A 药B 药 6 0. 5 5 6 8 9 8 5 5 2 2 1. 1 2 2 3 4 6 7 8 9 9 8 7 7 6 5 4 3 3 22.1 4 5 6 7。

2014届北京体育大学附中高考数学一轮复习单元训练:《统计》

2014届北京体育大学附中高考数学一轮复习单元训练:《统计》

统计本试卷分第Ⅰ卷(选择题)和第Ⅱ卷(非选择题)两部分.满分150分.考试时间120分钟.第Ⅰ卷(选择题 共60分)一、选择题 (本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.下表是某小卖部一周卖出热茶的杯数与当天气温的对比表:若热茶杯数y 与气温x 近似地满足线性关系,则其关系式最接近的是( )A . 6y x =+B . 42y x =+C . 260y x =-+D . 378y x =-+【答案】C2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由()()()()()22n ad bc K a b c d a c b d -=++++算得,()22110403020207.860506050K ⨯⨯-⨯=≈⨯⨯⨯.参照附表,得到的正确结论是( )A . 再犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B . 再犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C . 有99%以上的把握认为“爱好该项运动与性别有关”D . 有99%以上的把握认为“爱好该项运动与性别无关” 【答案】C 3.下图是2007年中央电视台举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶统计图,去掉一个最高分和一个最底分后,所剩数据的平均数和方差分别为( )A .84, 4.84B . 84, 1.6C .85, 1.6D . 85, 4 【答案】C 4.下图中的茎叶图表示的是某城市一台自动售货机的销售额情况(单位:元),图中的数字7表示的意义是这台自动售货机的销售额为( )A .7元B .37元C .27元D .2337元【答案】C5.已知一组样本点(),i i x y 其中1,2,330i =根据最小二乘法求得的回归方程是y bx a =+则下列说法正确的是( )A .若所有样本点都在y bx a =+上,则变量间的相关系数为1B .至少有一个样本点落在回归直线y bx a =+上C . 对所有的预报变量 i x (1,2,330i =),i bx a +的值与i y 有误差 D .若 y bx a =+斜率0b >则变量x 与y 正相关【答案】D6.在某学校组织的一次数学模拟考试成绩统计中,工作人员采用简单随机抽样的方法,抽取一个容量为50的样本进行统计,若每个学生的成绩被抽到的概率为0.1,则可知这个学校参加这次数学考试的人数是( ) A .100人 B .600人 C .225人 D .500人 【答案】D7.已知回归直线的斜率估计值为2,样本数据是()()()1,2.8,2,5.1,3,7.1,则残差的平方和是( ) A . 0.03 B . 0.04 C . 0.05 D . 0.06 【答案】D8.在样本频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形面积和的41,且样本容量为160,则中间一组的频数为( ) A .32 B . 0.2 C . 40 D . 0.25【答案】A9.在2012年8月15日,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x 元和销售量y 件之间的一组数据如下表所示:由散点图可知,销售量y 与价格x 之间有较好的线性相关关系,其线性回归直线方程是:=-3.2 x +a ,则a =( )A .-24B .35.6C .40.5D .40 【答案】D10.下列四个判断:①某校高三一班和高三二班的人数分别是,m n ,某次测试数学平均分分别是,a b ,则这两个班的数学平均分为2a b+; ②10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a ,中位数为b ,众数为c ,则有b a c >>; ③从总体中抽取的样本11221111(,),(,),,(,),,n nn n i i i i x y x y x y x x y y n n ====∑∑若记,则回归直线y =bx a +必过点(,x y )④已知ξ服从正态分布(0N ,2)σ,且(20)0.4P ξ-≤≤=,则(2)0.2P ξ>= 其中正确的个数有( )A .3个B . 2 个C .1 个D .0个【答案】C11.某产品的广告费用x 与销售额y 的统计数据如下表:根据上表可得回归方程=x +中的为9.4,据此模型预报广告费用为6万元时销售额为( )A .63.6万元B .65.5万元C .67.7万元D .72.0万元 【答案】B12.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变; ②设有一个回归方程ˆ35yx =-,变量x 增加一个单位时,y 平均增加5个单位;③线性回归方程ˆˆˆy bx a =+必过(,x y );④在一个2×2列联中,由计算得213.079,K =则有99%的把握确认这两个变量间有关系;其中错误..的个数是( ) A .0 B .1 C .2 D .3参考独立性检验临界值表:【答案】B第Ⅱ卷(非选择题 共90分)二、填空题 (本大题共4个小题,每小题5分,共20分,把正确答案填在题中横线上) 13.某高校甲、乙、丙、丁四个专业分别有150、150、400、300名学生,为了解学生的就业倾向,用分层抽样的方法从该校这四个专业共抽取40名学生进行调查,应在丙专业抽取的学生人数为________. 【答案】1614.某同学学业水平考试的9科成绩如茎叶图4所示,则根据茎叶图可知该同学的平均分为 .【答案】8015.如图是某学校学生体重的频率分布直方图,已知图中从左到右的前3个小组的频率之比为1:2:3,第2小组的频数为10,则抽取的学生人数是 .【答案】4016.某公司的广告费支出x 与销售额y (单位:万元)之间有下列对应数据:由资料显示y 对x 呈线性相关关系。

年高三数学一轮 知能突破系列15 统计、统计案例

年高三数学一轮 知能突破系列15 统计、统计案例

2014年高三数学一轮单元知能全掌握系列之15.统计、统计案例一、选择题。

1错误!未指定书签。

.(2013年辽宁卷)某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组一次为[)[)20,40,40,60,[)[)60,80,820,100.若低于60分的人数是15人,则该班的学生人数是() A .45 B .50 C .55 D .60B第一、第二小组的频率分别是0.1、0.2,所以低于60分的频率是0.3,设班级人数为m ,则150.3m =,50m =。

选B.错误!未指定书签。

2.(2013年陕西卷)某单位有840名职工, 现采用系统抽样方法, 抽取42人做问卷调查, 将840人按1, 2, , 840随机编号, 则抽取的42人中, 编号落入区间[481, 720]的人数为 () A .11 B .12 C .13 D .14B使用系统抽样方法,从840人中抽取42人,即从20人抽取1人。

,所以从编号1~480的人中,恰好抽取24人,接着从编号481~720共240人中抽取12人。

故选B错误!未指定书签。

4.(2013年安徽数学)某班级有50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是 ()A .这种抽样方法是一种分层抽样B .这种抽样方法是一种系统抽样C .这五名男生成绩的方差大于这五名女生成绩的方差D .该班级男生成绩的平均数小于该班女生成绩的平均数C对A 选项,分层抽样要求男女生总人数之比=男女生抽样人数之比,所以A 选项错。

对B 选项,系统抽样要求先对个体进行编号再抽样,所以B 选项错。

对C 选项,男生方差为40,女生方差为30。

所以C 选项正确。

对D 选项,男生平均成绩为90,女生平均成绩为91。

2014届高考人教A版数学(理)一轮复习单元训练统计与概率(二)

2014届高考人教A版数学(理)一轮复习单元训练统计与概率(二)

统计与概率(二)1.设S n 为等比数列{a n }的前n 项和,已知3S 3=a 4-2,3S 2=a 3-2,则公比q =( ).A .3B .4C .5D .6解析 将两个已知式作差得3a 3=a 4-a 3,则公比q =a 4a 3=4. 答案 B2.在等比数列{a n }中,如果a 1+a 2=40,a 3+a 4=60,那么a 7+a 8=( ). A .135B .100C .95D .80解析 由等比数列的性质知a 1+a 2,a 3+a 4,…,a 7+a 8仍然成等比数列,公比q =a 3+a 4a 1+a 2=6040=32,A.k nB.1nC.k -1nD.k !n !解析 X =k 表示第k 次恰好打开,前k -1次没有打开,∴P (X =k )=n -1n ×n -2n -1×…×n -(k -1)n -(k -2)×1n -(k -1)=1n . 答案 B3.(2013·洛阳联考)若事件E 与F 相互独立,且P (E )=P (F )=14,则P (EF )的值等于( ). A .0B.116C.14D.12解析 ∵事件E 、F 相互独立.∴P (EF )=P (E )·P (F )=14×14=116. 答案 B4.口袋中有5只白色乒乓球,5只黄色乒乓球,从中任取5次,每次取1只后又放回,则5次中恰有3次取到白球的概率是( ). A.12B.35C.C 35C 510D .C 35×0.55解析 任意取球5次,取得白球3次的概率为P 5(3)=C 35×0.53×(1-0.5)5-3=C 35×0.55.答案 D5.分别在区间[1,6]和[1,4]内任取一个实数,依次记为m 和n ,则m >n 的概率为( ).A.310B.710C.23D.57解析 如图所示,分别在区间[1,6]和[1,4]内任取一个实数,若记为m 和n ,则点(m ,n )对应的区域为矩形,其面积S =3×5=15,而满足条件m >n 的点(m ,n )对应的区域为图中阴影部分,其面积为S 1=15-12×3×3=212,故所求概率为P =21215=710. 答案 B6.(2013·徐州模拟)某一随机变量X 的概率分布如表,且E (X )=1.5,则m -n2的值为( ).A.-0.2B .0.1解析 由题意,知⎩⎨⎧ m +n =0.8,m +2n +0.3=1.5,解得⎩⎨⎧m =0.4,n =0.4,∴m -n2=0.4-0.2=0.2. 答案 B7.(2013·白山联考)设随机变量X ~N (1,52),且P (X ≤0)=P (X ≥a -2),则实数a 的值为( ). A .4B .6C .8D .10解析 由题意可知随机变量X 的正态曲线关于x =1对称,则P (X ≤0)=P (X ≥2),所以a -2=2,a =4.答案 A8.(2013·福州二模)盒子中装有6件产品,其中4件一等品,2件二等品,从中不放回地取产品,每次1件,共取2次,已知第二次取得一等品,则第一次取得二等品的概率是().A.310 B.35 C.12 D.25解析设“第二次取得一等品”为事件A,“第一次取得二等品”为事件B,则P(AB)=C12C14C16C15=415,P(A)=C14C13+C12C14C16C15=23,∴P(B|A)=P(AB)P(A)=41523=25.答案 D9.某种饮料每箱装6听,其中有4听合格,2听不合格,现质检人员从中随机抽取2听进行检测,则检测出至少有一听不合格饮料的概率是().A.115 B.35 C.815 D.1415解析从“6听饮料中任取2听饮料”这一随机试验中所有可能出现的基本事件共有15个,而“抽到不合格饮料”含有9个基本事件,所以检测到不合格饮料的概率为P=915=35.答案 B10.(2013·荆门一模)随机变量ξ的概率分布为P(ξ=k)=p k(1-p)1-k(k=0,1),则E(ξ),D(ξ)的值分别是().A.0和1 B.p和p2C.p和1-p D.p和(1-p)p解析由分布列的表达式知,随机变量ξ服从两点分布,所以E(ξ)=p,D(ξ)=(1-p)p.答案 D11.一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画了如图所示的样本频率分布直方图.为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中用分层抽样方法抽出100人作进一步调查,则在[2 500,3 500)月收入段应抽出________人.解析 根据图可以看出月收入在[2 500,3 500)的人数的频率是(0.000 5+0.000 3)×500=0.4,故在[2 500,3 500)月收入段应抽出100×0.4=40(人). 答案 4012.袋中有4只红球3只黑球,从袋中任取4只球,取到1只红球得1分,取到1只黑球得3分,设得分为随机变量X ,则P (X ≤6)=________.解析 从袋中任取4只球的可能有:4红,3红1黑,2红2黑,1红3黑,得分分别为4分,6分,8分,10分.以红球个数为标准,则其服从超几何分布,由题意,得P (X ≤6)=P (X =4)+P (X =6)=C 44C 03C 47+C 34C 13C 47=135+1235=1335.答案 133513.某射手射击1次,击中目标的概率是0.9,他连续射击4次,且各次是否击中目标相互之间没有影响,有下列结论:①他第3次击中目标的概率是0.9;②他恰好击中目标3次的概率是0.93×0.1;③他至少击中目标1次的概率是1-0.14,其中正确结论的序号是________(写出所有正确结论的序号).解析 由n 次独立重复试验发生k 次的概率为C k n p k (1-p )n -k,知①正确,②错误,应为C 34×0.93×0.11,③正确.答案 ①③14.(2013·济南二模)有一个公用电话亭,里面有一部电话,在观察使用这部电话的人的流量时,设在某一时刻,有n 个人正在使用电话或等待使用的概率为P (n ),且P (n )与时刻t 无关,统计得到P (n )=⎩⎪⎨⎪⎧⎝ ⎛⎭⎪⎫12n P (0),1≤n ≤5,0,n ≥6,那么在某一时刻,这个公用电话亭里一个人也没有的概率P (0)的值是________. 解析 用对立事件的概率求解.P (0)=1-12P (0)+122P (0)+123P (0)+124P (0)+125P(0)+0+0+…,解得P(0)=32 63.答案32 6315.(2013·成都质检)在一次数学测试(满分为150分)中,某地在10 000名考生的分数X服从正态分布N(100,152).据统计,分数在110以上的考生共2 514人,则分数在90分以上的考生共有________人.解析由X~N(100,152)知,正态分布曲线关于μ=100对称,故P(X≤90)=P(X≥110),即90分以下的人数与110分以上的人数相等.因此分数在90分以上的考生共有10 000-2 514=7 486.答案7 486。

高考数学一轮复习 第9章《统计、统计案例》(第2课时)知识过关检测 理 新人教A版

高考数学一轮复习 第9章《统计、统计案例》(第2课时)知识过关检测 理 新人教A版

2014届高考数学(理)一轮复习知识过关检测:第9章《统计、统计案例》(第2课时)(新人教A 版)一、选择题 1.(2012·高考湖北卷)容量为20的样本数据,分组后的频数如下表:分 组[10,20) [20,30) [30,40) [40,50) [50,60) [60,70) 频 数2 3 4 5 4 2 则样本数据落在区间[10,40)的频率为( )A .0.35B .0.45C .0.55D .0.65解析:选 B.求出样本数据落在区间[10,40)中的频数,再除以样本容量得频率.求得该频数为2+3+4=9,样本容量是20,所以频率为920=0.45. 2.在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是( )A .众数B .平均数C .中位数D .标准差解析:选D.只有标准差不变,其中众数、平均数和中位数都加2.3.有一个容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间[)10,12内的频数为( )A .18B .36C .54D .72解析:选B.由0.02+0.05+0.15+0.19=0.41,∴落在区间[]2,10内的频率为0.41×2=0.82.∴落在区间[)10,12内的频率为1-0.82=0.18.∴样本数据落在区间[)10,12内的频数为0.18×200=36.4.(2012·高考陕西卷)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A .46,45,56B .46,45,53C .47,45,56D .45,47,53解析:选A.从茎叶图可以看出样本数据的中位数为中间两个数的平均数,即45+472=46,众数为45,极差为68-12=56,故选择A.5.如图是某学校抽取的学生体重的频率分布直方图,已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为10,则抽取的学生人数为( )A .20B .30C .40D .50解析:选C.前3组的频率之和等于1-(0.0125+0.0375)×5=0.75,第2小组的频率是0.75×21+2+3=0.25,设样本容量为n ,则10n=0.25,即n =40. 二、填空题6.在如图所示的茎叶图中,甲、乙两组数据的中位数分别是__________,__________.解析:甲组数据为:28,31,39,42,45,55,57,58,66,中位数为45. 乙组数据为:29,34,35,42,46,48,53,55,67,中位数为46.答案:45 467.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):甲 10 8 9 9 9乙 10 10 7 9 9.解析:x 甲=x 乙=9,s 2甲=15×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25,s 2乙=15×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65,s 2甲<s 2乙,故甲更稳定,故填甲.答案:甲8.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a =______.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为__________.解析:∵小矩形的面积等于频率,∴除[120,130)外的频率和为0.700,∴a =1-0.70010=0.030.由题意知,身高在[120,130),[130,140),[140,150]的学生分别为30人,20人,10人,∴由分层抽样可知抽样比为1860=310,∴在[140,150]中选取的学生应为3人. 答案:0.030 3三、解答题9.某学校从参加高三模拟考试的学生中随机抽取60名学生,将其数学成绩(均为整数)分成六段[90,100),[100,110),…,[140,150)后得到如下部分频率分布直方图.观察图形的信息,回答下列问题:(1)求分数在[120,130)内的频率,并补全这个频率分布直方图;(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试的平均分.解:(1)分数在[120,130)内的频率为1-(0.1+0.15+0.15+0.25+0.05)=1-0.7=0.3,频率组距=0.310=0.03,补全后的直方图如下:(2)平均分为x =95×0.1+105×0.15+115×0.15+125×0.3+135×0.25+145×0.05=121.10.(2012·高考安徽卷)若某产品的直径长与标准值的差的绝对值不超过1 mm 时,则视为合格品,否则视为不合格品.在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取5000件进行检测,结果发现有50件不合格品.计算这50件不合格品的直径长与标准值的差(单位:mm),将所得数据分组,得到如下频率分布表:分组 频数 频率[-3,-2) 0.10[-2,-1) 8(1,2] 0.50(2,3] 10(3,4]合计 50 1.00(1)将上面表格中缺少的数据填在相应位置;(2)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率;(3)现对该厂这种产品的某个批次进行检查,结果发现有20件不合格品.据此估算这批产品中的合格品的件数.解:(1)频率分布表分组 频数 频率[-3,-2) 5 0.10[-2,-1) 8 0.16(1,2] 25 0.50(2,3] 10 0.20(3,4] 2 0.04合计 50 1.00(2)由频率分布表知,该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率约为0.50+0.20=0.70.(3)设这批产品中的合格品数为x 件,依题意有505000=20x +20,解得x =5000×2050-20=1980.所以该批产品的合格品件数估计是1980件.一、选择题1.为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a ,视力在4.6到5.0之间的学生数为b ,则a ,b 的值分别为( )A .0.27,78B .0.27,83C .2.7,78D .2.7,83解析:选A.由频率分布直方图知,组距为0.1,4.3~4.4间的频数为100×0.1×0.1=1,4.4~4.5间的频数为100×0.1×0.3=3.又前4组的频数成等比数列,∴公比为3.根据后6组的频数成等差数列,且共有100-13=87人,且4.6~4.7间的频数最大,为1×33=27,∴a =0.27.设公差为d ,则6×27+6×52d =87,∴d =-5,从而b =4×27+4×32×(-5)=78.2.(2012·高考陕西卷)从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲、乙两组数据的平均数分别为x 甲、x 乙,中位数分别为m 甲、m 乙,则( )A.x 甲<x 乙,m 甲>m 乙B.x 甲<x 乙,m 甲<m 乙C.x 甲>x 乙,m 甲>m 乙D.x 甲 >x 乙,m 甲<m 乙解析:选B.由茎叶图可知甲数据集中在10至20之间,乙数据集中在20至40之间,明显x 甲<x 乙,甲的中位数为20,乙的中位数为29,即m 甲<m 乙,所以选B.二、填空题3.(2012·高考广东卷)由正整数组成的一组数据x 1,x 2,x 3,x 4,其平均数和中位数都是2,且标准差等于1,则这组数据为________.(从小到大排列)解析:设x 1≤x 2≤x 3≤x 4,根据已知条件得到x 1+x 2+x 3+x 4=8,且x 2+x 3=4,所以x 1+x 4=4.又因为14[x 1-22+x 2-22+x 3-22+x 4-22]=1,所以(x 1-2)2+(x 2-2)2=2.又因为x 1,x 2,x 3,x 4是正整数,所以(x 1-2)2=(x 2-2)2=1,所以x 1=1,x 2=1,x 3=3,x 4=3.答案:1,1,3,34.把容量为100的某个样本数据分为10组,并填写频率分布表,若前七组的累积频率为0.79,而剩下三组的频数成公比为大于2的整数的等比数列,则剩下三组中频数最高的一组的频数为________.解析:由已知得前七组的共有频数为0.79×100=79,故后三组共有的频数为21,依题意a 1·1-q 31-q=21,a 1(1+q +q 2)=21. ∵q >2,∴1+q +q 2>7.∴a 1=1,q =4.∴后三组中频数最高的一组的频数为16.答案:16三、解答题5.(2013·日照质检)某学校为了了解学生的日平均睡眠时间(单位:h),随机选择了n 序号(i ) 分组(睡眠时间) 频数(人数) 频率1 [4,5) 6 0.122 [5,6) 0.203 [6,7) a4 [7,8) b5 [8,9) 0.08(1)求n (2)统计方法中,同一组数据常用该组区间的中点值(例如区间[4,5)的中点值是4.5)作为代表.若据此计算的上述数据的平均值为6.52,求a ,b 的值,并由此估计该学校学生的日平均睡眠时间在7小时以上的概率.解:(1)由频率分布表可得n =60.12=50. 补全数据如下表:序号(i )分组(睡眠时间) 频数(人数) 频率 1[4,5) 6 0.12 2[5,6) 10 0.20 3[6,7) 20 0.40 4[7,8) 10 0.20 5[8,9) 4 0.08频率分布直方图如下:(2)由题意⎩⎪⎨⎪⎧ 150×6×4.5+10×5.5+a ×6.5+b ×7.5+4×8.5=6.52,6+10+a +b +4=50,解得a =15,b =15.设“该学校学生的日平均睡眠时间在7小时以上”为事件A ,则P (A )=P (x ≥7)=15+450=0.38,即该学校学生的日平均睡眠时间在7小时以上的概率约为0.38.。

高考数学一轮复习 12.2 统计随堂检测 理(含解析)人教

高考数学一轮复习 12.2 统计随堂检测 理(含解析)人教

【优化方案】2014届高考数学一轮复习 12.2 统计随堂检测理
(含解析)人教版
某校一课外小组对南昌市工薪阶层关于“楼市限购令”态度进行调查,随机抽调了50人,他们月收入频数分布及对“楼市限购令”赞成人数如下表.
(2)若从收入(单位:百元)在[15,25),[25,35)的被调查者中各随机选取两人进行追踪调查,记选中的4人中不赞成“楼市限购令”人数为ξ,求随机变量ξ的分布列和数学期望.
解:(1)各组的频率分别是0.1,0.2,0.3,0.2,0.1,0.1,
所以图中各组的纵坐标分别是0.01,0.02,0.03,0.02,0.01,0.01,
(2)ξ所有可能取值有0,1,2,3,
P (ξ=0)=C 24C 25×C 28C 210=610×2845=84225
, P (ξ=1)=C 14C 25×C 28C 210+C 24C 25×C 18C 12C 210=410×2845+610×1645=104225
, P (ξ=2)=C 14C 25×C 18C 12C 210+C 24C 25×C 22C 210=410×1645+610×145=35225
, P (ξ=3)=C 14C 25·C 22C 210=410×145=2225
. 所以ξ的分布列是
所以ξ的期望值是Eξ=0+225+225+225=5.。

高考数学一轮精品复习I单元统计(含解析)

高考数学一轮精品复习I单元统计(含解析)

I单元统计I1 随机抽样2.I1[2014·湖南卷] 对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则( )A.p1=p2<p3 B.p2=p3<p1C.p1=p3<p2 D.p1=p2=p32.D [解析] 不管是简单随机抽样、系统抽样还是分层抽样,它们都是等概率抽样,每个个体被抽中的概率均为n N .9.I1[2014·天津卷] 某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取________名学生.9.60[解析] 由分层抽样的方法可得,从一年级本科生中抽取学生人数为300×44+5+5+6=60.I2 用样本估计总体6.I2[2014·广东卷] 已知某地区中小学生人数和近视情况分别如图1­1和图1­2所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )图1­1图1­2A.200,20 B.100,20C.200,10 D.100,106.A [解析] 本题考查统计图表的实际应用.根据图题中的图知该地区中小学生一共有10 000人,由于抽取2%的学生,所以样本容量是10 000×2%=200.由于高中生占了50%,所以高中生近视的人数为2000×2%×50%=20.17.I2、K5[2014·广东卷] 随机观测生产某种零件的某工厂25名工人的日加工零件数(单位:件),获得数据如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36.根据上述数据得到样本的频率分布表如下:(1)确定样本频率分布表中1,2,1和2的值;(2)根据上述频率分布表,画出样本频率分布直方图;(3)根据样本频率分布直方图,求在该厂任取4人,至少有1人的日加工零件数落在区间(30,35]的概率.18.I2、K5、K6[2014·辽宁卷] 一家面包房根据以往某种面包的销售记录,绘制了日销售量的频率分布直方图,如图1­4所示.将日销售量落入各组的频率视为概率,并假设每天的销售量相互独立.(1)求在未来连续3天里,有连续2天的日销售量都不低于100个且另1天的日销售量低于50个的概率;(2)用X表示在未来3天里日销售量不低于100个的天数,求随机变量X的分布列,期望E(X)及方差D(X).18.解:(1)设A1表示事件“日销售量不低于100个”,A2表示事件“日销售量低于50个”,B表示事件“在未来连续3天里有连续2天日销售量不低于100个且另1天销售量低于50个”.因此P(A1)=(0.006+0.004+0.002)×50=0.6,P(A2)=0.003×50=0.15,P(B)=0.6×0.6×0.15×2=0.108.(2)X可能取的值为0,1,2,3,相应的概率分别为P(X=0)=C03·(1-0.6)3=0.064,P(X=1)=C13·0.6(1-0.6)2=0.288,P(X=2)=C23·0.62(1-0.6)=0.432,P(X=3)=C33·0.63=0.216.X的分布列为因为X~B(3,=3×0.6×(1-0.6)=0.72.18.I2、I3[2014·新课标全国卷Ⅰ] 从某企业生产的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如图1­4所示的频率分布直方图:图1­4(1)求这500件产品质量指标值的样本平均数x 和样本方差s 2(同一组中的数据用该组区间的中点值作代表);(2)由直方图可以认为,这种产品的质量指标值Z 服从正态分布N (μ,σ2),其中μ近似为样本平均数x -,σ2近似为样本方差s 2.(i)利用该正态分布,求P (187.8<Z <212.2); (ii)某用户从该企业购买了100件这种产品,记X 表示这100件产品中质量指标值位于区间(187.8,212.2)的产品件数,利用(i)的结果,求EX .附:150≈12.2.若Z ~N (μ,σ2),则p (μ-σ<Z <μ+σ)=0.682 6, p (μ-2σ<Z <μ+2σ)=0.954 4.18.解:(1)抽取产品的质量指标值的样本平均数x -和样本方差s 2分别为 x -=170×0.02+180×0.09+190×0.22+200×0.33+210×0.24+220×0.08+230×0.02=200.s 2=(-30)2×0.02+(-20)2×0.09+(-10)2×0.22+0×0.33+102×0.24+202×0.08+302×0.02=150.(2)(i)由(1)知,Z ~N (200,150),从而P (187.8<Z <212.2)=P (200-12.2<Z <200+12.2)=0.682 6.(ii)由(i)知,一件产品的质量指标值位于区间(187.8,212.2)的概率为0.682 6,依题意知X ~B (100,0.682 6),所以EX =100×0.682 6=68.26.7.I2[2014·山东卷] 为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.下图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )图1­1A. 6B. 8C. 12D. 18 7.C [解析] 因为第一组与第二组一共有20人,并且根据图像知第一组与第二组的人数比是0.24∶0.16=3∶2,所以第一组有20×35=12.又因为第一组与第三组的人数比是0.24∶0.36=2∶3 ,所以第三组一共有12÷23=18.因为第三组中没有疗效的有6人,所以第三组中有疗效的人数是18-6=12.9.I2[2014·陕西卷] 设样本数据x 1,x 2,…,x 10的均值和方差分别为1和4,若y i=x i +a (a 为非零常数,i =1,2,…,10),则y 1,y 2,…,y 10的均值和方差分别为( )A .1+a ,4B .1+a ,4+aC .1,4D .1,4+a9.A [解析] 由题意可知x 1+x 2+x 3+…+x 1010=1,故y -=(x 1+x 2+x 3+…+x 10)+10a10=1+a .数据x 1,x 2,…,x 10同时增加一个定值,方差不变.故选A.I3 正态分布18.I2、I3[2014·新课标全国卷Ⅰ] 从某企业生产的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如图1­4所示的频率分布直方图:图1­4(1)求这500件产品质量指标值的样本平均数x 和样本方差s 2(同一组中的数据用该组区间的中点值作代表);(2)由直方图可以认为,这种产品的质量指标值Z 服从正态分布N (μ,σ2),其中μ近似为样本平均数x -,σ2近似为样本方差s 2.(i)利用该正态分布,求P (187.8<Z <212.2); (ii)某用户从该企业购买了100件这种产品,记X 表示这100件产品中质量指标值位于区间(187.8,212.2)的产品件数,利用(i)的结果,求EX .附:150≈12.2.若Z ~N (μ,σ2),则p (μ-σ<Z <μ+σ)=0.682 6, p (μ-2σ<Z <μ+2σ)=0.954 4.18.解:(1)抽取产品的质量指标值的样本平均数x -和样本方差s 2分别为 x -=170×0.02+180×0.09+190×0.22+200×0.33+210×0.24+220×0.08+230×0.02=200.s 2=(-30)2×0.02+(-20)2×0.09+(-10)2×0.22+0×0.33+102×0.24+202×0.08+302×0.02=150.(2)(i)由(1)知,Z ~N (200,150),从而P (187.8<Z <212.2)=P (200-12.2<Z <200+12.2)=0.682 6.(ii)由(i)知,一件产品的质量指标值位于区间(187.8,212.2)的概率为0.682 6,依题意知X ~B (100,0.682 6),所以EX =100×0.682 6=68.26.I4 变量的相关性与统计案例3.I4[2014·重庆卷] 已知变量x与y正相关,且由观测数据算得样本平均数x=3,y =3.5,则由该观测数据算得的线性回归方程可能是( )A.y^=0.4x+2.3 B.y^=2x-2.4C.y^=-2x+9.5 D.y^=-0.3x+4.43.A [解析] 因为变量x与y正相关,则在线性回归方程中,x的系数应大于零,排除B,D;将x=3,y=3.5分别代入A,B中的方程只有A满足,故选A.4.I4得到的回归方程为y=bx+a,则( )A.a>0,b>0 B.a>0,b<0C.a<0,b>0 D.a<0,b<04.B [解析] 作出散点图如下:观察图象可知,回归直线y=bx+a的斜率b<0,截距a>0.故a>0,b<0.故选B.6.I4[2014·江西卷] 某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )表表3A .成绩B .视力C .智商D .阅读量6.D [解析] 根据独立性检验计算可知,阅读量与性别有关联的可能性较大.19.I4[2014·新课标全国卷Ⅱ] 某地区2007年至2013年农村居民家庭人均纯收入(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:19.解:(1)由所给数据计算得t -=17(1+2+3+4+5+6+7)=4,y -=17(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,a ^=y --b ^t -=4.3-0.5×4=2.3,所求回归方程为y ^=0.5t +2.3.(2)由(1)知,b ^=0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将2015年的年份代号t =9,代入(1)中的回归方程,得y ^=0.5×9+2.3=6.8, 故预测该地区2015年农村居民家庭人均纯收入为6.8千元.I5 单元综合2.[2014·福州期末] 将参加夏令营的500名学生分别编号为001,002,…,500,这500名学生分住在三个营区,从001到200在第一营区,从201到350在第二营区,从351到500在第三营区.若采用分层抽样的方法抽取一个容量50的样本,则三个营区被抽取的人数分别为( )A .20,15,15B .20,16,14C .12,14,16D .21,15,142.A [解析] 根据分层抽样的比例抽取,分别应抽取的人数为20,15,15.3.[2014·广州调研] 如图X38­1所示是2013年某大学自主招生面试环节中,七位评委为某考生打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和众数依次为( )A .85,84B .84,85C .86,84D .84,863.A [解析] 由题意可知,所剩数据的平均数为x =84+84+86+84+875=85,众数为84.4.[2014·泰安一模] 为了调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样的方法从该地区调查了500位老人,其结果如下表:由K 2=(a +b )(c +d )(a +c )(b +d ),得K 2=500×(40×270-30×160)2200×300×70×430≈9.967.附表:A .在犯错误的概率不超过0.1%的前提下,认为“需要志愿者提供帮助与性别有关”B .在犯错误的概率不超过0.1%的前提下,认为“需要志愿者提供帮助与性别无关”C .有99%以上的把握认为“需要志愿者提供帮助与性别有关”D .有99%以上的把握认为“需要志愿者提供帮助与性别无关” 4.C [解析] 由数据知,选项C 正确. 6.[2014·威海一模] 某班级统计一次数学测试后的成绩,并制成了如下的频率分布表,根据该表估计该班级的数学测试平均分为( )6.C [解析] 65×0.1+75×0.3+85×0.4+95×0.2=82.8.[2014·邯郸期末] 某商场在庆元宵促销活动中,对元宵节当天9时至14时的销售额进行统计,其频率分布直方图如图X38­2所示.已知9时至10时的销售额为2.5万元,则11时至12时的销售额为________万元.8.10 [解析] 设11时至12时的销售额为x 万元,则2.50.1=x0.4,解得x =10.11.[2014·韶关一模] 设某大学的女生体重y (kg)与身高x (cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的线性回归方程为y ^=0.85x -85.71,给出下列结论:①y 与x 具有正的线性相关关系; ②回归直线过样本点的中心(x ,y );③若该大学某女生身高增加1 cm ,则其体重约增加0.85 kg ; ④若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg. 其中,正确结论的序号是______________.11.①②③ [解析] 利用有关概念可知,①②③正确.。

江苏省2014届高三数学一轮复习 考试试题精选(1)分类汇编15 概率与统计

江苏省2014届高三数学一轮复习 考试试题精选(1)分类汇编15 概率与统计

江苏省2014届高三数学一轮复习考试试题精选(1)分类汇编15:概率与统计一、填空题 1 .(江苏省宿迁市2014届高三上学期第一次摸底考试数学试卷)将一枚骰子(一种六个面上分别标有1,2,3,4,5,6个点的正方体玩具)先后抛掷2次,向上的点数分别记为,m n ,则点(,)P m n 落在区域22x y -+-≤2内的概率是______.【答案】36112 .(江苏省宿迁市2014届高三上学期第一次摸底考试数学试卷)一位篮球运动员在最近的8场比赛中得分的茎叶图如图,则他在这8场比赛中得分的方差是______.【答案】14 3 .(江苏省南京市2014届高三9月学情调研数学试题)口袋中有形状和大小完全相同的四个球,球的编号分别为1,2,3,4,若从袋中随机抽取两个球,则取出的两个球的编号之和大于5的概率为____.【答案】134 .(江苏省启东中学2014届高三上学期期中模拟数学试题)已知样本7,8,9,,x y 的平均数是8,且60xy =,则此样本的标准差是______.【答案】粘贴有误,原因可能为题目为公式编辑器内容,而没有其它字符 5 .(江苏省如皋中学2014届高三上学期期中模拟数学试卷)若以连续掷两次骰子分别得到的点数n m ,作为点P 的横、纵坐标,则点P 在直线5=+y x 上的概率为_____________. 【答案】196 .(江苏省连云港市赣榆县清华园双语学校2014届高三10月月考数学试题)若在区间(1,1)-内任取实数a ,在区间(0,1)内任取实数b ,则直线0ax by -=与圆22(1)(2)1x y -+-=相交的概率为__________.【答案】5167 .(江苏省泰州中学2014届第一学学期高三数学摸底考试)某射击选手连续射击5枪命中的环数分别为:9.7,9.9,10.1,10.2,10.1,则这组数据的方差为__________. 【答案】0.032 8 .(江苏省淮安市车桥中学2014届高三9月期初测试数学试题)为了调查城市PM2.5的值,按地域把36个城市分成甲、乙、丙三组,对应的城市数分别为6,12,18.若用分层抽样的方法抽取12个城市,则乙组中应抽取的城市数为_______. 【答案】49 .(江苏省沛县歌风中学(如皋办学)2014届高三第二次调研数学试题)在集合{x |x =}0 81 02 4 4 6 8 2 0(第4题图)中任取一个元素,所取元素恰好满足方程cos x =的概率是__________.【答案】10.(江苏省淮安市车桥中学2014届高三9月期初测试数学试题)有3个兴趣小组,甲、乙两位同学各参加其中一个小组,且他们参加各个兴趣小组是等可能的,则甲、乙两位同学参加同一个兴趣小组的概率为_______.【答案】1311.(江苏省无锡市2014届高三上学期期中调研考试数学试题)某高中学校有高一学生600人,高二学生500人,高三学生500人,现通过分层抽样抽取一个容量为320的样本,则高三学生应抽取的人数为___________. 【答案】100 12.(江苏省如皋中学2014届高三上学期期中模拟数学试卷)若样本321,,a a a 的方差是2,则样本32,32,32321+++a a a 的方差是___________【答案】 813.(江苏省如皋中学2014届高三上学期期中模拟数学试卷)如图是某学校学生体重的频率分布直方图,已知图中从左到右的前3个小组的频率之比为1:2:3,第2小组的频数为10,则抽取的学生人数是_____________.【答案】40 14.(江苏省启东中学2014届高三上学期期中模拟数学试题)若将一颗质地均匀的骰子(一种各面上分别标有1,2,3,4,5,6个点的正方体玩具),先后抛掷两次,则出现向上的点数之和为4的概率是____.【答案】15.(江苏省无锡市2014届高三上学期期中调研考试数学试题)已知,m n 为正整数,320m n +=,则m n>的概率为___________. 【答案】1616.(江苏省南京市第五十五中学2014届高三上学期第一次月考数学试题)在棱长为a 的正方体1111ABCD A B C D -内任取一点P ,则点P 到点A 的距离小于a 的概率为____________.【答案】6π17.(江苏省连云港市赣榆县清华园双语学校2014届高三10月月考数学试题)为了了解一片经济林的生长情况,随机测量了其中100株树木的底部周长(单位:cm ).所得数据如图,那么在这100株树木中,底部周长不小于110cm 的有_________株.【答案】3018.(江苏省扬州中学2014届高三开学检测数学试题)已知Ω={(,)|6,0,0}x y x y x y +<>>,{(,)|4,0,20}A x y x y x y =<>->,若向区域Ω上随机投掷一点P ,则点P 落入区域A 的概率为▲ . 【答案】2919.(江苏省苏州市2014届高三暑假自主学习测试(9月)数学试卷)样本数据18,16,15,16,20的方差2s =______.【答案】3.2 20.(江苏省阜宁中学2014届高三第一次调研考试数学(理)试题)右图茎叶图是甲、乙两人在5次综合测评中成绩,其中一个数字被污损,则甲的平均成绩超过乙的平均成绩的概率为________.【答案】45二、解答题 21.(江苏省苏州市2013-2014学年第一学期高三期中考试数学试卷)某地区举办科技创新大赛,有50件科技作品参赛,大赛组委会对这50件作品分别从“创新性”和“实用性”两项进行评分,每项评分均按等级采用5分制,若设“创新性”得分为x ,“实用性”得分为y ,统计结果如下表:作品数量 yx实用性1分 2分 3分 4分 5分 创 新 性1分1 3 1 0 1 2分 1 0 7 5 1 3分2 10 9 34分 1 b6 0 a5分113(Ⅰ)求“创新性为4分且实用性为3分”的概率; (Ⅱ)若“实用性”得分的数学期望为50167,求a 、b 的值. 【答案】解:(Ⅰ)从表中可以看出,“创新性为4分且实用性为3分”的作品数量为6件, ∴“创新性为4分且实用性为3分”的概率为60.1250=(Ⅱ)由表可知“实用性”得分y 有1分、2分、3分、4分、5分五个等级, 且每个等级分别有5件,b +4件,15件,15件,a +8件.∴“实用性”得分y 的分布列为:又∵“实用性”得分的数学期望为16750,∴541515816712345505050505050b a ++⨯+⨯+⨯+⨯+⨯=∵作品数量共有50件,∴3a b += 解得1a =,2b = 22.(江苏省南京市第五十五中学2014届高三上学期第一次月考数学试题)张明要参加某单位组织的招聘面试.面试要求应聘者有7次选题答题的机会(选一题答一题),若答对4题即终止答题,直接进入下一轮,否则则被淘汰.已知张明答对每一道题的概率都为21. (Ⅰ)求张明进入下一轮的概率;(Ⅱ)设张明在本次面试中答题的个数为ξ,试写出ξ的分布列,并求ξ的数学期望.【答案】解法一:(Ⅰ)张明答4道题进入下一轮的概率为161)21(4=;答5道题进入下一轮的概率为812121)21(334=⋅⋅C ;答6道题进入下一轮的概率为32521)21()21(2335=⋅⋅C ;答7道题进入下一轮的概率为32521)21()21(3336=⋅⋅C ;张明进入下一轮的概率为1155116832322P =+++=.(Ⅱ)依题意,ξ的可能取值为4,5,6,7.当ξ=4时可能答对4道题进入下一轮,也可能打错4道题被淘汰.81)21()21()4(44=+==ξP ; 类似有4121)21()21(21)21()21()5(334334=⋅⋅+⋅⋅==C C P ξ;)6(=ξP =+⋅⋅21)21()21(2335C 16521)21()21(2335=⋅⋅C ;)7(=ξP =+⋅⋅21)21()21(3336C 16521)21()21(3336=⋅⋅C .于是ξ的分布列为161671664584=⨯+⨯+⨯+⨯=ξE解法二:(Ⅰ)设张明进入下一轮的概率为1P ,被淘汰的概率为2P ,则121=+P P ,又因为张明答对每一道题的概率都为21,答错的概率也都为21.所以张明答对4题进入下一轮与答错4题被淘汰的概率是相等的.即21P P =.所以张明进入下一轮的概率为21.23.(江苏省扬州中学2014届高三开学检测数学试题)某舞蹈小组有2名男生和3名女生.现从中任选2人参加表演,记X 为选取女生的人数,求X 的分布列及数学期望. 【答案】依题意,X 所有取值0,1,2.P (X=0)=,P (X=1)==,P (X=2)==.X 的分布列为:X0 1 2 PEX=.24.(江苏省连云港市赣榆县清华园双语学校2014届高三10月月考数学试题)甲乙两人进行某种游戏比赛,规定每一次胜者得1分,负者得0分;当其中一人的得分比另一人的多2分时即赢得这场游戏比赛,比赛随之结束;同时规定比赛次数最多不超过10次,即经10次比赛,得分多者赢得这场游戏,得分相等为和局.已知每次比赛甲获胜的概率为p (0<p <1),乙获胜的概率为q (q =1-p ).假定各次比赛的结果是相互独立的,比赛经ξ次结束.(1)求ξ的分布列及数学期望Eξ. (2)求ξ的数学期望Eξ的取值范围. 【答案】【解】 (1)以P (ξ=k )记比赛经k 次结束的概率.若k 为奇数,则甲乙得分之差亦为奇数,因而有P (ξ=k )=0.考虑两次比赛结果:(1)甲连胜或乙连胜两次,称为有胜负的再次,结果出现的概率为p 2+q 2;(2)甲乙各胜一次,称为无胜负的两次,此结果有两种情况,故出现的概率为2pq . 比赛以k 次结束,k 必为偶数,则1,2两次,3,4两次,,k -3,k -2两次均未分胜负. 若k ≠10,则第k -1,k 两次为有胜负的两次,从而有 P (ξ=k )=(2pq )k /2-1(p 2+q 2).若k =10,比赛必须结束,所以P (ξ=20)=(2pq )4. ξ 1 2 3 4 5 6 7 8 9 10 Pp 2+q 22pq (p 2+q 2)4 p 2q 2 (p 2+q 2)8 p 3q 3 (p 2+q 2)16p 4q4综上所述E ξ=(p 2+q 2)4∑i =12i (2pq )i -1+10(2pq )4.(2) 令2 pq =x ,则0<x =2 pq ≤12(p +q )2=12,E ξ=(1-x ) 4∑i =12i (x )i -1+10(x )4=2(1+x +x 2+x 3+x 4)=2(1-x 5)1-x因为0<x ≤12,且Eξ随x 增加而增加,所以2<Eξ≤318.25.(江苏省扬州市扬州中学2014届高三10月月考数学试题)一个盒子装有六张卡片,上面分别写着如下六个定义域为R 的函数:f 1(x )=x ,f 2(x )=x 2,f 3(x )=x 3,f 4(x )=sin x ,f 5(x )=cos x ,f 6(x )=2.(1)现从盒子中任取两张卡片,将卡片上的函数相加得一个新函数,求所得函数是奇函数的概率; (2)现从盒子中进行逐一抽取卡片,且每次取出后均不放回,若取到一张记有偶函数的卡片则停止抽取,否则继续进行,求抽取次数ξ的分布列和数学期望.【答案】(1)记事件A 为“任取两张卡片,将卡片上的函数相加得到的函数是奇函数”,由题意知.51)(2623==C C A P(2)ξ可取1,2,3,4. 103)2(,21)1(151316131613=⋅=====C C C C P C C P ξξ,201)4(,203)3(1313141115121613141315121613=⋅⋅⋅===⋅⋅==C C C C C C C C P C C C C C C P ξξ; 故ξ的分布列为.47201420331032211=⨯+⨯+⨯+⨯=ξE 答:ξ的数学期望为.47 26.(江苏省丰县中学2014届高三10月阶段性测试数学(理)试题)在1,2,3,,9这9个自然数中,任取3个不同的数.(1)求这3个数中至少有1个是偶数的概率; (2)求这3个数和为18的概率;(3)设ξ为这3个数中两数相邻的组数(例如:若取出的数为1,2,3,则有两组相邻的数1,2和2,3,此时ξ的值是2).求随机变量ξ的分布列【答案】解:(1)记“这3个数至少有一个是偶数”为事件A ,则1221304545453937()42C C C C C C P A C ++==; (2)记“这3个数之和为18”为事件B ,考虑三数由大到小排列后的中间数只有可能为5、6、7、8,分别为459,567,468,369,279,378,189七种情况, 所以3971()12P B C ==;(3)随机变量ξ的取值为0,1,2,ξ的分布列为Eξ=⨯+⨯+⨯=. ∴ξ的数学期望为012122123。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2014届高三数学一轮突破单元检测训练:统计本试卷分第Ⅰ卷(选择题)和第Ⅱ卷(非选择题)两部分.满分150分.考试时间120分钟.第Ⅰ卷(选择题 共60分)一、选择题 (本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.若给出一组x 、y 之间的数据,则y 与x 之间的线性回归方程一定过点( )A . ()0,0B .(),0xC .()0,yD .(),x y【答案】D2.在某学校组织的一次数学模拟考试成绩统计中,工作人员采用简单随机抽样的方法,抽取一个容量为50的样本进行统计,若每个学生的成绩被抽到的概率为0.1,则可知这个学校参加这次数学考试的人数是( ) A .100人 B .600人 C .225人 D .500人 【答案】D3.已知一组数据54321,,,,x x x x x 的平均数是2,方差是13,那么另一组数据23,23,23,23,2354321-----x x x x x 的平均数和方差分别为( )A .2,13B .4,3C .4,23D . 2,1【答案】B4.甲、乙两名运动员在某项测试中的6次成绩的茎叶图如图2所示,1x ,2x 分别表示甲乙两名运动员这项测试成绩的平均数,12,s s 分别表示甲乙两名运动员这项测试成绩的标准差,则有( )A .1212,x x s s ><B .1212,x x s s =>C .1212,x x s s ==D .1212,x x s s =<【答案】D5.下列四个判断:①某校高三一班和高三二班的人数分别是,m n ,某次测试数学平均分分别是,a b ,则这两个班的数学平均分为2a b+; ②10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a ,中位数为b ,众数为c ,则有b a c >>;③从总体中抽取的样本11221111(,),(,),,(,),,n nn n i i i i x y x y x y x x y y n n ====∑∑ 若记,则回归直线y =bx a +必过点(,x y )④已知ξ服从正态分布(0N ,2)σ,且(20)0.4P ξ-≤≤=,则(2)0.2P ξ>=其中正确的个数有( )A .3个B . 2 个C . 个D .0个 【答案】C6.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图如右示,则该样本的中位数、众数、极差分别是( )A .46,45,56B .46,45,53C .47,45,56D .45,47,53 【答案】A7.为了评价某个电视栏目的改革效果,在改革前后分别从居民点抽取了100位居民进行调查,经过计算99.02≈K ,根据这一数据分析,下列说法正确的是( )A .有%99的人认为该栏目优秀B .有%99的人认为该栏目是否优秀与改革有关系C .有%99的把握认为电视栏目是否优秀与改革有关系D .没有理由认为电视栏目是否优秀与改革有关系 【答案】D 8.为保证树苗的质量,林业管理部门在每年3月12日植树节前都对树苗进行检测,现从甲、乙两种树苗中各抽测了10株树苗的高度(单位长度:cm ),其茎叶图如图所示,则下列描述正确的是( )A .甲种树苗的平均高度大于乙种树苗的平均高度,甲种树苗比乙种树苗长得整齐B .甲种树苗的平均高度大于乙种树苗的平均高度,乙种树苗比甲种树苗长得整齐C .乙种树苗的平均高度大于甲种树苗的平均高度,乙种树苗比甲种树苗长得整齐D .乙种树苗的平均高度大于甲种树苗的平均高度,甲种树苗比乙种树苗长得整齐 【答案】A9.某厂生产每吨产品的成本y (元)与生产过程中的废品率x (%)的回归方程为ˆ759yx =+,下列说法正确的是( )A .废品率每增加1%,成本每吨增加84元B .废品率每增加1%,成本每吨增加9%C .废品率每增加1%,成本每吨增加9元D .废品率每增加1%,成本每吨增加75元 【答案】C10.为调查中学生近视情况,测得某校男生150名中有80名近视,女生140名中有70名近视.在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( ) A .期望与方差 B .排列与组合 C .独立性检验 D .概率 【答案】C11.在一次实验中,测得()x y ,的四组值分别是(12)(23)(34)(45)A B C D ,,,,,,,,则y 与x 之间的回归直线方程为( ) A . 21y x =+B . 2y x =+C . 1y x =+D . 1y x =-【答案】C12.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a ,中位数为b ,众数为c ,则有( ) A .a b c >> B .b c a >> C .c a b >> D .c b a >> 【答案】D第Ⅱ卷(非选择题 共90分)二、填空题 (本大题共4个小题,每小题5分,共20分,把正确答案填在题中横线上) 13.某公司计划招聘男职工x 名,女职工y 名,要求女职工人数不能多于男职工,女职工的人数不得少于男职工的13,最少10名男职工,则该公司最少能招聘 名职工. 【答案】1414.某班50名学生的某项综合能力测试成绩统计如下表:已知该班的平均成绩10X =,则该班成绩的方差2S = (精确到0.001)【答案】1.76015.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x (单位:小时)与当天投篮命中率y 之间的关系:小李这 5天的平均投篮命中率为 ,用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为.【答案】0.5;0.5316.某中学期中考试后,对成绩进行分析,从某班中选出5名学生的总成绩和外语成绩如下表:,若已知外语成绩对总成绩的线性回归方程的斜率为0.25,则线性回归方程为____________【答案】)25.030,70,400(x y y x +-===三、解答题 (本大题共6个小题,共70分,解答应写出文字说明,证明过程或演算步骤)17.某校高一年段理科有8个班,在一次数学考试中成绩情况分析如下:(1) 求145分以上成绩y 对班级序号x 的回归直线方程。

(精确到0. 0001) (2) 能否在犯错误的概率不超过0.01的前提下认为7班与8班的成绩是否优秀(大于145分)与班级有关系。

【答案】 (1) 5.4=x y =517181=∑=i i i y x ;204281=∑=i i x2143.04295.4820455.48171882228181-≈-=⨯-⨯⨯-=-⋅-=∑∑==xx y x y x b i i i i i≈⨯--=-=5.4)2143.0(5x b y a 5.9643 (或5.9644)∴回归直线方程为: y bx a =+= -0.2143x+5.9643(2) 8.110804545)742383(9022=⨯⨯⨯⨯-⨯=k 因为 1.8<6.635所以在犯错误的概率不超过0.01的前提下不能认为7班与8班的成绩是否优秀(高于145分)与班级有关系。

18.某校高一某班的一次数学测试成绩(满分为100分)的茎叶图和频率分布直方图都受到不同程度的破坏,但可见部分如下,据此解答如下问题:(1)求分数在[50,60)的频率及全班人数;(2)求分数在[80,90)之间的频数,并计算频率分布直方图中[80,90)间的矩形的高;(3)若要从分数在[80,100]之间的试卷中任取两份分析学生失分情况,在抽取的试卷中,求至少有一份分数在[90,100]之间的概率.【答案】(1)分数在[50,60)的频率为0.008×10=0.08,由茎叶图知:分数在 [50,60)之间的频数为2,所以全班人数为20.08=25,(2)分数在[80,90)之间的频数为25-2-7-10-2=4;频率分布直方图中[80,90)间的矩形的高为425÷10=0.016.(3)将[80,90)之间的4个分数编号为1,2,3,4,[90,100]之间的2个分数编号为5,6, 在[80,100]之间的试卷中任取两份的基本事件为: (1,2),(1,3),(1,4),(1,5),(1,6), (2,3),(2,4),(2,5),(2,6), (3,4),(3,5),(3,6), (4,5),(4,6), (5,6)共15个,其中,至少有一份在[90,100]之间的基本事件有9个,故至少有一份分数在[90,100]之间的概率是915=0.6.19.甲、乙两人在相同条件下各射击10次,每次命中的环数如下: (1)分别计算以上两组数据的平均数; (2)分别计算以上两组数据的方差; 公式:])()()[(1222212x x x x x x ns n -++-+-=(3)根据计算结果,估计一下两人的射击情况.【答案】(1)甲的平均分为:71074109568768=+++++++++=甲x ;乙的平均分为:765978768776=+++++++++=乙x(2)甲的方差为:3])77()76()78[(1012222=-++-+-= 甲s ;乙的方差为:2.1])75()77()76[(1012222=-++-+-=乙s (3)甲、乙的平均分相同,说明甲、乙两人射击的平均水平相当,又甲2s >乙2s ,说明乙的射击水平要比甲的射击水平更稳定.20.甲、乙两个学校高三年级分别有1100人,1000人,为了统计两个学校在本地区一模考试的数学科目的成绩,采用分层抽样抽取了105名学生的成绩,并作了如下频率分布表。

(规定成绩在[130,150]内为优秀) 甲校:乙校:(I )计算x ,y 的值,并分别估计两个学校在此次一模考试中数学成绩的优秀率(精确到0.0001);(II )由以上统计数据填写下面的2×2列联表,并判断是否有90%的把握认为两个学校的数学成绩有差异,并说明理由。

附:22()()()()()n ad bc K a b c d a c b d -=++++【答案】(I )若该运动员希望获得该项目的第一名,应选择甲系列. 理由如下:选择甲系列最高得分为100+40=140>118,可能获得第一名;而选择乙系列最高得分为90+20=110<118,不可能获得第一名.记“该运动员完成K 动作得100分”为事件A ,“该运动员完成D 动作得40分”为事件B ,则P A .=34,P B .=34.记“该运动员获得第一名”为事件C ,依题意得P C .=P (AB )+()P AB =33134444×+×=34. 该运动员获得第一名的概率为34.(II )若该运动员选择乙系列,X 的可能取值是50,70,90,110, 则P (X =50)=111010×=1100, P (X =70)=191010×=9100,P (X =90)=911010×=9100, P (X =110)=991010×=81100.X 的分布列为:∴EX =50×1100+70×9100+90×9100+110×81100=104. 21.从甲、乙两个班级各随机抽取10名同学的数学成绩进行统计分析,两班成绩的茎叶图如图所示,成绩不小于90分为及格。

相关文档
最新文档