2020届高考数学(理)一轮复习课时训练:第11章_统计与统计案例_55_word版含解析
2020版高考数学一轮复习第十一章计数原理随机变量及分布列课时训练
第十一章计数原理、随机变量及分布列第1课时分类计数原理与分步计数原理一、填空题1. 三个人踢毽子,互相传递,每人每次只能踢一下.由甲开始踢,经过3次传递后,毽子又被踢回给甲.则不同的传递方式共有________种.答案:2解析:(列举法)传递方式有甲→乙→丙→甲;甲→丙→乙→甲.2. 将甲、乙、丙等六人分配到高中三个年级,每个年级2人.要求甲必须在高一年级,乙和丙均不在高三年级,则不同的安排种数为________.答案:9解析:若甲、乙在高一年级,则丙一定在高二年级,此时不同的安排种数为3;若甲、丙在高一年级,则乙一定在高二年级,此时不同的安排种数为3;若甲在高一年级,乙、丙在高二年级,此时不同的安排种数为3,所以由分类计数原理知不同的安排种数为9.3. 现有4名同学去听同时进行的3个课外知识讲座,每名同学可自由选择其中的一个讲座,不同选法的种数是________.答案:81解析:每个同学都有3种选择,所以不同选法共有34=81(种) .4. 五名学生争夺四项比赛的冠军(冠军不并列),获得冠军的可能性有________种.答案:625解析:获得冠军的可能情况有5×5×5×5=625(种).5. 4位同学从甲、乙、丙3门课程中选修1门,则恰有2人选修课程甲的不同选法有________种.答案:24解析:分三步,第一步先从4位同学中选2人选修课程甲,共有C24种不同选法;第二步给第3位同学选课程,有2种选法;第三步给第4位同学选课程,也有2种不同选法.故共有C24×2×2=24(种).6. 如图所示2×2方格,在每一个方格中填入一个数字,数字可以是1,2,3,4中的任何一个,允许重复.若填入A方格的数字大于B方格的数字,则不同的填法共有________种.答案:96解析:可分三步:第一步,填A,B方格的数字,填入A方格的数字大于B方格的数字有6种方式(若方格A填入2,则方格B只能填入1;若方格A填入3,则方格B只能填入1或2;若方格A填入4,则方格B只能填入1或2或3);第二步,填方格C的数字,有4种不同的填法;第三步,填方格D的数字,有4种不同的填法.由分步计数原理得不同的填法总数为6×4×4=96(种).7. 现有红、黄、蓝不同颜色的旗各三面,每次升一面、两面或三面在某一旗杆上纵向排列,共可以组成________种不同的旗语信号.答案:39解析:悬挂一面旗共可以组成3种旗语信号;悬挂两面旗共可以组成3×3=9(种)旗语信号;悬挂三面旗共可以组成3×3×3=27(种)旗语信号.由分类计数原理知,共有3+9+27=39(种)旗语信号.8. 将3个不同的小球放入编号分别为1,2,3,4的盒子内,则4号盒子中至少有一个球的放法有________种.答案:37解析:根据题意,将3个不同的小球放入编号分别为1,2,3,4的盒子内,有4×4×4=64(种)放法,而4号盒子中没有球,即3个小球放在1,2,3号的盒子内,有3×3×3=27(种)放法.所以4号盒子中至少有一个球的放法有64-27=37(种).9. 从0,1,2,3,4,5,6七个数字中,任意取出三个不同的数字,作为二次函数y=ax2+bx+c(a≠0)的系数,可得________个不同的二次函数.答案:180解析:由分步计算原理,可得6×6×5=180(个)不同的二次函数.10. 为举办校园文化节,某班推荐2名男生、3名女生参加文艺技能培训,培训项目及人数分别为:乐器1人,舞蹈2人,演唱2人,每人只参加一个项目,并且舞蹈和演唱项目必须有女生参加,则不同的推荐方案的种数为________.(用数字作答)答案:24解析:若参加乐器培训的是女生,则各有1名男生及1名女生分别参加舞蹈和演唱培训,共有3×2×2=12(种)方案;若参加乐器培训的是男生,则各有1名男生、1名女生及2名女生分别参加舞蹈和演唱培训,共有2×3×2=12(种)方案,所以共有24种推荐方案.11.如图,用4种不同的颜色对图中5个区域涂色(4种颜色全部使用),要求每个区域涂一种颜色,相邻的区域不能涂相同的颜色,则不同的涂色种数为________.答案:96解析:按区域1与3是否同色分类.(1) 区域1与3同色:先涂区域1与3,有4种方法,再涂区域2,4,5(还有3种颜色),有A33种方法.∴区域1与3涂同色,共有4A33=24(种)方法.(2) 区域1与3不同色:第一步,涂区域1与3,有A24种方法,第二步,涂区域2有2种方法,第三步,涂区域4只有1种方法,第四步,涂区域5有3种方法.∴这时共有A24×2×1×3=72(种)方法.故由分类计数原理,不同的涂色种数为24+72=96.二、解答题12. 书架的第一层有6本不同的数学书,第二层有6本不同的语文书,第三层有5本不同的英语书.(1) 从这些书中任取1本,有多少种不同的取法?(2) 从这些书中任取1本数学书,1本语文书,1本英语书共3本书的不同的取法有多少种?(3) 从这些书中任取3本,并且在书架上按次序排好,有多少种不同的排法?解:(1) 因为共有17本书,从这些书中任取1本,共有17种取法.(2) 分三步:第一步,从6本不同的数学书中取1本,有6种取法;第二步,从6本不同的语文书中取1本,有6种取法;第三步:从5本不同的英语书中取1本,有5种取法.由分步计数原理知,取法总数N=6×6×5=180(种).(3) 实际上是从17本书中任取3本放在三个不同的位置上,完成这个工作分三个步骤,第一步:从17本不同的书中取1本,放在第一个位置,有17种方法;第二步:从剩余16本不同的书中取1本,放在第二个位置,有16种方法;第三步:从剩余15本不同的书中取1本,放在第三个位置,有15种方法.由分步计数原理知,排法总数N=17×16×15=4 080(种).13. 如图是由四个全等的直角三角形与一个小正方形拼成的一个大正方形,现在用四种颜色给这四个直角三角形区域涂色,规定每个区域只涂一种颜色,相邻区域颜色不相同,则不同的涂色方法有多少种?解:如图,设四个直角三角形顺次为A ,B ,C ,D ,按A→B→C→D 顺序涂色,下面分两种情况: (1) A ,C 不同色(注意:B ,D 可同色、也可不同色,D 只要不与A ,C 同色,所以D 可以从剩余的2种颜色中任意取一色):有4×3×2×2=48(种);(2) A ,C 同色(注意:B ,D 可同色、也可不同色,D 只要不与A ,C 同色,所以D 可以从剩余的3种颜色中任意取一色):有4×3×1×3=36(种).所以不同的涂色方法共有84种.第2课时 排列与组合一、 填空题1. 若A 3n =6C 4n ,则n =________. 答案:7解析:n !(n -3)!=6×n !(n -4)!×4!,得n -3=4,解得n =7.2. 5人站成一排,甲、乙两人必须站在一起的不同排法有________种. 答案:48解析:可先排甲、乙两人,有A 22=2(种)排法,再把甲、乙两人与其他三人进行全排列,有A 44=24(种)排法,由分步计数原理,得一共有2×24=48(种)排法.3. 用数字1,2,3,4,5组成没有重复数字的五位数,其中奇数的个数为________. 答案:72解析:由题可知,五位数要为奇数,则个位数只能是1,3,5.分为两步:先从1,3,5三个数中选一个作为个位数有C 13种,再将剩下的4个数字排列得到A 44,则满足条件的五位数有C 13·A 44=72(个).4. 5位同学站成一排照相,其中甲与乙必须相邻,且甲不能站在两端的排法总数是________种. 答案:36解析:分三类:甲站第2个位置,则乙站1,3中的一个位置,不同的排法有C 12A 33=12(种);甲站第3个位置,则乙站2,4中的一个位置,不同的排法有C 12A 33=12(种);甲站第4个位置,则乙站3,5中的一个位置,不同的排法有C 12A 33=12(种).故共有12+12+12=36(种).5. 某电视台一节目收视率很高,现要连续插播4个广告,其中2个不同的商业广告和2个不同的公益宣传广告,要求最后播放的必须是商业广告,且2个商业广告不能连续播放,则不同的播放方式有________种.答案:8解析:分三步进行分析:第一步,最后一个排商业广告有A 12种;第二步,在前两个位置选一个排第二个商业广告有A 12种;第三步,余下的两个排公益宣传广告有A 22种.根据分步计数原理,可得不同的播放方式共有A 12A 12A 22=8(种).6. 用数字0,1,2,3,4组成没有重复数字的五位数,其中奇数的个数为________. 答案:36解析:由题可知,五位数为奇数,则个位数只能是1,3;分为两步:先从1,3两个数中选一个作为个位数有C 12种,再将中间3个位置中选一个放入0,剩下的3个数字排列得到A 33,则满足条件的五位数有C 12C 13A 33=36(个).7. 某大学的8名同学准备拼车去旅游,其中大一、大二、大三、大四每个年级各2名,分乘甲、乙两辆汽车,每车限坐4名同学(乘同一辆车的4名同学不考虑位置),其中大一的孪生姐妹需乘同一辆车,则乘坐甲车的4名同学中恰有2名同学是来自同一年级的乘坐方式共有________种.答案:24解析:分类讨论,有2种情形.孪生姐妹乘坐甲车,则有C 23C 12C 12=12(种)乘车方式;孪生姐妹不乘坐甲车,则有C13C12C12=12(种)乘车方式.由分类计数原理,得共有24种乘车方式.8. 甲、乙、丙3人站到共有7级的台阶上,若每级台阶最多站2人,同一级台阶上的人不区分站的位置,则不同的站法种数是________.(用数字作答)答案:336解析:若7个台阶上每一个只站一人,则有A37种;若有一个台阶有2人,另一个是1人,则共有C13A27种,因此共有不同的站法种数是336.9. 用1,2,3,4,5,6组成六位数(没有重复数字),要求任何相邻两个数字的奇偶性不同,且1和2相邻,这样的六位数的个数是________.(用数字作答)答案:40解析:本小题主要考查排列组合知识.依题先排除1和2的剩余4个元素有2A22A22=8种方案,再向这排好的4个元素中插入1和2捆绑的整体,有A15种插法,∴不同的安排方案共有2A22A22A15=40(种).10. 由0,1,2,…,9这十个数字组成的无重复数字的四位数中,十位数字与千位数字之差的绝对值等于7的四位数的个数是________.答案:280解析:当十位数字为0,千位数字为7时,四位数的个数是A28;当十位数字与千位数字为1,8时,四位数的个数是A28A22;当十位数字与千位数字为2,9时,四位数的个数是A28A22,故所求的四位数的个数是A28+A28A22+A28A22=280.11. 身穿红、黄两种颜色衣服的各有两人,身穿蓝色衣服的有一人,现将这五人排成一行,要求穿相同颜色衣服的人不能相邻,则不同的排法种数共有________种.答案:48解析:分类计数原理,按红红之间有蓝无蓝两类来分:(1) 当红红之间有蓝时,则有A22A24=24(种);(2) 当红红之间无蓝时,则有C12A22A33=24(种).因此,这五个人排成一行,穿相同颜色衣服的人不能相邻,则有48种排法.二、解答题12. 一种团体竞技比赛的积分规则是:每队胜、平、负分别得2分、1分、0分.已知甲球队已赛4场,积4分.在这4场比赛中,甲球队胜、平、负(包括顺序)的情况共有多少种?解:由题意,甲队积4分分三类情况:① 2胜2负,有C24C22=6(种);② 1胜2平1负,有C14C23=12(种);③ 0胜4平0负,有C44=1(种).综上可知共有6+12+1=19(种)情况.13. 某国际旅行社共有9名专业导游,其中6人会英语,4人会日语,若在同一天要接待5个不同的外国旅游团队,其中3个队要安排会英语的导游,2个队要安排会日语的导游,则不同的安排方法共有多少种?解:依题意,导游中有5人只会英语,3人只会日语,1人既会英语又会日语.按只会英语的导游分类:① 3个英语导游从只会英语人员中选取,则有A35A24=720(种);② 3个英语导游从只会英语的导游中选2名,另一名由既会英语又会日语的导游担任,则有C25A33A23=360(种).故不同的安排方法共有A35A24+C25A33A23=1 080(种).第3课时二项式定理一、填空题1. (2016·北京卷)在(1-2x)6的展开式中,x2的系数为________.(用数字作答)答案:60解析:由二项展开式的通项公式T r+1=C r6·(-2)r x r可知,x2的系数为C26(-2)2=60.2. (2016·山东卷)若(ax2+1x)5的展开式中x5的系数是-80,则实数a=________.答案:-2解析:因为T r+1=C r5(ax2)5-r(1x)r=C r5a5-r x10-52r,所以由10-52r=5得r=2,因此由C25a5-2=-80得a =-2.3. 在⎝ ⎛⎭⎪⎫ax -b x n(ab≠0,且a ,b 为常数)的展开式中,含x 项的系数为10a 3b 2,则n =________.答案:5解析:由题意,得展开式中含x 项的系数为C 2n a 3b 2,则由C 2n a 3b 2=10a 3b 2,即C 2n =10,解得n =5.4. 在(x 2-13x)n的展开式中,各项的二项式系数和为256,则展开式中常数项是________.答案:7解析:依题意,得2n =256,则n =8,则(x 2-13x)8展开式的通项T r +1=C r 8⎝ ⎛⎭⎪⎫128-r ·(-1)rx8-43r ,令8-43r =0,则r =6,因此展开式中的常数项T 7=C 68⎝ ⎛⎭⎪⎫122(-1)6=7.5. 若多项式x 2+x 10=a 0+a 1(x +1)+…+a 9(x +1)9+a 10(x +1)10,则a 9=________. 答案:-10解析:因为 x 2+x 10=[(x +1)-1]2+[(x +1)-1]10,所以a 9=C 110×(-1)=-10.6. 在(1+x)6(1+y)4的展开式中,记x m y n项的系数为f(m ,n),则f(3,0)+f(2,1)+f(1,2)+f(0,3)=________.答案:120解析:由题意可得f(3,0)+f(2,1)+f(1,2)+f(0,3)=C 36C 04+C 26C 14+C 16C 24+C 06C 34=20+60+36+4=120.7. 设(1-2x)7=a 0+a 1x +a 2x 2+a 3x 3+a 4x 4+a 5x 5+a 6x 6+a 7x 7,则代数式a 1+2a 2+3a 3+4a 4+5a 5+6a 6+7a 7的值为________.答案:-14解析:对已知等式的两边求导,得-14(1-2x)6=a 1+2a 2x +3a 3x 2+4a 4x 3+5a 5x 4+6a 6x 5+7a 7x 6,令x =1,有a 1+2a 2+3a 3+4a 4+5a 5+6a 6+7a 7=-14.8. 已知多项式(3x -1)7=a 0x 7+a 1x 6+a 2x 5+a 3x 4+a 4x 3+a 5x 2+a 6x +a 7,则|a 0|+|a 1|+|a 2|+|a 3|+|a 4|+|a 5|+|a 6|+|a 7|=________.答案:16 384解析:求 |a 0|+|a 1|+|a 2|+|a 3|+|a 4|+|a 5|+|a 6|+|a 7|的值相当于求(3x +1)7的系数和.即令x =1,|a 0|+|a 1|+|a 2|+|a 3|+|a 4|+|a 5|+|a 6|+|a 7|=47=16 384.9. 设二项式(x -a x)6(a>0)的展开式中x 3的系数为A ,常数项为 B.若B =4A ,则a 的值是________.答案:2解析:T r +1=(-1)r C r 6x 6-r ⎝ ⎛⎭⎪⎫a x r =(-1)r a r C r 6x6-32r ,令6-32r =3,得r =2,则A =(-1)2a 2C 26=15a 2.令6-32r =0得r =4,则B =(-1)4a 4C 46=15a 4.由B =4A 得15a 4=4×15a 2,又a >0,则a =2.10. 已知(1+x)+(1+x)2+(1+x)3+…+(1+x)n =a 0+a 1x +a 2x 2+…+a n x n,且a 0+a 1+a 2+…+a n =126,那么(x -1x)n的展开式中的常数项为________.答案:-20解析:令x =1得a 0+a 1+a 2+…+a n =2+22+…+2n =2×2n-12-1=2n +1-2=126⇒2n +1=128⇒2n+1=27⇒n =6,又T r +1=C r 6(x)6-r (-1x)r =C r 6(-1)r x 3-r ,所以由3-r =0得r =3,则常数项为-C 36=-20.二、 解答题 11. 求证:(1) 32n +2-8n -9能被64整除(n∈N *);(2) 3n >(n +2)·2n -1(n∈N *,n >2).证明:(1) ∵ 32n +2-8n -9=32·32n-8n -9=9·9n -8n -9=9(8+1)n-8n -9=9(C 0n 8n +C 1n 8n -1+…+C n -1n ·8+C nn ·1)-8n -9=9(8n +C 1n 8n -1+…+C n -2n 82)+9×8n +9-8n -9=9×82(8n -2+C 1n ·8n -3+…+C n -2n )+64n=64[9(8n -2+C 1n 8n -3+…+C n -2n )+n],∴ 32n +2-8n -9能被64整除.(2) ∵ n∈N *,且n >2,∴ 3n =(2+1)n 展开后至少有4项.(2+1)n =2n +C 1n ·2n -1+…+C n -1n ·2+1≥2n +n·2n -1+2n +1>2n +n ·2n -1=(n +2)·2n -1,∴ 3n >(n +2)·2n -1(n∈N *,n >2).12. 二项式(2x -3y)9的展开式中,求: (1) 二项式系数之和; (2) 各项系数之和;(3) 所有奇数项系数之和.解:设(2x -3y)9=a 0x 9+a 1x 8y +a 2x 7y 2+…+a 9y 9.(1) 二项式系数之和为C 09+C 19+C 29+…+C 99=29.(2) 令x =1,y =1,得各项系数之和为a 0+a 1+a 2+…+a 9=(2-3)9=-1. (3) 由(2)知a 0+a 1+a 2+…+a 9=-1,令x =1,y =-1,得a 0-a 1+a 2-…-a 9=59,将两式相加,得a 0+a 2+a 4+a 6+a 8=59-12,即为所有奇数项系数之和.13. (2017·徐州第一学期期末)已知等式(1+x)2n -1=(1+x)n -1(1+x)n.(1) 求(1+x)2n -1的展开式中含x n 的项的系数,并化简:C 0n -1C n n +C 1n -1C n -1n +…+C n -1n -1C 1n ;(2) 求证:(C 1n )2+2(C 2n )2+…+n(C n n )2=nC n2n -1.(1) 解:(1+x)2n -1的展开式中含x n 的项的系数为C n2n -1.由(1+x)n -1(1+x)n =(C 0n -1+C 1n -1x +…+C n -1n -1x n -1)(C 0n +C 1n x +…+C n n x n)可知,(1+x)n -1(1+x)n 的展开式中含x n 的项的系数为C 0n -1C n n +C 1n -1C n -1n +…+C n -1n -1C 1n .所以C 0n -1C n n +C 1n -1C n -1n +…+C n -1n -1C 1n =C n2n -1.(2) 证明:当k∈N *时,kC kn =k·n !k !(n -k )!=n !(k -1)!(n -k )!=n·(n -1)!(k -1)!(n -k )!=nC k -1n -1.所以(C 1n )2+2(C 2n )2+…+n(C n n )2第4课时 离散型随机变量及分布列、超几何分布一、 填空题1. 已知随机变量X 的分布列为P(X =k)=k15,k =1,2,3,4,5,则P(0.5<X <2.5)=________.答案:0.2解析:P(0.5<X <2.5)=P(X =1)+P(X =2)=1+215=15=0.2.2. 设随机变量X 的概率分布列如下表所示:F(x)=P(X≤x),则当x 答案:56解析:∵ a+13+16=1,∴ a =12.∵ x ∈[1,2),∴ F(x)=P(X≤x)=12+13=56.3. 设X 是一个离散型随机变量,其分布列为则q =________.答案:1-22解析:由分布列的性质知⎩⎪⎨⎪⎧1-2q≥0,q 2≥0,12+1-2q +q 2=1,所以q =1-22. 4. 在含有3件次品的10件产品中,任取4件,则取到次品数X =2的概率为________.答案:310解析:由题意,X 服从超几何分布,其中N =10,M =3,n =4,所以分布列为P(X =k)=C k 3·C 4-k 7C 410,k =0,1,2,3.即5. 若P(x≤x 2)=1-β112则P(x 1≤x ≤x 2)=________. 答案:1-(α+β)解析:由分布列性质可有P(x 1≤x ≤x 2)=P(x≤x 2)+P (x≥x 1)-1=(1-β)+(1-α)-1=1-(α+β).6. 甲、乙两队在一次对抗赛的某一轮中有3个抢答题,比赛规定:对于每一个题,没有抢到题的队伍得0分,抢到题并回答正确的得1分,抢到题但回答错误的扣1分(即得-1分).若X 是甲队在该轮比赛获胜时的得分(分数高者胜),则X 的所有可能取值是________.答案:-1,0,1,2,3解析:X =-1,甲抢到一题但答错了,而乙抢到了两个题都答错了;X =0,甲没抢到题,乙抢到3个题且答错至少2个题或甲抢到2题,但答时一对一错,而乙抢到一个题目并答错;X =1,甲抢到1题且答对,乙抢到2个题目且至少答错一个或甲抢到3题,且1错2对; X =2,甲抢到2题均答对; X =3,甲抢到3题均答对.7. 从装有3个红球,2个白球的袋中随机取出2个球,设其中有X 个红球,则随机变量X =1的概率为________.答案:0.6解析:P(X =1)=C 13·C 12C 25=0.6.8. 已知随机变量X 的分布列为P(X =i)=i2a(i =1,2,3,4),则P(2<X≤4)=________.答案:710解析:由分布列的性质得12a +22a +32a +42a=1,则a =5.所以P(2<X≤4)=P(X =3)+P(X =4)=310+410=710. 9. 从装有除颜色外没有区别的3个黄球、3个红球、3个蓝球的袋中摸3个球,设摸出的3个球的颜色种数为随机变量X ,则P(X =2)=________.答案:914解析:X =2,即摸出的3个球有2种颜色,其中一种颜色的球有2个,另一种颜色的球有1个,故P(X =2)=A 23C 23C 13C 39=914.10. 袋中共有6个除了颜色外完全相同的球,其中有1个红球,2个白球和3个黑球,从袋中任取两球,两球颜色为一白一黑的概率为________.答案:25解析:1个红球,2个白球和3个黑球分别记为a 1,b 1,b 2,c 1,c 2,c 3,从袋中任取两球共有a 1,b 1;a 1,b 2;a 1,c 1;a 1,c 2;a 1,c 3;b 1,b 2;b 1,c 1;b 1,c 2;b 1,c 3;b 2,c 1;b 2,c 2;b 2,c 3;c 1,c 2;c 1,c 3;c 2,c 315种,满足两球颜色为一白一黑有6种,概率为615=25.二、 解答题11. 从集合M ={1,2,3,4,5,6,7,8,9}中任取三个元素构成子集{a ,b ,c}. (1) 求a ,b ,c 中任意两数之差的绝对值均不小于2的概率;(2) 记a ,b ,c 三个数中相邻自然数的组数为X(如集合{3,4,5}中3和4相邻,4和5相邻,X =2),求随机变量X 的分布列及其数学期望E(X).解:(1) 从9个不同的元素中任取3个不同元素,为古典概型.记“a,b ,c 中任意两数之差的绝对值均不小于2”为事件A ,其基本事件总数n =C 39.由题意,a ,b ,c 均不相邻,利用插空法得,事件A 包含基本事件数m =C 37.故P(A)=C 37C 39=512.所以,a ,b ,c 中任意两数之差的绝对值均不小于2的概率为512.(2)所以E(X)=0×512+1×12+2×12=3.12. 某中学有4位学生申请A ,B ,C 三所大学的自主招生.若每位学生只能申请其中一所大学,且申请其中任何一所大学是等可能的.(1) 求恰有2人申请A 大学的概率;(2) 求被申请大学的个数X 的概率分布列与数学期望E(X).解:(1) 记“恰有2人申请A 大学”为事件A ,P(A)=C 24×2234=2481=827.(2) X 的所有可能值为1,2,3.P(X =1)=334=127,P(X =2)=C 34×A 23+3×A 2334=4281=1427,P(X =3)=C 24×A 3334=3681=49. X 的概率分布列为所以X 的数学期望E(X)=1×27+2×27+3×9=27.13. 某超市在节日期间进行有奖促销,规定凡在该超市购物满400元的顾客,均可获得一次摸奖机会.摸奖规则如下:奖盒中放有除颜色不同外其余完全相同的4个球(红、黄、黑、白).顾客不放回的每次摸出1个球,若摸到黑球则摸奖停止,否则就继续摸球.按规定摸到红球奖励20元,摸到白球或黄球奖励10元,摸到黑球不奖励.(1) 求1名顾客摸球2次摸奖停止的概率;(2) 记X 为1名顾客摸奖获得的奖金数额,求随机变量X 的分布列和数学期望.解:(1) 设“1名顾客摸球2次停止摸奖”为事件A ,则P(A)=C 13A 24=14,故1名顾客摸球2次停止摸奖的概率为14.(2) 随机变量X 的所有取值为0,10,20,30,40.P(X =0)=14,P(X =10)=A 12A 24=16,P(X =20)=A 22A 34+1A 24=16,P(X =30)=C 12A 22A 34=16,P(X =40)=A 33A 44=14,所以随机变量X 的分布列为所以E(X)=0×14+10×6+20×6+30×6+40×4=20.第5课时 独立性及二项分布一、 填空题1. 周老师上数学课时,给班里同学出了两道选择题,她预估计做对第一道题的概率为0.80,做对两道题的概率为0.60,则预估计做对第二道题的概率为________.答案:0.75解析:记做对第一道题为事件A ,做对第二道题为事件B ,则P(A)=0.80,P(AB)=0.60,因为做对第一道、第二道题这两个事件是相互独立的,所以P(AB)=P(A)P(B),即P(B)=P (AB )P (A )=0.600.80=0.75.2. 已知盒中装有3个红球、2个白球、5个黑球,它们大小形状完全相同,现需一个红球,甲每次从中任取一个不放回,在他第一次拿到白球的条件下,第二次拿到红球的概率为________.答案:13解析:事件A :“第一次拿到白球”,事件B :“第二次拿到红球”,则P(A)=210=15,P(AB)=210·39=115,故P(B|A)=P (AB )P (A )=13. 3. 设随机变量X ~B ⎝ ⎛⎭⎪⎫6,12,则P(X =3)=________. 答案:516解析:X ~B ⎝ ⎛⎭⎪⎫6,12,由二项分布可得,P(X =3)=C 36⎝ ⎛⎭⎪⎫123·⎝ ⎛⎭⎪⎫1-123=516.4. (2017·徐州期末改编)甲、乙、丙分别从A ,B ,C ,D 四道题中独立地选做两道题,其中甲必选B 题,则甲选做D 题,且乙、丙都不选做D 题的概率为________.答案:112解析:设“甲选做D 题,且乙、丙都不选做D 题”为事件E.甲选做D 题的概率为C 11C 13=13,乙、丙不选做D 题的概率都是C 23C 24=12.则P(E)=13×12×12=112,即甲选做D 题,且乙、丙都不选做D 题的概率为112.5. 一射手对同一目标独立地射击四次,已知至少命中一次的概率为8081,则此射手每次射击命中的概率为________.答案:23解析:由题意可知该射手对同一目标独立地射击了四次全都没有命中的概率为1-8081=181,设该射手每次射击命中的概率为p ,则(1-p)4=181,所以p =23.6. 有3位同学参加某项测试,假设每位同学能通过测试的概率都是12,且各人能否通过测试是相互独立的,则至少有2位同学能通过测试的概率为________.答案:12解析:记“至少有2位同学能通过测试”为事件A ,则其包含的事件为“恰好有2位同学能通过测试”或“恰好有3位同学能通过测试”,而每位同学不能通过测试的概率都是1-12=12,且相互独立,故P(A)=C 23⎝ ⎛⎭⎪⎫123+C 33⎝ ⎛⎭⎪⎫123=12.7. 某种电路开关闭合后,会出现红灯或绿灯闪烁,已知开关第一次闭合后出现红灯闪烁的概率是12,两次闭合都出现红灯闪烁的概率为16.则在第一次闭合后出现红灯闪烁的条件下第二次出现红灯闪烁的概率为________.答案:13解析:设事件A :第一次闭合后出现红灯闪烁;事件B :第二次闭合出现红灯闪烁.则P(A)=12,P(AB)=16,故满足条件的P(B|A)=P (AB )P (A )=1612=13.8. 甲、乙两人同时报考某一所大学,甲被录取的概率为0.6,乙被录取的概率为0.7,两人是否被录取互不影响,则其中至少有一人被录取的概率为________.答案:0.88 解析:因为甲、乙两人是否被录取相互独立,又因为所求事件的对立事件为“两人均未被录取”,由对立事件和相互独立事件概率公式知,P =1-(1-0.6)(1-0.7)=1-0.12=0.88.9. 设随机变量X ~B(2,p),η~B(4,p).若P(X≥1)=59,则P(η≥2)的值为________.答案:1127解析:由P(X≥1)=59,得C 12p(1-p)+C 22p 2=59,即9p 2-18p +5=0,解得p =13或p =53(舍去),∴ P(η≥2)=C 24p 2(1-p)2+C 34p 3(1-p)+C 44p 4=6×⎝ ⎛⎭⎪⎫132×⎝ ⎛⎭⎪⎫232+4×⎝ ⎛⎭⎪⎫133×23+⎝ ⎛⎭⎪⎫134=1127.二、 解答题10. 某企业有甲、乙两个研发小组,他们研发新产品成功的概率分别为23和35.现安排甲组研发新产品A ,乙组研发新产品B.设甲、乙两组的研发相互独立.(1) 求至少有一种新产品研发成功的概率;(2) 若新产品A 研发成功,预计企业可获利润120万元;若新产品B 研发成功,预计企业可获利润100万元.求该企业可获利润的分布列.解:记E ={甲组研发新产品成功},F ={乙组研发新产品成功},由题设知P(E)=23,P(E -)=13,P(F)=35,P(F -)=25,且事件E 与F ,E 与F -,E -与F ,E -与F -都相互独立.(1) 记H ={至少有一种新产品研发成功},则H -=E -F -,于是P(H -)=P(E -)P(F -)=13×25=215,故所求的概率为P(H)=1-P(H -)=1-215=1315.(2) 设企业可获利润为X(万元),则X 的可能取值为0,100,120,220.因为P(X =0)=P(E -F -)=13×25=215,P(X =100)=P(E -F)=13×35=315=15,P(X =120)=P(E F -)=23×25=415,P(X =220)=P(EF)=23×35=615=25.故所求的分布列为11. 某考生从62道解答题. (1) 求该考生至少抽到1道解答题的概率;(2) 若所抽取的3道题中有2道填空题,1道解答题.已知该考生答对每道填空题的概率为23,答对每道解答题的概率为12,且各题答对与否相互独立.用X 表示该考生答对题的个数,求X 的分布列和数学期望.解:(1) 记该考生至少抽到1道解答题为事件A ,则P(A)=1-P(A)=1-C 34C 36=1-15=45.(2) X 所有的可能取值为0,1,2,3.P(X =0)=⎝ ⎛⎭⎪⎫1-232·⎝ ⎛⎭⎪⎫1-12=118;P(x =1)=C 12·23·⎝ ⎛⎭⎪⎫1-23·⎝ ⎛⎭⎪⎫1-12+⎝ ⎛⎭⎪⎫1-232·12=518;P(X =2)=C 12·23·⎝ ⎛⎭⎪⎫1-23·12+⎝ ⎛⎭⎪⎫232·⎝ ⎛⎭⎪⎫1-12=818=49;P(X =3)=⎝ ⎛⎭⎪⎫232·12=29.所以X 的分布列为所以E(X)=0×118+1×18+2×9+3×9=18.12. 在一次数学考试中,第21题和第22题为选做题.规定每位考生必须且只需从其中选做一题.设4名考生选做每一道题的概率均为12.(1) 求其中甲、乙两名考生选做同一道题的概率;(2) 设这4名考生中选做第22题的考生个数为X ,求X 的分布列.解:(1) 设事件A 表示“甲选做第21题”,事件B 表示“乙选做第21题”,则甲、乙两名考生选做同一道题的事件为“AB+A - B -”,且事件A 与事件B 相互独立.故P(AB +A - B -)=P(A)P(B)+P(A -)P(B -)=12×12+⎝ ⎛⎭⎪⎫1-12×⎝ ⎛⎭⎪⎫1-12=12.(2) 随机变量X 的可能取值为0,1,2,3,4,且X ~B ⎝ ⎛⎭⎪⎫4,12, 则P(X =k)=C k 4⎝ ⎛⎭⎪⎫12k ⎝ ⎛⎭⎪⎫1-124-k =C k 4⎝ ⎛⎭⎪⎫124(k =0,1,2,3,4). 故随机变量X 的分布列为13. 产量均具有随机性,且互不影响,其具体情况如下表:(1) 设X (2) 若在这块地上连续3季种植此作物,求这3季中至少有2季的利润不少于2 000元的概率. 解:(1) 设A 表示事件“作物产量为300 kg ”,B 表示事件“作物市场价格为6元/kg ”,由题设知P(A)=0.5,P(B)=0.4,因为利润=产量×市场价格-成本,500×10-1 000=4 000,500×6-1 000=2 000,300×10-1 000=2 000,300×6-1 000=800.所以X 所有可能的取值为4 000,2 000,800.P(X =4 000)=P(A -)P(B -)=(1-0.5)×(1-0.4)=0.3,P(X =2 000)=P(A -)P(B)+P(A)P(B -)=(1-0.5)×0.4+0.5×(1-0.4)=0.5, P(X =800)=P(A)P(B)=0.5×0.4=0.2. 则X 的分布列为(2) 设C i 表示事件“第i 3), 由题意知C 1,C 2,C 3相互独立,由(1)知,P(C i )=P(X =4 000)+P(X =2 000)=0.3+0.5=0.8(i =1,2,3), 3季的利润均不少于2 000元的概率为P(C 1C 2C 3)=P(C 1)P(C 2)P(C 3)=0.83=0.512; 3季中有2季的利润不少于2 000元的概率为 P(C -1C 2C 3)+P(C 1C -2C 3)+P(C 1C 2C -3)=3×0.82×0.2=0.384.所以,这3季中至少有2季的利润不少于2 000元的概率为0.512+0.384=0.896.第6课时 离散型随机变量的均值与方差一、 填空题1. 设X 是一个离散型随机变量,其概率分布列如下表:则q =________.答案:12解析:∵ 随机变量的概率非负且随机变量取遍所有可能值时相应的概率之和等于1,∴⎩⎪⎨⎪⎧0.5+1-32q +q 2=1 ①,0<1-32q <1 ②,q 2<1 ③.解得q =12或1,而把q =1代入②③不合题意,舍去,∴ q =12.2. 设随机变量X 的分布列为P(X =k)=15(k =2,4,6,8,10),则V(X)=________.答案:8解析:∵ E(X)=15(2+4+6+8+10)=6,∴ V(X)=15[(-4)2+(-2)2+02+22+42]=8.3. 某老师从课本上抄录一个随机变量X 的分布列如下表:请小牛同学计算x 断定这两个“?”处的数值相同.据此,小牛给出了正确答案E(X)=________.答案:2解析:设“?”处的数值为x ,则“!”处的数值为1-2x ,则E(X)=1·x +2×(1-2x)+3x =x +2-4x +3x =2.4. 同时抛掷两枚质地均匀的硬币,当至少有一枚硬币正面向上时,就说这次试验成功,则在2次试验中成功次数X 的均值是________.答案:32解析:由题意知,试验成功的概率p =34,故X ~B ⎝ ⎛⎭⎪⎫2,34,所以E(X)=2×34=32. 5. 若离散型随机变量X 的分布列如下表:则X 的数学期望E(X)=答案:12解析:∵ 分布列中概率和为1,∴ a 2+a 22=1,即a 2+a -2=0,解得a =-2(舍去)或a =1,∴E(X)=12.6. 已知随机变量X 服从二项分布X ~B(n ,p).若E(X)=30,V(X)=20,则p =________.答案:13解析:依题可得E(X)=np =30且V(X)=np(1-p)=20,解得p =13.7. 抛掷两枚骰子,当至少一枚5点或一枚6点出现时,就说这次试验成功,则在10次试验中成功次数的均值为________.答案:509解析:抛掷两枚骰子,当两枚骰子不出现5点和6点时的概率为46×46=49,所以至少有一次出现5点或6点的概率为1-49=59,用X 表示10次试验中成功的次数,则随机变量X 满足二项分布X ~B ⎝⎛⎭⎪⎫10,59,E(X)=10×59=509. 8. 设整数m 是从不等式x 2-2x -8≤0的整数解的集合S 中随机抽取的一个元素,记随机变量X =m 2,则x 的数学期望E(X)=________.答案:5解析:由不等式x 2-2x -8≤0,得-2≤x≤4,∴ S ={-2,-1,0,1,2,3,4},∴ X =0,1,4,9,16,其分布列为∴ E(X)=0×17+1×7+4×7+9×7+16×7=7=5.9. 一个人将编号为1,2,3,4的四个小球随机放入编号为1,2,3,4的四个盒子,每个盒子放一个小球,球的编号与盒子的编号相同时叫做放对了,否则叫做放错了.设放对个数记为X ,则X 的数学期望为________.答案:1解析:将四个不同小球放入四个不同盒子,每个盒子放一个小球,共有A 44种不同放法,放对的个数X 可取的值有0,1,2,4,其中P(X =0)=9A 44=38,P(X =1)=C 14×2A 44=13,P(X =2)=C 24A 44=14,P(X=4)=1A 44=124,E(X)=0×38+1×13+2×14+4×124=1.二、 解答题10. 某校举办校园科技文化艺术节,在同一时间安排《生活趣味数学》和《校园舞蹈赏析》两场讲座.已知A ,B 两学习小组各有5位同学,每位同学在两场讲座中任意选听一场.A 组1人选听《生活趣味数学》,其余4人选听《校园舞蹈赏析》;B 组2人选听《生活趣味数学》,其余3人选听《校园舞蹈赏析》.(1) 若从此10人中任意选出3人,求选出的3人中恰有2人选听《校园舞蹈赏析》的概率; (2) 若从A ,B 两组中各任选2人,设X 为选出的4人中选听《生活趣味数学》的人数,求X 的分布列和数学期望E(X).解:(1) 设“选出的3人中恰有2人选听《校园舞蹈赏析》”为事件M ,则P(M)=C 27C 13C 310=2140.所以选出的3人中恰有2人选听《校园舞蹈赏析》的概率为2140.(2) X 可能的取值为0,1,2,3,P(X =0)=C 24C 23C 25C 25=950,P(X =1)=C 11C 14C 23+C 24C 12C 13C 25C 25=1225,P(X =3)=C 11C 14C 22C 25C 25=125,故P(X =2)=1-P(X =0)-P(X =1)-P(X =3)=310.所以X 的分布列为所以X 的数学期望E(X)=0×50+1×25+2×10+3×25=5.11. 甲、乙、丙三名同学参加歌唱、围棋、舞蹈、阅读、游泳5个课外活动,每个同学彼此独立地选择参加3个活动,其中甲同学喜欢唱歌但不喜欢下棋,所以必选歌唱,不选围棋,另在舞蹈、阅读、游泳中随机选2个,同学乙和丙从5个课外活动中任选3个.(1) 求甲同学选中舞蹈且乙、丙两名同学未选中舞蹈的概率;。
2020高考全国一轮数学理科 第十一章 复数、算法、统计
%# !"#$黄冈期末复数L#"L! 在复平面内分别对应点!""" L# C,A-5"将点! 绕原点9 逆时针旋转8"V得到点""则 L! C """"(
二解答题 &# 设复数LC $)A924%%A$!)B456%%5$5为虚数单位%"若对
任意的实数%"L +!"求实数)的取值范围(
)# 已知L ( 2"且满足ELE! A $LALB%5C .A!5$5是 虚 数 单位%( $#%求L( $!%若 + ( -"W CL5A+"求证'EWE&#(
#!."则输出的)C """"(
第$题
第&题
* !"' *
高考总复习%一轮配套精练%数学理科 !!!!!!!!!!!!!!!!!!!!!
'# 秦九韶算法是南宋时期数学家秦九韶提出的一种多项式 )# 九连环是我国一种传统的智力玩具"其构造如图$#%所示"
简化算法"即使在现代"它依然是利用计算机解决多项式 要将8个圆环全部从框架上解下$或套上%"无论是哪种情
!"""0 三所学校的高三文科学生人数成等差数列"在三月
进行全市联考后"准备用分层抽样的方法从所有高三文科
学生中抽取容量为#!"的样本进行成绩分析"则应从" 校
学生中抽取"""" 人(
%# 经问卷调查"某班学生对摄影分别执+喜欢,&+不喜欢,和
高考数学(理)一轮复习课时训练:第11章统计与统计案例55Word版含解析
【课时训练】第55节随机抽样一、选择题1.(天津模拟)某学校礼堂有30排座位,每排有20个.一次心理讲座时礼堂中坐满了学生,会后为了了解有关情况,留下座位号是15的30名学生.这里运用的抽样方法是()A.抽签法B.随机数法C.系统抽样D.分层抽样【答案】C【解析】由留下的学生座位号均相差一排可知是系统抽样.2.(广东潮州二模)某城市修建经济适用房.已知甲、乙、丙三个社区分别有低收入家庭360户、270户、180户,若首批经济适用房中有90套住房用于解决住房紧张问题,采用分层抽样的方法决定各社区户数,则应从乙社区中抽取低收入家庭的户数为() A.40 B.36C.30 D.20【答案】C【解析】利用分层抽样的比例关系,设从乙社区抽取n户,则270360+270+180=n90,解得n=30.3.(石家庄模拟)某学校高三年级一班共有60名学生,现采用系统抽样的方法从中抽取6名学生做“早餐与健康”的调查,为此将学生编号为1,2,…,60.选取的这6名学生的编号可能是() A.1,2,3,4,5,6 B.6,16,26,36,46,56C.1,2,4,8,16,32 D.3,9,13,27,36,54【答案】B【解析】由系统抽样知识可知,所取学生编号之间的间距相等且为10,所以应选B.4.(河北三市第二次联考)将参加夏令营的600名学生编号为001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为( )A .26,16,8B .25,17,8C .25,16,9D .24,17,9 【答案】B【解析】由题意及系统抽样的定义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k (k ∈N *)组抽中的号码是3+12(k -1).令3+12(k -1)≤300,得k ≤1034,因此第Ⅰ营区被抽中的人数是25;令300<3+12(k -1)≤495,得1034<k ≤42,因此第Ⅱ营区被抽中的人数是42-25=17.故选B.5.(兰州双基测试)从一个容量为N 的总体中抽取一个容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p 1,p 2,p 3,则( )A .p 1=p 2<p 3B .p 2=p 3<p 1C .p 1=p 3<p 2D .p 1=p 2=p 3 【答案】D【解析】根据简单随机抽样、系统抽样和分层抽样的定义可知,无论哪种抽样,每个个体被抽中的概率都是相等的,所以p 1=p 2=p 3.6.(珠海摸底)为了解72名学生的学习情况,采用系统抽样的方法,从中抽取容量为8的样本,则分段的间隔为( )A .9B .8C .10D .7【答案】A【解析】由系统抽样方法知,72人分成8组,故分段间隔为72÷8=9.7.(邯郸摸底)某校数学教研组为了解学生学习数学的情况,采用分层抽样的方法从高一600人、高二780人、高三n人中,抽取35人进行问卷调查.已知高二被抽取的人数为13,则n=() A.660 B.720C.780 D.800【答案】B【解析】由已知可得,抽样比为13780=160,从而35600+780+n=160,解得n=720.8.(江西八校联考)从编号为001,002,…,500的500个产品中用系统抽样的方法抽取一个样本,已知样本中编号最小的两个编号分别为007,032,则样本中最大的编号应该为()A.480 B.481C.482D.483【答案】C【解析】根据系统抽样的定义可知样本的编号成等差数列,令a1=7,a2=32,d=25,所以7+25(n-1)≤500.所以n≤20.72,故最大编号为7+25×(20-1)=482.二、填空题9.(江西吉安一中期中)一个总体中有90个个体,随机编号0,1,2,…,89,依从小到大的编号顺序平均分成9个小组,组号依次为1,2,3,…,9.现用系统抽样方法抽取一个容量为9的样本,规定如果在第1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与m+k的个位数字相同.若m=8,则在第8组中抽取的号码是________.【答案】76【解析】由题意知m=8,k=8,则m+k=16,也就是第8组抽取的号码个位数字为6,十位数字为8-1=7,故抽取的号码为76.10.(重庆一中模拟)已知某商场新进3 000袋奶粉,为检查其三聚氰胺是否超标,现采用系统抽样的方法从中抽取150袋进行检查,将3 000袋奶粉按1,2,…,3 000 随机编号.若第一组抽出的号码是11,则第六十一组抽出的号码为________.【答案】1 211【解析】由题意知,抽样比为k =3 000150=20,又第一组抽出的号码是11,则11+60×20=1 211,故第六十一组抽出的号码为1 211.三、解答题11.(河北邯郸质检)某校高中三年级的295名学生已经编号为1,2,3,…,295,为了了解学生的学习情况,要按1∶5的比例抽取一个样本,用系统抽样的方法进行抽取,请写出抽样过程.【解】按1∶5的比例抽样,295÷5=59.第一步,把295名同学分成59组,每组5人.第一组是编号为1~5的5名学生,第二组是编号为6~10的5名学生,…,依次类推,第59组是编号为291~295的5名学生.第二步,采用简单随机抽样,从第一组5名学生中随机抽取1名,不妨设其编号为k (1≤k ≤5).第三步,从以后各段中依次抽取编号为k +5i (i =1,2,3,…,58)的学生,再加上从第一段中抽取的编号为k 的学生,得到一个容量为59的样本.。
2020届高考数学(理)一轮复习课时训练:第11章 统计与统计案例 55 Word版含解析
【课时训练】第55节 随机抽样一、选择题1.(2018天津模拟)某学校礼堂有30排座位,每排有20个.一次心理讲座时礼堂中坐满了学生,会后为了了解有关情况,留下座位号是15的30名学生.这里运用的抽样方法是( )A .抽签法B .随机数法C .系统抽样D .分层抽样 【答案】C【解析】由留下的学生座位号均相差一排可知是系统抽样.2.(2018广东潮州二模)某城市修建经济适用房.已知甲、乙、丙三个社区分别有低收入家庭360户、270户、180户,若首批经济适用房中有90套住房用于解决住房紧张问题,采用分层抽样的方法决定各社区户数,则应从乙社区中抽取低收入家庭的户数为( )A .40B .36C .30D .20 【答案】C【解析】利用分层抽样的比例关系,设从乙社区抽取n 户,则270360+270+180=n 90,解得n =30. 3.(2018石家庄模拟)某学校高三年级一班共有60名学生,现采用系统抽样的方法从中抽取6名学生做“早餐与健康”的调查,为此将学生编号为1,2,…,60.选取的这6名学生的编号可能是( )A .1,2,3,4,5,6B .6,16,26,36,46,56C .1,2,4,8,16,32D .3,9,13,27,36,54【答案】B【解析】由系统抽样知识可知,所取学生编号之间的间距相等且为10,所以应选B.4.(2018河北三市第二次联考)将参加夏令营的600名学生编号为001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为( )A .26,16,8B .25,17,8C .25,16,9D .24,17,9 【答案】B【解析】由题意及系统抽样的定义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k (k ∈N *)组抽中的号码是3+12(k -1).令3+12(k -1)≤300,得k ≤1034,因此第Ⅰ营区被抽中的人数是25;令300<3+12(k -1)≤495,得1034<k ≤42,因此第Ⅱ营区被抽中的人数是42-25=17.故选B.5.(2018兰州双基测试)从一个容量为N 的总体中抽取一个容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p 1,p 2,p 3,则( )A .p 1=p 2<p 3B .p 2=p 3<p 1C .p 1=p 3<p 2D .p 1=p 2=p 3 【答案】D【解析】根据简单随机抽样、系统抽样和分层抽样的定义可知,无论哪种抽样,每个个体被抽中的概率都是相等的,所以p 1=p 2=p 3.6.(2018珠海摸底)为了解72名学生的学习情况,采用系统抽样的方法,从中抽取容量为8的样本,则分段的间隔为( )A .9B .8C .10D .7【答案】A【解析】由系统抽样方法知,72人分成8组,故分段间隔为72÷8=9.7.(2018邯郸摸底)某校数学教研组为了解学生学习数学的情况,采用分层抽样的方法从高一600人、高二780人、高三n 人中,抽取35人进行问卷调查.已知高二被抽取的人数为13,则n =( )A .660B .720C .780D .800 【答案】B【解析】由已知可得,抽样比为13780=160,从而35600+780+n =160,解得n =720.8.(2018江西八校联考)从编号为001,002,…,500的500个产品中用系统抽样的方法抽取一个样本,已知样本中编号最小的两个编号分别为007,032,则样本中最大的编号应该为( )A .480B .481C .482D .483【答案】C【解析】根据系统抽样的定义可知样本的编号成等差数列,令a 1=7,a 2=32,d =25,所以7+25(n -1)≤500.所以n ≤20.72,故最大编号为7+25×(20-1)=482.二、填空题9.(2018江西吉安一中期中)一个总体中有90个个体,随机编号0,1,2,…,89,依从小到大的编号顺序平均分成9个小组,组号依次为1,2,3,…,9.现用系统抽样方法抽取一个容量为9的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 组中抽取的号码个位数字与m +k 的个位数字相同.若m =8,则在第8组中抽取的号码是________.【答案】76【解析】由题意知m =8,k =8,则m +k =16,也就是第8组抽取的号码个位数字为6,十位数字为8-1=7,故抽取的号码为76.10.(2018重庆一中模拟)已知某商场新进3 000袋奶粉,为检查其三聚氰胺是否超标,现采用系统抽样的方法从中抽取150袋进行检查,将3 000袋奶粉按1,2,…,3 000 随机编号.若第一组抽出的号码是11,则第六十一组抽出的号码为________.【答案】1 211【解析】由题意知,抽样比为k =3 000150=20,又第一组抽出的号码是11,则11+60×20=1 211,故第六十一组抽出的号码为1 211.三、解答题11.(2018河北邯郸质检)某校高中三年级的295名学生已经编号为1,2,3,…,295,为了了解学生的学习情况,要按1∶5的比例抽取一个样本,用系统抽样的方法进行抽取,请写出抽样过程.【解】按1∶5的比例抽样,295÷5=59.第一步,把295名同学分成59组,每组5人.第一组是编号为1~5的5名学生,第二组是编号为6~10的5名学生,…,依次类推,第59组是编号为291~295的5名学生.第二步,采用简单随机抽样,从第一组5名学生中随机抽取1名,不妨设其编号为k (1≤k ≤5).第三步,从以后各段中依次抽取编号为k +5i (i =1,2,3,…,58)的学生,再加上从第一段中抽取的编号为k 的学生,得到一个容量为59的样本.。
2020届高考数学(理)一轮复习课时训练第11章 统计与统计案例 56 Word版含解析
【课时训练】第节用样本估计总体
一、选择题.(山西四校联考)某学校组织学生参加数学测试,
成绩的频率分布直方图如图,数据的分组依次为[),[),[),[].若低于分的人数是,则该班的学生人数是( )
.
.
.
.
【答案】【解析】∵[),[)的频率和为(+)×=,∴该班的学生人数是=..(江西南昌一模)若数据,,,…,的平均数为=,方差=,
则数据+++,…,+的平均数和方差分别为( )
.
.
.
.
【答案】
【解析】∵,,,…,的平均数为,
∴=.
∴+=×+=.
∵,,,…,的方差为,∴+++,…,+的方差是×=.故选..(武汉质检)某地区教育主管部门为了对该地区模拟考试成绩
进行分析,抽取了总成绩在分到分之间的名学生的成绩,并根据这名学生的总成绩画了样本的频率分布直方图,
则总成绩在[)内的学生共有( )
.人
.人
.人
.人
【答案】【解析】由频率分布直方图可求得=,故[)对应的频率为(+)×
=,故总成绩在[)内的学生共有×=(人).故选..(吉林长春质检)已知某班级部分同学一次测验的成绩统计如
图,则其中位数和众数分别为( )
.
.
.
.
【答案】【解析】由茎叶图可知,此组数据由小到大排列依次为,共个,故为中位数,出现次数最多的为众数,故众数为,故选..(陕西质检)某班位学生期中考试数学成绩的频率分布直方图
如图所示,其中成绩分组区间是:[),[),[),[),[),[],
则图中的值等于( )。
2020版高考数学人教版理科一轮复习课时作业:11 函数与方程含解析
课时作业11 函数与方程一、选择题1.函数f (x )=Error!的零点个数是( D )A .0B .1C .2D .3解析:当x >0时,令f (x )=0可得x =1;当x ≤0时,令f (x )=0可得x =-2或x =0.因此函数的零点个数为3.故选D.2.方程ln(x +1)-=0(x >0)的根存在的大致区间是( B )2x A .(0,1)B .(1,2)C .(2,e)D .(3,4)解析:令f (x )=ln(x +1)-,则f (1)=ln(1+1)-2=ln2-2<0,f (2)2x =ln3-1>0,所以函数f (x )的零点所在大致区间为(1,2).故选B.3.已知函数f (x )=log 3-a 在区间(1,2)内有零点,则实数a 的取值范x +2x 围是( C )A .(-1,-log 32)B .(0,log 52)C .(log 32,1)D .(1,log 34)解析:∵单调函数f (x )=log 3-a 在区间(1,2)内有零点,∴f (1)·f (2)x +2x <0,即(1-a )·(log 32-a )<0,解得log 32<a <1,故选C.4.关于x 的方程|x 2-2x |=a 2+1(a >0)的解的个数是( B )A .1B .2C .3D .4解析:∵a >0,∴a 2+1>1.而y =|x 2-2x |的图象如图所示,∴y =|x 2-2x |的图象与y =a 2+1的图象总有2个交点,即方程|x 2-2x |=a 2+1(a >0)的解的个数是2.5.(2019·广东七校联合体联考)若函数f (x )=2x +a 2x -2a 的零点在区间(0,1)上,则实数a 的取值范围是( C )A.B .(-∞,1)(-∞,12)C.D .(1,+∞)(12,+∞)解析:易知函数f (x )的图象连续,且在(0,1)上单调递增.∴f (0)f (1)=(1-2a )(2+a 2-2a )<0,解得a >.126.已知函数f (x )=ln x -ax 2+ax 恰有两个零点,则实数a 的取值范围为( C )A .(-∞,0)B .(0,+∞)C .(0,1)∪(1,+∞)D .(-∞,0)∪{1}解析:由题意,显然x =1是函数f (x )的一个零点,取a =-1,则f (x )=ln x +x 2-x ,f ′(x )==>0恒成立.则f (x )仅有一个零2x 2-x +1x 2(x -14)2+78x 点,不符合题意,排除A 、D ;取a =1,则f (x )=ln x -x 2+x ,f ′(x )==,f ′(x )=0得x =1,则f (x )在(0,1)上递增,在1-2x 2+x x (1+2x )(1-x )x (1,+∞)上递减,f (x )max =f (1)=0,即f (x )仅有一个零点,不符合题意,排除B ,故选C.二、填空题7.已知f (x )=Error!则函数g (x )=f (x )-e x 的零点个数为2.解析:函数g (x )=f (x )-e x 的零点个数即为函数y =f (x )与y =e x 的图象的交点个数.作出函数图象可知有2个交点,即函数g (x )=f (x )-e x 有2个零点.8.若函数f (x )=x 2+ax +b 的两个零点是-2和3,则不等式af (-2x )>0的解集是.{x |-32<x <1}解析:∵f (x )=x 2+ax +b 的两个零点是-2,3.∴-2,3是方程x 2+ax +b =0的两根,由根与系数的关系知Error!∴Error!∴f (x )=x 2-x -6.∵不等式af (-2x )>0,即-(4x 2+2x -6)>0⇔2x 2+x -3<0,解集为.{x|-32<x <1}9.已知函数f (x )=Error!则函数f (x )的零点个数为3.解析:解法1:当x >1时,由log 2(x -1)=0得x =2,即x =2为函数f (x )在区间(1,+∞)上的一个零点;当x ≤1时,∵f (x )=x 3-3x +1,∴f ′(x )=3x 2-3,由f ′(x )=0得x =-1或x =1,∵当x <-1时,f ′(x )>0,当-1≤x ≤1时,f ′(x )≤0,∴x =-1为函数f (x )=x 3-3x +1在(-∞,1]上的极大值点,∵f (-1)=3>0,f (1)=-1<0,且当x →-∞时,f (x )→-∞,∴函数f (x )=x 3-3x +1在(-∞,1]上有两个不同的零点.综上,函数f (x )的零点个数为3.解法2:当x >1时,作出函数y =log 2(x -1)的图象如图1所示,当x ≤1时,由f (x )=x 3-3x +1=0得,x 3=3x -1,在同一个平面直角坐标系中分别作出函数y =x 3和y =3x -1的图象如图2所示,由图1,2可知函数f (x )的零点个数为3.10.定义在R 上的奇函数f (x )满足:当x >0时,f (x )=2 015x +log 2 015x ,则在R 上,函数f (x )零点的个数为3.解析:因为函数f (x )为R 上的奇函数,所以f (0)=0,当x >0时,f (x )=2 015x +log 2015x 在区间内存在(0,12 015)一个零点,又f (x )为增函数,因此在(0,+∞)内有且仅有一个零点.根据对称性可知函数在(-∞,0)内有且仅有一个零点,从而函数f (x )在R 上的零点个数为3.三、解答题11.已知函数f (x )=x 3-x 2++.x 214证明:存在x 0∈,使f (x 0)=x 0.(0,12)证明:令g (x )=f (x )-x .∵g (0)=,g =f -=-,∴g (0)·g <0.14(12)(12)1218(12)又函数g (x )在上是连续曲线,[0,12]∴存在x 0∈,使g (x 0)=0,即f (x 0)=x 0.(0,12)12.已知a 是正实数,函数f (x )=2ax 2+2x -3-a .如果函数y =f (x )在区间[-1,1]上有零点,求a 的取值范围.解:f (x )=2ax 2+2x -3-a 的对称轴为x =-.12a ①当-≤-1,即0<a ≤时,须使Error!12a 12即Error!∴无解.②当-1<-<0,即a >时,须使Error!即12a 12Error!解得a ≥1,∴a 的取值范围是[1,+∞).13.(2019·惠州市调研考试)函数f (x )是定义在R 上的奇函数,当x >0时,f (x )=Error!则函数g (x )=xf (x )-1在[-6,+∞)上的所有零点之和为( A )A .8B .32C.D .012解析:令g (x )=xf (x )-1=0,则x ≠0,所以函数g (x )的零点之和等价于函数y =f (x )的图象和y =的图象的交点的横坐标之和,分别作出x >0时,1x y =f (x )和y =的大致图象,如图所示,1x 由于y =f (x )和y =的图象都关于原点对称,因此函数g (x )在[-6,6]上的1x 所有零点之和为0,而当x =8时,f (x )=,即两函数的图象刚好有1个交点,18且当x ∈(8,+∞)时,y =的图象都在y =f (x )的图象的上方,因此g (x )在1x [-6,+∞)上的所有零点之和为8.故选A.14.已知关于x 的方程|2x -10|=a 有两个不同的实根x 1,x 2,且x 2=2x 1,则实数a =6.尖子生小题库——供重点班学生使用,普通班学生慎用15.(2019·福州四校联考)已知函数f (x )=Error!若F (x )=f [f (x )+1]+m 有两个零点x 1,x 2,则x 1·x 2的取值范围是( D)A .[4-2ln2,+∞) B .(,+∞)e C .(-∞,4-2ln2] D .(-∞,)e 16.(2019·德州模拟)已知函数f (x )=-x 2-2x .g (x )=Error!(1)求g [f (1)]的值;(2)若方程g [f (x )]-a =0有4个实数根,求实数a 的取值范围.解:(1)∵f (1)=-12-2×1=-3,∴g [f (1)]=g (-3)=-3+1=-2.(2)令f (x )=t ,则原方程化为g (t )=a ,易知方程f (x )=t 在t ∈(-∞,1)内有2个不同的解,则原方程有4个解等价于函数y =g (t )(t <1)与y =a 的图象有2个不同的交点,作出函数y =g (t )(t <1)的图象,如图所示,由图象可知,当1≤a <时,函数y =g (t )(t <1)与y =a 有2个不同的交点,即所求a 的取值54范围是.[1,54)。
2020届高考数学(理)一轮复习课时训练:第11章统计与统计案例56Word版含解析
【课时训练】第56节 用样本估计总体一、选择题1. (2018山西四校联考)某学校组织学生参加数学测试,成绩的 频率分布直方图如图,数据的分组依次为[20,40),[40,60), [60,80), [80,100].若低于60分的人数是15,则该班的学生人数是( )D . 60BT [20,40), [ 40,60)的频率和为(0.005+ 0.01)x 20= 0.3,15 二该班的学生人数是03= 50.2. (2018江西南昌一模)若数据X 1, X 2, X 3,…,X n 的平均数为x =5,方差 s 2= 2,则数据 3X 1 + 1,3X 2 + 1,3X 3 + 1,…,3x + 1 的平均数 和方差分别为()A . 5,2C . 16,18【答案】C【解析】T X 1, X 2, X 3,…,X n 的平均数为5,X 1 + X + X 3 + …+ x n二 =5.nT X 1 , X 2 , X 3,…,X n 的方差为 2,— 3X 1 + 1,3X 2 + 1,3X 3 + 1,…, 3x n +C . 55【答案】B . 16,2 D . 16,9••兔 + 眺+眺+…+ 3Xn + i = 3x 5+ 1= 16.1的方差是32x 2= 18.故选C.3. (2018武汉质检)某地区教育主管部门为了对该地区模拟考试 成绩进行分析,抽取了总成绩在 350分到650分之间的10 000名学 生的成绩,并根据这10 000名学生的总成绩画了样本的频率分布直 方图,则总成绩在[400,500)内的学生共有()C . 3 250 人D . 2 500 人【答案】B【解析】由频率分布直方图可求得a = 0.005,故[400,500)对应的 频率为(0.005+ 0.004)X 50= 0.45,故总成绩在[400,500)内的学生共有 10 000X 0.45=4 500(人).故选 B.(2018吉林长春质检)已知某班级部分同学一次测验的成绩统 则其中位数和众数分别为1 3 §正确云2 101176,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,11,4共 17 个,故 924.计如图, 95,94 99,86【答案】B【解析】由茎叶图可知,B . 92,86 D . 95,91此组数据由小到大排列依次为为中位数,出现次数最多的为众数,故众数为86,故选B.5. (2018陕西质检)某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[40,50), [50,60), [60,70), [70,80), [80,90), [90,10q,则图中x 的值等于( )A . 0.12 B. 0.012C. 0.18D. 0.018【答案】D【解析】由题意知0.054X 10+ 10X x+ 0.01X 10+ 0.006X 10X 3 =1,解得x= 0.018.6. (2018中山模拟)某项测试成绩满分为10分,现随机抽取30 名学生参加测试,得分如图所示,假设得分值的中位数为m e,平均值为x,众数为m o,则()C. m e< m0v xD. m0v m e v x【答案】D【解析】由图可知m0= 5.由中位数的定义知应该是第15个数与第16个数的平均值,由图知将数据从小到大排,第15个数是5,第5 +6 一116 个数是6,所以m e=-^ = 5.5.x = 30(3x 2+ 4X 3+ 5X 10+ 6X 6 + 7x3 + 8x 2 + 9x 2+ 10x 2)~ 5.97> 5.5,所以m°v m e v x .故选D.二、填空题7. (2018广州检测)在样本的频率分布直方图中,共有11个小长方形.若中间一个小长方形的面积等于其他10个小长方形的面积和1的4,且样本容量为160,则中间一组的频数为 ____________ .【答案】32【解析】由题意可设中间小长方形的面积为x,则其余小长方形的面积和为4x,所以5x= 1, x= 0.2,则中间一组的频数为160x 0.2 =32.8. (2018南昌模拟)若1,2,3,4, m这五个数的平均数为3,则这五个数的方差为___________ .【答案】21 +2 +3 +4 + m5【解析】由:+ m = 3,得m= 5,所以这五个数的方差9. (2018安徽合肥一模)某学校共有教师300人,其中中级教师有192人,高级教师与初级教师的人数比为5 : 4.为了解教师专业发展需求,现采用分层抽样的方法进行调查,在抽取的样本中有中级教师64人,则该样本中的高级教师人数为________________________ .【答案】205【解析】由题意可知,高级教师有(300- 192)x = 60(人),5+ 4抽样比k= n= 192=3.故该样本中高级教师的人数为60x3= 20.10. (2018河北衡水中学调研)某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如表:________ .2 【答案】25【解析】由数据表可得出乙班的数据波动性较大,则其方差较大,1 甲班的数据波动性较小,其方差较小,其平均值为乙方差s2= 5(1+ 0+0+1 + 0) = |.三、解答题11. (2018广东湛江调研)为检查某工厂所生产的8万台电风扇的质量,抽查了其中20台的无故障连续使用时限(单位:小时)如下:248 256 232 243 188 268 278 266 289 312274 296 288 302 295 228 287 217 329 283(1) 完成下面的频率分布表,并做出频率分布直方图;(2) 估计8万台电风扇中有多少台无故障连续使用时限不低于280小时;(3) 用组中值(同一组中的数据在该组区间的中点值)估计样本的平均无故障连续使用时限.【解】(1)频率分布表及频率分布直方图如下所示:频率/组距分组频数频率[180,200)10.050.002 5[200,220)10.050.002 5[220,240)20.100.005 0[240,260)30.150.007 5[260,280)40.200.010 0[280,300)60.300.015 0[300,320)20.100.005 0[320,340]10.050.002 5合计20 1.000.05(2) 由题意可得8X (0.30 + 0.10+ 0.05) = 3.6,所以估计8万台电风扇中有3.6万台无故障连续使用时限不低于280小时.(3) 由频率分布直方图可知x = 190X 0.05 + 210X 0.05 + 230X 0.10+ 250X 0.15 + 270X 0.20 + 290X 0.30+ 310X 0.10+ 330X 0.05= 269(小时),所以样本的平均无故障连续使用时限为269小时.12. (2018湖北孝感联考)随着移动互联网的发展,与餐饮美食相关的手机应用软件层出不穷.现从使用A和B两款订餐软件的商家中分别随机抽取50个商家,对它们的“平均送达时间”进行统计, 得到频率分布直方图如下:众数及平均数;⑵根据以上抽样调查数据,将频率视为概率,回答下列问题:① 能否认为使用B 款订餐软件“平均送达时间”不超过 40分钟 的商家达到75%?② 如果你要从A 和B 两款订餐软件中选择一款订餐,你会选择 哪款?说明理由.【解】(1)依题意可得,使用A 款订餐软件的50个商家的“平均 送达时间”的众数为55.使用A 款订餐软件的50个商家的“平均送达时间”的平均数为15X 0.06+ 25X 0.34+ 35X 0.12 + 45X 0.04+ 55X 0.4+ 65X 0.04=40.(2)①使用B 款订餐软件“平均送达时间”不超过40分钟的商家 的比例估计值为 0.04+ 0.20+ 0.56= 0.80= 80%>75%.故可以认为使用B 款订餐软件“平均送达时间”不超过40分钟 的商家达到75%.②使用B 款订餐软件的50个商家的“平均送达时间”的平均数 为 15X0.04+ 25X 0.2+ 35X 0.56 + 45X 0.14+ 55X 0.04+ 65X 0.02= 35<40,所以选B 款订餐软件.的便用片款订餐软件的50牛商卞 艸 均送达时何广的極率分布代方图 使用鼻款订拧软件的50牛曲篆-K均送达时sr的频率分布口方图。
高考数学一轮复习第十一章统计11.4统计案例习题理
§11.4 统计案例1.回归分析(1)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.(2)线性回归模型用y =bx +a +e 表示,其中a 和b 为模型的未知参数,e 称为____________.它的均值满足E (e )=__________,D (e )=σ2,σ2越小,精度越________.(3)在具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )中,回归方程的斜率和截距的最小二乘估计公式分别为:⎪⎪⎪⎩⎪⎪⎪⎨⎧-=---=∑∑==.ˆˆ)())((ˆ121x b y ax x y y x x b ni i ni i i 其中x =1n ∑=ni i x 1,y =1n ∑=ni i y 1, 称为样本点的中心.(4)残差:i eˆ= 称为相应于点(i x ,i y )的残差,残差平方和为 . (5)相关指数R 2= . R 2越大,说明残差平方和 ,即模型的拟合效果 ;R2越小,残差平方和 ,即模型的拟合效果 .在线性回归模型中,R 2表示解释变量对于预报变量变化的 ,R 2越接近于1,表示回归的效果 .2. 独立性检验(1)变量的不同“值”表示个体所属的不同类别,像这样的变量称为___________.(2)像下表所示列出两个分类变量的频数表,称为___________.假设有两个分类变量X 和Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2 },其样本频数列联表(称为2×2列联表)为y 1 y 2 总计x 1 a b a+b x 2c d c+d 总计a+c b+d a+b+c+d构造一个随机变量K 2=___________, 其中n =a+b+c+d 为样本容量.如果K 2的观测值k ≥k 0,就认为“两个分类变量之间有关系”;否则就认为“两个分类变量之间没有关系”.我们称这样的k 0为一个判断规则的临界值.按照上述规则,把“两个分类变量之间没有关系”错误地判断为“两个分类变量之间有关系”的概率不超过P (K 2≥k 0).上面这种利用随机变量K 2来判断“两个分类变量有关系”的方法称为___________.自查自纠1. (2) 随机误差 0 高 (3)(x ,y )(4)i i yy ˆ- ∑=-ni i iyy12)ˆ((5)1-∑∑==--n i ini i iy yyy1212)()ˆ( 越小 越好 越大 越差 贡献率 越好2.(1)分类变量(2)列联表n (ad -bc )2(a +b )(c +d )(a +c )(b +d )独立性检验r 是相关系数,则下列叙述中正确的个数为( ) ①r ∈[-1,-0.75]时,两变量负相关很强; ②r ∈[0.75,1]时,两变量正相关很强;③r ∈(-0.75,-0.3]或[0.3,0.75)时,两变量相关性一般; ④r =0.1时,两变量相关性很弱. A .1B .2C .3D .4解:|r|越大,两变量相关性越强.故选D .在回归分析中,代表了数据点和它在回归直线上相应位置差异的是( ) A .总偏差平方和 B .残差平方和 C .回归平方和D .相关指数R 2解:残差平方和描述了数据点和它在回归直线上相应位置的差异,故选B .利用独立性检验来考察两个分类变量X 和Y 是否有关系时,通过查阅下表来确定“X 与Y 有关系”的可P (K 2≥k 0) 0.500.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828如果K 2≥5.024,那么有把握认为“X 与Y 有关系”的百分数为( ) A .25% B .75% C .2.5% D .97.5%解:∵K 2≥5.024,而在观测值表中对应于5.024的是0.025,∴有1-0.025=97.5%的把握认为“X 和Y 有关系”.故选D .在回归分析中,相关指数R 2的值越大,说明残差平方和________. 解:R 2越大,残差平方和越小,故填越小. 下面是一个2×2列联表y 1 y 2总计 x 1 a21 73 x 21225 37 总计b46则表中a ,b 处的值分别为________.解:∵a +21=73,∴a =52.又∵a +12=b ,∴b =64.故填52,64.类型一回归分析的相关概念(1)两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合效果最好的模型是( )A.模型1的相关指数R2为0.98B.模型2的相关指数R2为0.80C.模型3的相关指数R2为0.50D.模型4的相关指数R2为0.25解:相关指数越大,模型拟合效果越好.故选A.(2)下列四个命题:①残差平方和越小的模型,拟合的效果越好;②用相关指数R2来刻画回归效果,R2越小,说明模型拟合的效果越好;③散点图中所有点都在回归直线附近;④随机误差e满足E(e)=0,其方差D(e)的大小可用来衡量预报精确度.其中正确命题的个数是( )A.1 B.2 C.3 D.4解:②中R2越大,拟合效果越好;③中回归直线同样可以远远偏离变异点;①④正确.注意④,e是随机变量,其方差衡量预报精度.故选B.【点拨】回归模型的诊断主要是看残差图上、下是否大致均匀分布.另外相关指数R2也决定着模型拟合的优劣,R2越大,模型拟合效果越好.而随机误差e满足E(e)=0,D(e)=σ2,σ2越小,线性回归模型预报真实值的精度越高.(1)如图的5个数据,去掉D(3,10)后,下列说法错误..的是( )A.相关系数r变大B.残差平方和变大C.相关指数R2变大D.解释变量x与预报变量y的相关性变强解:观察可知,去掉D(3,10)后,拟合效果更好.因此相关系数变大,残差平方和变小,相关指数变大,解释变量与预报变量的相关性变强.故选B.(2)给出下列结论:①回归分析中,可用相关指数R2判断模型的拟合效果,R2越大,模型的拟合效果越好;②回归分析中,可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好;③回归分析中,可用相关系数r的值判断模型的拟合效果,r越大,模型的拟合效果越好;④回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合精度越高.以上结论中,正确的个数为( )A.1 B.2 C.3 D.4解:②的判断正好相反;③应改为|r|越大,模型拟合效果越好,①④正确.故选B.类型二回归分析(1)已知某商品的价格x 1416182022y 121075 3 (Ⅰ)画出y关于x的散点图;(Ⅱ)用最小二乘法求出回归直线方程;(Ⅲ)计算R2的值,并说明回归模型拟合程度的好坏.解:(Ⅰ)散点图如图所示.(Ⅱ)18=x,4.7=y,∑==5121660iix,∑==51620iiiyx,所以15.155ˆ512251-=--=∑∑==iiixxyxyxbii,1.28ˆˆ=-=x bya,yˆ=-1.15x+28.1.(Ⅲ)列出残差表:y i-iyˆ00.3-0.4-0.10.2y i-y 4.6 2.6-0.4-2.4-4.4 所以3.0)ˆ(512=-∑=iiiyy,.2.53)(512=-∑=iiyy.994.0)()ˆ(15125122≈---=∑∑==iiiiiyyyyR所以,回归模型拟合效果很好.【点拨】用相关指数R 2来刻画回归效果,R 2越大,说明模型拟合的效果越好.另外,计算也不能出错.※(2)下表是某年美国旧轿车价格的调查资料,今以x 表示轿车的使用年数,y 表示相应的年均价格,求y 关于x 的回归方程.使用 年数 x1 2 3 4 5 6 7 8 9 10年均 价格 y (美元)2651 1943 1494 1087 765 538 484 290 226 204 解:作出散点图如图所示.可以发现,各点并不是基本处于一条直线附近,因此y 与x 之间应是非线性相关关系.与已学函数图象比较,用a x b y ˆˆe ˆ+=来刻画题中模型更为合理,令z ˆ=ln y ˆ,则z ˆ=b ˆx +a ˆ,题中数据如下表所示: x 1 2 3 4 5 6 7 8 9 10 z 7.883 7.572 7.309 6.991 6.640 6.288 6.182 5.670 5.421 5.318相应的散点图如图所示,从图中可以看出,变换的样本点分布在一条直线附近,因此可以用线性回归方程拟合.由表中数据得bˆ≈-0.298, aˆ=6.527-(-0.298)×5.5≈8.166, 故回归直线方程为zˆ=-0.298x +8.166. 则yˆ=e z ˆ=e -0.298x +8.166. 【点拨】①对于非线性(可线性化)回归分析,可通过散点图直观找到函数类型,再通过变换z =f(y)变为线性回归问题;②常用的函数类型有f(x)=k e bx +a ,f(x)=k ln x, f(x)=kx 2, f(x)=kx 3,f(x)=k x等.(2015·全国卷Ⅰ)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t )和年利润z(单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.表中w i =x i ,w =18∑i =18w i .(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x.根据(2)的结果回答下列问题: ①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v ^=α^+β^u 的斜率和截距的最小二乘估计分别为β^=∑∑==--ni ini i u uv u u u121i)()()-(,α^=v -β^u .解:(1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型. (2)令w =x ,先建立y 关于w 的线性回归方程.由于d ^=∑∑==--81281i)()()-(i ii iw w y y w w =6.18.108=68,c ^=y -d ^w =563-68×6.8=100.6.所以y 关于w 的线性回归方程为y ^=100.6+68w ,因此y 关于x 的回归方程为y ^=100.6+68x.(3)①由(2)知,当x =49时,年销售量y 的预报值y ^=100.6+6849=576.6,年利润z 的预报值z ^=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z 的预报值z ^=0.2(100.6+68x)-x =-x +13.6x +20.12=-(x -6.8)2+6.82+20.12.所以当x =6.8,即x =46.24时,z ^取得最大值. 故年宣传费为46.24千元时,年利润的预报值最大.类型三 独立性检验的相关概念(1)独立性检验中的统计假设就是假设相关事件A ,B( ) A .互斥B .不互斥C .相互独立D .不独立解:独立性检验中的假设是H 0:A ,B 独立,当我们拒绝H 0时,A ,B 就相关了.故选C .(2)下列说法中正确的是( )①独立性检验的基本思想是带有概率性质的反证法;②独立性检验就是选取一个假设H 0条件下的小概率事件,若在一次试验中该事件发生了,这是与实际推断相抵触的“不合理”现象,则作出拒绝H 0的推断;③独立性检验一定能给出明确的结论.A.①②B.①③C.②③D.①②③解:假设检验的基本思想是:“在一次试验中,小概率事件不可能发生”,若小概率事件发生了,则有理由认为原假设不成立,故①②正确,当小概率事件没有发生,则不能拒绝原假设但也不能够肯定原假设,此时结论不明确,③不正确.故选A.【点拨】如果K2的观测值k很大,则断言H0不成立,即认为“两个分类变量有关系”;如果观测值k很小,则说明在样本数据中没有发现足够证据拒绝H0.(1)想要检验是否喜欢参加体育活动是不是与性别有关,应检验( )A.H0:男生喜欢参加体育活动B.H0:女生不喜欢参加体育活动C.H0:喜欢参加体育活动与性别有关D.H0:喜欢参加体育活动与性别无关解:独立性检验中的假设是喜欢参加体育活动与性别无关,当我们拒绝喜欢参加体育活动与性别无关时,喜欢参加体育活动与性别就相关了.故选D.(2)在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )A.若K2的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病B.从独立性检验可知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病C.若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误D.以上三种说法均不正确解:独立性检验的结论仅仅是一种数学关系,得出的结论也可能犯错误.有95%的把握认为吸烟与患肺病有关系,也可以说这个结论出错的概率为0.05以下,这是数学中的统计思维与确定性思维差异的反映.故选C.类型四独立性检验(2015·福建模拟)有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩后,得到如下的列联表优秀非优秀总计甲班10乙班30合计105已知从全部105人中随机抽取1人为优秀的概率为7.(1)请完成上面的列联表;(2)根据列联表的数据,能否有95%的把握认为“成绩与班级有关系”?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.P (K 2≥k 0)0.05 0.01 k 03.8416.635解:(1)列联表如下:优秀 非优秀 总计 甲班 10 45 55 乙班 20 30 50 合计3075105(2)根据列联表中的数据,得K 2=105×(10×30-20×45)255×50×30×75≈6.109>3.841,因此有95%的把握认为“成绩与班级有关系”.【点拨】在利用2×2列联表计算K 2的值之前,应先假设两个分类变量是无关的,最后再利用K 2的值的大小对二者关系进行含概率的判断.(2014·江西)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )成绩性别不及格 及格 总计 男 6 14 20 女 10 22 32 总计16 3652视力 性别好 差 总计 男 4 16 20 女 12 20 32 总计163652智商性别偏高 正常 总计 男 8 12 20 女 8 24 32 总计163652表4阅读量性别丰富不丰富总计男14620女23032总计163652A.成绩 B.视力 C.智商 D.阅读量解:K21=52×(6×22-14×10)216×36×32×20=52×8216×36×32×20,K22=52×(4×20-16×12)216×36×32×20=52×112216×36×32×20,K23=52×(8×24-12×8)216×36×32×20=52×96216×36×32×20,K24=52×(14×30-6×2)216×36×32×20=52×408216×36×32×20,则有K24>K22>K23>K21,所以阅读量与性别关联的可能性最大.故选D.1.线性回归分析的方法、步骤(1)画出两个变量的散点图;(2)求相关系数r,并确定两个变量的相关程度的高低;(3)用最小二乘法求回归直线方程yˆ=bˆx+aˆ,⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=---=∑∑∑∑====.ˆˆ,)())((ˆ1221121x byax nxy x nyxxxyyxxbniiniiiniiniii(4)利用回归直线方程进行预报.注:①对于非线性(可线性化)的回归分析,一般是利用条件及我们熟识的函数模型,将题目中的非线性关系转化为线性关系进行分析,最后还原.②利用相关指数R2=1-∑∑==--niiniiiyyyy1212)()ˆ(刻画回归效果时,R2越大,意味着残差平方和∑=-niiiyy12)ˆ(越小,模型的拟合效果越好.2.独立性检验的一般步骤(1)假设两个分类变量x与y没有关系;(2)计算出K2的观测值,其中K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d);(3)把K 2的值与临界值比较,作出合理的判断. 3.独立性检验的注意事项(1)在列联表中注意事件的对应及相关值的确定,不可混淆.(2)在实际问题中,独立性检验的结论仅是一种数学关系表述,得到的结论有一定的概率出错.(3)对判断结果进行描述时,注意对象的选取要准确无误,应是对假设结论进行的含概率的判断,而非其他.1.一位母亲记录了儿子3~9岁的身高,由此建立的身高y(单位:cm)与年龄x(单位:岁)的回归方程为y ˆ=7.19x +73.93.用这个方程预测这个孩子10岁时的身高,则正确的叙述是( )A .身高一定是145.83 cmB .身高在145.83 cm 以上C .身高在145.83 cm 以下D .身高在145.83 cm 左右解:回归模型的预报值是一种估计值,故选D .2.设两个变量x 和y 之间具有线性相关关系,它们的相关系数是r ,y 关于x 的回归直线的回归系数为bˆ,回归截距是aˆ,那么必有( ) A .bˆ与r 的符号相同 B .a ˆ与r 的符号相同 C .bˆ与r 的符号相反 D .a ˆ与r 的符号相反 解:根据bˆ和r 的定义公式可知A 正确,故选A . 3.设()x 1,y 1,()x 2,y 2,…,()x n ,y n 是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是()A .x 和y 的相关系数为直线l 的斜率B .x 和y 的相关系数在0到1之间C .当n 为偶数时,分布在l 两侧的样本点的个数一定相同D .直线l 过点(x ,y )解:选项具体分析结论A 相关系数用来衡量两个变量之间的相关程度,直线的斜率表示直线的倾斜程度;它们的计算公式也不相同不正确 B相关系数的值有正有负,还可以是0;当相关系数在0到1之间时,两个变量为正相关,在-1到0之间时,两个变量为负相关 不正确Cl 两侧的样本点的个数分布与n 是奇是偶无关,也不一定是平均分布不正确D 由于aˆ=y -b ˆx ,即y =b ˆx +a ˆ,因正确故选D .4.在对两个分类变量A 与B 进行的独立性检验中,当K 2>3.841时,我们认为A 与B ( ) A .有95%的把握有关 B .有99%的把握有关 C .没有理由说它们有关 D .不确定解:∵K 2>3.841,∴有95%的把握认为A ,B 有关.故选A .5.如果女大学生身高x (cm)与体重y (kg)的关系满足线性回归模型y =0.85x -88+e ,其中|e |≤4,如果已知某女大学生身高160 cm ,则体重预计不会低于( )A .44 kgB .46 kgC .50 kgD .54 kg解:由||e =||y -0.85x +88≤4,得0.85x -92≤y ≤0.85x -84,当x =160时,44≤y ≤52.故选A . 6.(2013·湖北模拟)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,由表中数据,求得线性回归方程为y =-20x +a .若在这些样本点中任取一点,则它在回归直线左下方的概率为( ) A.12B.13C.14D.15 解:易得x =8.5,y =80,故a ^=y -b ^x =80-(-20)×8.5=250,∴y ^=-20x +250,写成y ^+20x -250=0,令f (x ,y )=y +20x -250,由f (0,0)<0且点(0,0)在回归直线的左下方可知,满足f (x ,y )<0的数据点均在回归直线的左下方,逐一验证可知使f (x ,y )<0的是(8.2,84)和(9,68)两组数据点.故所求概率为P =26=13.故选B . 7.某校为了研究学生的性别与对待某一活动的态度(支持和不支持两种态度)的关系,运用2×2列联表进行独立性检验,经计算K 2=6.669,则所得到的统计学结论是:有________%的把握认为“学生性别与支持该活动有关系”.附:P (K 2≥k 0) 0.100 0.050 0.025 0.010 0.001k 02.7063.841 5.024 6.635 10.828解:因为6.669与附表中的6.635最接近,所以得到的统计学结论是:有1-0.010=0.99=99%的把握认为“学生性别与支持该活动有关系”.故填99.8.若一组观测值(x 1,y 1),(x 2,y 2),…,(x n ,y n )之间满足y i =bx i +a +e i (i =1,2,…,n ),若e i 恒为0,则R 2为________.解:此时回归方程为yˆ=bx +a ,故y ˆi =y i ,∴R 2=1-∑∑==--n i ini i iy yyy1212)()ˆ(=1.故填1.9. 对于数据:x 1 2 3 4y 2 3 4 5两位同学分别给出了拟合直线y ˆ=x +1和y ˆ=0.9x +1.2,试利用“最小二乘法”理论解释两条直线的拟合效果.解:对于拟合直线yˆ=x +1:∑=-412)ˆ(i i iyy=0. 对于拟合直线yˆ=0.9x +1.2: ∑=-412)ˆ(i i iyy=(-0.1)2+02+0.12+0.22=0.06>0, 因而拟合直线yˆ=x +1的拟合效果更好. 事实上,拟合直线yˆ=x +1应是针对这组数据的所有拟合直线中最优的. 10.(2015·河北模拟)某高校为调查学生喜欢“应用统计”课程是否与性别有关,随机抽取了选修该课程的(1)判断是否有99.5%的把握认为喜欢“应用统计”课程与性别有关?(2)用分层抽样的方法从喜欢“应用统计”课程的学生中抽取6名学生做进一步调查,将这6名学生作为一个样本,从中任选2人,求恰有1个男生和1个女生的概率.(参考公式:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d)解:(1)∵K 2=55×(20×20-10×5)230×25×25×30≈11.978>7.879,∴有99.5%的把握认为喜欢“应用统计”课程与性别有关.(2)设所抽样本中有m 个男生,则630=m 20,得m =4,∴样本中有4个男生,2个女生.从中任选2人有C 26=15种情形,其中恰有1个男生和1个女生的有C 14·C 12=8种情形,所求概率P =815.11.(2014·辽宁)某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:南方学生 60 20 80 北方学生 10 10 20 合计7030100(1)根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”; (2)已知在被调查的北方学生中有5名数学系的学生,其中2名喜欢甜品.现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率.附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),P(K 2≥k)0.100 0.050 0.010 k2.7063.8416.635解:(1)将2×2列联表中的数据代入公式计算,得K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=100×(60×10-20×10)270×30×80×20=10021≈4.762. 由于4.762>3.841,所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”. (2)从5名数学系学生中任取3人有C 35=10种情形,其中至多有1人喜欢甜品的有C 33+C 12C 23=7种,故所求概率P =710.(2015·贵州模拟)某校学习小组开展“学生语文成绩与外语成绩的关系”的课题研究,对该校高二年级800名学生上学期期末语文和外语成绩按优秀和不优秀分类:语文和外语都优秀的有60人,语文成绩优秀但外语不优秀的有140人,外语成绩优秀但语文不优秀的有100人.(1)能否在犯错概率不超过0.001的前提下认为该校学生的语文成绩与外语成绩有关系?(2)将上述调查所得的频率视为概率,从该校高二年级学生成绩中,有放回地随机抽取3名学生的成绩,记抽取的3名学生成绩中语文、外语两科至少有一科优秀的个数为X ,求X 的分布列和期望E(X).P(K 2≥k 0)0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 01.3232.0722.7063.8415.0246.6357.87910.828解:(1) 语文优秀 语文不优秀总计 外语优秀 60 100 160 外语不优秀140 500 640 总计200600800∵K 2=800160×640×200×600≈16.667>10.828,∴能在犯错概率不超过0.001的前提下认为该校学生的语文成绩与外语成绩有关系.(2)由已知数据,语文、外语两科成绩至少一科为优秀的频率是38,则X ~B ⎝ ⎛⎭⎪⎫3,38,P(X =k)=C k 3⎝ ⎛⎭⎪⎫38k ⎝ ⎛⎭⎪⎫583-k ,k =0,1,2,3. X 的分布列为E(X)=3×38=98.一、选择题:本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的.1.下列抽样中不是系统抽样的是( )A .从标有1~15号的15个球中,任选3个作样本,按从小号到大号排序,随机选起点i 0,以后i 0+5,i 0+10(超过15则从1再数起)号入样B .工厂生产的产品,用传送带将产品送入包装车间前,检验人员从传送带上每隔5分钟抽一件产品进行检验C .搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止D .电影院调查观众的某一指标,通知每排(每排人数相同)座位号为14的观众留下来谈 解:选项C 为简单随机抽样,其余选项为系统抽样.故选C .2.有50件产品编号从1到50,现在从中抽取5件检验,用系统抽样确定所抽取的编号可以是( ) A .5,10,15,20,25 B .5,15,20,35,40 C .5,11,17,23,29 D .10,20,30,40,50 解:间隔为10.故选D .3.(2015·湖南模拟)某工厂有3个车间,在12月份共生产了3 600双皮靴,在出厂前要检查这批产品的质量,决定采用分层抽样的方法进行检查,若从第一、二、三车间抽取的产品数分别为a ,b ,c ,且a ,b ,c 构成等差数列,则第二车间生产的产品数为( )A .800B .1 000C .1 200D .1 500解:∵a ,b ,c 成等差数列,∴2b =a +c ,第二车间抽取的产品数占抽样产品总数的三分之一,根据分层抽样的性质可知,第二车间生产的产品数占12月份生产总数的三分之一,即3600×13=1200(双).故选C .4.在检验某产品直径尺寸的过程中,将尺寸数据分成若干组,[a ,b )是其中的一组,抽查出的个体数在该组上的频率为m ,该组在频率分布直方图上的高为h ,则|a -b |=( )A.m hB.h mC .mhD .与h ,m 无关解:根据频率分布直方图的概念可知,|a -b |×h =m ,由此可知|a -b |=m h.故选A .5.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为( )A .-1B .0 C.12D .1解:因为所有点都分布在一条直线上,说明相关性很强,且正相关系数达到最大值,即为1.故选D .6.(2014·广东)已知某地区中小学生人数和近视情况分别如图1和图2所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生的近视人数分别为( )A .100,10B .200,10C .100,20D .200,20解:样本容量为(3500+4500+2000)×2%=200,抽取的高中生人数为2000×2%=40,由于高中生的近视率为50%,所以抽取的高中生近视人数为40×50%=20.综上知,故选D .7.通过随机询问110男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计6050110由K 2=n (ad -bc 2(a +b )(c +d )(a +c )(b +d )算得K 2=110×(40×30-20×20)260×50×60×50≈7.8.附表:P (K 2≥k )0.050 0.010 0.001 k3.8416.63510.828参照附表,得到的正确结论是( )A .有99%以上的把握认为“爱好该项运动与性别有关”B .有99%以上的把握认为“爱好该项运动与性别无关”C .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”解:由K 2≈7.8>6.635,而P (K 2≥6.635)=0.010,故由独立性检验的意义可知,有99%以上的把握认为“爱好该项运动与性别有关”.故选A .8.(2015·兰州模拟)对具有线性相关关系的变量x ,y ,有一组观测数据(x i ,y i )(i =1,2,…,8),其回归直线方程是y ^=13x +a ^,且x 1+x 2+x 3+…+x 8=2(y 1+y 2+…+y 8)=6,则实数a ^的值是( )A.116B.18C.14D.12解:依题意可知样本中心点为⎝ ⎛⎭⎪⎫34,38,则38=13×34+a ^,解得a ^=18.故选B . 9.(2013·湖北)四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -6.423;②y 与x 负相关且y ^=-3.476x +5.648;③y 与x 正相关且y ^=5.437x +8.493;④y 与x 正相关且y ^=-4.326x -4.578. 其中一定不正确...的结论的序号是( ) A .①② B .②③ C .③④ D .①④解:当y 与x 正相关时,应满足斜率大于0;当y 与x 负相关时,应满足斜率小于0,故①④一定不正确.故选D .10.在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是( )A .众数B .平均数C .中位数D .标准差解:样本数据每个都加2后所得数据的波动情况并没有发生改变,所以标准差不变.故选D .11.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则下列说法正确的是( )A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差解:由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A 错;甲、乙的成绩的中位数分别为6,5,B 错;甲、乙的成绩的方差分别为s 21=15×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,s 22=15×[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=125,C 正确;甲、乙的成绩的极差均为4,D 错.故选C .12.(2013·福建)已知x 与y x 1 2 3 4 5 6y2 13 3 4假设根据上表数据所得线性回归直线方程为y =b x +a .若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′B.b ^>b ′,a ^<a ′ C.b ^<b ′,a ^>a ′ D.b ^<b ′,a ^<a ′解:由题意得n =6,x =1+2+3+4+5+66=72,y =0+2+1+3+3+46=136,b ^=∑∑==--ni i ni i i x n xyx n y x 1221=58-45.591-6×⎝ ⎛⎭⎪⎫722=57,a ^=y -b ^x =136-57×72=-13.∵直线y =b ′x +a ′过两点(1,0)和(2,2),∴b ′=2-02-1=2,把点(1,0)代入y =2x +a ′得a ′=-2.通过比较可得b ^<b ′,a ^>a ′.故选C .二、填空题:本大题共4小题,每小题5分,共20分.13.甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件.解:分层抽样中各层的抽样比相同.样本中甲设备生产的有50件,则乙设备生产的有30件.在4 800件产品中,甲、乙设备生产的产品总数比为5∶3,所以乙设备生产的产品总数为4 800×38=1 800件.故填1800.14.已知某单位有40名职工,现要从中抽取5名职工,将全体职工随机按1~40编号,并按编号顺序平均分成5组.按系统抽样方法在各组内抽取一个号码.(1)若第1组抽出的号码为2,则所有被抽出的职工号码为____________;(2)分别统计这5名职工的体重(单位:kg),获得体重数据的茎叶图如图所示,则该样本方差为____________. 解:(1)由分组可知,抽号的间隔为8,又第1组抽出的号码为2,所以所有被抽出的职工号码为2,10,18,26,34.(2)由茎叶图知5名职工体重的平均数x =59+62+70+73+815=69,则该样本的方差s 2=15[(59-69)2+(62-69)2+(70-69)2+(73-69)2+(81-69)2]=62.故填2,10,18,26,34;62.15.(2015·江苏模拟)某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生人数是____________.解:由频率分布直方图知,随机抽取的200名学生中成绩小于60分的学生人数是(0.002+0.006+0.012)×10×200=40,设这3000名学生中该次数学成绩小于60分的学生人数为x ,则40x =2003 000,解得x =600.故填600.16.(2015·武汉模拟)利用独立性检验来判断两个分类变量X 和Y 是否有关系,通过查阅下表来确定“X 和Y 有关系”的可信度.为了调查用电脑时间与视力下降是否有关系,现从某地网民中抽取100位居民进行调查.经过计算得K 2≈3.855,那么,在犯错误的概率不超过____________的前提下认为用电脑时间与视力下降有关系.。
2020届高考数学一轮复习 第11章 统计与统计案例
第十章⎪⎪⎪ 统计与统计案例全国卷5年考情图解 高考命题规律把握1.本章在高考中的分值在12分左右,主要题型是选择题、解答题.2.随机抽样、样本估计总体、独立性检验多在解答题中作为问题的一部分出现.3.解答题多以实际生活为背景,考查利用统计知识解决实际问题的能力.第一节 随机抽样一、基础知识批注——理解深一点1.简单随机抽样(1)定义:一般地,设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N ),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,叫做简单随机样本.(2)常用方法:抽签法和随机数法.2.分层抽样(1)在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.3.系统抽样(1)定义:当总体中的个体数较多时,可以将总体分成均衡的几部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需的样本,这种抽样的方法叫做系统抽样.(2)系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本.①先将总体的N 个个体编号;②确定分段间隔k ,对编号进行分段.当N n (n 是样本容量)是整数时,取k =N n;当总体中的个体数不能被样本容量整除时,可先用简单随机抽样的方法从总体中剔除几个个体,使剩下的个体数能被样本容量整除,然后再按系统抽样进行.这时在整个抽样过程中每个个体被抽取的可能性仍然相等.③在第1段用简单随机抽样确定第一个个体编号l(l≤k);④按照一定的规则抽取样本.通常是将l加上间隔k得到第2个个体编号l+k,再加k 得到第3个个体编号l+2k,依次进行下去,直到获取整个样本.二、常用结论汇总——规律多一点(1)不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.(2)系统抽样一般也称为等距抽样,入样个体的编号相差分段间隔k的整数倍.(3)分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比.(4)三种抽样方法的特点、联系及适用范围类别共同点各自特点联系适用范围简单随机抽样①抽样过程中每个个体被抽到的可能性相等;②每次抽出个体后不再将它放回,即不放回抽样从总体中逐个抽取总体个数较少系统抽样将总体均分成几部分,按预先定出的规则在各部分中抽取在起始部分取样时,采用简单随机抽样总体个数较多分层抽样将总体分成几层,分层进行抽取各层抽样时,采用简单随机抽样或系统抽样总体由差异明显的几部分组成三、基础小题强化——功底牢一点(一)判一判(对的打“√”,错的打“×”)(1)在简单随机抽样中,某一个个体被抽到的可能性与第几次抽取有关,第一次被抽到的可能性最大.()(2)从100件玩具中随机拿出一件,放回后再拿出一件,连续拿5次,是简单随机抽样.()(3)系统抽样适用于元素个数很多且均衡的总体.()(4)要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.()(5)分层抽样中,每个个体被抽到的可能性与层数及分层有关.()(6)某校即将召开学生代表大会,现从高一、高二、高三共抽取60名代表,则可用分层抽样方法抽取.()答案:(1)×(2)×(3)√(4)×(5)×(6)√(二)选一选1.下面抽样方法是简单随机抽样的是()A.从平面直角坐标系中抽取5个点作为样本B.可口可乐公司从仓库中的1 000箱可乐中一次性抽取20箱进行质量检查C.某连队从200名战士中,挑选出50名最优秀的战士去参加抢险救灾活动D.从10个手机中逐个不放回地随机抽取2个进行质量检验(假设10个手机已编号) 解析:选D平面直角坐标系中有无数个点,这与简单随机抽样中要求总体中的个体数有限不相符,故A错误;一次性抽取不符合简单随机抽样逐个抽取的特点,故B错误;50名战士是最优秀的,不符合简单随机抽样的等可能性,故C错误.D选项显然符合简单随机抽样的特点,故选D.2.某学院A,B,C三个专业共有1 200名学生,为了调查这些学生勤工俭学的情况,拟采用分层抽样的方法抽取一个容量为120的样本,已知该学院的A专业有380名学生,B 专业有420名学生,则应在该学院的C专业抽取的学生人数为()A.30B.40C.50 D.60解析:选B C专业的学生有1 200-380-420=400名,由分层抽样知应抽取120×4001 200=40名.3.假设从高一年级全体同学(500人)中随机抽出60人参加一项活动,利用随机数法抽取样本时,先将500名同学按000,001,…,499进行编号,如果从随机数表第8行第11列的数开始,按三位数连续向右读取,最先抽出的5名同学的号码是(下面摘取了此随机数表第7行和第8行)()84421 75331 57245 50688 77047 44767 21763 35025 83921 2067663016 37859 16955 56719 98105 07175 12867 35807 44395 23879A.455068047447176B.169105071286443C.050358074439332D.447176335025212解析:选B由随机数表法的随机抽样的过程可知最先抽出的5名同学的号码为169,105,071,286,443.(三)填一填4.(2018·全国卷Ⅲ)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________.解析:因为客户数量大,且不同年龄段客户对其服务的评价有较大差异,所以最合适的抽样方法是分层抽样.答案:分层抽样5.某班共有56人,学号依次为1,2,3,…,56,现用系统抽样的方法抽取一个容量为4的样本,已知学号为2,30,44的同学在样本中,则样本中还有一位同学的学号为________.解析:由题意得,需要将56人按学号从小到大分成4组,每组抽取第2个学号对应的同学,所以还有一位同学的学号为1×14+2=16.答案:16考点一简单随机抽样[典例]下列抽取样本的方式属于简单随机抽样的个数有()①从无限多个个体中抽取100个个体作为样本;②盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里;③用抽签方法从10件产品中选取3件进行质量检验;④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.A.0个B.1个C.2个D.3个[解析]①不是简单随机抽样,因为被抽取样本的总体的个数是无限的,而不是有限的;②不是简单随机抽样,因为它是有放回抽样;③明显为简单随机抽样;④不是简单随机抽样,因为不是等可能抽样.[答案] B[解题技法] 应用简单随机抽样应注意的问题(1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.(2)在使用随机数法时,如遇到三位数或四位数,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去.[题组训练]1.总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )A.08 C .02 D .01解析:选D 由随机数法的随机抽样的过程可知选出的5个个体是08,02,14,07,01,所以第5个个体的编号是01.2.利用简单随机抽样,从n 个个体中抽取一个容量为10的样本.若第二次抽取时,余下的每个个体被抽到的概率为13,则在整个抽样过程中,每个个体被抽到的概率为( ) A.14B.13C.514D.1027解析:选C 根据题意,9n -1=13, 解得n =28.故在整个抽样过程中每个个体被抽到的概率为1028=514. 考点二 系统抽样[典例] (1)某校为了解1 000名高一新生的身体生长状况,用系统抽样法(按等距的规则)抽取40名同学进行检查,将学生从1~1 000进行编号,现已知第18组抽取的号码为443,则第一组用简单随机抽样抽取的号码为( )A .16B .17C .18D .19(2)中央电视台为了解观众对某综艺节目的意见,准备从502名现场观众中抽取10%进行座谈,现用系统抽样的方法完成这一抽样,则在进行分组时,需剔除________个个体,抽样间隔为________.[解析] (1)因为从1 000名学生中抽取一个容量为40的样本,所以系统抽样的分段间隔为1 00040=25, 设第一组随机抽取的号码为x ,则抽取的第18组编号为x +17×25=443,所以x =18.(2)把502名观众平均分成50组,由于502除以50的商是10,余数是2,所以每组有10名观众,还剩2名观众,采用系统抽样的方法抽样时,应先用简单随机抽样的方法从502名观众中抽取2名观众,这2名观众不参加座谈;再将剩下的500名观众编号为1,2,3,…,500,并均匀分成50段,每段含50050=10个个体.所以需剔除2个个体,抽样间隔为10. [答案] (1)C (2)2 10[变透练清]1.(变结论)若本例(1)的条件不变,则编号落入区间[501,750]的人数为________.解析:从1 000名学生中抽取一个容量为40的样本,系统抽样分40组,每组1 00040=25个号码,每组抽取一个,从501到750恰好是第21组到第30组,共抽取10人.答案:102.(2018·南昌摸底调研)某校高三(2)班现有64名学生,随机编号为0,1,2,…,63,依编号顺序平均分成8组,组号依次为1,2,3,…,8.现用系统抽样方法抽取一个容量为8的样本,若在第1组中随机抽取的号码为5,则在第6组中抽取的号码为________.解析:由题知分组间隔为648=8,又第1组中抽取的号码为5,所以第6组中抽取的号码为5×8+5=45.答案:45[解题技法] 系统抽样中所抽取编号的特点系统抽样又称等距抽样,所以依次抽取的样本对应的号码就是一个等差数列,首项就是第1组所抽取样本的号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组内所要抽取的样本号码.[提醒] 系统抽样时,如果总体中的个数不能被样本容量整除时,可以先用简单随机抽样从总体中剔除几个个体,然后再按系统抽样进行.考点三 分层抽样[典例] 某电视台在网上就观众对其某一节目的喜爱程度进行调查,参加调查的一共有20 000人,其中各种态度对应的人数如下表所示:电视台为了了解观众的具体想法和意见,打算从中抽取100人进行详细的调查,为此要进行分层抽样,那么在分层抽样时,每类人中应抽取的人数分别为( )A .25,25,25,25B .48,72,64,16C .20,40,30,10D .24,36,32,8 [解析] 法一:因为抽样比为10020 000=1200,所以每类人中应抽取的人数分别为 4 800×1200=24,7 200×1200=36,6 400×1200=32,1 600×1200=8. 法二:最喜爱、喜爱、一般、不喜欢的比例为4 800∶7 200∶6 400∶1 600=6∶9∶8∶2, 所以每类人中应抽取的人数分别为66+9+8+2×100=24,96+9+8+2×100=36,86+9+8+2×100=32,26+9+8+2×100=8. [答案] D[解题技法] 分层抽样问题的类型及解题思路(1)求某层应抽个体数量:按该层所占总体的比例计算.(2)已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比例式进行计算.(3)分层抽样的计算应根据抽样比构造方程求解,其中“抽样比=样本容量总体容量=各层样本数量各层个体数量”. [题组训练]1.(2019·山西五校联考)某校为了解学生的学习情况,采用分层抽样的方法从高一1 000人、高二1 200人、高三n 人中抽取81人进行问卷调查,若高二被抽取的人数为30,则n =( )A .860B .720C .1 020D .1 040解析:选D 由已知条件知抽样比为301 200=140,从而811 000+1 200+n =140,解得n = 1 040,故选D.2.(2018·广州高中综合测试)已知某地区中小学学生人数如图所示.为了解该区学生参加某项社会实践活动的意向,拟采用分层抽样的方法来进行调查.若高中需抽取20名学生,则小学与初中共需抽取的学生人数为________.解析:设小学与初中共需抽取的学生人数为x ,依题意可得 1 2002 700+2 400+1 200=20x +20,解得x =85.答案:85[课时跟踪检测]1.从2 019名学生中选取50名学生参加全国数学联赛,若采用以下方法选取:先用简单随机抽样法从2 019名学生中剔除19名学生,剩下的2 000名学生再按系统抽样的方法抽取,则每名学生入选的概率( )A .不全相等B .均不相等C .都相等,且为502 019D .都相等,且为140解析:选C 从N 个个体中抽取M 个个体,则每个个体被抽到的概率都等于M N,故每名学生入选的概率都相等,且为502 019. 2.福利彩票“双色球”中红球的号码可以从01,02,03,…,32,33这33个两位号码中选取,小明利用如下所示的随机数表选取红色球的6个号码,选取方法是从第1行第9列的数字开始,从左到右依次读取数据,则第四个被选中的红色球的号码为( )C .06D .16解析:选C 被选中的红色球的号码依次为17,12,33,06,32,22,所以第四个被选中的红色球的号码为06.3.某班共有学生52人,现根据座号,用系统抽样的方法,抽取一个容量为4的样本.已知5号、18号、44号同学在样本中,那么样本中还有一个同学的座号是( )A .23B .27C .31D .33解析:选C 分段间隔为524=13,故样本中还有一个同学的座号为18+13=31. 4.某工厂在12月份共生产了3 600双皮靴,在出厂前要检查这批产品的质量,决定采用分层抽样的方法进行抽取,若从一、二、三车间抽取的产品数分别为a ,b ,c ,且a ,b ,c 构成等差数列,则第二车间生产的产品数为( )A .800双B .1 000双C .1 200双D .1 500双解析:选C 因为a ,b ,c 成等差数列,所以2b =a +c ,即第二车间抽取的产品数占抽样产品总数的三分之一,根据分层抽样的性质可知,第二车间生产的产品数占12月份生产总数的三分之一,即为1 200双皮靴.5.(2018·南宁摸底联考)已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )A .100,20B .200,20C .200,10D .100,10解析:选B 由题图甲可知学生总人数是10 000,样本容量为10 000×2%=200,抽取的高中生人数是2 000×2%=40,由题图乙可知高中生的近视率为50%,所以抽取高中生的近视人数为40×50%=20,故选B.6.一个总体中有100个个体,随机编号为0,1,2,…,99.依编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,如果在第一组随机抽取的号码为m ,那么在第k 组中抽取的号码个位数字与m +k 的个位数字相同.若m=6,则在第7组中抽取的号码是( )A .63B .64C .65D .66解析:选A 若m =6,则在第7组中抽取的号码个位数字与13的个位数字相同,而第7组中的编号依次为60,61,62,63,…,69,故在第7组中抽取的号码是63.7.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间(450,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为( )A .7B .9C .10D .15解析:选C 960÷32=30,故由题意可得抽到的号码构成以9为首项,以30为公差的等差数列,其通项公式为a n =9+30(n -1)=30n -21.由450<30n -21≤750,解得15.7<n ≤25.7.又n 为正整数,所以16≤n ≤25,故做问卷B 的人数为25-16+1=10.故选C.8.某企业三月中旬生产A ,B ,C 三种产品共3 000件,根据分层抽样的结果,企业统计员制作了如下的统计表格:统计员记得A 产品的样本容量比C 产品的样本容量多10,根据以上信息,可得C 的产品数量是________件.解析:设样本容量为x ,则x 3 000×1 300=130,∴x =300. ∴A 产品和C 产品在样本中共有300-130=170(件).设C 产品的样本容量为y ,则y +y +10=170,∴y =80.∴C 产品的数量为3 000300×80=800(件). 答案:8009.某企业三个分厂生产同一种电子产品,三个分厂产量分布如图所示,现在用分层抽样方法从三个分厂生产的该产品中共抽取100件做使用寿命的测试,则第一分厂应抽取的件数为________;由所得样品的测试结果计算出一、二、三分厂取出的产品的使用寿命平均值分别为1 020小时、980小时、1 030小时,估计这个企业所生产的该产品的平均使用寿命为________小时.解析:第一分厂应抽取的件数为100×50%=50;该产品的平均使用寿命为1 020×0.5+980×0.2+1 030×0.3=1 015.答案:50 1 01510.将参加冬季越野跑的600名选手编号为:001,002,…,600,采用系统抽样方法抽取一个容量为50的样本,把编号分为50组后,在第一组的001到012这12个编号中随机抽得的号码为004,这600名选手穿着三种颜色的衣服,从001到301穿红色衣服,从302到496穿白色衣服,从497到600穿黄色衣服,则抽到穿白色衣服的选手人数为________.解析:由题意及系统抽样的定义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k (k ∈N *)组抽中的号码是4+12(k -1).令302≤4+12(k -1)≤496,得2556≤k ≤42,因此抽到穿白色衣服的选手人数为42-25=17(人).答案:1711.某初级中学共有学生2 000名,各年级男、女生人数如下表:(1)求x 的值;(2)现用分层抽样的方法在全校抽取48名学生,问应在初三年级抽取多少名? 解:(1)∵x2 000=0.19,∴x =380.(2)初三年级人数为y +z =2 000-(373+377+380+370)=500,现用分层抽样的方法在全校抽取48名学生,应在初三年级抽取的人数为482 000×500=12(名).第二节用样本估计总体一、基础知识批注——理解深一点1.频率分布直方图(1)纵轴表示频率组距,即小长方形的高=频率组距;(2)小长方形的面积=组距×频率组距=频率; (3)各个小方形的面积总和等于1 . 2.频率分布表的画法第一步:求极差,决定组数和组距,组距=极差组数;第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表. 3.茎叶图茎叶图是统计中用来表示数据的一种图, 茎是指中间的一列数,叶就是从茎的旁 边生长出来的数.4.中位数、众数、平均数的定义 (1)中位数将一组数据按大小依次排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(2)众数一组数据中出现次数最多的数据叫做这组数据的众数. (3)平均数一组数据的算术平均数即为这组数据的平均数,n 个数据x 1,x 2,…,x n 的平均数x =1n (x 1+x 2+…+x n ). 5.样本的数字特征如果有n 个数据x 1,x 2,…,x n ,那么这n 个数的(1)平均数x =1n (x 1+x 2+…+x n ).(2)标准差s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. (3)方差s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2].二、常用结论汇总——规律多一点1.频率分布直方图中的常见结论(1)众数的估计值为最高矩形的中点对应的横坐标.(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(3)中位数的估计值的左边和右边的小矩形的面积和是相等的. 2.平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为x ,则mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x +a .(2)若数据x 1,x 2,…,x n 的方差为s 2,则数据ax 1+b ,ax 2+b ,…,ax n +b 的方差为a 2s 2.三、基础小题强化——功底牢一点(一)判一判(对的打“√”,错的打“×”)(1)在频率分布直方图中,小矩形的高表示频率.( ) (2)频率分布直方图中各个长方形的面积之和为1.( )(3)茎叶图中的数据要按从小到大的顺序写,相同的数据可以只记一次.( ) (4)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( ) (5)一组数据的方差越大,说明这组数据的波动越大.( ) 答案:(1)× (2)√ (3)× (4)√ (5)√(二)选一选1.某便利店记录了100天某商品的日需求量(单位:件),整理得下表:A .16件B .16.2件C .16.6件D .16.8件解析:选D 由题意可知,日平均需求量为14×0.1+15×0.2+16×0.3+18×0.2+20×0.2=16.8(件).2.(2019·长春监测)已知某班级部分同学某次测验成绩的茎叶图如图所示,则其中位数和众数分别为( )A .92,94B .92,86C .99,86D .95,91解析:选B由茎叶图可知,此组数据由小到大排列依次为76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114,故中位数为92,众数为86.故选B.3.样本中共有五个个体,其值分别为0,1,2,3,m .若该样本的平均值为1,则其方差为( )A.105 B.305C. 2 D .2解析:选D 依题意得m =5×1-(0+1+2+3)=-1,则样本方差s 2=15×[(-1)2+02+12+22+(-2)2]=2,即所求的样本方差为2.(三)填一填4.某校为了了解教科研工作开展状况与教师年龄之间的关系,将该校不小于35岁的80名教师按年龄分组,分组区间为[35,40),[40,45),[45,50),[50,55),[55,60],由此得到频率分布直方图如图,则这80名教师中年龄小于45岁的有________人.解析:由频率分布直方图可知45岁以下的教师的频率为5×(0.040+0.080)=0.6,所以年龄小于45岁的共有80×0.6=48(人).答案:485.已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________. 解析:5个数的平均数x =4.7+4.8+5.1+5.4+5.55=5.1,所以它们的方差s 2=15[(4.7-5.1)2+(4.8-5.1)2+(5.1-5.1)2+(5.4-5.1)2+(5.5-5.1)2]=0.1.答案:0.1考点一 茎叶图[典例] (2017·山东高考)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( )A .3,5B .5,5C .3,7D .5,7[解析] 由两组数据的中位数相等可得65=60+y ,解得y =5,又它们的平均值相等, 所以15×[56+62+65+74+(70+x )]=15×(59+61+67+65+78),解得x =3.[答案] A[解题技法] 茎叶图的应用(1)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.(2)给定两组数据的茎叶图,比较数字特征时,“重心”下移者平均数较大,数据集中者方差较小.[题组训练]1.在如图所示一组数据的茎叶图中,有一个数字被污染后模糊不清,但曾计算得该组数据的极差与中位数之和为61,则被污染的数字为( )A .1B .2C .3D .4解析:选B 由图可知该组数据的极差为48-20=28,则该组数据的中位数为61-28=33,易得被污染的数字为2.2.甲、乙两名篮球运动员5场比赛得分的原始记录如茎叶图所示,若甲、乙两人的平均得分分别为x 甲,x 乙,则下列结论正确的是( )A.x 甲<x 乙;乙比甲得分稳定B.x 甲>x 乙;甲比乙得分稳定C.x 甲>x 乙;乙比甲得分稳定D.x 甲<x 乙;甲比乙得分稳定 解析:选A 因为x 甲=2+7+8+16+225=11,x乙=8+12+18+21+255=16.8,所以x甲<x 乙且乙比甲成绩稳定.考点二 频率分布直方图[典例] 某城市100户居民的月平均用电量(单位:千瓦时),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数.[解] (1)由(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)×20=1,解得x =0.007 5.即直方图中x 的值为0.007 5.(2)月平均用电量的众数是220+2402=230.∵(0.002+0.009 5+0.011)×20=0.45<0.5, (0.002+0.009 5+0.011+0.012 5)×20=0.7>0.5, ∴月平均用电量的中位数在[220,240)内.设中位数为a ,则0.45+0.012 5×(a -220)=0.5,解得a =224,即中位数为224. [变透练清]1.某校随机抽取20个班,调查各班有出国意向的人数,所得数据的茎叶图如图所示.以5为组距将数据分组为[0,5),[5,10),…,[30,35),[35,40],所作的频率分布直方图是( )解析:选A 以5为组距将数据分组为[0,5),[5,10),…,[30,35),[35,40],各组的频数依次为1,1,4,2,4,3,3,2,可知画出的频率分布直方图为选项A 中的图.2.(变结论)在本例条件下,在月平均电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取________户.解析:月平均用电量在[220,240)的用户有0.012 5×20×100=25(户).同理可得月平均用电量在[240,260)的用户有15户,月平均用电量在[260,280]的用户有10户,月平均用电量在[280,300]的用户有5户,故抽取比例为1125+15+10+5=15.所以月平均用电量在[220,240)的用户中应抽取25×15=5(户).答案:53.我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由.解:(1)由频率分布直方图可知,月均用水量在[0,0.5)的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]6组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.(2)估计全市居民中月均用水量不低于3吨的人数为3.6万.理由如下:由(1)知,100位居民中月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000=3.6(万).[解题技法]考点三样本的数字特征考法(一)样本的数字特征与频率分布直方图交汇[典例](2019·辽宁师范大学附属中学模拟)某校初三年级有400名学生,随机抽查了40名学生测试1分钟仰卧起坐的成绩(单位:次),将数据整理后绘制成如图所示的频率分布直方图.用样本估计总体,下列结论正确的是()。
2020版高三数学(理科)一轮复习课件:第十一章统计与统计案例 56
【答案】D
【解析】根据题意,样本在(10,50]上的频数为2+3+4+5=14, 14 7 所求的频率为 = .故选D. 20 10
2.(2018江西模拟)甲、乙两位歌手在“中国好声音”选拔赛 中,5位评委评分情况如茎叶图所示,记甲、乙两人的平均得分分别 为 x 甲, x 乙,则下列判断正确的是( )
1.(2018四川内江四模)如图的茎叶图表示的是甲、乙两人在5 次综合测评中的成绩,其中一个数字被污损,则甲的平均成绩超过 乙的平均成绩的概率为( )
2.平均数、方差的公式推广 (1)若数据x1,x2,…,xn的平均数为 x ,那么mx1+a,mx2+a, mx3+a,…,mxn+a的平均数是m x +a. (2)数据x1,x2,…,xn的方差为s2. ①数据x1+a,x2+a,…,xn+a的方差也为s2. ②数据ax1,ax2,…,axn的方差为a2s2.
1.在使用茎叶图时,一定要注意看清楚所有的样本数据,弄清 楚这个图中的数字特点,不要漏掉了数据,也不要混淆茎叶图中茎 与叶的含义. 2.利用频率分布直方图求众数、中位数与平均数时,应注意这 三者的区分:(1)最高的矩形的中点即众数;(2)中位数左边和右边的 直方图的面积是相等的;(3)平均数是频率分布直方图的“重心”, 等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横 坐标之和.
(2)总体密度曲线:随着样本容量的增加,作图时所分的 组数 增加, 组距 减小,相应的频率折线图会越来越接近于一条光滑曲 线,统计中称这条光滑曲线为总体密度曲线.
3.茎叶图 统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间 的一列数,叶就是从茎的旁边生长出来的数. 4.标准差和方差 (1)标准差是样本数据到平均数的一种 (2)标准差:s=
2020版高三数学(理科)一轮复习课件:第十一章统计与统计案例 57
C.பைடு நூலகம்
2.若回归直线方程为 y( ) A.平均增加1.5个单位 B.平均增加2个单位 C.平均减少1.5个单位 D.平均减少2个单位
【答案】C
^ y
=2-1.5x,则变量x增加一个单位,
形成型·微题组
归纳演绎·形成方法
相关关系的判断 (2018宁夏石嘴山模拟)某公司在2017年上半年的收入x(单位:万 元)与月支出y(单位:万元)的统计资料如下表所示: 月份 收入x 支出y 1月份 2月份 3月份 4月份 5月份 6月份 12.3 5.63 14.5 5.75 ) 15.0 5.82 17.0 5.89 19.8 6.11 20.6 6.18
a+c b+d a+b+c+d
构造一个随机变量K2= 为样本容量. (3)独立性检验 利用随机变量 称为独立性检验.
K2
nad-bc2 a+bc+da+cb+d
,其中n=
来判断“两个分类变量 有关系 ”的方法
1.回归分析是对具有相关关系的两个变量进行统计分析的方 法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意 义,否则,求出的线性回归方程毫无意义.根据回归方程进行预 报,仅是一个预报值,而不是真实发生的值. 2.独立性检验中统计量K2的观测值k的计算公式很复杂,在解 题中易混淆一些数据的意义,代入公式时出错,而导致整个计算结 果出错.
根据表中数据,得到K2的观测值 50×13×20-10×72 k= ≈4.844.则认为选修文科与性别有关系 23×27×20×20 出错的可能性为________.
【答案】5%
2020版高考数学(理科)复习作业答案-第十一单元统计与统计案例
全品一线咼考总复习数学(理科)课时作业(五十七)1. D [解析]对居民按行业分类,再进行等比例抽取,这种抽样方法属于分层抽样•故选D.2. B [解析]由题意知,用系统抽样方法抽取5位同学,则分段间隔为一=10,且在第1段抽取的同学编号不大于10,所以符合要求的编号可能是3,13,23,33,43 •故选B.3. A [解析]因为某校高一⑴班有男生、女生共50人,其中男生20人,所以男生、女生的人数之比为20 :0=2 3,故选取的15人中男生、女生的人数之比也为 2 :,所以选取的男生有 6 人,女生有9人•故选A.4•—[解析]由题得,该学生8次考试成绩的平均值为 --------------------------- =87,则标准差为 - - - - - = ^5.15 [解析]由频率分布直方图可得,面包的日销售量在100个到200个之间的频率为(0.006+0.004) X50=0.5,故估计这家面包店一个月内面包的日销售量在100个到200个之间的天数为30 >0.5=15.6. A [解析]在抽样过程中,个体a每一次被抽到的概率是相等的,因为总体容量为10,故个体a第一次被抽到的可能性与第二次被抽到的可能性均为一,故选A.7. C [解析]由题意可知,分段间隔为——=20,又第1组随机抽取的编号为015,所以抽取的这些编号从小到大组成以15为首项,20为公差的等差数列,则抽取的第35个样本编号为15+(35-1)X20=695 .故选C.8. B [解析]设老年人有x人从中抽取y 人,则1600+3x=4300,解得x=900,即老年人有900 人,所以——=一,解得y=180 .故选B.9. A [解析]由茎叶图可知甲班同学数据的波动较大,则甲班同学身高的方差较大,A选项中的结论正确;甲班同学身高的平均值为--------------------------------------- =169 .2,乙班同学身高的平均值为-------------------------------------- = 171,则乙班同学身高的平均值较大,B选项中的结论错误;甲班同学身高的中位数为 -------- =168,乙班同学身高的中位数为------ =171.5,则乙班同学身高的中位数较大,C选项中的结论错误;甲班同学身高在175cm以上的人数为3,乙班同学身高在175 cm以上的人数为4,则乙班同学身高在175 cm以上的人数较多,D选项中的结论错误.故选A.10. D [解析]由平均数和标准差的性质可知,若X1,X2,…,X n的平均数为一,标准差为S,则kx i+b,kx2+b,…,kx n+b的平均数为+b,标准差为|k|s,据此结合题意可得y i,y2,…,y20i8的平均数为-3汎3-2)=-3,标准差为3>4=12.故选D.11. C [解析]第一组数据的频率为0.02 >5=0.1,第二组数据的频率为0.06豹=0.3,第三组数据的频率为0.08 >5=0.4,「中位数在第三组内,设中位数为25+x,则x>0.08=0.5-0.1-0.3,解得x=1.25, /数据的中位数为26.25,故A错误;题图中的最高矩形是第三组,又第三组数据的中间值为27.5, ••数据的众数为27 .5,故B错误;•学生1分钟仰卧起坐的成绩超过30次的频率为0.04 >5=0.2,「该校初三年级满足条件的学生人数约为400 >0.2=80,故C正确;••学生1分钟仰卧起坐的成绩少于20次的频率为0.02 >5=0.1,/该校初三年级满足条件的学生人数约为400 >0.1 =40,故D错误.故选C.12. -11,3,17 ------------------------------------------------------------ [解析]由题得,这组数据的平均数为=——,众数为2若x电,则中位数为2,所以2 >2= ------ +2,解得x=-11;若2<x<4,则中位数为X,所以2x= ---------- +2,解得x=3;若X再,则中位数为4,所以2 >4 = ------ +2,解得x=17.所以x的所有可能取值为-11,3,17 .13 .A [解析]依题意得X1+X2 ------ X n=n ,y1+y2 ------------ y m=m ,X1+X2+ ------ x n+y1+y2+ …+y m=(m+n)— =(m+n)+(m+n)(1 -a)_,所以n_+ m_=(m+n)+(m+n)(1-a):因为一h,所以整理得n-m=(m+n)[a-(1 -a)]=(m+n)(2a-1).因为0<a<-,所以-1 <2a-1 <0,所以n-m<0,即n<m.故选A.14.6 [解析]由题意知,n为18+12+6=36的正约数.又因为足球、篮球、乒乓球运动员人数之比为18 : 2 6=3 2 1,所以n为6的倍数,所以n=6,12,18 .因为当样本容量为(n +1)时,若采用系统抽样法,则需要剔除1个个体,所以(n+1)为35的正约数,即n=6.课时作业(五十八)1. B [解析]因为点E到回归直线的距离最远,所以去掉点E,余下的5个点所对应的数据的相关系数最大.故选B.2. C [解析]由于K2的观测值k胡2>10.828,故有99.9%的把握认为学习成绩优秀与使用智能手机有关.3. D [解析]相关系数r用来衡量两个变量之间线性关系的强弱,|r|越接近于1,则相关性越强所以①错误;回归直线=x+ 一定经过样本点的中心(一,一),②正确;随机误差e的方差D(e)的大小是用来衡量预报的精确度的,③正确;相关指数R2用来刻画回归的效果,R2越小,说明模型的拟合效果越不好,所以④错误.故选D.4. 丁[解析]相关指数R2越大,则模型的拟合效果越好,所以丁组数据的模型的拟合效果最好.5.0.83 [解析]-= =2 =2.6,将(2,2.6)代入=x+0.94,解得=0.83.6. -------------------------------------------------------------------------- B [解析]根据表中数据得K2的观测值k= ----------------------------------------------------------------------------- - ---- -5.059>5.024,所以若推断“学生的性别与认为作业量是否大有关”,则这种推断犯错误的概率不超过0.025.故选B.7. C [解析]由-0.7V0,得变量x,y之间呈负相关关系,故A选项中的说法正确;当x=20时,=-0.7疋0 + 10.3=-3.7,故B选项中的说法正确;由数据表格可知一=-刈6+8 + 10 + 12)=9,一=- ><6+m+ 3+2)=——,则——=-0.7 >9+10.3,解得m=5,所以样本点的中心为(9,4),故C选项中的说法错误,D选项中的说法正确.故选C.8. A [解析]若X与Y有关系的可能性最大,则易知|a-c|最大,结合选项计算可得A选项符合题意.9. A [解析]由题图可知这些点分布在一条斜率大于零的直线附近,所以x,y之间为正相关,即相关系数r>0,所以①正确;因为一 = ---------- =3厂= -------------- =3,所以回归直线l必过样本点的中心(3,3),即直线l恰好过点D,所以②正确;因为直线I的斜率接近于直线AD的斜率,且k AD= —=0.5<1,所以③错误.故选A.10. C [解析]由两组数据(1,0)和(2,2)可得直线方程为y=2x-2,即b'=2,a'=-2.利用线性回归方程的公式与表格中的数据可得= -------- -- --------------- =-,=一-一=一-- >=--,所以<b', >a'.故选C.11.68 [解析]设所求数据为a,由数据表格可得一= ---------------- =30,一= ----------------- =------ ,代入回归方程得 ------ =0.67 X30 + 54.9,解得a= 68.12.12 [解析]设男生人数为x,由题意可得2 >2列联表如下:若有95%的把握认为是否喜欢韩剧和性别有关,则K2的观测值k>3.841,即k=------------- —>3.841,解得x>10.243 .又因为-,-为整数,所以若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有12人.13. ------------------------------------------------------- 解:⑴由题意可知一=--------- =120,一= =90,-一-一(145 -120) >^110-90)+(130-120) >^90-90)+(120-120) X(102-90)+(105-120) X (78-90) + (100-120) X70 -90) =500 +0+0+180 +400 = 1080, - (145 -120) 2+(130-120)2+ (120-120)2+(105-120)2+(100 -120) 2=625 +100 +0 +225 +400 = 1350,故=——=0.8, =90-120 >0.8=-6,故线性回归方程为=0.8x-6.⑵将x=110代入回归方程,得=0.8 X10-6=82,即估计该同学的物理成绩为82分.(3)由题意可知,该班数学优秀的人数及物理优秀的人数分别为30,36 .由表知,抽出的5人中,数学优秀但物理不优秀的有1人,故全班数学优秀但物理不优秀的有1 + 5=6(人).于是K2的观测值k= =10>6.635,因此在犯错误的概率不超过0.01的前提下,可以认为数学优秀与物理优秀有关.14.解:(1)由题得,一= ------------- =3.5,=7,所以=——=0.16,又=一-",所以=7-0.16 X3.5=6.44,⑵①由⑴知=0.16t+6.44,当t=7 时,=0.16 X7+6.44=7.56,即预测该地区2019年该农产品的产量为7.56万吨.②当年产量为y万吨时,销售额S=(4.5-0.3y)y X103=(-0.3y2+4.5y)xl03(万元), 当y=7.5 时屈数S 取得最大值,又y €{6.6,6.7,7,7.1,7.2,7.4,7.56},所以当y=7.56,即t=7时,销售额最大.15. B [解析]因为+ + …+ =(X i+X2+…+X8,y i+y2+ …+『8)=(8一,8一)=(6,2),所以8一=6,8一=2,解得—=-,一=-,代入回归直线方程,得-=-X +,解得=--,故选B.16. B [解析]由所给的数据计算可得=0.6x+0.2. _=37=2, = 一:2——-——=0.6, =2-0.6 >3=0.2,所以回归直线h的方程为直线12的方程为y=x,所以m=1,n=0.显然m> , >n,①为真命题;直线h过点A3,即回归直线过样本点的中心,②为真命题;-- -- ③为假命题-- -④为假命题综上可得真命题有个故选所以y关于t的线性回归方程为=0.16t+6.44.。
2020高考文科数学一轮总复习课标通用版作业:第11章 统计 课时作业56
课时作业56统计案例一、选择题1.(2019年福建省福州市八县(市)协作校高二下学期期中)下面的等高条形图1可以说明的问题是()图1A.“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响是绝对不同的B.“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响没有什么不同C.此等高条形图看不出两种手术有什么不同的地方D.“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响在某种程度上是不同的,但是没有100%的把握解析:由图可知,“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响在某种程度上是不同的,但是没有100%的把握,故选D.答案:D2.考察棉花种子是否经过处理和棉花生病之间的关系,得到如下列联表(单位:株),根据表中数据,则(当K2≤2.706时认为没有充分证据显示两个分类变量有关)下列说法正确的是()种子处理种子未处理总计生病32101133不生病61213274总计93314407 A.B.种子是否经过处理跟棉花生病无关C.种子是否经过处理决定棉花是否生病D.以上说法都不对解析:K2=407×(32×213-61×101)293×314×274×133≈0.164<2.706∴没有充分证据认为两个分类变量有关,选D.答案:D3.(2019年河北省深州市中学高二下学期期中)随机调查某校110名学生是否喜欢跳舞,由列联表和公式K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)计算出K2,并由此作出结论:“有99%的可能性认为学生喜欢跳舞与性别有关”,则K2可以为()P(K2≥k0)0.100.050.0250.010k0 2.706 3.841 5.024 6.635A.3.565C.5.233 D.6.842解析:利用所给数据,在K2≥6.635时,可作出结论:“有99%的可能性认为学生喜欢跳舞与性别有关”,只有D满足.故选D.答案:D4.某市政府调查市民收入与旅游欲望时,采用独立性检验法抽取3 000人,计算发现K2=6.023,则根据这一数据查阅下表,市政府断言市民收入增减与旅游欲望有关系的把握是()P(K2≥k0)0.250.150.100.0250.0100.005k0 1.323 2.072 2.706 5.024 6.6357.879C.97.5% D.99.5%解析:K2=6.023>5.024,∴可断言市民收入增减与旅游欲望有关的把握为97.5%.答案:C5.某医疗研究所为了检验新开发的流感疫苗对甲型H1N1流感的预防作用,把1 000名注射了疫苗的人与另外1 000名未注射疫苗的人的半年的感冒记录作比较,提出假设H0:“这种疫苗不能起到预防甲型H1N1流感的作用”,并计算出P(χ2≥6.635)≈0.01,则下列说法正确的是()A.这种疫苗能起到预防甲型H1N1流感的有效率为1%B.若某人未使用该疫苗,则他在半年中有99%的可能性得甲型H1N1C.有1%的把握认为“这种疫苗能起到预防甲型H1N1流感的作用”D.有99%的把握认为“这种疫苗能起到预防甲型H1N1流感的作用”解析:P(χ2≥6.635)≈0.01的解释是能够以99%的把握认为“这种疫苗能起到预防甲型H1N1流感的作用”,其出错的可能性是1%,所以答案选D.答案:D6.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K2≈3.918,经查临界值表知P(K2≥3.841)≈0.05.则下列表述中正确的是()A.有95%的把握认为“这种血清能起到预防感冒的作用”B.若有人未使用该血清,那么他一年中有95%的可能性得感冒C.这种血清预防感冒的有效率为95%D.这种血清预防感冒的有效率为5%解析:由题意可知,在假设H成立情况下,P(K2≥3.841)≈0.05,即在犯错的概率不超过0.05的前提下认为“血清起预防感冒的作用”,即有95%的把握认为“这种血清能起到预防感冒的作用”.这里的95%是我们判断H不成立的概率量度,而非预测血清与感冒的几率的量度,故B错误.C,D也犯有B中的错误.答案:A7.(2019年黑龙江省海林市朝鲜中学高三高考综合卷)某学校为判断高三学生选修文科是否与性别有关,现随机抽取50名学生,得到如表2×2列联表:理科文科合计男131023女72027合计203050根据表中数据得到χ2=50×(13×20-10×7)223×27×20×30≈4.844,已知P(χ2≥3.841)≈0.05, P(χ2≥5.024)≈0.025.现作出结论“选修文科与性别相关”,估计这种判断出错的可能性约为()A.97.5% B.95%C.2.5% D.5%解析:K2≈4.844>3.841 ,而P(K2≥3.841)≈0.05,故这种判断出错的可能性约为5% ,选D.答案:D8.(2019年湖北省武汉市蔡甸区实验高级中学高二上学期月考)以下四个命题,其中正确的个数有()①由独立性检验可知,有99%的把握认为物理成绩与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀.②两个随机变量相关性越强,则相关系数的绝对值越接近于1;③在线性回归方程y^=0.2x+12中,当解释变量x每增加一个单位时,预报变量y^平均增加0.2个单位;④对分类变量X与Y的随机变量K2的观测值k来说,k越小,“X 与Y有关系”的把握程度越大.A.1B.2 C.3D.4解析:对于命题①认为数学成绩与物理成绩有关,不出错的概率是99%,不是数学成绩优秀,物理成绩就有99%的可能优秀,不正确;对于④,随机变量K2的观测值k越小,说明两个相关变量有关系的把握程度越小,不正确;容易验证②③正确,应选答案B.答案:B9.(2019年江西科技学院附属中学上学期高二第一次月考)某班主任对全班50名学生进行了作业量多少的调查,数据如表:认为作业多认为作业不多总数喜欢玩电脑游戏18927 不喜欢玩电脑游戏81523 总数262450 根据表中数据得到K2=27×23×24×26≈5.059,因为P(K2≥5.024)=0.025,则认为喜欢玩电脑游戏与认为作业量的多少有关系的把握大约为()A.90% B.95%C.97.5% D.无充分根据解析:根据2×2列联表计算的K2=50×(18×15-8×9)2 27×23×24×26≈5.059,且P(K2≥5.024)可知,有97.5%的把握认为喜欢玩电脑游戏与认为作业量的多少有关系,故选C.答案:C10.(2019年山东省德州市高二高级中学第二学期期末)为大力提倡“厉行节约,反对浪费”,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘”能做到“光盘”男4510女3015P(K2≥k0)0.100.050.025k0 2.706 3.841 5.024K2=(a+b)(c+d)(a+c)(b+d)参照附表,得到的正确结论是()A.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”C.有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”D.有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”解析:由表计算得:K2=100×(45×15-30×10)255×45×75×25=3.03,所以有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”,选C.答案:C11.(2019年广西南宁月考)某同学寒假期间对其30位亲属的饮食习惯进行了一次调查,列出了如下列联表:偏爱蔬菜偏爱肉类合计50岁以下481250岁以上16218合计201030附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).P(K2≥k0)0.100.050.0100.0050.001k0 2.706 3.841 6.6357.87910.82 8C.99% D.99.9%解析:由2×2列联表知,K2=30×(4×2-16×8)2 12×18×20×10=10.∵K2>6.635,∴有99%的把握认为其亲属的饮食习惯与年龄有关.答案:C12.某企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了72名员工进行调查,所得的数据如下表所示:积极支持改革不太支持改革合计工作积极28836 工作一般162036 合计442872()(参考公式与数据:χ2=n(n11n22-n12n21)2(n11+n12)(n21+n22)(n11+n21)(n12+n22).当χ2>3.841时,有95%的把握说事件A与B有关;当χ2>6.635时,有99%的把握说事件A与B有关;当χ2<3.841时,认为事件A与B无关.)A.有99%的把握说事件A与B有关B.有95%的把握说事件A与B有关C.有90%的把握说事件A与B有关D.事件A与B无关解析:由列联表得χ2=72×(28×20-16×8)244×28×36×36≈8.416>6.635,所以有99%的把握说事件A与B有关.答案:A二、填空题13.(2019年河南省天一大联考高二下学期阶段性测试)用独立性检验的方法来验证性别与是否喜爱喝酒的关系,得到的K2=6.428,则________(填“有”或“没有”)99%的把握认为性别与是否爱喝酒有关(临界值表参见18题).解析:K2=6.428<6.635,所以没有99%的把握认为性别与是否爱喝酒有关.故答案为:没有.答案:没有14.(2019年湖南师大附中高三上学期月考)在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:感染未感染总计服用104050 未服用203050总计3070100 提下,可认为“该种疫苗有预防埃博拉病毒感染的效果”.参考公式:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)P(K2≥k0)0.100.050.0250.0100.0050.001 k0 2.706 3.841 5.024 6.6357.87910.828K2=100×(10×30-20×40)250×50×30×70≈4.762>3.841,参照附表,可得:在犯错误的概率不超过5%的前提下,认为“该种疫苗有预防埃博拉病毒感染的效果”.故答案为:5%.答案:5%15.(2019年四川省成都七中高三上学期入学考试)某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:喜欢甜品不喜欢甜品合计南方学生602080北方学生101020 合计7030100在选用甜品的饮食习惯方面有差异”______.(填“有”或“没有”)附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)P(K2≥k0)0.100.050.0100.005 k0 2.706 3.841 6.6357.879K2=100×(60×10-20×10)270×30×80×20=10021>3.841,对照临界值可知,有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.答案:有16.(2019年云南省玉溪市民族中学高二下学期第二次阶段考试)为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下2×2 列联表喜爱打篮球不喜爱打篮球合计男生20525 女生101525 合计302050数表示).解析:K2=50×(300-50)225×25×30×20≈8.333,0.005>P(K2≥k0)>0.001,则至少有99.5%的把握认为喜爱打篮球与性别有关.答案:99.5%三、解答题17.(2019年山东省烟台市高三下学期高考诊断性测试)某高中学校对全体学生进行体育达标测试,每人测试A、B两个项目,每个项目满分均为60分.从全体学生中随机抽取了100人,分别统计他们A、B两个项目的测试成绩,得到A项目测试成绩的频率分布直方图和B 项目测试成绩的频数分布表如下:图2B项目测试成绩频数分布表分数区间频数[0,10) 2[10,20) 3[20,30) 5[30,40)15[40,50)40[50,60)35分数[0,30)[30,50)[50,60]等级一般良好优秀(1)(2)已知A项目等级为优秀的学生中女生有14人,A项目等级为一般或良好的学生中女生有34人,试完成下列2×2列联表,并分析是否有95%以上的把握认为“A项目等级为优秀与性别有关”?优秀一般或良好合计男生女生合计参考数据:p(K2≥k0)0.100.0500.0250.0100.001k0 2.706 3.841 5.024 6.63510.828 参考公式K2=,(a+b)(c+d)(a+c)(b+d)其中n=a+b+c+d.(3)将样本频率作为总体的概率,并假设A项目和B项目测试成绩互不影响,现从该校学生中随机抽取1人进行调查,试估计其A项目等级比B项目等级高的概率.解:(1)由A项目测试成绩的频率分布直方图,得A项目等级为优秀的频率为0.04×10=0.4,所以,A项目等级为优秀的人数为0.4×100=40.(2)由(1)知A项目等级为优秀的学生中,女生为14人,男生为26人.A项目等级为一般或良好的学生中,女生为34人,男生为26人.作出2×2列联表:优秀一般或良好合计男生数262652女生数143448合计4060100计算K2=40×60×48×52≈4.514,由于K2>3.841,所以有95%以上的把握认为“A项目等级为优秀与性别有关”.(3)设“A项目等级比B项目等级高”为事件C.记“A项目等级为良好”为事件A1;“A项目等级为优秀”为事件A2;“B项目等级为一般”为事件B0;“B项目等级为良好”为事件B1.于是P(A1)=(0.02+0.02)×10=0.4,P(A2)=0.4,由频率估计概率得:P(B0)=2+3+5100=0.1,P(B1)=40+15100=0.55.因为事件A i与B j相互独立,其中i=1,2,j=0,1.所以P(C)=P(A1B0+A2B1+A2B0)=0.4×0.1+0.4×0.1+0.4×0.55=0.3.所以随机抽取一名学生其A项目等级比B项目等级高的概率为0.3.18.(2019年陕西省高三一模)随着资本市场的强势进入,互联网共享单车“忽如一夜春风来”,遍布了一二线城市的大街小巷.为了解共享单车在A市的使用情况,某调查机构借助网络进行了问卷调查,并从参与调查的网友中随机抽取了200人进行抽样分析,得到下表(单位:人):经常使用偶尔或不用合计30岁及以下703010030岁以上6040100 合计13070200A市使用共享单车情况与年龄有关?(2)现从所有抽取的30岁以上的网民中利用分层抽样抽取5人,①求这5人中经常使用、偶尔或不用共享单车的人数;②从这5人中,再随机选出2人赠送一件礼品,求选出的2人中至少有1人经常使用共享单车的概率.参考公式:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a +b+c+d.P(K2≥k0)0.150.100.050.0250.010k0 2.072 2.706 3.841 5.024 6.635K2=200×(70×40-60×30)2130×70×100×100≈2.198.因为2.198>2.072,所以能在犯错误的概率不超过0.15的前提下认为A市使用共享单车情况与年龄有关.(2)①依题意可知,所抽取的5名30岁以上的网友中,经常使用共享单车的有5×60100=3(人),偶尔或不用共享单车的有5×40100=2(人).②设这5人中,经常使用共享单车的3人分别为a,b,c;偶尔或不用共享单车的2人分别为d,e.则从5人中选出2人的所有可能结果为(a,b),(a,c),(a,d),(a,e),(b,c),(b,d),(b,e),(c,d),(c,e),(d,e),共10种.其中没有1人经常使用共享单车的可能结果为(d,e),共1种,故选出的2人中至少有1人经常使用共享单车的概率为P=1-110=910.19.(2019年内蒙古赤峰市高三上学期期末)2017年5月14日,第一届“一带一路”国际高峰论坛在北京举行,为了解不同年龄的人对“一带一路”关注程度,某机构随机抽取了年龄在15~75岁之间的100人进行调查,并按年龄绘制成频率分布直方图,如图3所示,其分组区间为:[15,25),[25,35),[35,45),[45,55),[55,65),[65,75).把年龄落在区间[15,35)和[35,75)内的人分别称为“青少年”和“中老年”.(1)根据频率分布直方图图3求样本的中位数(保留两位小数)和众数;(2)根据已知条件完成下面的2×2列联表,并判断能否有99%的把握认为关注“一带一路”和年龄段有关?图3关注不关注合计青少年15中老年合计 50 50 100附:参考公式K 2=(a +b )(c +d )(a +c )(b +d ),其中n=a +b +c +d临界值表:P (K 2≥k 0)0.05 0.010 0.001 k 03.841 6.63510.828解:40,因为10×(0.015+0.030)=0.45,设样本的中位数为x ,则(x -35)×0.035=0.5-0.45,所以x =35107≈36.43,即样本的中位数为36.43.(2)依题意知,抽取的“青少年”共有100×(0.015+0.030)×10=45人,“中老年”共有100-45=55人,完成2×2列联表如下:关注 不关注 合计 青少年 15 30 45 中老年 35 20 55 合计5050100结合数据得K 2=2(a +b )(c +d )(a +c )(b +d )=100×(30×35-20×15)255×50×55×45≈9.091,因为P (K 2>6.635)=0.01,9.091>6.635,所以有99%的把握认为关注“一带一路”和年龄段有关.20.(2019年福建省厦门市高三下学期第一次质量检查)为了解学生的课外阅读时间情况,某学校随机抽取了50人进行统计分析,把这50人每天阅读的时间(单位:分钟)绘制成频数分布表,如下表所示:阅读[0,20)[20,40)[40,60)[60,80)[80,100)[100,120) 时间人数81012117 2达人”,根据统计结果中男女生阅读达人的数据,制作出如图所示的等高条形图.图4(1)根据抽样结果估计该校学生的每天平均阅读时间(同一组数据用该区间的中点值作为代表);(2)根据已知条件完成下面的2×2列联表,并判断是否有99%的把握认为“阅读达人”跟性别有关?男生女生总计阅读达人非阅读达人总计K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .临界值表:P (K 2≥k 0) 0.100 0.050 0.0100.001 k 02.7063.841 6.63510.828解:(1)该校学生的每天平均阅读时间为:10×850+30×1050+50×1250+70×1150+90×750+110×250=1.6+6+12+15.4+12.6+4.4=52.(2)由频数分布表得,“阅读达人”的人数是11+7+2=20, 根据等高条形图得2×2列联表:男生 女生 总计 阅读达人 6 14 20 非阅读达人 18 12 30 总计242650K 2=5020×30×24×26=22552≈4.327,由于4.327<6.635,故没有99%的把握认为“阅读达人”跟性别有关.。
2020届高考数学一轮复习单元检测十一算法、统计与统计案例(提升卷)单元检测理解析版新人教A版
单元检测十一算法、统计与统计案例(提升卷)考生注意:1.本试卷分第Ⅰ卷(选择题)和第Ⅱ卷(非选择题)两部分,共4页.2.答卷前,考生务必用蓝、黑色字迹的钢笔或圆珠笔将自己的姓名、班级、学号填写在相应位置上.3.本次考试时间100分钟,满分130分.4.请在密封线内作答,保持试卷清洁完整.第Ⅰ卷(选择题共60分)一、选择题(本题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.(2018·上海十四校联考)若x1,x2,x3,…,x10的平均数为3,则3(x1-2),3(x2-2),3(x3-2),…,3(x10-2)的平均数为( )A.3B.9C.18D.27答案 A解析由题意得x1+x2+x3+…+x10=30,所以3(x1-2)+3(x2-2)+3(x3-2)+…+3(x10-2)=3(x1+x2+x3+…+x10)-60=30,所以所求平均数3(x-2)=3010=3,故选A. 2.(2018·青岛模拟)一个公司有8名员工,其中6位员工的月工资分别为5 200,5 300,5 500,6100,6500,6600,另两位员工数据不清楚,那么8位员工月工资的中位数不可能是( ) A.5800B.6000C.6200D.6400答案 D解析由题意知,当另外两位员工的工资都小于5200时,中位数为(5300+5500)÷2=5400;当另外两位员工的工资都大于6600时,中位数为(6100+6500)÷2=6300,所以8位员工月工资的中位数的取值区间为[5 400,6 300],所以这8位员工月工资的中位数不可能是6400,故选D.3.若x1,x2,...,x2019的平均数为3,标准差为4,且y i=-3(x i-2),i=1,2, (2019)则新数据y1,y2,…,y2019的平均数和标准差分别为( )A.-9,12 B.-9,36C.-3,36 D.-3,12答案 D解析由平均数和标准差的性质可知,若x1,x2,x3,…,x n的平均数为x,标准差为s,则kx1+b,kx2+b,kx3+b,…,kx n+b的平均数为k x+b,标准差为|k|s,据此结合题意可得y1,y2,…,y2019的平均数为-3(3-2)=-3,标准差为3×4=12,故选D.4.执行如图所示的程序框图,若输出的结果为1,则输入x的值为( )A.-2或-1或3 B.2或-2C.3或-1 D.3或-2答案 D解析由-2x-3=1,解得x=-2,因为-2>2不成立,所以-2是输入的x的值;由log3(x2-2x)=1,即x2-2x=3,解得x=3或x=-1(舍去).综上,x的值为-2或3,故选D.5.(2018·济南模拟)中国诗词大会的播出引发了全民的读书热,某小学语文老师在班里开展了一次诗词默写比赛,班里40名学生得分数据的茎叶图如图,若规定得分不小于85分的学生得到“诗词达人”的称号,小于85分且不小于70分的学生得到“诗词能手”的称号,其他学生得到“诗词爱号者”的称号,根据该次比赛的成绩按照称号的不同进行分层抽样抽选10名学生,则抽选的学生中获得“诗词能手”称号的人数为( )A .2B .4C .5D .6 答案 B解析 由茎叶图得班里40名学生中,获得“诗词达人”称号的有8人,获得“诗词能手”称号的有16人,获得“诗词爱好者”称号的有16人,则由分层抽样的概念得选取的10名学生中,获得“诗词能手”称号的人数为10×1640=4,故选B.6.某市某高中从高三年级甲、乙两个班中各选出7名学生参加2018年全国高中数学联赛,他们取得的成绩(满分140分)的茎叶图如图所示,其中甲班学生成绩的中位数是81,乙班学生成绩的平均数是86.若正实数a ,b 满足a ,G ,b 成等差数列,且x ,G ,y 成等比数列,则1a +4b的最小值为( )A.49B .2C.94D .9答案 C解析 甲班学生成绩的中位数是80+x =81,解得x =1.由茎叶图可知乙班学生的总分为76+80×3+90×3+(0+2+y +1+3+6)=598+y ,又乙班学生成绩的平均数是86,所以86×7=598+y ,解得y =4.若正实数a ,b 满足a ,G ,b 成等差数列,且x ,G ,y 成等比数列,则2G =a +b ,xy =G 2,即有a +b =4,则1a +4b =14(a +b )·⎝ ⎛⎭⎪⎫1a +4b =14⎝⎛⎭⎪⎫1+4+b a +4a b ≥14⎝ ⎛⎭⎪⎫5+2 b a ·4a b =14×9=94,当且仅当a =43,b =83时,取等号.故选C. 7.某校九年级有400名学生,随机抽取了40名学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图,用样本估计总体,下列结论正确的是( )A .该校九年级学生1分钟仰卧起坐的次数的中位数为25B .该校九年级学生1分钟仰卧起坐的次数的众数为24C .该校九年级学生1分钟仰卧起坐的次数超过30的人数约为80D .该校九年级学生1分钟仰卧起坐的次数少于20的人数约为8 答案 C解析 第一组数据的频率为0.02×5=0.1,第二组数据的频率为0.06×5=0.3,第三组数据的频率为0.08×5=0.4,所以中位数在第三组内,设中位数为25+x ,则x ×0.08=0.5-0.1-0.3=0.1,所以x =1.25,所以中位数为26.25,故A 错误;最高矩形是第三组数据,第三组数据的中间值为27.5,所以众数为27.5,故B 错误;学生1分钟仰卧起坐的成绩超过30次的频率为0.04×5=0.2,所以超过30次的人数为400×0.2=80,故C 正确;学生1分钟仰卧起坐的成绩少于20次的频率为0.02×5=0.1,所以1分钟仰卧起坐的成绩少于20次的人数为400×0.1=40,故D错误.故选C.8.某程序框图如图所示,若输出S=3,则判断框中M为( )A.k<14?B.k≤14? C.k≤15? D.k>15?答案 B解析由程序框图可知S=11+2+12+3+…+1k+k+1,因为1k+k+1=k+1-k,所以S=2-1+3-2+4-3+…+k+1-k=k+1-1,所以S=k+1-1=3,解得k=15,即当k=15时程序退出,故选B.9.某班一次测试成绩的茎叶图和频率分布直方图可见部分如图,根据图中的信息可确定被抽测的人数及分数在[90,100]内的人数分别为( )A .20,2B .24,4C .25,2D .25,4 答案 C解析 由频率分布直方图可得分数在[50,60)内的频率是0.008×10=0.08,又由茎叶图可得分数在[50,60)内的频数是2,则被抽测的人数为20.08=25.又由频率分布直方图可得分数在[90,100]内的频率与分数在[50,60)内的频率相同,则频数也相同,都是2,故选C. 10.某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用2×2列联表进行独立性检验,经计算K 2=6.705,则所得到的统计学结论是认为“学生性别与支持该活动没有关系”的把握是( )A.99.9%B .99%C .1%D .0.1% 答案 C解析 因为 6.635<6.705<10.828,所以有1%的把握认为“学生性别与支持该活动没有关系”,故选C.11.设某中学的高中女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,3,…,n ),用最小二乘法近似得到线性回归方程为y ^=0.85x -85.71,则下列结论中不正确的是( ) A .y 与x 具有正线性相关关系 B .回归直线过样本点的中心(x ,y )C .若该中学某高中女生身高增加1cm ,则其体重约增加0.85kgD .若该中学某高中女生身高为160cm ,则可断定其体重必为50.29kg答案 D解析 y 与x 具有正线性相关关系,A 正确;由线性回归方程的性质可知,B 正确;身高每增加1cm ,体重约增加0.85kg ,C 正确;某女生身高为160cm ,则其身高约为50.29kg ,D 错误,故选D.12.以下四个结论,正确的是( )①质检员从匀速传递的产品生产流水线上,每间隔10分钟抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②在频率分布直方图中,所有小矩形的面积之和为1;③在线性回归方程y ^=0.2x +12中,当变量x 每增加一个单位时,变量y 一定增加0.2个单位;④对于两个分类变量X 与Y ,求出其统计量K 2的观测值k ,观测值k 越大,我们认为“X 与Y 有关系”的把握程度就越大.A .①④B.②③C.①③D.②④ 答案 D解析 对于①,易得这样的抽样为系统抽样,①错误;对于②,由频率分布直方图的概念易得②正确;对于③,由线性回归方程的概念易得变量y 约增加0.2个单位,③错误;对于④,由独立性检验易得④正确.综上所述,故选D.第Ⅱ卷(非选择题 共70分)二、填空题(本题共4小题,每小题5分,共20分.把答案填在题中横线上)13.已知下表所示数据的线性回归方程为y ^=4x +242,则实数a =________.答案 262解析 由题意得x =4,y =15(1028+a ),代入y ^=4x +242,可得15(1028+a )=4×4+242,解得a =262.14.抽样统计甲、乙两名学生的5次训练成绩(单位:分),结果如下:则成绩较为稳定(方差较小)的那位学生成绩的方差为________. 答案 20解析 由数据可得甲的平均数是15(65+80+70+85+75)=75,方差为15[(65-75)2+(80-75)2+(70-75)2+(85-75)2+(75-75)2]=50,乙的平均数是15(80+70+75+80+70)=75,方差为15[(80-75)2+(70-75)2+(75-75)2+(80-75)2+(70-75)2]=20<50,故成绩较稳定的学生为乙,其方差为20.15.为了解某一段公路汽车通过时的车速情况,现随机抽测了通过这段公路的200辆汽车的时速,所得数据均在[40,80]中,其频率分布直方图如图所示,则在抽测的200辆汽车中,时速在[40,60)内的汽车有________辆.答案 80解析 由频率分布直方图可得时速在[40,60)内的频率为(0.01+0.03)×10=0.4,则时速在[40,60)内的汽车有0.4×200=80(辆).16.对某两名高三学生连续9次数学测试的成绩(单位:分)进行统计得到如下折线图.下列有关这两名学生数学成绩的分析中,正确的结论是________.(写出所有正确结论的序号)①甲同学的成绩折线图具有较好的对称性,与正态曲线相近,故而平均成绩为130分;②根据甲同学成绩折线图中的数据进行统计,估计该同学平均成绩在区间[110,120]内;③乙同学的数学成绩与测试次号具有比较明显的线性相关性,且为正相关;④乙同学在这连续九次测验中的最高分与最低分的差超过40分.答案②③④解析①甲同学的成绩折线图具有较好的对称性,最高分是130分,故而平均成绩小于130分,①错误;②根据甲同学成绩折线图中的数据易知,该同学平均成绩在区间[110,120]内,②正确;③乙同学的数学成绩与测试次号具有比较明显的线性相关性,且为正相关,③正确;④乙同学在这连续九次测验中的最高分大于130分,最低分小于90分,差超过40分,故④正确.三、解答题(本题共4小题,共50分.解答应写出文字说明、证明过程或演算步骤) 17.(12分)某网站针对“2019年法定节假日调休安排”提出的A,B,C三种放假方案进行了问卷调查,调查结果如下:(1)从所有参与调查的人中,用分层抽样的方法抽取n 个人,已知从支持A 方案的人中抽取了6人,求n 的值;(2)从支持B 方案的人中,用分层抽样的方法抽取5人,这5人中在35岁以下的人数是多少?35岁以上(含35岁)的人数是多少?解 (1)由题意知,6100+200=n 200+400+800+100+100+400,解得n =40.(2)这5人中,35岁以下的人数为5400+100×400=4,35岁以上(含35岁)的人数为5400+100×100=1.18.(12分)某高校组织自主招生考试,共有2000名学生报名参加了笔试,成绩均介于195分到275分之间,从中随机抽取50名学生的成绩进行统计,将统计的结果按如下方式分成八组:第一组[195,205),第二组[205,215),…,第八组[265,275].如图是按上述分组方法得到的频率分布直方图:(1)求a 的值和这2000名学生的平均分;(2)若计划按成绩选取1000名学生进入面试环节,试估计应将分数线定为多少. 解 (1)由(0.004+0.008+0.01×2+a +0.016+0.02×2)×10=1,解得a =0.012, 则这2000名学生的平均分为200×0.04+(210+220)×0.1+(230+240)×0.2+250×0.16+260×0.12+270×0.08=237.8(分).(2)设这2000名学生成绩的中位数为x分,因为0.04+0.1+0.1+0.2=0.44<0.5,0.04+0.1+0.1+0.2+0.2=0.64>0.5,所以中位数x位于第五组,则(x-235)×0.02=0.5-(0.04+0.1+0.1+0.2),解得x=238. 故应将分数线定为238分.19.(13分)某机构就是否支持发展共享单车随机调查了50人,他们年龄的分布及支持发展共享单车的人数统计如下表:由以上统计数据填写下面的2×2列联表,并判断能否在犯错误的概率不超过0.1的前提下,认为年龄与是否支持发展共享单车有关系.参考数据:,其中n=a+b+c+d.参考公式:K2=(a+b)(c+d)(a+c)(b+d)解根据所给数据得到如下2×2列联表:根据2×2列联表中的数据,得到K 2的观测值为 k =50×(30×5-10×5)2(30+10)(5+5)(30+5)(10+5)≈2.38<2.706. ∴不能在犯错误的概率不超过0.1的前提下,认为年龄与是否支持发展共享单车有关系. 20.(13分)某农科所对冬季昼夜温差x (℃)与某反季节新品种大豆种子的发芽数y (颗)之间的关系进行了分析研究,他们分别记录了12月1日至12月5日每天的昼夜温差与实验室每天每100颗种子的发芽数,得到的数据如下表所示:该农科所确定的研究方案是:先从这5组数据中选取3组求线性回归方程,剩下的2组数据用于线性回归方程的检验.(1)请根据12月2日至12月4日的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^; (2)若由线性回归方程得到的估计数据与所选的验证数据的误差不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得到的线性回归方程是否可靠?如果可靠,请预测温差为14℃时种子的发芽数;如果不可靠,请说明理由. 解 (1)由已知得x =11+13+123=12, y =25+30+263=27, 则b ^=52,a ^=y -b ^x =-3.所以y 关于x 的线性回归方程为y ^=52x -3.(2)当x =10时,y ^=52×10-3=22,|22-23|<2;当x =8时,y ^=52×8-3=17,|17-16|<2.所以(1)中所得到的线性回归方程是可靠的. 当x =14时,有y ^=52×14-3=32,即预测当温差为14 ℃时,每天每100颗种子的发芽数约为32颗.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
【课时训练】第55节随机抽样
一、选择题
1.(2018天津模拟)某学校礼堂有30排座位,每排有20个.一次心理讲座时礼堂中坐满了学生,会后为了了解有关情况,留下座位号是15的30名学生.这里运用的抽样方法是()
A.抽签法B.随机数法
C.系统抽样D.分层抽样
【答案】C
【解析】由留下的学生座位号均相差一排可知是系统抽样.
2.(2018广东潮州二模)某城市修建经济适用房.已知甲、乙、丙三个社区分别有低收入家庭360户、270户、180户,若首批经济适用房中有90套住房用于解决住房紧张问题,采用分层抽样的方法决定各社区户数,则应从乙社区中抽取低收入家庭的户数为()
A.40 B.36
C.30 D.20
【答案】C
【解析】利用分层抽样的比例关系,设从乙社区抽取n户,则
270
360+270+180
=n
90
,解得n=30.
3.(2018石家庄模拟)某学校高三年级一班共有60名学生,现采用系统抽样的方法从中抽取6名学生做“早餐与健康”的调查,为此将学生编号为1,2,…,60.选取的这6名学生的编号可能是()
A.1,2,3,4,5,6 B.6,16,26,36,46,56
C.1,2,4,8,16,32 D.3,9,13,27,36,54
【答案】B
【解析】由系统抽样知识可知,所取学生编号之间的间距相等且为10,所以应选B.
4.(2018河北三市第二次联考)将参加夏令营的600名学生编号为001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的
号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为() A.26,16,8 B.25,17,8
C.25,16,9 D.24,17,9
【答案】B
【解析】由题意及系统抽样的定义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k(k∈N*)组抽中的号码是3+12(k-1).令3+12(k-1)≤300,得k≤103
,
4
因此第Ⅰ营区被抽中的人数是25;令300<3+12(k-1)≤495,得103
4<k≤42,因此第Ⅱ营区被抽中的人数是42-25=17.故选B.
5.(2018兰州双基测试)从一个容量为N的总体中抽取一个容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则()
A.p1=p2<p3B.p2=p3<p1
C.p1=p3<p2D.p1=p2=p3
【答案】D
【解析】根据简单随机抽样、系统抽样和分层抽样的定义可知,无论哪种抽样,每个个体被抽中的概率都是相等的,所以p1=p2=p3.
6.(2018珠海摸底)为了解72名学生的学习情况,采用系统抽样的方法,从中抽取容量为8的样本,则分段的间隔为()
A.9 B.8
C.10 D.7
【答案】A
【解析】由系统抽样方法知,72人分成8组,故分段间隔为72÷8=9.
7.(2018邯郸摸底)某校数学教研组为了解学生学习数学的情况,采用分层抽样的方法从高一600人、高二780人、高三n人中,抽取35人进行问卷调查.已知高二被抽取的人数为13,则n=()
A.660 B.720 C.780 D.800【答案】B
【解析】由已知可得,抽样比为13
780
=1
60
,从而35
600+780+n
=1
60
,解得n=
720.
8.(2018江西八校联考)从编号为001,002,…,500的500个产品中用系统抽样的方法抽取一个样本,已知样本中编号最小的两个编号分别为007,032,则样本中最大的编号应该为()
A.480 B.481
C.482 D.483
【答案】C
【解析】根据系统抽样的定义可知样本的编号成等差数列,令a1=7,a2=32,d=25,所以7+25(n-1)≤500.所以n≤20.72,故最大编号为7+25×(20-
1)=482.
二、填空题
9.(2018江西吉安一中期中)一个总体中有90个个体,随机编号0,1,2,…,89,依从小到大的编号顺序平均分成9个小组,组号依次为1,2,3,…,9.现用系统抽样方法抽取一个容量为9的样本,规定如果在第1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与m+k的个位数字相同.若m=8,则在第8组中抽取的号码是________.
【答案】76
【解析】由题意知m=8,k=8,则m+k=16,也就是第8组抽取的号码个位数字为6,十位数字为8-1=7,故抽取的号码为76.
10.(2018重庆一中模拟)已知某商场新进3 000袋奶粉,为检查其三聚氰胺是否超标,现采用系统抽样的方法从中抽取150袋进行检查,将3 000袋奶粉按1,2,…,3 000 随机编号.若第一组抽出的号码是11,则第六十一组抽出的号码为________.
【答案】1 211
【解析】由题意知,抽样比为k =3 000150=20,又第一组抽出的号码是11,则
11+60×20=1 211,故第六十一组抽出的号码为1 211.
三、解答题
11.(2018河北邯郸质检)某校高中三年级的295名学生已经编号为1,2,3,…,295,为了了解学生的学习情况,要按1∶5的比例抽取一个样本,用系统抽样的方法进行抽取,请写出抽样过程.
【解】按1∶5的比例抽样,295÷5=59.
第一步,把295名同学分成59组,每组5人.第一组是编号为1~5的5名学生,第二组是编号为6~10的5名学生,…,依次类推,第59组是编号为291~295的5名学生.
第二步,采用简单随机抽样,从第一组5名学生中随机抽取1名,不妨设其编号为k (1≤k ≤5).
第三步,从以后各段中依次抽取编号为k +5i (i =1,2,3,…,58)的学生,再加上从第一段中抽取的编号为k 的学生,得到一个容量为59的样本.。