高二文科数学统计案例专项练习
高三数学-22统计练习题(文科) 精品
统计练习题(文科用)一、填空题1. 常用的抽样方法有 和 .2. 实施简单随机抽样的常用方法有 ⑴ ;⑵ .3. 简单随机抽样适用于 的情况.4. 分层抽样适 用于 的情况.5. 在已分组的若干数据中,每组的频数是指 ;每组的频率是指 .6. 田径队有运动员98人,其中女队员42人,用分层抽样的方法抽取一个容量为28人的样本,则应抽取男队员 人;女队员 人.7. 某市三个区共有高中学生2万人,这三个区的高中学生人数的比为 2 :3 :5 ,要用分层抽样的方法抽取一个200人的样本,则这三个区应抽取的人数分别为 人、 人和 人.8. 某工厂有若干个车间,今欲采用分层抽样的方法,从全厂某天生产的2188件产品中抽取一个容量为128的样本进行质量检查. 如果一车间这天的产量是256件,则从该车间抽取的产品件数应为 件.9. 一个容量为20的样本数据,分组后的组距和频数如下:则样本在区间 (],50-∞ 上的频率为10. 在容量为10的样本中,若9s =,则*s = 二、 选择题1. 为了解5000名学生的期末考试成绩,从中抽取了200名学生的个人总分进行分析. 在这个问题中,这5000名学生的个人总分的全体是( )A. 总体B. 个体C. 从总体中抽取的一个样本D. 样本的容量2. 某单位共有老年人28人,中年人54人,青年人81人,为了调查他们身体状况的某一项指标,需要从他们中抽取一个容量为36个样本,适合抽取样本的方法是( )A. 简单随机抽样B. 分层抽样C. 先从老年人中随机排除1人,然后分层抽样D. 其它方法 三、解答题 1. . 抽查10个品种小麦的千粒重(单位:克),结果如下:187,195,218,230,232, 238,240,248,250,256. 试求:2*2,,s s x . 2. 甲、乙两名射手各打了10发子弹,各人成绩(每发子弹击中的环数)如下:甲:10, 6, 7, 10 ,8 ,9 ,9, 10 ,5, 10乙:8, 7, 9 ,10, 9, 8 ,7, 9 ,8 ,9试问:哪一名射手的射击技术较好?3. 为了解一个小水库养殖鱼的情况,从这个小水库多个不同地点捕捞出100条鱼,称得它们的质量如下(单位:千克):1.15 1.18 1.11 1.18 1.10 1.32 1.25 1.19 1.15 1.211.18 1.14 1.19 1.18 1.25 1.21 1.29 1.16 1.24 1.121.16 1.17 1.14 1.18 1.12 1.18 1.17 1.18 1.13 1.101.13 1.35 1.28 1.21 1.18 1.24 1.21 1.17 1.22 1.121.26 1.24 1.32 1.19 1.27 1.16 1.18 1.12 1.18 1.111.33 1.26 1.20 1.16 1.22 1.19 1.15 1.20 1.19 1.151.26 1.22 1.23 1.17 1.25 1.13 1.17 1.24 1.21 1.171.22 1.12 1.12 1.26 1.24 1.12 1.16 1.17 1.14 1.181.12 1.18 1.24 1.12 1.16 1.16 1.22 1.19 1.15 1.201.12 1.16 1.17 1.14 1.20 1.18 1.24 1.21 1.17 1.26⑴ 根据上述样本,估计这个小水库鱼的平均质量是大约多少千克?⑵ 在上述100条鱼每条鱼的身上分别作一记号,然后放回水库。
高二数学 第三章 统计案例单元综合检测 新人教A版选修2-3
高中数学 第三章 统计案例单元综合检测一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中只有一个是符合题目要求的)1.已知具有线性相关关系的两个变量x ,y 之间的一组数据如下:且回归方程是y ^=0.95x +2.6,则t =( ) A .2.5 B .3.5 C .4.5 D .5.5[答案] C[解析] ∵x =15(0+1+2+3+4)=2,∴y =0.95×2+2.6=4.5,又y =15(2.2+4.3+t +4.8+6.7),∴t =4.5,故选C .2.四名同学根据各自的样本数据研究变量x 、y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -6.423;② y 与x 负相关且y ^=-3.476x +5.648;③y 与x 正相关且y ^=5.437x +8.493;④y 与x 正相关且y ^=-4.326x -4.578.其中一定不正确的结论的序号是( ) A .①② B .②③ C .③④ D .①④ [答案] D[解析] y 与x 正(或负)相关时,线性回归直线方程y =b ^x +a ^中,x 的系数b ^>0(或b ^<0),故①④错.3.有甲、乙两种钢材,从中各取等量样品检验它们的抗拉强度指标如下:甲A .期望与方差B .正态分布C .K 2D .概率[答案] A4.给出下列五个命题:①将A 、B 、C 三种个体按312的比例分层抽样调查,如果抽取的A 个体为9个,则样本容量为30;②一组数据1,2,3,3,4,5的平均数、众数、中位数都相同;③甲组数据的方差为5,乙组数据为5,6,9,10,5,那么这两组数据中比较稳定的是甲; ④已知具有相关关系的两个变量满足的回归直线方程为y =1-2x ,则x 每增加1个单位,y 平均减少2个单位;⑤统计的10个样本数据为125、120、122、105、130、114、116、95、120、134,则样本数据落在[114.5,124.5)内的频率为0.4.其中真命题为( )A .①②④B .②④⑤C .②③④D .③④⑤[答案] B[解析] ①样本容量为9÷36=18,①是假命题;②数据1,2,3,3,4,5的平均数为16(1+2+3+3+4+5)=3,中位数为3,众数为3,都相同,②是真命题;③x -乙=5+6+9+10+55=7,s 2乙=15[(5-7)2+(6-7)2+(9-7)2+(10-7)2+(5-7)2]=15×(4+1+4+9+4)=4.4,∵s 2甲>s 2乙,∴乙稳定,③是假命题;④是真命题;⑤数据落在[114.5,124.5)内的有:120,122,116,120共4个,故所求概率为410=0.4,⑤是真命题.5.对变量x 、y 观测数据(x 1,y 1)(i =1,2,…,10),得散点图1;对变量u 、v 有观测数据(u 1,v 1)(i =1,2,…,10),得散点图2.由这两个散点图可以判断.( )A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关 [答案] C6为了解疾病A 是否与性别有关,在一医院随机地对入院50人进行了问卷调查得到了如下的列联表:患疾病A 不患疾病A总计 男 20 5 25 女 10 15 25 总计302050下面的临界值表供参考:P (K 2≥k )0.05 0.010 0.005 0.001 k3.8416.6357.87910.828A .95%B .99%C .99.5%D .99.9%[答案] C[解析] 由公式得K 2=50×20×15-5×10225×25×30×20≈8.333>7.879,故有1-0.005=99.5%的把握认为疾病A 与性别有关.7.已知回归直线的斜率的估计值是2,样本点的中心为(4,12),则回归直线的方程是( )A .y ^=2x +4B .y ^=52x +2C .y ^=2x -20D .y ^=16x +2[答案] A[解析] 由回归直线方程y ^=b ^x +a ^的定义知,b ^=2, ∵回归直线过样本点的中心,∴12=2×4+a ^, ∴a ^=4,∴回归直线方程为y ^=2x +4. 8.以下关于线性回归的判断,正确的个数是( )①若散点图中所有点都在一条直线附近,则这条直线为回归直线;②散点图中的绝大多数都线性相关,个别特殊点不影响线性回归,如图中的A ,B ,C 点; ③已知回归直线方程为y ^=0.50x -0.81,则x =25时,y 的估计值为11.69; ④回归直线方程的意义是它反映了样本整体的变化趋势.A .0B .1C .2D .3[答案] D[解析] 能使所有数据点都在它附近的直线不止一条,而据回归直线的定义知,只有按最小二乘法求得回归系数a ^,b ^得到的直线y ^=bx +a ^才是回归直线,∴①不对;②正确;将x =25代入y ^=0.50x -0.81,得y ^=11.69, ∴③正确;④正确,故选D .9.甲、乙两位歌手在“中国好声音”选拔赛中,5次得分情况如茎叶图所示,记甲、乙两人的平均得分分别为x 甲、x 乙,则下列判断正确的是( )甲乙 6775A .x 甲<x 乙,乙比甲成绩稳定B .x 甲<x 乙,甲比乙成绩稳定C .x 甲>x 乙,甲比乙成绩稳定D .x 甲>x 乙,乙比甲成绩稳定[答案] A[解析] x 甲=15(77+76+88+90+94)=85x 乙=15(75+88+86+88+93)=86∴x 甲<x 乙且乙的成绩分布比甲的成绩分布集中稳定,故选A .10.某学校要从5名男生和2名女生中选出2人作为志愿者,若用随机变量ξ表示选出的志愿者中女生的人数,则数学期望E (ξ)等于( ) A .47 B .57 C .67 D .1[答案] A[解析] ∵随机变量ξ表示选出的志愿者中女生的人数,∴ξ可取0,1,2, 当ξ=0时,表示没有选到女生;当ξ=1时,表示选到一个女生;当ξ=2时,表示选到2个女生,∴P (ξ=0)=C 25C 27=1021,P (ξ=1)=C 15C 12C 27=1021,P (ξ=2)=C 22C 27=121,∴E (ξ)=0×1021+1×1021+2×121=47.11.两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关系数r 如下,其中拟合效果最好的模型是( )A .模型[答案] A[解析] 线性回归分析中,相关系数为r ,|r |越接近于1,相关程度越大; |r |越小,相关程度越小,∵模型1的相关系数r 最大,∴模拟效果最好, 故选A .12.下面是某市场农产品的调查表.市场供应量表:) A .(2.3,2.6) B .(2.4,2.6) C .(2.6,2.8) D .(2.8,2.9) [答案] C[解析] 以横轴为单价,纵轴为市场供、需量,在同一坐标系中描点,用近似曲线观察可知选C .二、填空题(本大题共4个小题,每小题4分,共16分,把正确答案填在题中横线上) 13.已知一个回归直线方程为y ^=1.5x +45,x ∈{1,7,5,13,19},则y =__________.[答案] 58.5[解析] 因为x =15(1+7+5+13+19)=9,且y =1.5x +45,所以y =1.5×9+45=58.5.本题易错之处是根据x 的值及y ^=1.5x +45求出y 的值再求y ,由y ^=1.5x +45求得的y 值不是原始数据,故错误.14.给出下列命题:①样本方差反映了所有样本数据与样本平均值的偏离程度;②若随机变量X ~N (0.43,0.182),则此正态曲线在x =0.43处达到峰值;③在回归分析模型中,残差平方和越小,说明模型的拟合效果越差;④市政府调查江北水城市民收入与市民旅游欲望的关系时,抽查了3000人.经过计算得K 2=6.023,根据这一数据查阅下表,则市政府有97.5%以上的把握认为市民收入与旅游欲望有关系.其中正确的命题是________. [答案] ①②④[解析] 根据样本方差的概念、正态分布的概念可知①②均正确;在回归分布中,残差的平方和越小,说明模型的拟合效果越好,即X 与Y 有很强的关系,所以③不正确;通过表中的数据和K 2=6.023>5.024可知,可以认为有97.5%以上的把握认为市民收入与旅游欲望有关系,因此④正确.15.在2015年春节期间,某市物价部门,对本市五个商场销售的某商品一天的销售量及其价格进行调查,五个商场的售价x 元和销售量y 件之间的一组数据如下表所示:通过分析,y 对商品的价格x 的回归直线方程为________.[答案] y ^=-3.2x +40[解析] ∑i =15x i y i =392,x -=10,y -=8,∑i =15(x i -x -)2=2.5,代入公式,得b ^=-3.2,所以,a ^=y --b ^x -=40,故回归直线方程为y ^=-3.2x +40.16.某市居民2011~2015年家庭年平均收入x (单位:万元)与年平均支出Y (单位:万元)的统计资料如下表所示:根据统计资料,居民家庭平均收入的中位数是__________,家庭年平均收入与年平均支出有__________线性相关关系.[答案] 13 正[解析] 中位数的定义的考查,奇数个时按大小顺序排列后中间一个是中位数,而偶数个时须取中间两数的平均数.由统计资料可以看出,当平均收入增多时,年平均支出也增多,因此两者之间具有正线性相关关系.三、解答题(本大题共6个大题,共74分,解答应写出文字说明,证明过程或演算步骤) 17.(本题满分12分)电视传媒公司为了解某地区观众对某体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名,下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.(1)根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?非体育迷体育迷合计男女合计(2)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.附:K2=n ad-bc2a+b c+d a+c b+dP(K2≥k)0.050.01k 3.841 6.635[解析](1)由频率分布直方图可知,在抽取的100人中,“体育迷”为25人,从而完成2×2列联表如下:非体育迷体育迷合计男301545女451055合计7525100将2×2列联表中的数据代入公式计算,得K2=n ad-bc2a+b c+d a+c b+d=100×30×10-45×15275×25×45×55=10033≈3.030.因为3.030<3.841,所以我们没有理由认为“体育迷”与性别有关.(2)由频率分布直方图可知,“超级体育迷”为5人,从而一切可能结果所组成的集合为Ω={(a1,a2),(a1,a3),(a2,a3),(a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3,b2),(b1,b2)}其中a i 表示男性,i =1,2,3,b j 表示女性,j =1,2.Ω由10个基本事件组成,而且这些基本事件的出现是等可能的.用A 表示“任选2人中,至少有1人是女性”这一事件,则A ={(a 1,b 1),(a 1,b 2),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2),(b 1,b 2)},事件A 由7个基本事件组成,因而P (A )=710.[点评] 本题考查了频率分布直方图,独立性检验,古典概型,解决这类题目的关键是对题意准确理解.18.(本题满分12分)某工业部门进行一项研究,分析该部门的产量与生产费用之间的关系,从该部门内随机抽选了10个企业为样本,有如下资料:(1)计算x 与y (2)对这两个变量之间是否线性相关进行检验; (3)设回归方程为y ^=b ^x +a ^,求回归系数. [解析] (1)根据数据可得:x =77.7,y =165.7,∑10i =1x 2i=70903,∑10i =1y 2i =277119, ∑10i =1x i y i =132938,所以r =0.808, 即x 与y 之间的相关系数r ≈0.808;(2)因为r >0.75,所以可认为x 与y 之间具有线性相关关系; (3)b ^=0.398,a ^=134.8.19.(本题满分12分)为考查某种药物预防疾病的效果,进行动物试验,得到如下丢失数据的列联表:患病 未患病 总计 没服用药 203050 服用药 x y 50 总计MN100ξ2只,未患病数为η,工作人员曾计算过P (ξ=0)=389P (η=0).(1)求出列联表中数据x 、y 、M 、N 的值;(2)求ξ与η的均值(期望)并比较大小,请解释所得结论的实际含义; (3)能够以99%的把握认为药物有效吗? 参考公式:K 2=n ad -bc 2a +bc +d a +cb +d.①当K 2≥3.841时有95%的把握认为ξ、η有关联; ②当K 2≥6.635时有99%的把握认为ξ、η有关联.[分析] (1)从已知P (ξ=0)=389P (η=0)出发,结合2×2列联表可求.(2)求出ξ、η的分布列,再利用期望定义式求E (ξ)和E (η)即可. (3)利用公式算出K 2,结合参考数据可以判断. [解析] (1)∵P (ξ=0)=C 220C 250,P (η=0)=C 2xC 250,∴C 220C 250=389×C 2xC 250,∴x =10. ∴y =40,∴M =30,N =70. (2)ξ取值为0、1、2.P (ξ=0)=C 220C 250=38245,P (ξ=1)=C 120C 130C 250=120245,P (ξ=2)=C 230C 250=87245.ξ 0 1 2 P3824512024587245∴E (ξ)=294245.P (η=0)=C 210C 250=9245.P (η=1)=C 110C 140C 250=80245.P (η=2)=C 240C 250=156245.η 0 1 2 P924580245156245∴E (η)=392245.∴E (ξ)<E (η),即说明药物有效. (3)∵K 2=100×800-300230×70×50×50≈4.76.∵4.76<6.635,∴不能够有99%的把握认为药物有效.20.(本题满分12分)以下资料是一位销售经理收集来的每年销售额和销售经验年数的关系的一组样本数据:销售经验x (年) 1 3 4 6 10 12 年销售额y (万元)89.5910.51112(1)(2)试预测销售经验为8年时的年销售额约为多少万元(精确到十分位)?[解析] (1)由散点图(图略)知y 与x 呈线性相关关系,由表中数据计算得,x -=6,y -=10,b ^=59180,a ^=24130,回归直线方程:y ^=59180x +24130.(2)x =8时,预测年销售额为59180×8+24130≈10.7万元.21.(本题满分12分)某班50位学生期中考试数学成绩的频率分布直方图如下图所示,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中x 的值;(2)从成绩不低于80分的学生中随机选取2人,该2人中成绩在90分以上(含90分)的人数记为ξ,求ξ的数学期望.[分析] (1)利用频率和为1,可求x 值;(2)先确定各部分人数,再确定ξ取值,利用组合知识,用古典概型求ξ的分布列,再求数学期望.[解析] (1)图中x 所在组为[80,90]即第五组,∵由频率分布直方图的性质知,10×(0.054+x +0.01+3×0.006)=1, ∴x =0.018.(2)成绩不低于80分的学生所占的频率为f =10×(0.018+0.006)=0.24, 所以成绩不低于80分的学生有:50f =50×0.24=12人. 成绩不低于90分的学生人数为:50×10×0.006=3 所以为ξ的取值为0、1、2 P (ξ=0)=C 29C 212=611,P (ξ=1)=C 19×C 13C 212=922,P (ξ=2)=C 23C 212=122所以ξ的分布列为:所以为ξ的数学期望E (ξ)=0×11+1×22+2×22=2.[点评] 1.本题考查频率分布直方图与随机变量的分布列,数学期望等知识,考查抽象概括能力与应用意识.2.应用古典概型求事件的概率是分布列的常见命题方式.22.(本题满分14分)为了调查学生星期天晚上学习时间利用问题,某校从高二年级1 000名学生(其中走读生450名,住宿生550名)中,采用分层抽样的方法抽取n 名学生进行问卷调查.根据问卷取得了这n 名同学每天晚上学习时间(单位:分钟)的数据,按照以下区间分为八组①[0,30),②[30,60),③[60,90),④[90,120),⑤[120,150),⑥[150,180),⑦[180,210),⑧[210,240],得到频率分布直方图如图.已知抽取的学生中星期天晚上学习时间少于60分钟的人数为5人.(1)求n 的值并补全频率分布直方图;(2)如果把“学生晚上学习时间达到两小时”作为是否充分利用时间的标准,对抽取的n 名学生,完成下列2×2列联表:利用时间充分利用时间不充分总计 走读生住宿生10 总计(3)若在第①组、第②组、第⑧组中共抽出3人调查影响有效利用时间的原因,记抽到“学习时间少于60分钟”的学生人数为X ,求X 的分布列及期望.参考公式:K 2=n ad -bc 2a +bc +d a +cb +d[解析] (1)设第i 组的频率为P i (i =1,2,…,8),由图可知:P 1=11500×30=2100, P 2=11000×30=3100∴学习时间少于60分钟的频率为P 1+P 2=120由题意:n ×120=5,∴n =100.又P 3=1375×30=8100, P 5=1100×30=30100,P 6=1120×30=25100,P 7=1200×30=15100, P 8=1600×30=5100, ∴P 4=1-(P 1+P 2+P 3+P 5+P 6+P 7+P 8)=325.∴第④组的高度为:h =325×130=1250频率分布直方图如图:(注:未标明高度1/250扣1分)(2)由频率分布直方图可知,在抽取的100人中,“走读生”有45人,“住宿生”有55人,其中“住宿生”中利用时间不充分的有10人,从而走读生中利用时间不充分的有25-10=15人,利用时间充分的有45-15=30人,由此可得2×2列联表如下:利用时间充分利用时间不充分总计 走读生 30 15 45 住宿生 45 10 55 总计7525100将2×2列联表中的数据代入公式计算,得K 2=n ad -bc 2a +bc +d a +cb +d=100×30×10-45×15275×25×45×55=10033≈3.030 因为3.030<3.841,所以没有理由认为学生“利用时间是否充分”与走读、住宿有关 (3)由(1)知:第①组2人,第②组3人,第⑧组5人,总计10人,则X 的所有可能取值为0,1,2,3P (X =i )=C i 5C 3-i5C 310(i =0,1,2,3)∴P (X =0)=C 05C 35C 310=10120=112,P (X =1)=C 15C 25C 310=50120=512,P (X =2)=C 25C 15C 310=50120=512,P (X =3)=C 35C 05C 310=10120=112∴X 的分布列为:∴E (X )=0×112+1×12+2×12+3×12=12=2(或由超几何分布的期望计算公式E (X )=n ×M N =3×510=32)。
高二数学统计案例测试题及答案
(1)假定两艘轮船相差1000吨;船员平均人数相差多少?
(2)对于最小的船估计的船员数为多少?对于最大的船估计的船员数是多少?
10
35
45
乙班
7
38
45
合计
17
73
90
利用独立性检验估计;你认为推断“成绩与班级有关系”错误的概率介于( )
A. B. C. D.
二、填空题(每题6分共36分)
12.某矿山采煤的单位成本 与采煤量 有关;其数据如下:
采煤量
(千吨)
289
298
316
322
327
329
329
331
350
单位成本
(元)
则 对 的回归系数为.
12.对于回归直线方程 ;当 时; 的估计值为.
13.在某医院;因为患心脏病而住院的665名男性病人中;有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶;则 .
14.某工厂在2004年里每月产品的总成本 (万元)与该月产量 (万件)之间有如下一组数据:
42
7817
吸烟
2099
49
2148
合计
9874
91
9965
根据表中数据;你认为吸烟与患肺癌有关的把握有( )
A. B. C. D.
6.调查某医院某段时间内婴儿出生的时间与性别的关系;得到下面的数据表:
晚上
白天
合计
男婴
24
31
(必考题)高中数学高中数学选修2-3第三章《统计案例》测试题(含答案解析)(4)
一、选择题1.在一次对性别与是否说谎有关的调查中,得到如下数据,根据表中数据判断如下结论中正确的是( ) 性别 说谎 不说谎 总计 男 6 7 13 女 8 9 17 总计141630A .在此次调查中有95%的把握认为是否说谎与性别有关B .在此次调查中有99%的把握认为是否说谎与性别有关C .在此次调查中有99.5%的把握认为是否说谎与性别有关D .在此次调查中没有充分证据显示说谎与性别有关2.为检测某药品服用后的多长时间开始有药物反应,现随机抽取服用了该药品的1000人,其服用后开始有药物反应的时间(分钟)与人数的数据绘成的频率分布直方图如图所示.若将直方图中分组区间的中点值设为解释变量x (分钟),这个区间上的人数为y (人),易见两变量x ,y 线性相关,那么一定在其线性回归直线上的点为( )A .()1.5,0.10B .()2.5,0.25C .()2.5,250D .()3,3003.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:k≈参照附表,得到的正确结论是().由列联表算得7.8A.在犯错误的概率不超过0.01的前提下认为“爱好该项运动与性别有关”B.在犯错误的概率不超过0.01的前提下认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.001的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.001的前提下,认为“爱好该项运动与性别无关”4.如图所示,茎叶图记录了甲、乙两组各4名学生完成某道数学题的得分情况,该题满分为12分.已知甲、乙两组学生的平均成绩相同,乙组某个数据的个位数字模糊,记为x.则下列命题正确的是( )A.甲组学生的成绩比乙组稳定B.乙组学生的成绩比甲组稳定C.两组学生的成绩有相同的稳定性D.无法判断甲、乙两组学生的成绩的稳定性5.在独立性检验中,统计量2χ有三个临界值:2.706、3.841和6.635,在一项打鼾与患心χ=18.87,根据这一数据分析,认为打鼾与脏病的调查中,共调查了1000人,经计算的2患心脏病之间 ( )A.有95%的把握认为两者无关B.约有95%的打鼾者患心脏病C.有99%的把握认为两者有关D.约有99%的打鼾者患心脏病6.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程35=-,变量x增加一个单位时,y平均增加5个单位;y x(),x y;③线性回归直线y bx a=+必过④曲线上的点与该点的坐标之间具有相关关系;⑤在一个2×2列联表中,由计算得K2=13.079.则其两个变量间有关系的可能性是90%.其中错误的个数是( )A.1 B.2C.3 D.47.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力()A.平均数与方差 B.回归分析C.独立性检验 D.概率8.有下列数据:x123y3 5.9912.01下列四个函数中,模拟效果最好的为()A.B.C.D.9.某中学学生会为了调查爱好游泳运动与性别是否有关,通过随机询问110名性别不同的高中生是否爱好游泳运动得到如下的列联表:由()()()()()22n ad bcka b c d a c b d-=++++并参照附表,得到的正确结论是A.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”B.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别无关”C.有99.9%的把握认为“爱好游泳运动与性别有关”D.有99.9%的把握认为“爱好游泳运动与性别无关”10.下列说法中正确的是①相关系数r用来衡量两个变量之间线性关系的强弱,r越接近于1,相关性越弱;②回归直线y bx a=+一定经过样本点的中心(),x y;③随机误差e的方差()D e的大小是用来衡量预报的精确度;④相关指数2R用来刻画回归的效果,2R越小,说明模型的拟合效果越好.( ) A.①②B.③④C.①④D.②③11.已知变量x,y的一组观测数据如表所示:x34567y 4.0 2.5-0.50.5-2.0据此得到的回归方程为y bx a=+,若a =7.9,则x每增加1个单位,y的预测值就()A .增加1.4个单位B .减少1.2个单位C .增加1.2个单位D .减少1.4个单位12.已知回归方程0.8585.7y x ∧=-,则该方程在样本()165,57 处的残差为( ) A .111.55B .54.5C .3.45D .2.45二、填空题13.给出下列结论:①在回归分析中,可用相关指数2R 的值判断模型的拟合效果,2R 越大,模型的拟合效果越好;②某工厂加工的某种钢管,内径与规定的内径尺寸之差是离散型随机变量;③随机变量的方差和标准差都反映了随机变量的取值偏离均值的平均程度,它们越小,则随机变量偏离均值的平均程度越小;④甲、乙两人向同一目标同时射击一次,事件A :“甲、乙中至少一人击中目标”与事件B :“甲、乙都没有击中目标”是相互独立事件.其中结论正确的是______. 14.已知下列命题:①在线性回归模型中,相关指数2R 表示解释变量x 对于预报变量y 的贡献率,2R 越接近于1,表示回归效果越好;②两个变量相关性越强,则相关系数的绝对值就越接近于1;③在回归直线方程0.52y x ∧=-+中,当解释变量x 每增加一个单位时,预报变量y ∧平均减少0.5个单位;④对分类变量X 与Y ,它们的随机变量2K 的观测值k 来说,k 越小,“X 与Y 有关系”的把握程度越大.其中正确命题的序号是__________.15.已知下列表格所示数据的回归直线方程为 y =" 3.8x" + a , 则a 的值为__________.16.某研究小组为了研究中学生的身体发育情况,在某学校随机抽出20名15至16周岁的男生,将他们的身高和体重制成2×2列联表,根据列联表的数据,可以有_____%的把握认为该学校15至16周岁的男生的身高和体重之间有关系.(注:独立性检验临界值表参考第9题,K 2=2()()()()()n ad bc a b c d a c b d -++++.) 17.炼钢时,通过加入有特定化学元素的材料,使炼出的钢满足一定的指标要求,假设为了炼出某特定用途的钢,每吨需要加入某元素的量在500g 到1000g 之间,用0.618法安排实验,则第二次试点加入量可以是____g .18.下列4个命题:①为了了解800名学生对学校某项教改试验的意见,打算从中抽取一个容量为40的样本,考虑用系统抽样,则分段的间隔为40;②四边形ABCD 为长方形,2AB =,1BC =,O 为AB 中点,在长方形ABCD 内随机取一点P ,取得的P 点到O 的距离大于1的概率为12π-; ③把函数3sin 23y x π⎛⎫=+⎪⎝⎭的图象向右平移6π个单位,可得到3sin 2y x =的图象; ④已知回归直线的斜率的估计值为1.23,样本点的中心为()4,5,则回归直线方程为1.230.08y x =+.其中正确的命题有__________.(填上所有正确命题的编号) 19.下列命题中,正确的命题有__________.①回归直线ˆˆˆy bx a =+恒过样本点的中心(),x y ,且至少过一个样本点;②将一组数据的每个数据都加一个相同的常数后,方差不变;③用相关指数2R 来刻面回归效果;表示预报变量对解释变量变化的贡献率,越接近于1,说明模型的拟合效果越好;④若分类变量X 和Y 的随机变量2K 的观测值K 越大,则“X 与Y 相关”的可信程度越小;⑤.对于自变量x 和因变量y ,当x 取值一定时,y 的取值具有一定的随机性,x ,y 间的这种非确定关系叫做函数关系;⑥.残差图中残差点比较均匀的地落在水平的带状区域中,说明选用的模型比较合适; ⑦.两个模型中残差平方和越小的模型拟合的效果越好. 20.已知下列命题:①从匀速传递的产品生产流水线上,质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样;②两个变量的线性相关程度越强,则相关系数的值越接近于1;③两个分类变量X 与Y 的观测值2k ,若2k 越小,则说明“X 与Y 有关系”的把握程度越大;④随机变量X ~(0,1)N ,则(1)2(1)1P X P X <=<-. 其中为真命题的是__________.三、解答题21.为研究男、女生的身高差异,现随机从高三某班选出男生、女生各10人,并测量他们的身高,测量结果如下(单位:厘米): 男:173 178 174 185 170 169 167 164 161 170 女:165 166 156 170 163 162 158 153 169 172(1)根据测量结果完成身高的茎叶图(单位:厘米),并分别求出男、女生身高的平均值;(2)请根据测量结果得到20名学生身高的中位数h (单位:厘米),将男、女生身高不低于h 和低于h 的人数填入下表中,并判断是否有90%的把握认为男、女生身高有差异? 人数 男生女生身高h ≥ 身高h <参照公式:()()()()()2n ad bc k a b c d a c b d -=++++()20P K k ≥ 0.100.05 0.025 0.010 0.005 0.001 0k2.7063.8415.0246.6357.87910.828175厘米为偏高.采用分层抽样的方法从以上男生中抽取5人作为样本.若从样本中任取2人,试求恰有1人身高属于正常的概率.22.2020年是脱贫攻坚的收官之年,国务院扶贫办确定的贫困县全部脱贫摘帽,脱贫攻坚取得重大胜利,为确保我国如期全面建成小康社会,实现第一个百年奋斗目标打下了坚实的基础在产业扶贫政策的大力支持下,西部某县新建了甲、乙两家玩具加工厂,加工同一型号的玩具质监部门随机抽检了两个厂的各100件玩具,在抽取中的200件玩具中,根据检测结果将它们分成“A ”、“B ”、“C ”三个等级,A 、B 等级都是合格品,C 等级是次品,统计结果如下表所示: 等级 A B C 频数 2012060厂家 合格品 次品合计甲 75乙35在相关政策扶持下,确保每件合格品都有对口销售渠道,但从安全起见,所有的次品必须由原厂家自行销.(1)请根据所提供的数据,完成上面的2×2列联表(表二),并判断是否有95%的把握认为产品的合格率与厂家有关?(2)每件玩具的生产成本为30元,A、B等级产品的出厂单价分别为60元、40元.另外已知每件次品的销毁费用为4元.若甲厂抽检的玩具中有10件为A等级,用样本的频率估计概率,试判断甲、乙两厂能否都能盈利,并说明理由.附:22()()()()()n ad bca b c d a c b dχ-=++++,其中n a b c d=+++.23.某土特产超市为预估2021年元旦期间游客购买土特产的情况,对2020年元旦期间的购买情况进行随机抽样并统计,得到如下数据:(1)估计游客平均购买金额(同一组中的每个数据可用该组区间的中点值代替);(2)根据以上数据完成22⨯列联表,并判断是否有90%的把握认为购买金额是否少于60元与性别有关.附:参考公式和数据:22(),()()()()n ad bcK n a b c da b c d a c b d-==+++ ++++.附表:)2k24.新冠肺炎疫情防控时期,各级各类学校纷纷组织师生开展了“停课不停学”活动,为了解班级线上学习情况,某位班主任老师进行了有关调查研究.(1)从班级随机选出5名同学,对比研究了线上学习前后两次数学考试成绩,如下表:线上学习前成绩x参考公式:在线性回归方程y bx a=+,()()()() 1122211n ni i i ii in ni ii ix x y y x y nx ybx x x n x ====---==--∑∑∑∑,a y bx=-(2)针对全班45名同学(25名女生,20名男生)的线上学习满意度调查中,女姓满意率为80%,男生满意率为75%,填写下面列联表,判断能否在犯错误概率不超过0.01的前提下,认为线上学习满意度与学生性别有关?参考公式和数据:()()()()()2n ad bcxa b c d a c b d-=++++,()20.0500.0100.0013.8416.63510.828P x kk≥25.2020突如其来的疫情让我们经历了最漫长、最特殊的一个假期,教育行政部门部署了“停课不停学”的行动,全力帮助学生在线学习.复课后某校进行了摸底考试,某数学教师为了调查高二学生这次摸底考试的数学成绩与每天在线学习数学的时长之间的相关关系,对在校高二学生随机抽取45名进行调查,了解到其中有25人每天在线学习数学的时长不超过1小时,并得到如下的等高条形图:(1)根据等高条形图填写下面22⨯列联表,并根据列联表判断能否在犯错误的概率不超过0.05的前提下认为“高二学生的这次摸底考试数学成绩与其每天在线学习数学的时长有关”;数学成绩不超过120分 数学成绩超过120分 总计 每天在线学习数学不超过1小时 25每天在线学习数学超过1小时总计45(2)从被抽查的,且这次数学成绩超过120分的学生中,再随机抽取3人,求抽取的3人中每天在线学习数学的时长超过1小时的人数ξ的分布列与数学期望. 附临界值表()20P K k ≥0.050 0.010 0.001 0k3.8416.63510.828参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.26.在传染病学中,通常把从致病刺激物侵入机体或者对机体发生作用起,到机体出现反应或开始现该疾病对应的相关症状时止的这一阶段称为潜伏期.一研究团队统计了某地区1000名患有某种传染病的患者的相关信息,得到如表: 潜伏期(单位:天) []0,2(2,4](]4,6(]6,8(]8,10 (]10,12 (]12,14人数85205310250130155该传染病的潜伏期受诸多因素的影响,为研究潜伏期与患者年龄的关系,以潜伏期是否超过6天为标准进行分层抽样,从上述1000名患者中抽取200人,得到如下列联表.(Ⅰ)请将列联表补充完整;(Ⅱ)根据列联表判断是否有95%的把握认为潜伏期与患者年龄有关?附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】根据上表数据可求得20.027 1.323k ≈<,再结合课本上的概率附表可知在此次调查中没有充分证据显示说谎与性别有关,故选D2.C解析:C 【分析】写出四个区间中点的横纵坐标,从而可求出 2.5x =,250y =,进而可选出正确答案. 【详解】解:由频率分布直方图可知, 第一个区间中点坐标,111.0,0.101000100x y ==⨯=,第二个区间中点坐标,222.0,0.211000210x y ==⨯=, 第三个区间中点坐标,333.0,0.301000300x y ==⨯=, 第四个区间中点坐标,444.0,0.391000390x y ==⨯=, 则()12341 2.54x x x x x =+++=,()123412504y y y y y =+++=, 则一定在其线性回归直线上的点为(),x y ()2.5,250=. 故选:C. 【点睛】本题考查了频率分布直方图,考查了线性回归直线方程的性质.本题的关键是利用线性回归直线方程的性质,即点(),x y 一定在方程上.3.A解析:A 【解析】 【分析】由题意结合独立性检验的结论和临界值表给出结论即可. 【详解】由独立性检验的结论,观测值7.8k ≈,结合临界值表:7.8 6.635>,据此可给出结论:在犯错误的概率不超过0.01的前提下认为“爱好该项运动与性别有关”. 本题选择A 选项. 【点睛】本题主要考查独立性检验的思想及其应用等知识,意在考查学生的转化能力和计算求解能力.4.A解析:A 【解析】()x 甲=14×(9+9+11+11)=10,x 乙=14×(8+9+10+x +12)=10,解得x =1.又2s 甲=14×[(9-10)2+(9-10)2+(11-10)2+(11-10)2]=1,2s 乙=14×[(8-10)2+(9-10)2+(11-10)2+(12-10)2]=52,∴2s 甲<2s 乙,∴甲组学生的成绩比乙组稳定. 故答案为A.5.C解析:C 【解析】因为统计量2χ有三个临界值:2.706、3.841和6.635,而2χ=18.87>6.635,所以有99%的把握认为两者有关,选C.6.C解析:C 【解析】对于①,方差反映一组数据的波动大小,将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变,故正确;对于②,一个回归方程ˆ35yx =-,变量x 增加一个单位时,y 平均减小5个单位,故不正确;对于③,线性回归直线ˆˆˆy bx a =+必过样本中心点(),x y ,故正确;对于④,曲线上的点与该点的坐标之间具有一一对应关系,故不正确;对于⑤,有一个2×2列联表中,由计算得213.079K =,则其两个变量间有关系的可能性是99.9%,故不正确. 故选C.7.C解析:C【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C. 考点:独立性检验的意义.8.A解析:A 【解析】当x =1,2,3时,分别代入求y 值,离y 最近的值模拟效果最好,可知A 模拟效果最好.故选A.考点:非线性回归方程的选择.9.A解析:A 【解析】()22110403020207.8 6.63560506050k ⨯-⨯=≈>⨯⨯⨯,所以有99%的把握认为“爱好游泳运动与性别有关”,所以在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”10.D解析:D 【解析】①相关系数r 用来衡量两个变量之间线性关系的强弱,r 越接近于1,则相关性越强,所以错误;②回归直线y bx a =+一定经过样本点的中心(),x y ,正确; ③随机误差e 的方差()D e 的大小是用来衡量预报的精确度,正确;④相关指数2R 用来刻画回归的效果,2R 越小,说明模型的拟合效果越不好,所以错误. 所以正确的有②③.故选D .11.D解析:D 【解析】由表格得 5x =, 0.9y =,∵回归直线方程为7ˆ9ˆ.y bx=+,过样本中心, ∴57.90.9b +=,即75b =-,则方程为77.95ˆyx =-+,则x 每增加1个单位,y 的预测值就减少1.4个单位,故选D.12.D解析:D 【解析】57(0.85165ˆ85.7) 2.45Y Yσ=-=-⨯-= 二、填空题13.①③【分析】①在回归分析中根据相关指数越大模型的拟合效果越好即可判断;②根据离散型随机变量的概念即可判断;③根据样本的标准差是样本数据到平均数的一种平均距离样本的方差是标准差的平方即可判断;④根据相解析:①③ 【分析】①在回归分析中,根据相关指数2R 越大,模型的拟合效果越好即可判断;②根据离散型随机变量的概念即可判断;③根据样本的标准差是样本数据到平均数的一种平均距离,样本的方差是标准差的平方即可判断;④根据相互独立事件的定义即可判断. 【详解】解:①用相关指数2R 的值判断模型的拟合效果,2R 越大,模型的拟合效果越好,故①正确;②某工厂加工的某种钢管,内径与规定的内径尺寸之差是不确定,无法一一列举出来,不是离散型随机变量,故②错误;③样本的标准差是样本数据到平均数的一种平均距离,样本的方差是标准差的平方,反映了样本数据的分散程度的大小它们越小,则随机变量偏离均值的平均程度越小,故③正确;④甲、乙两人向同一目标同时射击一次,事件A :“甲、乙中至少一人击中目标”与事件B :“甲、乙都没有击中目标”是对立事件,但不是相互独立事件,因为事件A 对事件B 发生有影响. 故答案为:①③. 【点睛】本题考查了相关系数的意义、离散型随机变量的概念、样本的标准差与方差的概念与应用、对立事件与相互独立事件的区别,是基础题.14.①②③【解析】①相关指数表示解释变量对于预报变量的贡献率越接近于1表示回归效果越好;是正确的;②两个变量相关性越强则相关系数r 的绝对值就越接近于1是正确的;③在回归直线方程中当解释变量每增加一个单位解析:①②③ 【解析】①相关指数2R 表示解释变量x 对于预报变量y 的贡献率,2R 越接近于1,表示回归效果越好;是正确的;②两个变量相关性越强,则相关系数r 的绝对值就越接近于1,是正确的;③在回归直线方程0.52y x ∧=-+中,当解释变量x 每增加一个单位时,预报变量y ∧平均减少0.5个单位是正确的,因为回归方程,并不是样本点都落在方程上,故只能是估计值,所以说是平均增长;④对分类变量X 与Y ,它们的随机变量2K 的观测值k 来说,k 越小,“X 与Y 有关系”的把握程度越小;故原命题错误;故答案为①②③.15.【解析】试题分析:因为回归直线方程恒过点则代入得考点:回归直线方程解析:242.8a =【解析】试题分析:因为回归直线方程恒过点(),x y ,则234562512542572622664,25855x y ++++++++====,代入 3.8?y x a =+, 得258 3.84?242.8a a =⨯+⇒= 考点:回归直线方程16.5【分析】根据列联表运用公式求出k 值根据计算出的临界值同临界值表进行比较得到假设不合理的程度【详解】设该学校15至16周岁的男生的身高和体重情况为:偏高超重的记为a 偏高不超重记为b 不偏高超重记为c 不解析:5 【分析】根据列联表运用公式2()()()()()n ad bc k a b c d a c b d -=++++求出k 值,根据计算出的临界值,同临界值表进行比较,得到假设不合理的程度. 【详解】设该学校15至16周岁的男生的身高和体重情况为:偏高超重的记为a,偏高不超重记为b,不偏高超重记为c,不偏高不超重记为D, 则41a b ==,,312c d ==, 所以22()20(41213) 5.934()()()()(41)(312)(43)(112)n ad bc k a b c d a c b d -⨯-⨯==≈++++++++因为5.934 5.024>所以可以有97.5%的把握认为该学校15至16周岁的男生的身高和体重之间有关系.故答案为97.5. 【点睛】本题考查了独立性检验的应用,我们可以利用临界值的大小来决定是否拒绝原来的统计假设.17.【分析】由题意知试验范围为区间长度为故可利用黄金分割法(法)选取试点进行计算【详解】由题意知试验范围为可得区间长度为用法安排试验则第二次试点加入量可以是故答案为【点睛】本题考查黄金分割法的应用解题的解析:691. 【分析】由题意知试验范围为[]500,1000,区间长度为500,故可利用黄金分割法(0.618法)选取试点进行计算. 【详解】由题意知试验范围为[]500,1000,可得区间长度为500,用0.618法安排试验,则第二次试点加入量可以是()10000.6181000500691-⨯-=, 故答案为691. 【点睛】本题考查黄金分割法的应用,解题的关键是要了解黄金分割法(0.618法),考查分析问题与解决问题的能力,属于基础题.18.③④【解析】①为了了解800名学生对学校某项教改试验的意见打算从中抽取一个容量为40的样本考虑用系统抽样则分段的间隔为800÷40=20故①错误;②已知如图所示:长方形面积为2以O 为圆心1为半径作圆解析:③④ 【解析】①为了了解800名学生对学校某项教改试验的意见, 打算从中抽取一个容量为40的样本,考虑用系统抽样, 则分段的间隔为800÷40=20,故①错误; ②已知如图所示:长方形面积为2,以O 为圆心,1为半径作圆, 在矩形内部的部分(半圆)面积为π2. 因此取到的点到O 的距离大于1的概率22P 124ππ-==-; 故②错误;③把函数3sin 23y x π⎛⎫=+⎪⎝⎭的图象向右平移6π个单位,可得到3sin 23sin263y x x ππ⎡⎤⎛⎫=-+= ⎪⎢⎥⎝⎭⎣⎦的图象, 故③正确,④∵回归直线为ˆybx a =+, 的斜率的值为1.23, ∴方程为 1.23ˆyx a =+, ∵直线过样本点的中心(4,5), ∴a=0.08,∴回归直线方程是为=1.23x+0.08; ∴故④正确. 故答案为:③④.19.②⑥⑦【解析】①回归直线恒过样本点的中心可以不过任何一个样本点;②将一组数据中的每个数据都加上同一个常数后根据方差公式可知方差恒不变;③用相关指数来刻面回归效果;表示预报变量对解释变量变化的贡献率越解析:②⑥⑦ 【解析】①回归直线ˆˆˆy bx a =+恒过样本点的中心(),x y ,可以不过任何一个样本点;②将一组数据中的每个数据都加上同一个常数后,根据方差公式可知方差恒不变; ③用相关指数2R 来刻面回归效果;表示预报变量对解释变量变化的贡献率,越接近于0,说明模型的拟合效果越好;④若分类变量X 和Y 的随机变量2K 的观测值K 越大,则“X 与Y 相关”的可信程度越大;⑤.对于自变量x 和因变量y ,当x 取值一定时,y 的取值具有一定的随机性,x ,y 间的这种非确定关系叫做相关关系;⑥.残差图中残差点比较均匀的地落在水平的带状区域中,说明选用的模型比较合适; ⑦.两个模型中残差平方和越小的模型拟合的效果越好. 故答案为:②⑥⑦20.①④【解析】对于①从匀速传递的产品生产流水线上质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测这样的抽样方法是系统抽样故①正确;对于②两个变量的线性相关程度越强则相关系数的绝对值越接近于1解析:①④ 【解析】对于①,从匀速传递的产品生产流水线上,质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样,故①正确;对于②,两个变量的线性相关程度越强,则相关系数的绝对值越接近于1,故②错误; 对于③,两个分类变量X 与Y 的观测值2k ,若2k 越小,则说明“X 与Y 有关系”的把握程度越小,故③错误;对于④,∵随机变量X ∼N (0,1),设P (|X |<1)=p ,则1(1)(1)2pP X P X ->=<-=, ∴11(1)1(1)122p pP X P X -+<=->=-=, ∴2(1)1P X p <-=,即(1)2(1)1P X P X <=<-,故④正确。
(好题)高中数学选修1-2第一章《统计案例》检测(答案解析)(3)
一、选择题1.某单位对某村的贫困户进行“精准扶贫”,若甲、乙贫困户获得扶持资金的概率分别为37和27,两户是否获得扶持资金相互独立,则这两户中至少有一户获得扶持资金的概率为( ) A .2949B .649C .2349D .43492.在一个质地均匀的小正方体的六个面中,三个面标0,两个面标1,一个面标2,将这个小正方体连续抛掷两次,若向上的数字的乘积为偶数,则该乘积为非零偶数的概率为( ) A .14 B .89 C .116D .5323.下列命题不正确的是( )A .研究两个变量相关关系时,相关系数r 为负数,说明两个变量线性负相关B .研究两个变量相关关系时,相关指数R 2越大,说明回归方程拟合效果越好.C .命题“∀x ∈R ,cos x ≤1”的否定命题为“∃x 0∈R ,cos x 0>1”D .实数a ,b ,a >b 成立的一个充分不必要条件是a 3>b 3 4.“人机大战,柯洁哭了,机器赢了”,2017年5月27日,岁的世界围棋第一人柯洁不敌人工智能系统AlphaGo ,落泪离席.许多人认为这场比赛是人类的胜利,也有许多人持反对意见,有网友为此进行了调查.在参与调查的男性中,有人持反对意见,名女性中,有人持反对意见.再运用这些数据说明“性别”对判断“人机大战是人类的胜利”是否有关系时,应采用的统计方法是( )A .分层抽样B .回归分析C .独立性检验D .频率分布直方图5.一张储蓄卡的密码共有6位数字,每位数字都可以从09中任选一个,某人在银行自动提款机上取钱时,忘记了密码最后一位数字,如果任意按最后一位数字,不超过2次就按对的概率为( )A .25 B .310 C .15D .1106.从345678910,1112,,,,,,,,中不放回地依次取2个数,事件A = “第一次取到的数可以被3整除”,B = “第二次取到的数可以被3整除”,则()P B|?A =( ) A .59B .23C .13 D .297.下列说法中正确的是( )A .设随机变量~(10,0.01)X N ,则1(10)2P X >=B .线性回归直线不一定过样本中心点(,)x yC .若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1D .先把高三年级的2000名学生编号:1到2000,再从编号为1到50的50名学生中随机抽取1名学生,其编号为m ,然后抽取编号为50m +,100m +,150m +,……的学生,这样的抽样方法是分层抽样 8.随机变量a 服从正态分布()21,N σ,且()010.3000P a <<=.已知0,1a a >≠,则函数1xy a a =+-图象不经过第二象限的概率为( ) A .0.3750B .0.3000C .0.2500D .0.20009.下列关于回归分析的说法中错误的是( ) A .回归直线一定过样本中心(,)x yB .残差图中残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适C .两个模型中残差平方和越小的模型拟合的效果越好D .甲、乙两个模型的2R 分别约为0.98和0.80,则模型乙的拟合效果更好10.在5道题中有3道理科题和2道文科题,如果一次性抽取 2道题,已知有一道是理科题的条件下,则另一道也是理科题的概率为 A .13B .14C .12D .3511.某商品的售价x (元)和销售量y (件)之间的一组数据如下表所示:由散点图可知,销售量y 与价格x 之间有较好的线性相关关系,且回归直线方程是3.ˆ2yx a =-+,则实数a =( ) A .30B .35C .38D .4012.2020年2月,全国掀起了“停课不停学”的热潮,各地教师通过网络直播、微课推送等多种方式来指导学生线上学习.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男、女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程,且有99%的把握但没有99.9%的把握认为是否喜欢网络课程与性别有关,则被调查的男、女学生总数量可能为( )参考公式附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:A.130 B.190C.240 D.250二、填空题13.掷三个骰子,出现的三个点数的乘积为偶数的概率是________.14.一盒子中装有6只产品,其中4只一等品,2只二等品,从中取产品两次,每次任取1只,做不放回抽样.则在第一次取到的是一等品的条件下,第二次取到的是二等品的概率为__________.15.已知x、y之间的一组数据如下:=+所表示的直线必经过点________.则线性回归方程ˆy a bx16.甲袋中装有2个白球,2个黑球,乙袋中装有2个白球,4个黑球,从甲、乙两袋中各取一球均为白球的概率为______________17.已知某种高炮在它控制的区域内击中敌机的概率为0.2,要使敌机一旦进入这个区域后有0.9以上的概率被击中,需要至少布置___________门高炮?(用数字作答,已知=)=,lg30.4771lg20.301018.体育课上定点投篮项目测试规则:每位同学有3次投篮机会,一旦投中,则停止投篮,视为合格,否则一直投3次为止.每次投中与否相互独立,某同学一次投篮投中的概率为p,若该同学本次测试合格的概率为0.784,则p=_____.19.某质检员检验一件产品时,把正品误判为次品的概率是0.1,把次品误判为正品的概率是0.05.如果一箱产品中含有8件正品,2件次品,现从中任取1件让该质检员检验,那么出现误判的概率为___________.20.一名信息员维护甲乙两公司的5G网络,一天内甲公司需要维护和乙公司需要维护相互独立,它们需要维护的概率分别为0.4和0.3,则至少有一个公司不需要维护的概率为________三、解答题21.一个口袋中有4个红球和3个黑球.(1)从口袋中随机地连续取出三个球,取出后不放回,求:(i)三个球中有两个红球一个黑球的概率;(ii)第二次取出的是红球且第三次取出的也是红球的概率.(2)从口袋中随机地连续取出三个球,取出后放回,求至少有两个是红球且第三个是红球的概率22.中国探月工程自2004年立项以来,聚焦“自主创新、重点跨越、支撑发展、引领未来”的目标,创造了许多项中国首次.2020年12月17日凌晨,嫦娥五号返回器携带“月壤”着陆地球,又首次实现了我国地外天体无人采样返回.为了了解某中学高三学生对此新闻事件的关注程度,从该校高三学生中随机抽取了100名学生进行调查,调查结果如下面22⨯列联表.22⨯与性别有关”?(2)现在从这100名学生中按性别采取分层抽样的方法抽取5名学生,如果再从中随机选取2人进行有关“嫦娥五号”情况的宣讲,求选取的2名学生中恰有1名女生的概率.若将频率视为概率. 附:()()()()()2n ad bc K a b c d a c b d -=++++,其中n a b c d =+++ 23.某小区停车场的收费标准为:每车每次停车时间不超过2小时免费,超过2小时的部分每小时收费1元(不足1小时的部分按1小时计算).现有甲乙两人独立来停车场停车(各停车一次),且两人停车时间均不超过5小时,设甲、乙两人停车时间(小时)与取车概率如表所示:(1)求甲、乙两人所付车费相同的概率;(2)设甲、乙两人所付停车费之和为随机变量ξ,求ξ的分布列和数学期望()E ξ. 24.随着运动App 和手环的普及和应用,在朋友圈、运动圈中出现了每天1万步的健身打卡现象,“日行一万步,健康一辈子”的观念广泛流传.“健康达人”小王某天统计了他朋友圈中所有好友(共400人)的走路步数,并整理成下表:间中点值作代表);(2)若用A 表示事件“走路步数低于平均步数”,试估计事件A 发生的概率;(3)若称每天走路不少于8千步的人为“健步达人”,小王朋友圈中岁数在40岁以上的中老年人有200人,其中健步达人恰有150人,请填写下面22⨯列联表.根据列联表判断有多大把握认为,健步达人与年龄有关?附:()()()()()22n ad bc K a b c d a c b d -=++++25.在疫情这一特殊时期,教育行政部门部署了“停课不停学”的行动,全力帮助学生在线学习.复课后进行了摸底考试,某校数学教师为了调查高三学生这次摸底考试的数学成绩与在线学习数学时长之间的相关关系,对在校高三学生随机抽取45名进行调查.知道其中有25人每天在线学习数学的时长是不超过1小时的,得到了如下的等高条形图:(Ⅰ)是否有99%的把握认为“高三学生的这次摸底考试数学成绩与其在线学习时长有关”;(Ⅱ)将频率视为概率,从全校高三学生这次数学成绩超过120分的学生中随机抽取10人,求抽取的10人中每天在线学习时长超过1小时的人数的数学期望和方差.()20P K k ≥ 0.050 0.010 0.001 0k3.8416.63510.828()()()()()22n ad bc K a b c d a c b d -=++++26.2022年北京冬奥会的申办成功与“3亿人上冰雪”口号的提出,将冰雪这个冷项目迅速炒“热”.北京某综合大学计划在一年级开设冰球课程,为了解学生对冰球运动的兴趣,随机从该校一年级学生中抽取了100人进行调查,其中女生中对冰球运动有兴趣的占23,而男生有10人表示对冰球运动没有兴趣额.(1)完成22⨯列联表,并回答能否有90%的把握认为“对冰球是否有兴趣与性别有关”?(2)若将频率视为概率,现再从该校一年级全体学生中,采用随机抽样的方法每次抽取1名学生,抽取5次,记被抽取的5名学生中对冰球有兴趣的人数为x ,若每次抽取的结果是相互独立的,求x 的分布列,期望和方差. 附表:22()()()()()n ad bc K a b c d a c b d -=++++【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【分析】考虑都没有获得扶持资金的情况,再计算对立事件概率得到答案. 【详解】根据题意:32291117749p ⎛⎫⎛⎫=---=⎪⎪⎝⎭⎝⎭. 故选:A . 【点睛】本题考查了概率的计算,意在考查学生的计算能力和应用能力.2.D解析:D 【分析】首先确定是条件概率,在出现数字乘积为偶数的前提下,乘积为非零偶数的概率, 首先求两次数字乘积为偶数的概率, 然后两次为非零偶数的概率,再按照条件概率的公式求解. 【详解】两次数字乘积为偶数,可先考虑其反面——只需两次均出现1向上,概率是22169⎛⎫= ⎪⎝⎭, 所以两次数字乘积为偶数的概率P =228169⎛⎫-= ⎪⎝⎭ ; 若乘积非零且为偶数,需连续两次抛掷小正方体的情况为(1,2)或(2,1)或(2,2),P =111152366636⨯⨯+⨯=,.故所求条件概率为55368329P ==.故选:D 【点睛】本题主要考查了条件概率的计算和独立事件,考查了学生的计算能力,属于基础题.3.D解析:D 【分析】根据相关系数、相关指数的知识、全称命题的否定的知识,充分、必要条件的知识对四个选项逐一分析,由此得出命题不正确的选项. 【详解】相关系数r 为负数,说明两个变量线性负相关,A 选项正确. 相关指数2R 越大,回归方程拟合效果越好,B 选项正确.根据全称命题的否定是特称命题的知识可知C 选项正确.对于D 选项,由于33a b a b >⇔>,所以33a b >是a b >的充分必要条件,故D 选项错误.所以选D. 【点睛】本小题主要考查相关系数、相关指数的知识,考查全称命题的否定是特称命题,考查充要条件的判断,属于基础题.4.C解析:C 【解析】 【分析】根据“性别”以及“反对与支持”这两种要素,符合,从而可得出统计方法。
高二文科习题案
第一章统计案例测试一独立性检验Ⅰ学习目标通过对典型案例的探究,了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用.Ⅱ基础训练题一、选择题1.甲、乙两人分别投篮一次,记“甲投篮一次,投进篮筐”为事件A,“乙投篮一次,投进篮筐”为事件B,则在A与B,与B,A与,与中,满足相互独立的有几对( )(A)1 (B)2 (C)3 (D)42.若由一个2×2列联表中的数据计算得到χ2=3.528,那么( )(A)有95%的把握认为这两个变量有关系(B)有95%的把握认为这两个变量存在因果关系(C)有99%的把握认为这两个变量有关系(D)没有充分的证据显示这两个变量之间有关系3.设A是一随机事件,则下列式子中不正确的是( )(A)P(A+)=P(A)+P( ) (B)P(A+)=1(C)P(A•)=P(A)•P( ) (D)P(A•)=04.针对使用统计量χ2作一个2×2列联表的独立性检验时,以下说法中正确的是( )(A)选取样本的容量没有限制(B)独立性检验结果只对所研究的对象成立(C)若根据数据算出两个分类变量A,B的统计量χ2>6.635,我们就认为有99%的把握说A与B有关(D)若根据数据算出两个分类变量A,B的统计量χ2>6.635,我们就认为有99%的把握说A与B存在因果关系5.为了考察高中生的性别与是否喜欢数学课程之间的关系,北京市西城区教育研修学院在西城区的高中学生中随机地抽取300名学生调查,得到下表:喜欢数学课程不喜欢数学课程合计男47 95 142女35 123 158合计82 218 300则通过计算,可得统计量χ2的值是( )(A)4.512 (B)6.735 (C)3.325 (D)12.624二、填空题6.针对两个分类变量作独立性检验,若χ2统计量的值越大,则说明这两个分类变量间有关系的可能性________________.7.甲、乙两人各自独立练习射击,甲射击击中目标的概率为p1,乙射击击中目标的概率为p2,那么恰好有一人射击击中目标的概率是________________.8.对于两个分类变量X与Y:(1)如果χ2>6.635,就约有________的把握认为“X与Y有关系”;(2)如果χ2>3.841,就约有________的把握认为“X与Y有关系”.9.考察棉花种子是否经过处理跟是否生病之间的关系得到如下表所示的数据:种子经过处理种子未处理合计得病32 101 133不得病61 213 274合计93 314 407根据以上数据,则统计量χ2的值是________.10.2008年北京奥运会期间,北京某五星级宾馆上调了住宿价格.为了调查上调价格与客人的所处地区是否有关系,奥运会后,统计本国客人与外国客人的人数,与2007年同期相比,结果如下:本国客人外国客人合计2007年218 238 4562008年123 354 477合计341 592 933通过计算,可得统计量χ2=________,我们可以得到结论:__________________.三、解答题11.甲、乙两人在同一办公室工作.办公室只有一部电话机,设经过该机打进的电话是打给甲、乙的概率分别为,.若在一段时间内打进两个电话,且这两个电话是相互独立的.(1)求这两个电话是打给同一个人的概率;(2)求这两个电话一个是打给甲、一个是打给乙的概率.12.为了研究儿童性格与血型的关系,先抽取80名儿童测试,血型与性格汇总如下,试判断性格与血型是否相关.血型性格O型或A型B型或AB型合计自然、率性18 16 34天真、感性17 29 46合计35 45 8013.对服用某种维生素对成年人头发稀疏或稠密的影响调查如下:服用维生素的成年人有60人,其中头发稀疏的有5人.不服用维生素的成年人有60人,其中头发稀疏的有46人.请作出列联表,并判断服用维生素与头发稀疏是否相关.测试二回归分析Ⅰ学习目标通过对典型案例的探究,进一步了解回归的基本思想、方法及初步应用.Ⅱ基础训练题一、选择题1.对于一组具有线性相关关系的数据:(x1,y1),(x2,y2),…,(xn,yn),其回归方程的截距和斜率的最小二乘法估计公式分别为和,其中为( )(A)a=y-bx (B)a=(C) (D)2.由一组数据(x1,y1),(x2,y2),…,(xn,yn)得到回归直线=a+bx,下列说法中不正确的是( )(A)直线=a+bx必过点( ,)(B)直线=a+bx至少过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点(C)直线=a+bx的斜率为(D)直线=a+bx和各点(x1,y1),(x2,y2),…,(xn,yn)的偏差是坐标平面上所有直线与这些点的偏差中最小的直线3.两个线性相关变量满足如下关系:x 2 3 4 5 6y 2.2 3.8 5.5 6.5 7.0则y对x的回归方程是( )(A) =0.87x+0.32 (B) =3.42x-3.97(C) =1.23x+0.08 (D) =2.17x+32.14.对于相关系数r,下列说法正确的是( )(A)|r|越大,线性相关程度越强(B)|r|越小,线性相关程度越强(C)|r|越大,线性相关程度越弱,|r|越小,线性相关程度越强(D)|r|≤1且|r|越接近1,线性相关程度越强,|r|越接近0,线性相关程度越弱5.在一次试验中,当变量x取值分别为1,,,时,变量y的值依次为2,3,4,5,则y与之间的回归曲线方程是( )(A)y=+1 (B)y=+3 (C)y=2x+1 (D)y=x-1二、填空题6.在两个变量的回归分析中,作散点图的目的是________.7.一亩水稻田中,施化肥量xkg(x<300)与水稻的产量ykg之间的回归直线方程是=3.16x+300,当施化肥量为50kg时,预计水稻产量为________.8.某医院用光电比色计检验尿汞,得尿汞含量(mg/L)与消化系数如下表:尿汞含量x 2 4 6 8 10消化系数y 64 138 205 285 260若y与x具有线性相关关系,则回归直线方程是________________________.三、解答题9.现有5名同学的物理成绩和数学成绩如下表:物理成绩x 64 61 78 65 71数学成绩y 66 63 88 76 73(1)画出散点图;(2)若x和y具有线性相关关系,试求变量y对x的回归方程.10.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(t)与相应的生产能耗y(t标准煤)的几组对照数据.x 3 4 5 6y 2.5 3 4 4.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程;(3)已知该厂技术改造前100t甲产品的生产能耗为90t标准煤,试根据(2)求出的线性回归方程预测生产100t甲产品的生产能耗比技术改造前降低多少吨标准煤?11.某工业部门进行一项研究,分析该部门的年产量与生产费用的样本,从这个工业部门内随机抽选了10个企业作样本,有如下资料:年产量x/千件40 42 48 55 65 79 88 100 120 140生产费用y/千元150 140 160 170 150 162 185 165 190 185(1)画出散点图;(2)对这两个变量之间是否存在线性相关进行相关性检验;(3)该部门欲建一个年产量为200千件的企业,预测其生产费用.测试三统计案例全章练习一、选择题1.分析身高与体重有关系,可以用( )(A)误差分析(B)回归分析(C)独立性分析(D)上述都不对2.是x1,x2,…,x100的平均数,a是x1,x2,…,x40的平均数,b是x1,x2,…,x60的平均数,则下列各式中正确的是( )(A) (B) (C) (D)3.设有一个线性回归方程为=2-2.5x,则变量x增加一个单位时,则( )(A)y平均增加2.5个单位(B)y平均增加2个单位(C)y平均减少2.5个单位(D)y平均减少2个单位4.为了研究变量x与y的线性相关性,甲乙两人分别做了研究,并利用线性回归方法得到回归方程l1和l2,非常巧合的是,两人计算的相同,也相同,下列说法正确的是( )(A)l1和l2相同(B)l1和l2一定平行(C)l1和l2相交于点( ,) (D)无法判断l1和l2是否相交5.某班主任对全班50名学生进行了作业量多少的调查,数据如下表:认为作业多认为作业不多合计喜欢玩电脑游戏18 9 27不喜欢玩电脑游戏8 15 23合计26 24 50则认为喜欢玩电脑游戏与认为作业量的多少有关系的把握大约为( )(A)99%(B)95%(C)90%(D)无充分依据二、填空题6.下面是2×2列联表:y1 y2 合计x1 a 28 35x2 11 34 45合计 b 62 80则表中a=________,b=________.7.|r|≤1且|r|越接近1,线性相关程度越________,|r|越接近0,线性相关程度越________.8.在一项打鼾与患心脏病的关系的调查中,共调查了2000人,经计算得χ2=20.87,根据这一数据分析,我们有________的把握认为打鼾与患心脏病是________的.9.某工厂的设备使用年限x(年)与维修费用y(万元)之间的回归直线方程为=0.8x+1.5,那么设备使用前3年的维修费用约为________万元.10.在一次实验中,测得(x,y)的4组数值分别是(0,1),(1,2),(3,4),(4,5),那么y与x之间的回归直线方程是________________.三、解答题11.生物学习小组在研究性别与色盲关系时,得到如下列联表:色盲非色盲合计男12 788 800女 5 995 1000合计17 1783 1800试判断性别与色盲是否有关系?12.为了研究高中女生身高与体重的关系,从某高中随机选取8名女生,测量其身高与体重的数据,具体如下表:编号 1 2 3 4 5 6 7 8身高/cm 155 157 165 165 165 170 170 175体重/kg 43 50 48 57 61 54 59 64(1)请根据上表提供的数据,求出体重y关于身高x的线性回归方程;(2)试根据(1)的回归方程,预计一名身高160cm的女高中生的体重.13.在一次实验中,测得(x,y)的5组数值,如下表:xy 360 285 205 138 64试判断y与是否具有线性相关关系?如有,求出线性回归方程.第二章推理与证明测试四合情推理与演绎推理Ⅰ学习目标1.了解合情推理的含义,能利用归纳和类比等进行简单的推理.2.掌握演绎推理的基本模式,并能运用它们进行一些简单推理.3.了解合情推理和演绎推理之间的联系和差异.Ⅱ基础训练题一、选择题1.数列2,5,10,17,x,37,…中的x等于( )(A)25 (B)26 (C)27 (D)282.已知扇形的弧长为l,半径为r.类比三角形的面积公式:底×高,可推知扇形的面积公式S扇形等于( )(A) (B) (C) (D)lr3.在公差为d的等差数列{an}中,我们可以得到an=am+(n-m)d(m,n∈N*).通过类比推理,在公比为q的等比数列{bn}中,我们可得( )(A)bn=bm+qn-m (B)bn=bm+qm-n (C)bn=bm•qm-n (D)bn=bm•qn-m4.将正奇数数列1,3,5,7,9,…进行如下分组:第一组含一个数{1};第二组含两个数{3,5};第三组含3个数{7,9,11};第四组含4个数{13,15,17,19};….记第n 组内各数之和为Sn,则Sn与n的关系为( )(A)Sn=n2 (B)Sn=n3 (C)Sn=2 n+1 (D)Sn=3n-15.数列{an}中,a1=3,a2=6,且an+2=an+1-an,则a33等于( )(A)3 (B)-3 (C)6 (D)-6二、填空题6.已知圆具有性质:圆的切线垂直于经过切点的圆半径.类比这条性质,可得球的一条相关性质为________________________.7.在数列{an}中,a1=1,an+1=(n=1,2,3,…),则此数列的通项公式可归纳为________________________.8.半径为r的圆的面积S(r)=πr2,周长C(r)=2πr,若将r看作(0,+∞)上的变量,则(πr2)′=2πr①,①式用语言可以叙述为:圆的面积函数的导数等于圆的周长函数.对于半径为R的球,若将R看作(0,+∞)上的变量,请写出类比①的等式:________________;上式用语言可以叙述为________________________.9.将“菱形的对角线互相平分”写成三段论的形式为________________________.10.在平面几何中,我们有如下结论:三边相等的三角形内任意一点到三边的距离之和为定值.拓展到空间,类比平面几何的上述结论,我们可得:4个面均为等边三角形的四面体内任意一点________________________________________________.三、解答题11.类比实数的加法和向量的加法,从相加的结果是否为实数(向量),以及运算律、逆运算、0与0(零向量)几个方面考虑,列出他们相似的运算性质.12.下列推理的两个步骤分别遵循哪种推理原则?因为直线a⊥平面α,直线b⊥平面α,所以a∥b.又因为b∥c,所以a∥c.13.设{an}是由正数组成的等比数列,Sn是其前n项的和.证明:Sn•Sn+2<.Ⅲ拓展训练题14.在等差数列{an}中,若a10=0,则有等式a1+a2+…+an=a1+a2+…+a19-n 成立,其中1≤n<19,n∈N*.类比上述性质,相应的:在等比数列{bn}中,若b9=1,试写出相应的一个等式.测试五直接证明与间接证明Ⅰ学习目标1.了解直接证明的两种基本方法:分析法和综合法,能利用它们解决简单问题.2.了解间接证明的一种基本方法——反证法,能利用反证法解决简单问题.Ⅱ基础训练题一、用分析法或综合法证明下列问题1.证明:.2.已知a>b>0,求证:.3.设a,b∈(0,+∞),且a≠b,证明:a3+b3>a2b+ab2.4.已知锐角A,B满足A+B>,证明:sinA>cosB.5.已知数列{an}是等差数列,(n=1,2,3,…).证明:数列{bn}是等差数列.6.在△ABC中,3个内角A,B,C的对边分别是a,b,c,且A,B,C成等差数列,a,b,c成等比数列.求证:△ABC为等边三角形.二、用反证法证明下列问题7.设a,b是平面内的两条直线,证明:这两条直线最多只有一个交点.8.证明:若函数f(x)在区间[a,b]上是增函数,那么方程f(x)=0在区间[a,b]上至多只有一个实数根.9.设p,q∈R,且p3+q3=2,求证:p+q≤2.10.求证:一元二次方程ax2+bx+c=0(a≠0)至多有两个不相等的实数根.Ⅲ拓展训练题11.求证:1,,不能成为同一等差数列中的3项.12.证明:对于函数f(x)=lgx,找不到这样的正数M,使得对于f(x)定义域内任意的x 有|f(x)|<M成立.测试六推理与证明全章练习一、选择题1.观察数列{an}:1,2,2,3,3,3,4,4,4,4,…的特点,则a100是( )(A)14 (B)13 (C)12 (D)112.不等式a>b与>同时成立的充要条件是( )(A)a>b>0 (B)0>a>b (C)a>0>b (D) >>03.已知{an}为等比数列,a5=2,那么有等式a1•a2•…•a9=29成立.类比上述性质,相应的:若{bn}为等差数列,b5=2,则有( )(A)b1+b2+…+b9=29 (B)b1•b2•…•b9=29(C)b1+b2+…+b9=2×9 (D)b1•b2•…•b9=2×94.对于任意正整数n,下列结论正确的是( )(A)当n=2时,2n=n2;当n≠2时,2n>n2(B)当n=2或n=4时,2n=n2;当n≠2且n≠4时,2n>n2(C)当n=3时,2n<n2;当n≠3时,2n>n2(D)当n=3时,2n<n2;当n≠3时,2n≥n25.设a>0,b>0,则以下不等式中不恒成立的是( )(A)(a+b)( )≥4 (B)a3+b3≥2ab2(C)a2+b2+2≥2a+2b (D)6.若用反证法证明命题:三角形的内角中至少有一个大于60°,则与命题结论相矛盾的假设为( )(A)假设三角形的3个内角都大于60°(B)假设三角形的3个内角都不大于60°(C)假设三角形的3个内角中至多有一个大于60°(D)假设三角形的3个内角中至多有两个大于60°二、填空题7.设正实数a,b,c满足a+b+c=1,则a,b,c三者中至少有一个数不小于____________.8.已知数列{an}的通项公式为,记f(n)=(1-a1)(1-a2)…(1-an),其中n∈N*.那么f(1)=________;f(2)=________;f(3)=________;推测f(n)=________.9.若三角形的内切圆半径是r,三边长分别是a,b,c,则三角形的面积是r(a+b+c).类比此结论,若四面体的内切球半径是R,4个面的面积分别是S1,S2,S3,S4,则四面体的体积V=________.10.已知数列{an}的前n项和为Sn,,(n≥2),通过计算S1,S2,S3,S4,可归纳出Sn=________________.三、解答题11.已知a,b,c是正数,且ab+bc+ca=1,求证:a+b+c≥.12.设{an}是公比为q的等比数列,Sn是它的前n项和.证明:数列{Sn}不是等比数列.13.设函数f(x)=|lgx|,若0<a<b,且f(a)>f(b),求证:ab<1.14.设a>0,函数是R上的偶函数.(1)求a的值;(2)证明:f(x)在(0,+∞)上单调递增.第三章数系的扩充与复数的引入测试七数系的扩充与复数的引入Ⅰ学习目标1.了解数系的扩充过程.2.理解复数的基本概念以及复数相等的充要条件.3.了解复数的代数表示法及其几何意义.Ⅱ基础训练题一、选择题1.下列结论中正确的是( )(A)Z N Q R C (B)N Z Q C R(C)N Z Q R C (D)R N Z Q C2.复数1-i的虚部是( )(A)1 (B)-1 (C)i (D)-i3.若复数z=m(m-1)+(m-1)i是纯虚数,则实数m的值为( )(A)0 (B)1 (C)-1 (D)0或14.设x,y∈R,且满足x+y+(x-2y)i=2x-5+(3x+y)i,则xy等于( )(A)-2 (B)2 (C)6 (D)-65.设z∈C,则满足1≤|z|≤3的复数在复平面上的对应点构成图形的面积是( )(A)π(B)4π(C)8π(D)9π二、填空题6.若x是实数,y是纯虚数,且3x+1-2i=y,则x=________;y=________.7.当<m<1时,复数z=3m-2+(m-1)i在复平面上的对应点位于第________象限.8.设x,y∈R,复数z=x-2+yi,=3x-i,则x=________;y=________.9.已知复数z=(1+i)m2-(4+i)m-6i所对应的点位于复平面的第二象限,则实数m 的取值范围是________.10.设集合M={0,1,3,5,7,9},a,b∈M,则形如a+bi的不同虚数共有________个.三、解答题11.已知2x-1+(y+1)i=x-y-(x+y)i,求实数x,y的值.12.实数m取何值时,复数z=(m2-5m+6)+(m2-3m)i是(1)零;(2)虚数;(3)纯虚数.13.设x∈R,若复数z=(x2-3)+i•log2(x+3)在复平面内的对应点在第三象限,求x 的取值范围.14.设z∈C,若|z|=z+2-4i,求复数z.测试八复数的运算Ⅰ学习目标能进行复数代数形式的四则运算,了解复数代数形式的加减运算的几何意义.Ⅱ基础训练题一、选择题1.已知复数z满足z+i-3=3-i,则等于( )(A)2i (B)-2i (C)6+2i (D)6-2i2.若复数z1=3+i,z2=1-i,则z=z1•z2在复平面内的对应点位于( )(A)第一象限(B)第二象限(C)第三象限(D)第四象限3.复数的值是( )(A) (B) (C) (D)4.复数i+i3+i5+…+i33的值是( )(A)i (B)-i (C)1 (D)-15.对于任意两个复数z1=x1+y1i,z2=x2+y2i(x1,y1,x2,y2为实数),定义运算“⊙”为:z1⊙z2=x1x2+y1y2.设非零复数ω1,ω2在复平面内对应的点分别为P1,P2,点O 为坐标原点.如果ω1⊙ω2=0,则△P1OP2中∠P1OP2的大小为( )(A) (B) (C) (D)二、填空题6.复数的共轭复数是________.7.若z∈C,且(3+z)i=1,则复数z=________.8.已知复数,则z4=________.9.复平面上平行四边形ABCD的4个顶点中,A,B,C所对应的复数依次为2+3i,3+2i,-2-3i,则D点对应的复数为________.10.对于n个复数z1,z2,…,zn如果存在n个不全为零的实数k1,k2,…,kn,使得k1z1+k2z2+…+knzn=0,就称z1,z2,…,zn线性相关.若3个复数z1=1+2i,z2=1-i,z3=-2线性相关,那么可取{k1,k2,k3}=________.三、解答题11.设复数,求证:(1)ω2=;(2)1+ω+ω2=0;(3)ω3=1.12.求复数3+4i的平方根.13.已知z是虚数,,求证:ω∈R的充要条件是|z|=1.14.已知复数(a>0),若复数ω=z(z+i)的虚部减去其实部的差等于,求复数ω测试九数系的扩充与复数的引入全章练习一、选择题1.复数z与其共轭复数在复平面内的对应点( )(A)关于实轴对称(B)关于虚轴对称(C)关于原点对称(D)关于直线y=x对称2.复数的实部是( )(A)-2 (B)2 (C)-4 (D)43.若复数z=(x2-6x+5)+(x-2)i在复平面内的对应点位于第三象限,则实数x的取值范围是( )(A)(-∞,2) (B)(1,5) (C)(1,2) (D)(2,5)4.设a,b∈R,则复数(a+bi)(a-bi)(-a+bi)(-a-bi)的值是( )(A)(a2+b2)2 (B)(a2-b2)2 (C)a4+b4 (D)a4-b45.如果复数z满足|z-2i|=1,那么|z|的最大值是( )(A)1 (B)2 (C)3 (D)46.若复数z=cosθ+i•sinθ,则使z2=-1的θ值可能为( )(A) (B) (C) (D)二、填空题7.若z∈C,且i•z=1-i,则复数z=________.8.i+2i2+3i3+…+8i8=________.9.设b∈R,复数(1+bi)(2+i)是纯虚数,则b=________.10.如果1+i是方程x2+bx+c=0(b,c∈R)的一个根,那么b+c=________.三、解答题11.设x,y∈R,且,求x,y的值.12.在复平面内,△ABC的3个顶点依次对应复数1,2i,5+2i,判断△ABC的形状.13.是否存在虚数z,使得,且z+3的实部与虚部互为相反数,证明你的结论.14.设复数z满足|z|=1,且z2+2z+是负实数,求复数z.第四章框图测试十框图Ⅰ学习目标1.了解程序框图.2.了解工序流程图(即统筹图)和结构图.3.能绘制简单实际问题的流程图,了解流程图在解决实际问题中的作用;会运用结构图梳理已学过的知识、整理收集到的资料信息.Ⅱ基础训练题一、选择题1.某人带着包裹进入超市购物的流程图如下图所示,则在空白处应填( )(A)退换物品(B)归还货车(C)取回包裹(D)参加抽奖2.复数分类的框图如下,下列空白处应填( )(A)虚数(B)非纯虚数(C)非实数(D)非纯虚数的虚数(a≠0,b≠0)3.右图是集合的知识结构图,如果要加入“子集”,则应该放在( )(A)“集合的概念”的下位(B)“集合的表示”的下位(C)“基本关系”的下位(D)“基本运算”的下位4.下列结构图中要素之间表示从属关系的是( )5.下面的程序框图的作用是按大小顺序输出两数,则括号处的处理可以是( )(A)A←B,B←A (B)T←B,B←A,A←T(C)T←B,A←T,B←A (D)A←B,T←A,B←T6.某成品的组装工序图如右,箭头上的数字表示组装过程中所需要的时间(小时),不同车间可同时工作,同一车间不能同时做两种或两种以上的工作,则组装该产品所需要的最短时间是( )(A)12小时(B)11小时(C)8小时(D)6小时二、填空题7.按照程序框图(如下图)执行,第3个输出的数是________.8.下面的流程图是交换两个变量的值并输出,则图中空白处应为________.第7题图第8题图9.读下面的流程图,若输入的值为-5时,输出的结果是________.10.某工程的工序流程如图所示(工时单位:天),现已知工程总时数为10天,则工序c 所需工时为________天.三、解答题11.已知画出输入x,打印f(x)的程序框图.12.某公司做人事调整:设总经理一个,配有经理助理一名;设副经理两人,直接对总经理负责,设有6个部门,其中副经理A管理生产部、安全部和质量部,副经理B管理销售部、财务部和保卫部;生产车间由生产部和安全部共同管理,公司配有质检中心和门岗。
人教版数学高二A版选修2-3单元检测第三章统计案例(附答案)
数学人教版A2-3第三章 统计案例单元检测(时间:45分钟,满分:100分)一、选择题(每小题6分,共48分)1( ).A .一次函数模型B .二次函数模型C .指数函数模型D .对数函数模型2.工人月工资y (元)随劳动生产率x (千元)变化的回归方程为ˆy=50+80x .下列判断错误的是( ).A .劳动生产率为1 000元时,工资约为130元B .劳动生产率提高1 000元时,工资提高130元C .劳动生产率提高1 000元时,工资提高80元D .当月工资约为210元时,劳动生产率为2 000元3.某考察团对全国10大城市进行职工人均工资水平x (千元)与居民人均消费水平y (千元)统计调查,y 与x 具有相关关系,回归方程为ˆy=0.66x +1.562.若某城市居民人均消费水平为7.675(千元),估计该城市人均消费额占人均工资收入的百分比约为( ).A .83%B .72%C .67%D .66%4.若两个变量的残差平方和是325,21()nii x y =-∑=923,则随机误差对预报变量的贡献率约为( ). A .64.8% B .60% C .35.2% D .40% 5.下列说法:①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适; ②用相关指数可以刻画回归的效果,值越小说明模型的拟合效果越好; ③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型拟合效果越好.其中说法正确的是( ). A .①② B .②③ C .①③ D .①②③6.(创新题)独立检验中,假设H 0:变量X 与变量Y 没有关系,则在H 0成立的情况下,P (K 2≥6.635)=0.010表示的意义是( ). A .变量X 与变量Y 有关系的概率为1%B .变量X 与变量Y 没有关系的概率为99.9%C .变量X 与变量Y 没有关系的概率为99%D .变量X 与变量Y 有关系的概率为99%7( ).A.K2=9.564 B.K2=3.564 C.K2<2.706 D.K2>3.841 8.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中由以上数据,计算得到K2的观测值k≈9.643,根据临界值表,以下说法正确的是().A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关二、填空题(每小题6分,共18分)9.(创新题)已知回归直线ˆy=bx+a斜率的估计值是52,且样本点的中心为(4,5).则当x=-2时,ˆy的值为______.10.若一组观测值(x1,y1),(x2,y2),…,(x n,y n)之间满足y i=bx i+a+e i(i=1,2,…,n),若e i恒为0,则R2为________.11.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的试根据上述数据计算K2=______,比较这两种手术对病人又发作心脏病的影响有没有差别______.三、解答题(共34分)12.(10分)某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm,170 cm和182 cm.因儿子的身高与父亲的身高有关,求该老师用线性回归分析的方法预测他孙子的身高为多少.13.(12分)为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.下表1和表2分别是注射药物A和药物B后的试验结果.(疱疹面积单位:mm2)表2:注射药物B后皮肤疱疹面积的频数分布表完成下面2×2列联表,并回答能否有99.9%的把握认为“注射药物A后的疱疹面积与14.(12分)一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了(1)建立零件数为解释变量,加工时间为预报变量的回归模型,并计算残差;(2)你能残差分析这个模型能较好地刻画零件数和加工时间的关系吗?参考答案1答案:A解析:画出散点图可观察得点都在一条直线上,故A正确.2答案:B解析:当x=1(千元)时,ˆy=130元,A正确;当ˆy=210元时,x=2105080-=2千元,D正确;当x增加一个单位时,ˆy增加80,C正确.3答案:A解析:因为当ˆy=7.675时,x=7.675 1.5620.66-≈9.262,所以7.6759.262≈0.829≈83%.4答案:C解析:由题意可知随机误差对预报变量的贡献率约为325923=0.352.5答案:C解析:相关指数R2越大,说明模型拟合效果越好,故②错误.6答案:D解析:由题意知变量X与Y没有关系的概率为0.01,即认为变量X与Y有关系的概率为99%.7答案:D解析:由K2=2()()()()()n ad bca b c d a c b d-++++,得K2的观测值k=285(4012528)68174540⨯⨯⨯⨯⨯⨯-≈4.722>3.841.8答案:D解析:根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.9答案:-10解析:由已知b=52且4b+a=5,∴a=-5,5ˆ2y x=-5.∴x=-2时,y=-10.10答案:1解析:e i恒为0,说明随机误差总为0,于是y i=ˆy,故R2=1.11答案:1.78不能作出这两种手术对病人又发作心脏病的影响有差别的结论解析:提出假设H0:两种手术对病人又发作心脏病的影响没有差别.根据列联表中的数据,可以求得K2的观测值k=2392(3916729157)68324196196⨯⨯⨯⨯⨯⨯-≈1.78.当H 0成立时,K 2≈1.78,而K 2<2.072的概率为0.85.所以,不能否定假设H 0.也就是不能作出这两种手术对病人又发作心脏病的影响有差别的结论.12解:由题意父亲身高x cm 与儿子身高y cm 对应关系如下表:则1731701763x ++==173,1701761823y ++==176, 31()()iii x x y y =--∑=(173-173)×(170-176)+(170-173)×(176-176)+(176-173)×(182-176)=18,321()ii x x =-∑=(173-173)2+(170-173)2+(176-173)2=18.∴18ˆ18b==1. ∴ˆˆay bx =-=176-173=3. ∴线性回归直线方程ˆˆˆybx a =+=x +3. ∴可估计孙子身高为182+3=185(cm).由列联表中的数据,得K 2的观测值为k =2200(70653530)10010010595⨯⨯⨯⨯⨯⨯-≈24.561>10.828.因此,有99.9%的把握认为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有差异”.14解:(1)根据表中数据作出散点图,如图所示.间对零件数的线性回归方程为ˆy=0.668x+54.93.(2)以零件数为横坐标,残差为纵坐标作出残差图如图所示.由图可知,残差点分布较均匀,即用上述回归模型拟合数据效果很好.但需注意,由残差图也可以看出,第4个样本点和第5个样本点的残差比较大,需要确认在采集这两个样本点的过程中是否有人为的错误.。
高二数学统计案例试题
高二数学统计案例试题1.某医疗研究所为了检验新开发的流感疫苗对甲型H1N1流感的预防作用,把1000名注射了疫:“这种疫苗不能起苗的人与另外1000名未注射疫苗的人的半年的感冒记录作比较,提出假设H到预防甲型H1N1流感的作用”,并计算出,则下列说法正确的( )A.这种疫苗能起到预防甲型H1N1流感的有效率为1%B.若某人未使用该疫苗,则他在半年中有99%的可能性得甲型H1N1C.有1%的把握认为“这种疫苗能起到预防甲型H1N1流感的作用”D.有99%的把握认为“这种疫苗能起到预防甲型H1N1流感的作用”【答案】D【解析】的解释是能够以99%的把握认为“这种疫苗能起到预防甲型H1N1流感的作用”,其出错的可能性是1%,所以答案选D.【考点】独立性检验2.某产品的广告费用与销售额的统计数据如下表:广告费用(万元)销售额(万元)根据上表可得回归方程中的为7.据此模型预报广告费用为10万元时销售额为(万元).【答案】73.5【解析】回归直线必过样本点中心(4.5,35),得,因此回归方程为,将代入回归方程,得到答案是73.5。
【考点】回归分析3.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:零件的个数(个)2345加工的时间(小时)(1)在给定的坐标系中画出表中数据的散点图;(2)求出关于的线性回归方程,并在坐标系中画出回归直线;(3)试预测加工个零件需要多少时间?参考公式:回归直线,其中.【答案】(1)见图;(2)线性回归方程为,回归直线见图;(3)预测加工个零件需要小时.【解析】(1)画散点图,即根据提供的数对,找出对应的点即可,这一点不难;(2)首先要了解提供的计算公式中每个部分的含义,然后分步计算,这样做的好处在于出错时便于检查是哪步出错了,也能分步得分;(3)若了解回归方程的意义和作用,此问也不难,这一题对回归分析这部分内容考查的比较全面,其实关键还是落实在知识的理解和计算能力上.试题解析:(1)散点图如下图.3分(2)由表中数据得,,,所以, 9分因此回归直线如图中所示. 10分(3)将代入回归直线方程,得(小时),∴预测加工个零件需要小时. 12分【考点】线性回归方程及其应用.4.某医疗研究所为了检验新开发的流感疫苗对甲型H1N1流感的预防作用,把1000名注射了疫苗的人与另外1000名未注射疫苗的人的半年的感冒记录作比较,提出假设:“这种疫苗不能起到预防甲型H1N1流感的作用”,并计算出,则下列说法正确的( )A.这种疫苗能起到预防甲型H1N1流感的有效率为1%B.若某人未使用该疫苗,则他在半年中有99%的可能性得甲型H1N1C.有1%的把握认为“这种疫苗能起到预防甲型H1N1流感的作用”D.有99%的把握认为“这种疫苗能起到预防甲型H1N1流感的作用”【答案】D【解析】由独立性检验的知识知,有99%的把握认为“这种疫苗能起到预防甲型H1N1流感的作用”,故D正确.【考点】独立性检验5.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是( )A.总偏差平方和B.残差平方和C.回归平方和D.相关指数R2【答案】B【解析】根据拟合效果好坏的判断方法我们可得,数据点和它在回归直线上相应位置的差异是通过残差的平方和来体现的.【考点】回归分析6.某产品的广告费用x与销售额y的统计数据如表:根据上表可得回归方程=x+中的为9.4,据此模型预报广告费用为6万元时销售额为()A.63.6万元 B.65.5万元 C.67.7万元 D.72.0万元【答案】【解析】根据统计数表可知:,所以,所以,将代入回归方程可得.【考点】回归方程.7.若对于预报变量y与解释变量x的10组统计数据的回归模型中,计算R2=0.95,又知残差平方和为120.55,那么的值为()A.241.1B.245.1C.2411D.2451【答案】C.【解析】设,根据条件残差平方和为,即由公式,可得.【考点】残差平方和,总偏差平方和和相关指数的关系.8.车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了8次试验,数据如下:零件数(个)1020304050607080加工时间设回归方程为,则点在直线的()A.左上方 B.右上方 C.左下方 D.右下方【答案】B【解析】利用线性回归系数公式求出的值,从而可确定点与直线的位置关系.根据题意可知,,,故可知在直线的右上方,故选B.【考点】线性回归.9.在调查男女同学是否喜爱篮球的情况中,已知男同学喜爱篮球的为28人,不喜爱篮球的也是28人,而女同学喜爱篮球的为28人,不喜爱篮球的为56人,(1)根据以上数据建立一个2×2的列联表;(2)试判断是否喜爱篮球与性别有关?【答案】(1) 列联表如下:喜爱篮球不喜爱篮球合计【解析】解:(1)2×2列联表如下:(2)计算χ2==≈3.889.因为χ2>3.841,故我们有95%的把握认为是否喜爱篮球与性别有关.10.想象一下一个人从出生到死亡,在每个生日都测量身高,并作出这些数据的散点图,这些点将不会落在一条直线上,但在一段时间内的增长数据有时可以用线性回归来分析,下表是一位母亲给儿子做的成长记录:年龄/周岁3456789(2)如果年龄相差5岁,则身高有多大差异(3~16岁之间)?(3)如果身高相差20 cm,其年龄相差多少(3~16岁之间)?(4)计算残差,说明该函数模型是否能够较好地反映年龄与身高的关系,说明理由.【答案】(1)=6.286x+72 (2) 31.4 cm (3) 3(岁) (4) 拟合效果较好【解析】解:(1)设年龄x与身高y之间的回归直线方程为=x+,由公式=得≈6.286,=-≈72,所以=6.286x+72.(2)如果年龄相差5岁,则预报变量变化6.286×5=31.425,即身高相差约31.4 cm.(3)如果身高相差20 cm,年龄相差Δx==3.182≈3(岁).(4)ii由表得R2=1-≈0.999 7.由R2=0.999 7,表明年龄解释了99.97%的身高的变化,拟合效果较好.11.对有线性相关关系的两个变量建立的线性回归方程=+x,关于回归系数,下面叙述正确的是________.①可以小于0;②大于0;③能等于0;④只能小于0.【答案】①【解析】由和r的公式可知,当r=0时,这两变量不具有线性相关关系,但b能大于0也能小于0.12.某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关.现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,在将两组工人的日平均生产件数分成5组:,,,,分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的频率.(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成的列联表,并判断是否有的把握认为“生产能手与工人所在的年龄组有关”?附表:【答案】(1)(2)没有的把握认为“生产能手与工人所在的年龄组有关”【解析】(1)因为,所以抽取的100名工人中周岁以上组工人名,周岁以下组工人名。
高二数学统计案例试题
高二数学统计案例试题1.下列结论正确的是()①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.A.①②B.①②③C.①②④D.①②③④【答案】C【解析】①函数关系是一种确定性关系,这是一个正确的结论.②相关关系是一种非确定性关系,是一个正确的结论.③回归分析是对具有相关关系的两个变量进行统计分析的一种方法,所以③不对.与③对比,依据定义知④是正确的,故答案为C。
【考点】本题主要考查相关关系。
点评:本题主要考查相关关系,对本题的正确判断需要对相关概念的熟练掌握。
2.在分析两个分类变量之间是否有关系时,常用到的图表有.【答案】列联表、三维柱形图、二维条形图【解析】在分析两个分类变量之间是否有关系时,常用到的图表有列联表、三维柱形图、二维条形图。
【考点】本题主要考查变量的相关关系。
点评:用列联表、三维柱形图、二维条形图等研究变量关系。
3.在回归分析中,通过模型由解释变量计算预报变量的值时,应注意什么问题?【答案】应注意下列问题:(1)回归方程只适用于我们所研究的样本的总体;(2)我们所建立的回归方程一般都有时间性;(3)样本取值的范围会影响回归方程的适用范围;(4)不能期望回归方程得到的预报值就是预报变量的精确值【解析】应注意下列问题:(1)回归方程只适用于我们所研究的样本的总体;(2)我们所建立的回归方程一般都有时间性;(3)样本取值的范围会影响回归方程的适用范围;(4)不能期望回归方程得到的预报值就是预报变量的精确值.【考点】本题主要考查回归分析的基本思想和方法及其应用。
点评:明确概念,牢记性质。
4.某10名同学的数学、物理、语文成绩如下表:试分别研究他们的数学成绩与物理成绩的关系、数学成绩与语文成绩的关系,你能发现什么规律?【答案】数学成绩好的同学,一般来说物理成绩也较好,它们之间的联系较紧密,而数学成绩好的同学,语文成绩也可能好,也可能差,它们之间的关系不大.【解析】可求出物理成绩与数学成绩的相关系数,从而认为物理成绩与数学成绩之间具有很强的线性相关关系.而由语文成绩与数学成绩的相关系数远小于0.75,说明语文成绩与数学成绩不具有线性相关关系.因此,数学成绩好的同学,一般来说物理成绩也较好,它们之间的联系较紧密,而数学成绩好的同学,语文成绩也可能好,也可能差,它们之间的关系不大.【考点】本题主要考查回归分析、相关系数。
高二文科数选修1-2第一章统计案列测试题带答案
高二文科数学统计案例测试班级: 姓名:一、选择题1、已知某回归方程为:ˆˆ23y x =-,则当解释变量增加1个单位时,预报变量平均:( )A 、增加3个单位BC 、减少3个单位 D2、下面是一个2⨯2列联表,则表中a 、b 处的值分别为( )A. 94、96B. 52、54C. 52、50D. 54、523、两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数2R 如下 ,其中拟合效果最好的模型是( )(A)模型1的相关指数2R 为0.98 (B) 模型2的相关指数2R 为0.80 (C)模型3的相关指数2R 为0.50 (D) 模型4的相关指数2R 为0.254、工人月工资(元)依劳动生产率(千元)变化的回归直线方程为ˆ6090yx =+,下列判断正确的是( ) (A)劳动生产率为1000元时,工资为50元 (B)劳动生产率提高1000元时,工资提高150元 (C)劳动生产率提高1000元时,工资提高90元 (D)劳动生产率为1000元时,工资为90元5、为研究变量x 和y 的线性相关性,甲、乙二人分别作了研究,利用线性回归方法得到回归直线方程1l 和2l ,两人计算知x 相同,y 也相同,下列正确的是( ) (A) 1l 与2l 重合 (B) 1l 与2l 一定平行 (C) 1l 与2l 相交于点),(y x (D) 无法判断1l 和2l 是否相交 6则y 与x 的线性回归方程为y=bx+a 必过( )(A)(2,2)点 (B)(1.5,0)点 (C)(1,2)点 (D)(1.5,4)点7、回归分析中,相关指数R 2的值越大,说明残差平方和( )A.越小B.越大C.可能大也可能小D.以上都不对 8、在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )(A ) 若K 2的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病(B)从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病(C)若从统计量中求出有95% 的把握认为吸烟与患肺病有关系,是指有5% 的可能性使得推判出现错误(D)以上三种说法都不正确. 二、填空题9、经过对卡方K 2 统计量分布的研究,已经得到两个临界值,当根据具体的数据算出的K 2>6.635时,有__ ____ 的把握说事件A 和B 有关。
高二文科数学统计案例
高二数学测试1 2014.2.17提示:22()()()()()n ad bcKa b c d a c b d-=++++∑∑==---=niiiniixxyyxxb121)()()(ˆ2121∑∑==--=niiiniix nxy x nyx,xbyaˆˆ-=1、下列各组变量的关系中是相关关系的是A、电压U与电流IB、圆面积S与半径RC、粮食产量与施肥量D、天上的出现慧星流与自然界的灾害2.已知有线性相关关系的两个变量建立的回归直线方程为 y a bx=+,方程中的回归系数b ()A.可以小于0 B.只能大于0C.可以为0 D.只能小于03.考察棉花种子经过处理跟生病之间的关系得到如下表数据:种子处理种子未处理合计得病32 101 133不得病61 213 274合计93 314 407根据以上数据,则( )(A)种子经过处理跟是否得病有关 (B)种子经过处理跟是否得病无关(C)种子是否经过处理决定是否生病 (D)以上都是错误的4.在吸烟与患肺病这两个分类变量中,下列说法正确的是()A.若观测值为k2>6.635,我们有99%的把握认为“吸烟与患肺病有关系”,那么在100个吸烟的人中必有99人有肺病B.由独立性检验可知,有99%的把握认为“吸烟与患肺病有关系”时,如果我们说某人吸烟,那么他有99%的可能患有肺病C.若根据统计量中求出有99%的把握认为“吸烟与患肺病有关系”,那么有1%的可能性使得推判出现错误D.以上三种说法都不正确5.已知y与x之间数据如下表所示,则y与x之间的线性回归方程过点()x 1.08 1.12 1.191.28y 2.25 2.40 2.55 2.37A、(0,0)B、(1.1675,0)C、(0,2.3925)D、(1.1675,2.3925)6.(2011•山东)某产品的广告费用x与销售额y的统计数据如下表根据上表可得回归方程aˆxbˆyˆ+=中的bˆ为9.4,据此模型预报广告费用为6万元时销售额为()A、63.6万元B、65.5万元C、67.7万元D、72.0万元7、已知回归直线方程为12.1xyˆ+=,则在(2,5)处的残差ε为。
高中数学选修1-2第一章统计案例测试题带详细解答(可编辑修改word版)
1
A、增加3个单位B、增加个单位C、减少3个单位D、减少个单位
3
【答案】C
【解析】
解释变量即回归方程里的自变量xˆ,由回归方程知预报变量yˆ减少 3 个单位
4.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U
与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),r1表示变量Y与X之
选修 1-2 第一章、统计案例测试
一、选择题
1.已知x与y之间的一组数据:
x
0
1
2
3
y
1
3
5
7
则y与x的线性回归方程为ybxa必过点() A.(2,2)B. (1.5 ,4)C.(1.5 ,0)D.(1,2)
【答案】B
【解析】
试题分析:由数据可知x1.5,y4,∴线性回归方程
4
为yb xa必过点(1.5,4)
5 =11.72
. Y =(1+2+3+4+5)
5 =3
∴这组数据的相关系数是r=7.2
19.172 =0.3755,
变量U与V相对应的一组数据为(10,5),(11.3,4),
(11.8,3),(12.5,2),(13,1)
. U =(5+4+3+2+1)
5 =3,
∴这组数据的相关系数是-0.3755,
【解析】
试题分析:由题意,年劳动生产率x(千元)和工人工资y(元)之间回归方程为
y1070x,
故当x增加 1 时,y要增加 70 元,
∴劳动生产率每提高1千元时,工资平均提高70元,故A正确.
部编版高中数学必修二第九章统计典型例题
(名师选题)部编版高中数学必修二第九章统计典型例题单选题1、某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率直方图如图所示,估计棉花纤维的长度的样本数据的80百分位数是()A.29 mmB.29.5 mmC.30 mmD.30.5 mm答案:A分析:先求得棉花纤维的长度在30 mm以下的比例为85%,在25 mm以下的比例为85%-25%=60%,从而可得80百分位数一定位于[25,30)内,进而可求出答案棉花纤维的长度在30 mm以下的比例为(0.01+0.01+0.04+0.06+0.05)×5=0.85=85%,在25 mm以下的比例为85%-25%=60%,因此,80百分位数一定位于[25,30)内,=29,由25+5×0.80−0.600.85−0.60可以估计棉花纤维的长度的样本数据的80百分位数是29 mm.故选:A2、某学校在校学生有2000人,为了增强学生的体质,学校举行了跑步和登山比赛,每人都参加且只参加其中一项比赛,高一、高二、高三年级参加跑步的人数分别为a,b,c,且a:b:c=2:5:3,全校参加登山的人数占总人数的14.为了了解学生对本次比赛的满意程度,按分层抽样的方法从中抽取一个容量为200的样本进行调查,则应从高三年级参加跑步的学生中抽取()A.15人B.30人C.40人D.45人答案:D分析:由题知全校参加跑步的人数为2000×34=1500,再根据分层抽样的方法求解即可得答案.解:由题意,可知全校参加跑步的人数为2000×34=1500,所以a+b+c=1500.因为a:b:c=2:5:3,所以c=1500×32+5+3=450.因为按分层抽样的方法从中抽取一个容量为200的样本,所以应从高三年级参加跑步的学生中抽取的人数为450×2002000=45.故选:D3、演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是A.中位数B.平均数C.方差D.极差答案:A分析:可不用动笔,直接得到答案,亦可采用特殊数据,特值法筛选答案.设9位评委评分按从小到大排列为x1≤x2≤x3≤x4⋯≤x8≤x9.则①原始中位数为x5,去掉最低分x1,最高分x9,后剩余x2≤x3≤x4⋯≤x8,中位数仍为x5,∴A正确.②原始平均数x=19(x1+x2+x3+x4⋯+x8+x9),后来平均数x′=17(x2+x3+x4⋯+x8)平均数受极端值影响较大,∴x与x′不一定相同,B不正确③S2=19[(x1−x̅)2+(x1−x̅)2+⋯+(x9−x̅)2]s′2=17[(x2−x′)2+(x3−x′)2+⋯+(x8−x′)2]由②易知,C不正确.④原极差=x9−x1,后来极差=x8−x2可能相等可能变小,D不正确.小提示:本题旨在考查学生对中位数、平均数、方差、极差本质的理解.4、为保障食品安全,某监管部门对辖区内一家食品企业进行检查,现从其生产的某种产品中随机抽取100件作为样本,并以产品的一项关键质量指标值为检测依据,整理得到如下的样本频率分布直方图.若质量指标值在[25,35)内的产品为一等品,则该企业生产的产品为一等品的概率约为()A.0.38B.0.61C.0.122D.0.75答案:B分析:利用频率=频率组距×组距,即可得解.根据频率分布直方图可知,质量指标值在[25,35)内的概率P=(0.080+0.042)×5=0.122×5=0.61故选:B5、现用分层抽样的方法从三个兴趣小组中抽取若干人进行集训,抽取情况如下表:答案:B解析:根据每小组抽取人数与小组人数比值相等,计算即可得结果.因为乒乓球抽取人数与小组人数比值为2200=1100;所以足球小组抽取人数为x=100×1100=1;篮球小组抽取人数为y=300×1=3,故x+y=1+3=4100故选:B.6、2020年5月我国抗击新冠肺炎疫情工作取得阶段性胜利,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是()A.这11天复工指数和复产指数均逐日增加B.这11天期间,复产指数的极差大于复工指数的极差C.第3天至第11天复工复产指数均超过80%D.第9天至第11天复工指数的增量大于复产指数的增量答案:C分析:根据折线图对选项一一分析即可.对于A,这11天复工指数和复产指数均有升有降,故A错误;对于B,这11天期间,复产指数的极差为11月与1月的差值,复工指数的极差为10月与2月的差值,易知复产指数的极差小于复工指数的极差,故B错误;对于C,第3天至第11天复工复产指数均超过80%,故C正确;对于D,第9天至第11天复工指数的增量小于复产指数的增量,故D错误;故选:C7、甲、乙两组数据的频率分布直方图如图所示,两组数据采用相同的分组方法,用x̅1和x̅2分别表示甲、乙的平均数,s12,s22分别表示甲、乙的方差,则()A.x̅1=x̅2,s12<s22B.x̅1=x̅2,s12>s22C.x̅1<x̅2,s12=s22D.x̅1>x̅2,s12=s22答案:B分析:由平均数和方差的定义和性质判断即可得出结果.平均数是每个矩形的底边中点的横坐标乘以本组频率(对应矩形面积)再相加,因为两组数据采取相同分组且面积相同,故x̅1=x̅2,由图观察可知,甲的数据更分散,所以甲方差大,即s12>s22,故选:B.8、为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是()A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间答案:C分析:根据直方图的意义直接计算相应范围内的频率,即可判定ABD,以各组的中间值作为代表乘以相应的频率,然后求和即得到样本的平均数的估计值,也就是总体平均值的估计值,计算后即可判定C.因为频率直方图中的组距为1,所以各组的直方图的高度等于频率.样本频率直方图中的频率即可作为总体的相应比率的估计值.该地农户家庭年收入低于4.5万元的农户的比率估计值为0.02+0.04=0.06=6%,故A正确;该地农户家庭年收入不低于10.5万元的农户比率估计值为0.04+0.02×3=0.10=10%,故B正确;该地农户家庭年收入介于4.5万元至8.5万元之间的比例估计值为0.10+0.14+0.20×2=0.64=64%> 50%,故D正确;该地农户家庭年收入的平均值的估计值为3×0.02+4×0.04+5×0.10+6×0.14+7×0.20+8×0.20+9×0.10+10×0.10+11×0.04+12×0.02+13×0.02+14×0.02=7.68(万元),超过6.5万元,故C错误.综上,给出结论中不正确的是C.故选:C.小提示:本题考查利用样本频率直方图估计总体频率和平均值,属基础题,样本的频率可作为总体的频率的估计值,样本的平均值的估计值是各组的中间值乘以其相应频率然后求和所得值,可以作为总体的平均值的×组距.估计值.注意各组的频率等于频率组距多选题9、PM2.5是衡量空气质量的重要指标,下图是某地7月1日到10日的PM2.5日均值(单位:ug/m3)的折线图,则下列关于这10天中PM2.5日均值的说法正确的是A.众数为30B.中位数是31C.平均数小于中位数D.后4天的方差小于前4天的方差答案:AD分析:根据折线图,由众数,中位数,平均数,方差等概念及公式,逐项判断,即可得出结果.众数即是出现次数最多的数字,由折线图可得,众数为30,即A正确;中位数即是处在中间位置的数字,将折线图中数字由小到大依次排序,得到:17,25,30,30,31,32,34,38,42,126;处在中间位置的数字是:31,32,因此中位数为31.5,即B错;由折线图可得,平均数为:17+25+30+30+31+32+34+38+42+12610=40.5>31.5,故C错;前4天的平均数为:38+25+17+304=27.5,后4天的平均数为42+31+32+304=33.75前4天方差为:s12=(38−27.5)2+(25−27.5)2+(17−27.5)2+(30−27.5)24=58.25,后4天方差为:s22=(42−33.75)2+(31−33.75)2+(32−33.75)2+(30−33.75)24=23.1875,所以后4天的方差小于前4天的方差,故D正确.故选:AD.小提示:本题主要考查由折线图计算众数、中位数、平均数、方差等,属于基础题型.10、有一组互不相等....的数组成的样本数据x1、x2、⋯、x9,其平均数为a(a≠x i,i=1、2、⋯、9),若插入一个数a,得到一组新的数据,则()A.两组样本数据的平均数相同B.两组样本数据的中位数相同C.两组样本数据的方差相同D.两组样本数据的极差相同答案:AD分析:利用平均数公式可判断A选项;利用中位数的定义可判断B选项;利用方差公式可判断C选项;利用极差的定义可判断D选项.由已知可得x1+x2+⋯+x9=9a.(9a+a)=a,与原数据的平均数相等,A对;对于A选项,新数据的平均数为110对于B选项,不妨设x1<x2<⋯<x9,则原数据的中位数为x5,(max{a,x4}+x5)<x5,若a<x5,则中位数为12(x5+min{a,x6})>x5,B错;若a>x5,则中位数为12[(x1−a)2+(x2−a)2+⋯(x9−a)2+(a−a)2]对于C选项,新数据的方差为s′2=110[(x1−a)2+(x2−a)2+⋯(x9−a)2]=s2,C错;<19对于D选项,不妨设x1<x2<⋯<x9,则x1<a<x9,故新数据的极差仍为x9−x1,D对.故选:AD.11、在某次测量中得到的A样本数据如下:52,54,54,56,56,56,55,55,55,55.若B样本数据恰好是A样本数据都加6后所得数据,则A,B两样本的下列数字特征对应相同的是()A.方差B.平均数C.中位数D.标准差答案:AD分析:设样本A的数据为X,样本B的数据为Y,可得Y=X+6,结合中位数、平均数和方差间的关系,即可求解.由题意,设样本A的数据为X,样本B的数据为Y,可得Y=X+6,设样本A的平均数为X,方差为S X2,中位数为X中,可得样本B的平均数为Y=X+6,方差S Y2=S X2,中位数Y中=X中+6,标准差S Y=S X.故选:AD.填空题12、某同学5次上学途中所花的时间(单位:分钟)分别为x,y,8,10,12.已知这组数据的平均数为10,标准差为√2,则x−y的值为____________.答案:±2分析:根据平均数和方差的计算方法可列出关于x和y的方程组,解之即可.平均数为15×(x+y+10+12+8)=10,即x+y=20①,方差为15×[(x−10)2+(y−10)2+(10−10)2+(12−10)2+(8−10)2]=2,即(x−10)2+(y−10)2=2②,由①②解得x=9,y=11或x=11,y=9,所以当x=9,y=11时,x−y=−2;当x=11,y=9,x−y=2所以答案是:±2.13、北京2022年冬奥会吉祥物“冰墩墩”和冬残奥会吉祥物“雪容融”一亮相,好评不断,这是中国文化与奥林匹克精神的一次完美结合.现工厂决定从20只相同的“冰墩墩”,15只相同的“雪容融”和10个相同的北京2022年冬奥会会徽中,采用分层随机抽样的方法,抽取一个容量为n的样本进行质量检测,若“冰墩墩”抽取了4只,则n=______.答案:9分析:根据成分层抽样的比例可得答案.20 :15:10=4:3:2,由于“冰墩墩”抽取了4只,所以“雪容融”抽取了3只,北京2022年冬奥会会徽抽取了2个,所以n=4+3+2=9.所以答案是:9.。
高考数学文科二轮复习练习(全国通用):第一篇第19练统计与统计案例
第 19 练统计与统计事例[明考情 ]统计中的抽样方法、统计图表、样本估计整体,少量年份观察,形式为选择、填空题,中低档难度 .[知考向 ]1.随机抽样 .2.统计图表和样本数字特色.3.统计事例 .考点一随机抽样重点重组简单随机抽样的特色是逐一抽取,合用于整体个数较少状况;系统抽样也称等距抽样,合用整体个数许多状况;分层抽样必定要注意按比率抽取,整体由差别显然的几部分组成 .1.某学校有男学生400 名,女学生600 名 .为认识男、女学生在学习兴趣与业余喜好方面能否存在明显差别,拟从全体学生中抽取男学生40 名,女学生60 名进行检查,则这类抽样方法是 ()A. 抽签法B.随机数法C.系统抽样法D.分层抽样法答案 D分析由题意知,样本和整体中男、女生的比率都是2∶ 3,所以这类抽样方法为分层抽样. 2.采纳系统抽样方法从 960 人中抽取 32 人做问卷检查,为此将他们随机编号为1,2,,960,分组后在第一组采纳简单随机抽样的方法抽到的号码为9.抽到的 32 人中,编号落入区间 [1,450] 的人做问卷 A,编号落入区间 [451 ,750] 的人做问卷 B,其他的人做问卷C,则抽到的人中,做问卷 B 的人数为 ()答案 D分析按系统抽样的规则应把整体分红32 组,每组30 人,即抽样的间隔为30.因为450= 15,30所以做问卷 A 的有 15 人;因为750= 25,所以做问卷 B 的有 25- 15= 10(人 ).应选 D. 303.(2017 长·沙模拟 )某林场有树苗30000 棵,此中松树苗4000 棵,为检查树苗的生长状况,采用分层抽样的方法抽取一个容量为150 的样本,则样本中松树苗的数目为()答案 A分析依据分层抽样的定义可得样本中松树苗的数目为4000× 150= 20.300004.(2017 烟·台模拟 )用 0,1,2,, 299 给 300 名学生编号,并用系统抽样的方法从中抽取15名学生的数学成绩进行质量剖析,若从第一组抽取的学生的编号为8,则从第三组抽取的学生编号为 ()答案 D分析∵是从 300 名学生中抽取15 个样本,∴组距是 20,∵第一组抽取的学生的编号为8,∴第三组抽取的学生编号为8+ 40=48.5.(2017 江·苏 ) 某工厂生产甲、乙、丙、丁四种不一样型号的产品,产量分别为200,400,300,100 件,为查验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60 件进行查验,则应从丙型号的产品中抽取________件 .答案 18样本容量603分析∵整体个数=200+400+ 300+ 100=50.∴ 应从丙型号的产品中抽取3× 300= 18(件 ). 50考点二统计图表和样本数字特色方法技巧1.由频次散布直方图进行有关计算时,需掌握关系式:频数=频次,此关系式的变形为样本容量频数=样本容量,样本容量×频次=频数.频次2.整体估计的方法:用样本的数字特色估计整体的数字特色.3.图表判断法:若依据统计图表比较样本数据的大小,可依据数据的散布状况直观剖析,大致判断均匀数的范围,并利用数据的颠簸性大小比较方差(标准差 )的大小 .6.某中学初中部共有110 名教师,高中部共有150 名教师,其性别比比以下图,则该校女教师的人数为()答案 B分析由题干扇形统计图可得该校女教师人数为110× 70%+150× (1- 60%) = 137.应选 B.7.从朝阳小区抽取100 户居民进行月用电量检查,为拟订阶梯电价供给数据,发现其用电量都在 50 到 350 度之间,制作频次散布直方图的工作人员马马虎虎,地点t 处未注明数据,你以为t 等于 ()答案 D分析由题意得, 50× (0.006+ t +0.0036+ 0.0024× 2+0.0012) = 1,t= 0.0044.8.(2017山·东 ) 以下图的茎叶图记录了甲、乙两组各5 名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且均匀值也相等,则x 和y 的值分别为()A.3 , 5B.5, 5C.3, 7D.5, 7答案 A分析甲组数据的中位数为65,由甲、乙两组数据的中位数相等得y= 5.又甲、乙两组数据的均匀值相等,∴1× (56+ 65+ 62+ 74+ 70+ x) =1× (59+ 61+67+ 65+ 78),55∴x= 3.应选 A.9.对某同学的 6 次物理测试成绩 (满分 100 分 )进行统计,作出的茎叶图以下图,给出对于该同学物理成绩的以下说法:①中位数为 84;②众数为 85;③均匀数为 85;④极差为 12.此中,正确说法的序号是 ________.答案①③分析将图中各数从小到大摆列为78, 83, 83,85,90,91,所以中位数为83+85=84,众数2为 83,均匀数为1× (78+ 83+ 83+ 85+90+ 91)= 85,极差为 91- 78= 13,故①③正确 . 610.学校依据某班的期中考试成绩绘制了频次散布直方图(以下图 ),依据图中所给的数据可知 a+b= ________.答案 0.06分析由题意得,依据频次散布直方图中各个矩形的面积和为 1,则 (0.01 +0.012+ 0.018+ a+ b)×10=1,所以 a+ b= 0.06.考点三统计事例方法技巧(1) 线性回归方程问题的两个重点:样本点的中心在回归直线上;由线性回归方程求出的数值是估计值 .(2)独立性查验的重点在于正确求出K2值,而后对照临界值表中的数据,而后下结论.11.(2017 宁·德一模 )从某大学随机抽取的 5 名女大学生的身高x(厘米 )和体重 y(公斤 )数据如表:x165160175155170y5852624360^^^依据上表可得线性回归方程为y= 0.92x+ a,则 a等于 ()A. -C.-答案A分析由表中数据可得x = 165,y = 55,^^∵ ( x , y )必定在线性回归方程y= 0.92x+ a上,^∴ 55=0.92× 165+ a,^解得 a=- 96.8.^12.已知变量 x,y 呈线性有关关系,回归方程为y= 1-2x,则变量 x, y 是 ()A. 线性正有关关系B. 由回归方程没法判断其正负有关关系C.线性负有关关系D.不存在线性有关关系答案 C^分析依据变量x, y 的线性回归方程是y= 1- 2x,^回归系数所以变量b=- 2< 0,x, y 是线性负有关关系.13.(2017南·昌一模)设某中学的高中女生体重y(单位: kg)与身高x( 单位: cm) 拥有线性有关关^系,依据一组样本数据(x i,y i)(i = 1, 2,3,, n),用最小二乘法近似获得线性回归方程为y=0.85x- 85.71,则以下结论中不正确的选项是() A. y 与 x 拥有正的线性有关关系B. 回归直线过样本点的中心( x , y )C.若该中学某高中女生身高增添1cm,则其体重约增添0.85kgD.若该中学某高中女生身高为160cm,则可判定其体重必为50.29kg答案 D分析因为线性回归方程中 x 的系数为 0.85,所以 y 与 x 拥有正的线性有关关系, A 正确;由线性回归方程必过样本点中心( x , y )知, B 正确;由线性回归方程中系数的意义知,x 每增添 1cm,其体重约增添 0.85kg, C 正确;当某女生的身高为160cm 时,其体重估计值是50.29kg ,而不是详细值,所以 D 错误 .应选D.14.经过随机咨询110 名学生能否喜好打篮球,获得以下的2× 2 列联表:男女总计喜好402060不喜好203050总计60501102n ad- bc2附:K =,此中 n= a+ b+ c+ d.a+ b c+ d a+ c b+ dP(K 2≥ k0)0.0500.0100.001k0 3.841 6.63510.828参照附表,正确的结论是()A. 在出错误的概率不超出0.1%的前提下,以为“喜好打篮球与性别没关”B. 在出错误的概率不超出0.1%的前提下,以为“喜好打篮球与性别有关”C.有 99%以上的掌握以为“喜好打篮球与性别没关”D.有 99%以上的掌握以为“喜好打篮球与性别有关”答案 D2110× 40× 30- 20×2021%的前提分析因为 K =60× 50×60× 50≈ 7.8> 6.635,所以在出错误的概率不超出下,即有99%以上的掌握以为“ 喜好打篮球与性别有关”.15.在西非暴虐的“埃博拉病毒”的流传速度很快,这已经成为全世界性的威迫.为了观察某种埃博拉病毒疫苗的成效,现随机抽取100 只小鼠进行试验,获得以以下联表:感染未感染总计服用104050未服用203050总计3070100附表:P(K2≥ k0)0.100.050.025k0 2.706 3.841 5.024参照附表,在出错误的概率不超出________(填百分比 )的前提下,以为“小鼠能否被感染与服用疫苗有关” .答案 5%分析K2=100 10×30-20×402≈ 4.762> 3.841,所以在出错误的概率不超出5%的前提下,30×70× 50×50以为“小鼠能否被感染与服用疫苗有关” .1.为了保证乘客的安全,某市要对该市出租车司机的年纪进行检查,现从中随机抽出 100 司机,已知抽到的司机年纪都在 [20 , 45)岁之间,依据检查结果,得出司机年纪状况的残破名的频次散布直方图以下图,利用这个残破的频次散布直方图估计该市出租车司机年纪的中位数大概是 ()答案 C分析 依据直方图的性质, [25,30)岁对应的频次为 1- (0.01× 5+ 0.07× 5+ 0.06× 5+ 0.02× 5)= 0.2.∵ 中位数处左右频次各占0.5,易知中位数在 30~ 35 之间,设中位数为 x ,则 0.25+ 0.07(x - 30)= 0.5,∴ x ≈ 33.6, ∴ 中位数大概是 34.2.如图是某汽车 4S 店 10 个月销售某豪华汽车数目(单位:台 )的茎叶图,若 m 是 2 与 12 的等差中项,则数据落在区间[19, 29)内的概率为 ()答案 C分析 因为 m 是 2 与 12 的等差中项,所以m = 2+ 12=7,2所以 10 个数据中落在区间[19 ,29)内的数占有19,21,22,22,27,共 5 个,所以,样本中的数据落在区间[19 , 29)内的频次为 105=0.5,所以数据落在区间 [19 , 29)内的概率为 0.5,应选 C.解题秘笈 (1) 在频次散布直方图中:①最高的小长方形底边中点的横坐标即是众数;②中位数左侧和右侧的小长方形的面积和是相等的;③均匀数是频次散布直方图的“重心”,等于频次散布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.(2)茎叶图的特色是保存了完好的原始数据,依据茎叶图就能够获得数据的所有数字特色.求解茎叶图问题需注意:重复出现的数字应当按原次数写入叶子部位,不可以只写入一次.1.对一个容量为 N 的整体抽取容量为 n 的样本,当选用简单随机抽样、系统抽样和分层抽样三种不一样方法抽取样本时,整体中每个个体被抽中的概率分别为p 1, p 2, p 3,则 ()A. p 1=p 2<p 3B. p 2= p 3<p 1C.p 1=p 3<p 2D. p 1= p 2= p 3答案 D分析 因为采纳简单随机抽样、系统抽样和分层抽样抽取样本时,整体中每个个体被抽中的概率相等,应选 D.2.(2017 中·卫二模 )某市教育主管部门为了全面认识 2017 届高三学生的学习状况, 决定对该市参加 2017 年高三第一次全国大联考统考 ( 后称统考 )的 32 所学校进行抽样检查,将参加统考的 32 所学校进行编号,挨次为1 到 32,现用系统抽样法,抽取8 所学校进行检查,若抽到的最大编号为 31,则最小的编号是 ()答案 D32分析 依据系统抽样法,整体分红8 组,组距为 8 = 4,若抽到的最大编号为 31,则最小的编号为 3.3.交通管理部门为认识灵活车驾驶员(简称驾驶员 )对某新法例的了解状况,对甲、乙、丙、丁四个社区做分层抽样检查 .假定四个社区驾驶员的总人数为 N ,此中甲社区有驾驶员96 人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为 12, 21, 25, 43,则这四个社区驾驶员的总人数 N 为 ()答案 B1212+ 21+ 25+43= 101,分析 由题意知,抽样比为 96,而四个社区一共抽取的驾驶员人数为 故有 12=101,解得 N =808.96N4.某学校教务处采纳系统抽样方法,从学校高三年级全体 1000 名学生中抽 50 名学生做学习状况问卷检查 .现将 1000 名学生从1 到 1000 进行编号, 求得间隔数 k = 20,即分 50 组,每组20 人 .在第 1 组中随机抽取一个号,假如抽到的是17 号,则第 8 组中应抽取的号码是()答案 B分析 依据系统抽样法的特色, 可知抽取的号码为首项为 17,公差为 20 的等差数列, 所以第 8组应抽取的号码是17+ (8-1)×20= 157.5.某市 8 所中学学生参加竞赛的得分茎叶图以下图,此中茎为十位数,叶为个位数,则这组数据的均匀数和方差分别是()A.91 , 5.5B.91 ,5C.92, 5.5D.92 ,5答案 A分析把茎叶图中的数据按由小到大的次序摆列,以下:87, 88, 90, 91, 92, 93, 93, 94.均匀数是18× (87+88+ 90+ 91+ 92+ 93+ 93+ 94)=91,212222s =× [(87 - 91) + (88- 91) + (90- 91) ++ (94- 91) ] = 5.5.6.(2016 全·国Ⅲ) 某旅行城市为向旅客介绍当地的气温状况,绘制了一年中各月均匀最高气温和均匀最低气温的雷达图.图中 A 点表示十月的均匀最高气温约为最低气温约为5℃ .下边表达不正确的选项是()15℃,B 点表示四月的均匀A. 各月的均匀最低气温都在0℃以上B.七月的均匀温差比一月的均匀温差大C.三月和十一月的均匀最高气温基真同样D.均匀最高气温高于20℃的月份有 5 个答案 D分析由题意知,均匀最高气温高于20℃的有七月,八月,应选 D.7.从某小学随机抽取100 名同学,将他们的身高(单位:厘米 )数据绘制成频次散布直方图,图所示,由图中数据可知,身高在[120 , 130) 内的学生人数为()如答案 C分析由图可知, (0.035+ a+0.020+ 0.010+ 0.005)×10= 1,解得 a= 0.03,所以身高在[120,130)内的学生人数在样本中的频次为0.03× 10= 0.3,所以身高在 [120 , 130)内的学生人数为0.3× 100= 30.应选 C.8.以下图的茎叶图是某班学生在一次数学测试中的成绩:依据茎叶图,得出该班男、女生数学成绩的四个统计结论,此中错误的一项为哪一项()A.15名女生成绩的均匀分为78B.17名男生成绩的均匀分为77C.女生成绩和男生成绩的中位数分别为82, 80D.男生中的高分段和低分段均比女生多,对比较而言,男生两极分化比较严重答案 C1分析 15 名女生成绩的均匀分为15× (90+ 93+ 80+ 80+ 82+ 82+83+ 83+85+ 70+71+73+75+ 66+ 57)= 78,故 A 正确;选项 B,17 名男生成绩的均匀分为1× (93+ 93+ 96+ 80+82 17+83+86+ 86+88+ 71+74+ 75+ 62+ 62+ 68+ 53+57)= 77,故 B 正确;选项 D ,察看茎叶图,对男生、女生成绩进行比较,可知男生两极分化比较严重,故 D 正确;选项 C,依据女生和男生成绩数据剖析可得,两组数据的中位数均为 80,故 C 错误 .综上,选 C.9.(2017 永·州二模 )实验测得四组数对 ( x, y)的值为 (1, 2), (2, 5),(4, 7), (5,10),则 y 与 x 之间的线性回归方程可能是()^^A. y= x+ 3B.y= x+ 4^^C.y= 2x+ 3D. y= 2x+ 4答案 A分析由题意可知,x = 3, y =6,线性回归方程经过点(3, 6).代当选项, A 切合 .10.(2017 宜·春二模 )某公司节能降耗技术改造后,在生产某产品过程中的产量x( 吨)与相应的生产能耗 y(吨 )的几组对应数据如表所示:x3456y 2.534 4.5^^若依据表中数据得出y 对于x 的线性回归方程为y= 0.7x+a,若生产7 吨产品,估计相应的生产能耗为 ()A.5.25 吨B.5.15 吨C.5.5 吨D.9.5 吨答案 A分析由表中数据,计算得x =14× (3+4+ 5+ 6)= 4.5,1y =4× (2.5+ 3+ 4+4.5) =3.5,^^且线性回归方程y= 0.7x+a过样本点中心( x , y ),^即 3.5= 0.7× 4.5+ a,^解得 a= 0.35,^∴ x, y 的线性回归方程是y= 0.7x+ 0.35.^将 x=7 代入,得 y= 5.25.11.在一次百米测试中,某年级120名学生成绩所有介于13 秒与 18 秒之间 .将测试结果分红5组: [13 , 14), [14, 15), [15 , 16), [16, 17), [17 , 18],获得以下图的频次散布直方图.假如从左到右的 5 个小矩形的面积之比为1∶3∶ 7∶ 6∶ 3,那么成绩在 [16 ,18]的学生人数是________.答案 54分析成绩在 [16, 18] 的学生人数所占比率为6+ 3=9,所以成绩在[16 , 18]的学生1+3+7+6+3209人数为 120×20= 54.12.某校为了研究学生的性别和对待某一活动的态度( 支持和不支持两种态度)的关系,运用2× 2 列联表进行独立性查验,经计算K2= 7.069,则所获得的统计学结论是:有________的掌握以为“学生性别与支持该活动有关系.”附:P(K2≥ k0)0.1000.0500.0250.0100.001k0 2.706 3.841 5.024 6.63510.828答案 99%分析因为 7.069> 6.635,所以获得的统计学结论是:有 1- 0.010= 0.99= 99%的掌握以为“学生性别与支持该活动有关系” .。
高二文科必修三统计概率练习
高二文科必修三统计概率练习1.某校从参加高一年级期末考试的学生中抽出60名学生,将其某科成绩(是不小于40不大于100的整数)分成六段后画出如下频率分布直方图,根据图形中所给的信息,回答以下问题:(1)求第四小组[70,80)的频率;(2)求样本的众数;(3)观察频率分布直方图图形的信息,估计这次考试的及格率(60分及以上为及格)和平均分.2.如图的茎叶图记录了甲、乙两代表队各10名同学在一次英语听力比赛中的成绩(单位:分),已知甲代表队数据的中位数为76,乙代表队数据的平均数是75.(1)求x,y的值;(2)若分别从甲、乙两队随机各抽取1名成绩不低于80分的学生,求抽到的学生中,甲队学生成绩不低于乙队学生成绩的概率;(3)判断甲、乙两队谁的成绩更稳定,并说明理由(方差较小者稳定).3.为了研究某灌溉渠道水的流速与水深之间的关系,测得一组数据如下表:(1) 画出散点图,判断变量与是否具有相关关系;(2) 若与之间具有线性相关关系,求对的回归直线方程;(,)(3) 预测水深为1.95m水的流速是多少.4.某种产品的广告费支出与销售额(单位:百万元)之间有如下对应数据:(Ⅰ)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;(Ⅱ)预测当广告费支出为9百万元时的销售额.5.某中学甲、乙两班共有25名学生报名参加了一项测试,这25名学生的考分编成如图所示的茎叶图,其中有一个数据因电脑操作人员不小心删掉了(这里暂用来表示),但他清楚地记得两班学生成绩的中位数相同.(1)求这两个班学生成绩的中位数及的值;(2)如果这些成绩分为优秀(得分175分以上,包括175分)和过关,若学校再从这两个班获得优秀成绩的学生中选出3名代表学校参加比赛,求这3人中甲班至多有一人入选的概率.6.一个盒子里装有三张卡片分别标记有数字1,2,3,这三张卡片除标记的数字外完全相同,随机有放回地抽取3次,每次抽取1张,将抽取的卡片上的数字依次记为a,b,c.(1)求“抽取的卡片上的数字满足a+b=c”的概率;(2)求“抽取的卡片上的数字a,b,c不完全相同”的概率.(注:若三个数a,b,c满足a≤b≤c,则称b为这三个数的中位数)7.甲、乙两位学生参加数学竞赛培训,他们在培训期间8次模拟考试的成绩如下:甲:82 81 79 78 95 88 93 84乙:92 95 80 75 83 80 90 85(1)画出甲、乙两位学生成绩的茎叶图,并求学生乙成绩的平均数和方差;(2)从甲同学超过80分的6个成绩中任取两个,求这两个成绩中至少有一个超过90分的概率.8.在甲、乙两个盒子中分别装有标号为1、2、3、4的四个球,现从甲、乙两个盒子中各取出1个球,每个球被取出的可能性相等.(Ⅰ)求取出的两个球上标号为相同数字的概率;(Ⅱ)求取出的两个球上标号之积能被3整除的概率.9.(12分)某人有3枚钥匙,其中只有一枚房门钥匙,但忘记了开房门的是哪一枚,于是,他逐枚不重复地试开,问:(Ⅰ)恰好第三次打开房门锁的概率是多少?(Ⅱ)两次内打开房门的概率是多少?10.某中学调查了某班全部45名同学参加书法社团和演讲社团的情况,数据如下表:(单位:人)(Ⅱ)在既参加书法社团又参加演讲社团的8名同学中,有5名男同学A1,A2,A3,A4,A5,3名女同学B1,B2,B3.现从这5名男同学和3名女同学中各随机选1人,求A1被选中且B1未被选中的概率.11.二年级有男生105人,女生126人,教师42人,用分层抽样的方法从中抽取13人,进行问卷调查.设其中某项问题的选择支为“同意”,“不同意”两种,且每人都做了一种选择.下面表格中提供了被调查人答卷情况的部分信息.(1)请完成此统计表;(2)试估计高二年级学生“同意”的人数;(3)从被调查的女生中选取2人进行访谈,求选到的两名学生中,恰有一人“同意”一人“不同意”的概率.12.某班级有数学、自然科学、人文科学三个兴趣小组,各有三名成员,现从三个小组中各选出一人参加一个座谈会.(I)求数学小组的甲同学没有被选中、自然小组的乙同学被选中的概率;(II)求数学组的甲同学、自然小组的乙同学至少有一人不被选中的概率.答案1.【考点】频率分布直方图;众数、中位数、平均数;极差、方差与标准差.【专题】概率与统计.【分析】(1)由各组的频率和等于1,由此利用频率分布直方图能求出第四组的频率.(2)由频率分布直方图知第四小组[70,80)的小矩形最高,由此能求出样本的众数.(3)依题意,60及以上的分数所在的第三、四、五、六组,求出频率和,由此能求出抽样学生成绩的及格率.利用组中值估算抽样学生的平均分,能估计这次考试的平均分.【解答】解:(1)因为各组的频率和等于1,故第四组的频率:f4=1﹣(0.025+0.015×2+0.01+0.005)×10=0.3(2)由频率分布直方图知第四小组[70,80)的小矩形最高,所以样本的众数是75.(3)依题意,60及以上的分数所在的第三、四、五、六组,频率和为(0.015+0.03+0.025+0.005)×10=0.75所以,抽样学生成绩的及格率是75%..利用组中值估算抽样学生的平均分45•f1+55•f2+65•f3+75•f4+85•f5+95•f6=45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71估计这次考试的平均分是71分.【点评】本题考查频率、众数、及格率和平均分的求法,是基础题,解题时要认真审题,注意频率分布直方图的合理运用.2.【考点】极差、方差与标准差;茎叶图.【专题】概率与统计.【分析】(1)按大小数列排列得出x值,运用平均数公式求解y,(2)判断甲乙两队各随机抽取一名,种数为3×4=12,列举得出甲队学生成绩不低于乙队学生成绩的有80,80;82,80;88,80;88,86;88,88.种数为3+1+1=5,运用古典概率求解.(3)求解甲的平均数,方差,一点平均数,方差,比较方差越小者越稳定,越大,波动性越大.得出结论:甲队的方差小于乙队的方差,所以甲队成绩较为稳定.【解答】解:(1)因为甲代表队的中位数为76,其中已知高于76的有77,80,82,88,低于76的有71,71,65,64,所以x=6,因为乙代表队的平均数为75,其中超过75的差值为5,11,13,14,和为43,少于75的差值为3,5,7,7,19,和为41,所以y=3,(2)甲队中成绩不低于80的有80,82,88;乙队中成绩不低于80的有80,86,88,89,甲乙两队各随机抽取一名,种数为3×4=12,其中甲队学生成绩不低于乙队学生成绩的有80,80;82,80;88,80;88,86;88,88.种数为3+1+1=5,所以甲队学生成绩不低于乙队学生成绩的概率为p=,(3)因为甲的平均数为:=(64+65+71+71+76+76+77+80+82+88)=75,所以甲的方差S2甲==50.2,又乙的方差S2乙==70.3,因为甲队的方差小于乙队的方差,所以甲队成绩较为稳定.【点评】本题考察了茎叶图的运用,求解方差,进行数据的分析解决实际问题,考察了计算能力,准确度.3.4..(Ⅰ)(Ⅱ)76百万元(Ⅰ)设回归直线方程由题意可得,∵,∴,∴线性回归方程为(Ⅱ)当时,即预测当广告费支出为9百万元时的销售额为76百万元.5..6.【考点】古典概型及其概率计算公式.【专题】概率与统计.【分析】(Ⅰ)所有的可能结果(a,b,c)共有3×3×3=27种,一一列举即可,而满足a+b=c的(a,b,c)有3个,由此求得“抽取的卡片上的数字满足a+b=c”的概率.(Ⅱ)所有的可能结果(a,b,c)共有3×3×3种,用列举法求得满足“抽取的卡片上的数字a,b,c完全相同”的(a,b,c)共计三个,由此求得“抽取的卡片上的数字a,b,c完全相同”的概率,再用1减去此概率,即得所求【解答】解:(Ⅰ)由题意,(a,b,c)所有的可能为:(1,1,1),(1,1,2),(1,1,3),(1,2,1),(1,2,2),(1,2,3),(1,3,1),(1,3,2),(1,3,3),(2,1,1),(1,1,2),(2,1,3),(2,2,1),(2,2,2),(2,2,3),(2,3,1),(2,3,2),(2,3,3),(3,1,1),(3,1,2),(3,1,3),(3,2,1),(3,2,2),(3,2,3),(3,3,1),(3,3,2),(3,3,3),共27种.设“抽取的卡片上的数字满足a+b=c”为事件A,则事件A包括(1,1,2),(1,2,3),(2,1,3),共3种,所以P(A)==.因此,“抽取的卡片上的数字满足a+b=c”的概率为.(Ⅱ)设“抽取的卡片上的数字a,b,c不完全相同”为事件B,则事件包括(1,1,1),(2,2,2),(3,3,3),共3种.所以P(B)=1﹣P()=1﹣=.因此,“抽取的卡片上的数字a,b,c不完全相同”的概率为.【点评】本题主要考查相互独立事件的概率乘法公式的应用,属于中档题7.【考点】列举法计算基本事件数及事件发生的概率;茎叶图.【专题】综合题;整体思想;综合法;概率与统计.【分析】(1)将成绩的十位数作为茎,个位数作为叶,可得茎叶图,计算乙的平均数与方差,即可求得结论,(2)一一列举出任取两次成绩,所有基本事件,再找到满足两个成绩中至少有一个超过90分的基本事件,根据概率公式计算即可.【解答】解:(1)茎叶图如下:…学生甲成绩中位数为83,…(2)=85 …S乙2=[(75﹣85)2+(80﹣85)2+(80﹣85)2+(83﹣85)2+(85﹣85)2+(90﹣85)2+(92﹣85)2+(95﹣85)2]=41 …(3)甲同学超过80(分)的成绩有82 81 95 88 93 84,任取两次成绩,所有基本事件为:(82,81),(82,95),(82,88),(82,93),(82,84),(81,95),(81,88),(81,93),(81,84),(95,88),(95,93),(95,84),(88,93),(88,84),(93,84)共15个…其中至少有一次超过90(分)的基本事件为:(82,95)(82,93)(81,95)(81,93)(95,88),(95,93),(95,84),(88,93)(93,84)共9个.…∴这两次成绩中至少有一次超过90(分)的概率为.…【点评】本题考查茎叶图,考查平均数与方差的计算,考查概率公式,属于基础题.8.【考点】列举法计算基本事件数及事件发生的概率.【专题】应用题.【分析】设从甲、乙两个盒子中各取1个球,其数字分别为x、y,用(x,y)表示抽取结果,则所有可能的结果有16种,(I)A={(1,1),(2,2),(3,3),(4,4)},代入古典概率的求解公式可求(Ⅱ)设“取出的两个球上标号的数字之积能被3整除”为事件B,则B={(1,3),(3,1),(2,3),(3,2),(3,3),(3,4),(4,3)},代入古典概率的求解公式可求【解答】解:设从甲、乙两个盒子中各取1个球,其数字分别为x、y,用(x,y)表示抽取结果,则所有可能的结果有16种,即(1,1),(1,2),(1,3),(1,4),(2,1),(2,2),(2,3),(2,4),(3,1),(3,2),(3,3),(3,4),(4,1),(4,2),(4,3),(4,4)共16种结果,每种情况等可能出现.(Ⅰ)设“取出的两个球上的标号相同”为事件A,则A={(1,1),(2,2),(3,3),(4,4)}.事件A由4个基本事件组成,故所求概率.答:取出的两个球上的标号为相同数字的概率为.(Ⅱ)设“取出的两个球上标号的数字之积能被3整除”为事件B,则B={(1,3),(3,1),(2,3),(3,2),(3,3),(3,4),(4,3)}.事件B由7个基本事件组成,故所求概率.答:取出的两个球上标号之积能被3整除的概率为.【点评】本题主要考查了等可能事件的概率公式的应用,解题的关键是准确求出每种情况下事件的个数.9.【考点】古典概型及其概率计算公式;列举法计算基本事件数及事件发生的概率.【专题】计算题;应用题.【分析】根据题意,设用a、b、c分别表示3枚钥匙,其中a是房门钥匙,分析可得这个随机事件包含:abc、acb、bac、cab、bca、cba共6个基本事件;(Ⅰ)设用A表示事件“恰好第三次打开房门锁”,事件A包括bca、cba共两个基本事件,由古典概型计算公式,计算可得答案,(Ⅱ)用B表示事件“两次内打开房门锁”,分析可得事件B包含的基本事件数目,由古典概型计算公式,计算可得答案.【解答】解:设用a、b、c分别表示3枚钥匙,其中a是房门钥匙,则这个随机事件可看作是三枚钥匙的一个排序,它包含了:abc、acb、bac、cab、bca、cba共6个基本事件;(Ⅰ)设:用A表示事件“恰好第三次打开房门锁”,则事件A包括bca、cba共两个基本事件:;(Ⅱ)设:用B表示事件“两次内打开房门锁”,则事件B包含:abc、acb、bac、cab共4个基本事件:;答:恰好第三次打开房门锁的概率是,两次内打开的概率是.【点评】本题考查古典概型的计算,涉及列举法分析表示事件的基本事件,注意使用列举法时,要全面分析,按一定的顺序,做到不重不漏.10.【考点】古典概型及其概率计算公式.【专题】概率与统计.【分析】(Ⅰ)先判断出这是一个古典概型,所以求出基本事件总数,“至少参加一个社团”事件包含的基本事件个数,从而根据古典概型的概率计算公式计算即可;(Ⅱ)先求基本事件总数,即从这5名男同学和3名女同学中各随机选1人,有多少中选法,这个可利用分步计数原理求解,再求出“A1被选中,而B1未被选中”事件包含的基本事件个数,这个容易求解,然后根据古典概型的概率公式计算即可.【解答】解:(Ⅰ)设“至少参加一个社团”为事件A;从45名同学中任选一名有45种选法,∴基本事件数为45;通过列表可知事件A的基本事件数为8+2+5=15;这是一个古典概型,∴P(A)=;(Ⅱ)从5名男同学中任选一个有5种选法,从3名女同学中任选一名有3种选法;∴从这5名男同学和3名女同学中各随机选1人的选法有5×3=15,即基本事件总数为15;设“A1被选中,而B1未被选中”为事件B,显然事件B包含的基本事件数为2;这是一个古典概型,∴.【点评】考查古典概型的概念,以及古典概型的概率的求法,分步计数原理的应用.11.(I)被调查人答卷情况统计表:(II)∵由表格可以看出女生同意的概率是,男生同意的概率是,用男女生同意的概率乘以人数,得到同意的结果数(人)(III)设“同意”的两名学生编号为1,2,“不同意”的四名学生分别编号为3,4,5,6,选出两人则有(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(5,6)共15种方法;其中(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),8种满足题意,则恰有一人“同意”一人“不同意”的概率为.12.考点:古典概型及其概率计算公式;互斥事件与对立事件;等可能事件的概率.专题:概率与统计.分析:(1)由题意知本题是一个古典概型,通过列举得到实验的所有事件,而满足条件的事件是甲同学没有选中、自然小组的乙同学被选中,根据写出的所有结果数出满足条件的事件数.(2)由题意知本题是一个古典概型,通过列举得到实验的所有事件,而满足条件的事件是数学组的甲同学、自然小组的乙同学至少有一人不被选中的对立事件是“数学组的甲同学、自然小组的乙同学都被选中”,根据对立事件公式得到结果.解答:解:由题意知本题是一个古典概型,我们把数学小组的三位成员记作S1,S2,S3,自然小组的三位成员记作Z1,Z2,Z3,人文小组的三位成员记作R1,R2,R3,则基本事件是(S1,Z1,R1),(S1,Z1,R2),(S1,Z1, R3),(S1,Z2,R1),(S1,Z2,R2),(S1,Z2,R3),(S1,Z3,R1),(S1,Z3,R2),(S1,Z3,R3),然后把这9个基本事件中S1换成S2,S3又各得9个基本事件,故基本事件的总数是27个.以S1表示数学组中的甲同学、Z2表示自然小组的乙同学;(I)甲同学没有选中、自然小组的乙同学被选中所含有的基本事件是上述基本事件中不含S1、含有Z2的基本事件,即(S2,Z2,R1),(S2,Z2,R2),(S2,Z2,R3),(S3,Z2,R1),(S3,Z2,R2),(S3,Z2,R3)共6个基本事件,故所求的概率为;(II)“数学组的甲同学、自然小组的乙同学至少有一人不被选中”的对立事件是“数学组的甲同学、自然小组的乙同学都被选中”,这个事件所包含的基本事件是(S1,Z2,R1),(S1,Z2,R2),(S1,Z2,R3),共3个基本事件,这个事件的概率是.根据对立事件的概率计算方法,所求的概率是.点评:本题严格按照大纲的要求来解古典概型的问题,即用列举法写出试验发生时的所有事件数和满足条件的事件数,是一个典型的问题,本题容易出错.。
专题01 统计案例高二数学(文)下学期期中专项复习(人教A版选修1-2+4-4+4-5)(解析版)
专题01统计案例【专项训练】-2020-2021学年高二数学下学期期中专项复习一、单选题1.(2021·全国高二课时练习)若由一个22K=,那么有()把握认⨯列联表中的数据计算得2 4.013为两个变量有关系.A.95%B.97.5%C.99%D.99.9%【答案】A【分析】K=与所给表格中临界值比较即可.将2 4.013【详解】∵由22K=,且4.013>3.841,⨯列联表中的数据计算得2 4.013∴有95%的把握认为这两个变量有关系.故选:A2.(2021·全国高二课时练习)为了调查中学生近视情况,某校150名男生中有80名近视,140名女生中有70名近视,在检验这些中学生眼睛近视是否与性别有关时,用什么方法最有说服力()A.平均数B.方差C.回归分析D.独立性检验【答案】D【分析】这是一个独立性检验应用题,处理本题时要注意根据已知构建方程计算出表格中男性近视与女性近视K的计算公式,计算出2K的值,并与临界值中进的人数,并填入表格的相应位置.根据列联表,及2行比较,不难得到答案.【详解】分析已知条件,得如下表格.根据列联表利用公式可得2K 的值,再与临界值比较,检验这些中学生眼睛近视是否与性别有关, 故利用独立性检验的方法最有说服力. 故选:D .3.(2021·全国高二课时练习)对两个变量x 、y 进行线性相关检验,得线性相关系数10.7859r =,对两个变量u 、v 进行线性相关检验,得线性相关系数20.9568r =-,则下列判断正确的是( ) A .变量x 与y 正相关,变量u 与v 负相关,变量x 与y 的线性相关性较强 B .变量x 与y 负相关,变量u 与v 正相关,变量x 与y 的线性相关性较强 C .变量x 与y 正相关,变量u 与v 负相关,变量u 与v 的线性相关性较强 D .变量x 与y 负相关,变量u 与v 正相关,变量u 与v 的线性相关性较强 【答案】C 【分析】根据相关系数的符号决定两个变量的正相关、负相关,以及相关系数绝对值越大,两个变量的线性相关性越强,进而可得出结论. 【详解】由线性相关系数10.78590r =>知x 与y 正相关, 由线性相关系数20.95680r =-<知u 与v 负相关,又12r r <,所以,变量u 与v 的线性相关性比x 与y 的线性相关性强, 故选:C.4.(2020·四川省阆中东风中学校高二月考(文))回归系数R 越大,则样本的残差平方和( ) A .越大 B .越小C .可能大有可能小D .以上都不正确【答案】B 【分析】由回归系数越大,模型拟合度越高可分析得到结果.【详解】回归系数R越大,说明模型拟合度越高,则残差越小,残差平方和也越小.故选:B.5.(2020·麻城市第二中学高二月考)下列说法正确的是()r>时,表明变量x和y正相关;①当相关系数0②用相关系数r来衡量两个变量之间线性关系的强弱时,r越接近于1,相关性越弱;,x y;③回归直线过样本点的中心()④若回归方程为0.8585.71=-,则当x=170时,y的值必为58.79.y xA.①②B.①③④C.①②③D.①③【答案】D【分析】①由相关系数的意义判断;②由相关系数r越接近于1,相关性越强判断;③由回归分析的特点判断;④当x=170时,由y的值为预测值判断.【详解】r>时,表明变量x和y正相关,故正确;①由相关系数的意义知:当相关系数0②用相关系数r来衡量两个变量之间线性关系的强弱时,r越接近于1,相关性越强,故错误;,x y,故正确;③回归直线过样本点的中心()④若回归方程为0.8585.71=-,则当x=170时,y的预测值为58.79,故错误;y x故选:D6.(2018·安庆市第七中学高二期中(理))下面的散点图与相关系数r一定不符合的是()A.①②③B.①②④C.①③④D.②③④【答案】C 【分析】根据散点图与相关系数直接的关系,逐项判断,即可得出结果. 【详解】①中,由散点图可得,两相关变量呈负相关,故①错;②中,由散点图可得,两相关变量呈正相关,且相关系数可能是0.75r;③中,若相关系数1r =-,则所有的点应该分布在一条直线上,散点图显然不符合,故③错; ④中,若相关系数1r =,则所有的点应该分布在一条直线上,散点图显然不符合,故④错; 故选:C.7.(2020·河南南阳市·南阳华龙高级中学高二月考(文))在一组样本数据()11,x y ,()22,x y ,…,(),n n x y (2n ≥,1x ,2x ,……,n x 不全相等)的散点图中,若所有样本点()(),1,2,,i i x y i n =⋅⋅⋅都在直线215y x =+上,则这组样本数据的样本相关系数为( ) A .-1 B .0C .12D .1【答案】D 【分析】根据相关系数的概念直接判断. 【详解】因为所有样本点()(),1,2,,i i x y i n =⋅⋅⋅都在直线215y x =+上,所以这组样本数据的样本相关系数为1, 故选:D 【点睛】本题考查相关系数的含义,考查基本分析判断能力,属基础题.8.(2020·全国高二课时练习)红铃虫是棉花的主要害虫之一,一只红铃虫的产卵数和温度有关.现收集了7组观侧数据.用4种模型分别进行拟合.由此得到相应的回归方程并进行残差分析,进一步得到如图4幅残差图,根据残差图,拟合效果最好的模型是( )A .模型一B .模型二C .模型三D .模型四【答案】D 【分析】利用残差点分布的带状区域越窄,拟合精度越好, 拟合效果越好即可选出答案. 【详解】当残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适, 这样的带状区域的宽度越窄,说明拟合精度越好,拟合效果越好, 对比4个残差图,可知模型四的图对应的带状区域的宽度最窄. 故选:D . 【点睛】本题主要考查了回归分析中的误差分析,要注意残差图的含义,属于基础题.9.(2020·重庆高二期末)在研究某地区高中学生体重与身高间的相关关系的过程中,不会使用到的统计方法是( ) A .随机抽样 B .散点图C .回归分析D .独立性检验【答案】D 【分析】由于独立性检验研究的是两个分类变量间的关系,所以即可得到答案. 【详解】因为已经确定了某地区高中学生体重与身高间具有相关关系,所以不会使用到的统计方法是独立性检验. 故选:D 【点睛】此是考查几种统计方法的区别,属于基础题.10.(2020·全国高二课时练习)在一组样本数据()()()1122,,,,,,n n x y x y x y (2n ≥,12,,,n x x x 不全相等)的散点图中,若所有样本点()(),1,2,,i i x y i n =都在直线115y x =+上,则这组样本数据的样本相关系数为( ) A .1- B .1C .15-D .15【答案】B 【分析】根据样本数据的所有样本点都在一条直线上,得出这组样本数据完全相关,再根据直线的斜率得出是正相关还是负相关即可. 【详解】 解:这组样本数据的所有样本点()(),1,2,,i i x y i n =都在直线115y x =+上,∴这组样本数据完全相关,即说明这组数据的样本完全正相关,其相关系数是1. 故选:B. 【点睛】本题考查变量的正负相减,一般在散点图中,所有点都在一条斜率为正的直线,则这两个变量正相关,如果所有点在一条斜率为负的直线附近,则这两个变量呈负相关. 二、填空题11.(2021·全国高二课时练习)在吸烟与患肺癌这两个分类变量的独立性检验的计算中,下列说法正确的是________.(填序号)①若2K 的观测值为 6.635k =,在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系,那么在100个吸烟的人中必有99人患有肺癌;②由独立性检验可知,在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系时,我们说某人吸烟,那么他有99%的可能患有肺癌;③若从统计量中求出在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系,是指有1%的可能性使得判断出现错误 【答案】③ 【分析】根据独立性检验的基本思想可得出结论. 【详解】若从统计量中求出在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系,是指有1%的可能性使得判断出现错误,故③正确. 故答案为:③.12.(2020·山东)如图是具有相关关系的两个变量的一组数据的散点图和回归直线,若去掉一个点使得余下的5个点所对应的数据的相关系数最大,则应当去掉的点是__________.【答案】E . 【解析】分析:由于点越靠近回归直线,则相关性越强,相关系数越大,又由于点E 到回归直线的距离最大,所以要去掉点E.详解:由于点E 到回归直线的距离最大,所以去掉点E 后,剩下的5个点对应的相关系数会最大.点睛:(1)本题主要考查回归直线方程和相关系数,意在考查学生对这些基础知识的掌握水平.(2) 两个变量之间线性相关关系的强弱用相关系数r 来衡量.相关系数12211()()()()niii nni i i i x x y y r x x y y ===--=--∑∑∑ 0r >,表示两个变量正相关;0r <,表示两个变量负相关;r 的绝对值越接近1,表明两个变量的线性相关性越强.r 的绝对值越接近0,表明两个变量之间几乎不存在线性相关关系.通常,r 的绝对值大于0.75时,表明两个变量的线性相关性很强.13.(2020·夏县第二中学高二期末)某种产品的广告费支出x 与销售额y (单位:万元)之间的关系如下表: x 2 4 5 6 8 y30406050 70y 与x 的线性回归方程为 6.517.5y x =+,当广告支出5万元时,随机误差的残差为________.【答案】10 【分析】先由回归直线方程,求出5x =对应的预测值,再由残差的概念,即可得出结果. 【详解】由题意,当5x =时, 6.5517.550y =⨯+=, 因此其残差为605010y y -=-=. 故答案为:10. 【点睛】本题主要考查残差的计算,属于基础题型. 三、解答题14.(2021·河南高二月考(文))某班主任对全班50名学生的学习积极性和对待班级工作的态度进行了调查,得出以下22⨯列联表:如果随机抽查该班的一名学生,那么抽到积极参加班级工作的学生的概率是1225. (1)求a ,b ,c ,d 的值.(2)试运用独立性检验的思想方法分析:能否有99.9%的把握认为学生的学习积极性与对待班级工作的态度有关系?并说明理由.参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:【答案】(1)6a =,19b =,24c =,26d =;(2)有. 【分析】(1)由抽到积极参加班级工作的学生的概率是1225,可求出c 的值,然后根据表中的数据可求出,,a b d 的值;(2)直接利用22()()()()()n ad bc K a b c d a c b d -=++++公式求解,然后根临界值表判断即可【详解】解:(1)积极参加班级工作的学生有c 人,总人数为50, 由抽到积极参加班级工作的学生的概率1125025c P ==, 解得24c =,所以6a =.所以2525619b a =-=-=,50502426d c =-=-=.(2)由列联表知,2250(181967)11.53825252426K ⨯⨯-⨯=≈⨯⨯⨯,由11.53810.828>,可得有99.9%的把握认为学生的学习积极性与对待班级工作的态度有关系. 15.(2020·河南驻马店市·高一期末(文))这次新冠肺炎疫情,是新中国成立以来在我国发生的传播速度最快、感染范围最广防控难度最大的一次重大突发公共卫生事件.中华民族历史上经历过很多磨难,但从来没有被压垮过,而是愈挫愈勇,不断在磨难中成长,从磨难中奋起.在这次疫情中,全国人民展现出既有责任担当之勇、又有科学防控之智,某市某校学生也运用数学知识展开了对这次疫情的研究,一名同学在疫情初期数据统计中发现,从2020年2月1日至2月7日期间,日期x 和全国累计报告确诊病例数量y (单位:万人)之间的关系如下表:(1)根据表中的数据,y a bx =+适宜作为确诊病例数量y 关于日期x 的回归方程类型,请求出此线性回归方程;(精确到0.01)(2)预测2月16日全国累计报告确诊病例数.(精确到0.01) 参考数据:①7116.9ii y==∑;②7177.5i i i x y ==∑.其中,1231ni n i a a a a a ==++++∑.参考公式:对于一组数据()11,u v ,()22,u v ,…,(),n n u v 其回归方程v u αβ=+中斜率和截距的最小二乘估计公式分别为:①()()()1122211n ni i ii i i nniii i u v nuv uu v vunuuuβ====---==--∑∑∑∑,②v u αβ=-.【答案】(1)0.351y x =+;(2)6.6万人. 【分析】(1)根据表中的数据先求出x ,y , 再结合公式求出a b ,的值,从而可得线性回归方程; (2)把16x =代入回归方程中可得结果. 【详解】 解:(1)由已知数据得:4x =,16.92.4147y =≈, ∴()71721777.574 2.4140.3549410149i ii i i x y x yb x x==--⨯⨯==≈++++++-∑∑,2.4140.35440.998a y bx =-⨯≈=-,所以,y 关于x 的回归方程为:0.351y x =+;(2)把16x =代入回归方程得:0.35161 6.6y =⨯+=, 所以预测2月16日全国累计报告确诊病例数为6.6万人. 【点睛】此题考查了线性回归方程,最小二乘法等知识,考查数学运算能力,属于基础题.16.(2018·湖南长沙市·长郡中学高三其他模拟(文))长沙某公司对其主推产品在过去5个月的月广告投入x i (百万元)和相应的销售额y i (百万元)进行了统计,其中i =1,2,3,4,5,对所得数据进行整理,绘制散点图并计算出一些统计量如下:51 6.8i i x==∑,5110.3i i w ==∑,5115.8i i y ==∑,5122.76i i i x y ==∑,5134.15i i i w y ==∑, ()5210.46ii x x =-=∑,()521 3.56i i w w =-=∑,其中2i i w x =,i =1,2,3,4,5. (Ⅰ)根据散点图判断,y bx a =+与2y cx d =+哪一个适宜作为月销售额关于月广告投入x i 的回归方程类型?(给出判断即可,不必说明理由)(Ⅱ)根据(Ⅰ)的判断结果及题中所给数据,建立y 关于x 的回归方程,并据此估计月广告投入220万元时的月销售额.附:对于一组数据()()()1122,,,,,,n n u v u v u v ⋯,其回归直线v u αβ=+的斜率和截距的最小二乘估计分别为:()()()121n i i i n ii u u v v u u β∧==--=-∑∑,v u αβ∧∧=-. 【答案】(Ⅰ)2y cx d =+更适宜作为月销售额关于月广告投入的回归方程;(Ⅱ)月广告投入220万元时的月销售额为21782.233万元.【分析】(1)根据散点图选择2y cx d =+作为回归方程.(2)利用公式及所给数据计算回归方程后可估计月销售额.【详解】(1)根据散点图选择2y cx d =+作为回归方程.(2)令2w x =,则()5152110.315.8534.155550.453.5ˆ6i ii i i w y w y c w w ==-⨯-⨯⨯===-∑∑,15.8ˆ10.30.450.45 2.23355d y w =-⨯=-⨯=, 故回归方程为20.45 2.233y x =+,当月广告投入为220万元时,月销售额为20.45220 2.23321782.233y =⨯+≈(万元).答:选择2y cx d =+作为回归方程,当月广告投入为220万元时,月销售额约21782.233(万元). 【点睛】回归分析中,回归方程类型的确定是关键,应根据散点图的特征选择合适的拟合函数(要熟悉常见函数的图像).。
高中数学 第三章 统计案例学业质量标准检测练习(含解析)新人教A版高二选修2-3数学试题
第三章 学业质量标准检测时间120分钟,满分150分.一、单项选择题(本大题共8个小题,每小题5分,共40分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.下列说法中错误的是( B )A .如果变量x 与y 之间存在着线性相关关系,则我们根据试验数据得到的点(x i ,y i )(i =1,2,…,n )将散布在某一条直线的附近B .如果两个变量x 与y 之间不存在着线性关系,那么根据它们的一组数据(x i ,y i )(i =1,2,…,n )不能写出一个线性方程C .设x ,y 是具有相关关系的两个变量,且y 关于x 的线性回归方程为y ^=b ^x +a ^,b ^叫做回归系数D .为使求出的线性回归方程有意义,可用统计检验的方法来判断变量y 与x 之间是否存在线性相关关系[解析] 任何一组(x i ,y i )(i =1,2,…,n )都能写出一个线性方程,只是有的无意义. 2.(2020·四川模拟)为了解某高校学生使用手机支付和现金支付的情况,抽取了部分学生作为样本,统计其喜欢的支付方式,并制作出如下等高条形图:根据图中的信息,下列结论中不正确的是( D ) A .样本中的男生数量多于女生数量B .样本中喜欢手机支付的数量多于现金支付的数量C .样本中多数男生喜欢手机支付D .样本中多数女生喜欢现金支付[解析] 由左图知,样本中的男生数量多于女生数量,A 正确; 由右图知样本中喜欢手机支付的数量多于现金支付的数量,B 正确; 由右图知,样本中多数男生喜欢手机支付,C 正确;由右图知样本中女生喜欢现金支付人数比手机支付人数少,D 错误. 故选D .3.对两个变量x ,y 进行线性相关检验,得线性相关系数r 1=0.785 9,对两个变量u ,v 进行线性相关检验,得线性相关系数r 2=-0.956 8,则下列判断正确的是( C )A .变量x 与y 正相关,变量u 与v 负相关,变量x 与y 的线性相关性较强B .变量x 与y 负相关,变量u 与v 正相关,变量x 与y 的线性相关性较强C .变量x 与y 正相关,变量u 与v 负相关,变量u 与v 的线性相关性较强D .变量x 与y 负相关,变量u 与v 正相关,变量u 与v 的线性相关性较强 [解析] 由线性相关系数r 1=0.785 9>0,知x 与y 正相关, 由线性相关系数r 2=-0.956 8<0知u 与v 负相关, 又|r 1|<|r 2|,∴变量u 与v 的线性相关性比x 与y 的线性相关性强.故选C . 4.下表是某厂1~4月份用水量(单位:百吨)的一组数据:由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归方程是y ^=-0.7x +a ^,则a ^等于( D )A .10.5B .5.15C .5.2D .5.25[解析] 样本点的中心为(2.5,3.5),将其代入线性回归方程可解得a ^=5.25. 5.设有一个线性回归方程为y ^=-2+10x ,则变量x 增加一个单位时( B ) A .y 平均减少2个单位 B .y 平均增加10个单位 C .y 平均增加8个单位D .y 平均减少10个单位[解析] 10是斜率的估计值,说明x 每增加一个单位时,y 平均增加10个单位. 6.为了解疾病A 是否与性别有关,在一医院随机地对入院的50人进行了问卷调查得到了如下的列联表:请计算出统计量K 2,你有多大的把握认为疾病A 与性别有关( C ) 下面的临界值表供参考:A .95%B .99%C .99.5%D .99.9%[解析] 由公式得K 2=50×20×15-5×10225×25×30×20≈8.333>7.879,故有1-0.005=99.5%的把握认为疾病A 与性别有关.7.已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( A )A .y ^=0.4x +2.3 B .y ^=2x -2.4 C .y ^=-2x +9.5D .y ^=-0.3x +4.4[解析] 因为变量x 和y 正相关,则回归直线的斜率为正,故可以排除选项C 和D .因为样本点的中心在回归直线上,把点(3,3.5)的坐标分别代入选项A 和B 中的直线方程进行检验,可以排除B ,故选A .8.某汽车的使用年数x 与所支出的维修总费用y 的统计数据如下表:使用年数x /年 1 2 3 4 5 维修总费用y /万元0.51.22.23.34.5根据上表可得y 关于x 的线性回归方程y =b ^x -0.69,若该汽车维修总费用超过10万元就不再维修,直接报废,据此模型预测该汽车最多可使用(不足1年按1年计算)( D )A .8年B .9年C .10年D .11年[解析] 由y 关于x 的线性回归直线y ^=b ^x -0.69过样本点的中心(3,2.34),得b ^=1.01,即线性回归方程为y ^=1.01x -0.69,由y ^=1.01x -0.69=10得x ≈10.6,所以预测该汽车最多可使用11年,故选D .二、多项选择题(本大题共4个小题,每小题5分,共20分,在每小题给出的四个选项中,有多项符合题目要求.全部选对的得5分,部分选对的得3分,有选错的得0分)9.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论,其中结论一定不正确的是( AD )A .y 与x 负相关且y ^=2.347x -6.423 B .y 与x 负相关且y ^=-3.476x +5.648 C .y 与x 正相关且y ^=5.437x +8.493 D .y 与x 正相关且y ^=-4.326x -4.578[解析] y 与x 正(或负)相关时,线性回归直线方程y =b ^x +a ^中,x 的系数F >0(或b ^<0),故选AD .10.以下关于线性回归的判断,正确的是( BCD )A .若散点图中所有点都在一条直线附近,则这条直线为回归直线B .散点图中的绝大多数都线性相关,个别特殊点不影响线性回归,如图中的A ,B ,C 三点C .已知回归直线方程为y ^=0.50x -0.81,则x =25时,y 的估计值为11.69 D .回归直线方程的意义是它反映了样本整体的变化趋势[解析] 能使所有数据点都在它附近的直线不止一条,而根据回归直线的定义知,只有按最小二乘法求得回归系数a ^,b ^得到的直线y ^=b ^x +a ^才是回归直线,∴A 不对,B 正确;将x =25代入y ^=0.50x -0.81,得y ^=11.69, ∴C 正确;D 正确,故选BCD .11.经过对χ2的统计量的研究,得到了若干个临界值,当χ2>3.841时,我们( AD ) A .在犯错误的概率不超过0.05的前提下可认为A 与B 有关 B .在犯错误的概率不超过0.05的前提下可认为A 与B 无关 C .有99%的把握说A 与B 有关 D .有95%的把握说A 与B 有关[解析] 由于χ2>3.841,所以P (χ2>3.841)=0.05,则我们认为在犯错误的概率不超过0.05的前提下可认为A 与B 有关,有95%的把握说A 与B 有关.故选AD .12.已知x ,y 是两个变量,下列四个关系中,x ,y 不是负相关的是( ABC ) A .y =x 2-1 B .y =-x 2+1C .y =x -1D .y =-x +1[解析] 根据题意,依次分析选项:对于A ,y =x 2-1,当x 增大时,y 的值不一定减小,两个变量不是负相关,符合题意; 对于B ,y =-x 2-1,当x 增大时,y 的值不一定减小,两个变量不是负相关,符合题意; 对于C ,y =x -1,当x 增大时,y 的值一定增大,两个变量正相关,符合题意; 对于D ,y =-x +1,当x 增大时,y 的值一定减小,两个变量负相关,不符合题意. 三、填空题(本大题共4个小题,每小题5分,共20分,把正确答案填在题中横线上)13.已知一个回归直线方程为y ^=1.5x +45,x ∈{1,7,5,13,19},则y =__58.5__. [解析] 因为x =15(1+7+5+13+19)=9,且y =1.5x +45,所以y =1.5×9+45=58.5.本题易错之处是根据x 的值及y ^=1.5x +45求出y 的值再求y ,由y ^=1.5x +45求得的y 值不是原始数据,故错误.14.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到2×2列联系:理科 文科 总计 男 13 10 23 女 7 20 27 总计203050已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025. 根据表中数据,得到K 2=50×13×20-10×7223×27×20×30≈4.844,则认为选修文理科与性别有关系出错的可能性约为__5%__.[解析] 由K 2=4.844>3.841,故认为选修文理科与性别有关系出错的可能性约为5%. 15.给出下列命题:①样本方差反映了所有样本数据与样本平均值的偏离程度;②若随机变量X ~N (0.43,0.182),则此正态曲线在x =0.43处达到峰值; ③在回归分析模型中,残差平方和越小,说明模型的拟合效果越差;④市政府调查江北水城市民收入与市民旅游欲望的关系时,抽查了 3 000人.经过计算得K 2=6.023,根据这一数据查阅下表,则市政府有97.5%以上的把握认为市民收入与旅游欲望有关系.P (K 2≥k 0)… 0.25 0.15 0.10 0.025 0.010 0.005 0.001 k 0…1.3232.0722.7065.0246.6357.87910.828其中正确的命题是__①②④__.[解析] 根据样本方差的概念、正态分布的概念可知①②均正确;在回归分析中,残差的平方和越小,说明模型的拟合效果越好,即X 与Y 有很强的关系,所以③不正确;通过表中的数据和K 2=6.023>5.024可知,可以认为有97.5%以上的把握认为市民收入与旅游欲望有关系,因此④正确.16.某市居民2015~2019年家庭年平均收入x (单位:万元)与年平均支出Y (单位:万元)的统计资料如下表所示:根据统计资料,居民家庭平均收入的中位数是__13__,家庭年平均收入与年平均支出有__正__线性相关关系.[解析] 中位数的定义的考查,奇数个时按大小顺序排列后中间一个是中位数,而偶数个时须取中间两数的平均数.由统计资料可以看出,当平均收入增多时,年平均支出也增多,因此两者之间具有正线性相关关系.四、解答题(本大题共6个大题,共70分,解答应写出文字说明,证明过程或演算步骤) 17.(本题满分10分)改革开放以来,我国高等教育事业有了迅速发展,有人记录了某村2006到2016年10年间每年考入大学人数所占该年参加高考总人数的百分比,为了便于计算,把2006年编号为0,2007年编号为1,…,2016年编号为10.如果把每年考入大学人数占该年参加高考总人数的百分比作为因变量,把年份从0到10作为自变量进行回归分析,可得到下面三条回归直线:农村y ^=0.42x +1.80; 县镇y ^=2.32x +6.76; 城市y ^=2.84x +9.50.(1)对于农村青年来讲,系数等于0.42意味着什么?(2)在这10年间,农村、县镇和城市哪一个的大学入学率增长最快? (3)预测2020年县镇的入学率是多少?[解析] (1)0.42是回归直线的斜率,意味着对于农村考生,每年的入学率平均增长0.42%.(2)城市对应回归直线的斜率最大,所以城市的年入学率增长最快. (3)y =2.32×14+6.76=39.24,故2020年县镇的入学率为39.24%.18.(本题满分12分)(2020·青岛高二检测)电视传媒公司为了解某地区观众对某体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名,下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.(1)根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?非体育迷体育迷合计男女合计(2)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.附:K2=n ad-bc2a+b c+d a+c b+dP(K2≥k0)0.050.01k0 3.841 6.635[解析](1)由频率分布直方图可知,在抽取的100人中,“体育迷”为25人,从而完成2×2列联表如下:非体育迷体育迷合计男301545女451055合计7525100 将2×2列联表中的数据代入公式计算,得K2=n ad-bc2a+b c+d a+c b+d=100×30×10-45×15275×25×45×55=10033≈3.030.因为3.030<3.841,所以我们没有理由认为“体育迷”与性别有关.(2)由频率分布直方图可知,“超级体育迷”为5人,从而一切可能结果所组成的集合为Ω={(a1,a2),(a1,a3),(a2,a3),(a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a 3,b 2),(b 1,b 2)}其中a i 表示男性,i =1,2,3,b j 表示女性,j =1,2.Ω由10个基本事件组成,而且这些基本事件的出现是等可能的.用A 表示“任选2人中,至少有1人是女性”这一事件,则A ={(a 1,b 1),(a 1,b 2),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2),(b 1,b 2)},事件A 由7个基本事件组成,因而P (A )=710.19.(本题满分12分)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程y =b x +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)[解析] (1)x =8+8.2+8.4+8.6+8.8+96=8.5,y =16(90+84+83+80+75+68)=80.∵b ^=-20,a ^=y -b ^x , ∴a ^=80+20×8.5=250, ∴回归直线方程y ^=-20x +250.(2)设工厂获得的利润为L 元,则L =x (-20x +250)-4(-20x +250)=-20⎝⎛⎭⎪⎫x -3342+361.25,∴该产品的单价应定为334元,工厂获得的利润最大.20.(本题满分12分)为考查某种药物预防疾病的效果,进行动物试验,得到如下丢失数据的列联表:2只,未患病数为η,工作人员曾计算过P (ξ=0)=389P (η=0).(1)求出列联表中数据x 、y 、M 、N 的值;(2)求ξ与η的均值(期望)并比较大小,请解释所得结论的实际含义; (3)能够以99%的把握认为药物有效吗? 参考公式:K 2=n ad -bc 2a +bc +d a +cb +d.①当K 2≥3.841时有95%的把握认为ξ、η有关联; ②当K 2≥6.635时有99%的把握认为ξ、η有关联. [解析] (1)∵P (ξ=0)=C 220C 250,P (η=0)=C 2xC 250,∴C 220C 250=389×C 2xC 250,∴x =10. ∴y =40,∴M =30,N =70. (2)ξ取值为0、1、2.P (ξ=0)=C 220C 250=38245,P (ξ=1)=C 120C 130C 250=120245,P (ξ=2)=C 230C 250=87245.ξ 0 1 2 P3824512024587245∴E (ξ)=294245.P (η=0)=C 210C 250=9245.P (η=1)=C 110C 140C 250=80245.P (η=2)=C 240C 250=156245.η 0 1 2 P924580245156245∴E (η)=392245.∴E (ξ)<E (η),即说明药物有效.(3)∵K 2=100×800-300230×70×50×50≈4.76.∵4.76<6.635,∴不能够以99%的把握认为药物有效.21.(本题满分12分)(2020·全国卷Ⅲ)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次空气质量等级[0,200] (200,400](400,600]1(优) 2 16 25 2(良) 5 10 12 3(轻度污染) 6 7 8 4(中度污染)72(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次≤400人次>400空气质量好 空气质量不好附:K 2=n ad -bc 2a +bc +d a +c b +d, P (K 2≥k )0.050 0.010 0.001 k3.8416.63510.828[解析] (1)由频数分布表可知,该市一天的空气质量等级为1的概率为2+16+25100=0.43,等级为2的概率为5+10+12100=0.27,等级为3的概率为6+7+8100=0.21,等级为4的概率为7+2+0100=0.09.(2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为100×20+300×35+500×45100=350.(3) 列联表如下:人次≤400人次>400 空气质量好 33 37 空气质量不好228K 2=100×33×8-37×22255×45×70×30≈5.820>3.841,因此,有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关. 22.(本题满分12分)为了调查学生星期天晚上学习时间利用问题,某校从高二年级1 000名学生(其中走读生450名,住宿生550名)中,采用分层抽样的方法抽取n 名学生进行问卷调查.根据问卷取得了这n 名同学每天晚上学习时间(单位:分钟)的数据,按照以下区间分为八组①[0,30),②[30,60),③[60,90),④[90,120),⑤[120,150),⑥[150,180),⑦[180,210),⑧[210,240],得到频率分布直方图如图.已知抽取的学生中星期天晚上学习时间少于60分钟的人数为5人.(1)求n 的值并补全频率分布直方图;(2)如果把“学生晚上学习时间达到两小时”作为是否充分利用时间的标准,对抽取的n 名学生,完成下列2×2列联表:利用时间充分利用时间不充分总计 走读生住宿生10 总计据此资料,你是否认为学生“利用时间是否充分”与走读、住宿有关?(3)若在第①组、第②组、第⑧组中共抽出3人调查影响有效利用时间的原因,记抽到“学习时间少于60分钟”的学生人数为X ,求X 的分布列及期望.参考公式:K 2=n ad -bc 2a +bc +d a +cb +d[解析] (1)设第i 组的频率为P i (i =1,2,…,8),由图可知:P 1=11500×30=2100, P 2=11000×30=3100∴学习时间少于60分钟的频率为P 1+P 2=120由题意:n ×120=5,∴n =100.又P 3=1375×30=8100, P 5=1100×30=30100, P 6=1120×30=25100, P 7=1200×30=15100, P 8=1600×30=5100, ∴P 4=1-(P 1+P 2+P 3+P 5+P 6+P 7+P 8)=325.∴第④组的高度为:h =325×130=1250.频率分布直方图如图:(2)由频率分布直方图可知,在抽取的100人中,“走读生”有45人,“住宿生”有55人,其中“住宿生”中利用时间不充分的有10人, 从而走读生中利用时间不充分的有25-10=15人,利用时间充分的有45-15=30人,由此可得2×2列联表如下:利用时间充分利用时间不充分总计 走读生 30 15 45 住宿生 45 10 55 总计7525100将2×2列联表中的数据代入公式计算,得K 2=n ad -bc 2a +bc +d a +cb +d=100×30×10-45×15275×25×45×55=10033≈3.030, 因为3.030<3.841,所以没有理由认为学生“利用时间是否充分”与走读、住宿有关. (3)由(1)知:第①组2人,第②组3人,第⑧组5人,总计10人,则X 的所有可能取值为0,1,2,3,P (X =i )=C i 5C 3-i5C 310(i =0,1,2,3),∴P (X =0)=C 05C 35C 310=10120=112,P (X =1)=C 15C 25C 310=50120=512,P (X =2)=C 25C 15C 310=50120=512,P (X =3)=C 35C 05C 310=10120=112,∴X 的分布列为:X 0 1 2 3 P112512512112∴E (X )=0×112+1×512+2×512+3×112=1812=32.(或由超几何分布的期望计算公式E (X )=n ×M N =3×510=32)。
高三数学二轮复习(文科数学)统计与统计案例专题卷(全国通用)(8)
⾼三数学⼆轮复习(⽂科数学)统计与统计案例专题卷(全国通⽤)(8)统计与统计案例A组基础题组时间:35分钟分值:60分1.(2017⼴西三市联考)在如图所⽰⼀组数据的茎叶图中,有⼀个数字被污染后模糊不清,但曾计算得该组数据的极差与中位数之和为61,则被污染的数字为()A.1B.2C.3D.42.某公司有⼀批专业技术⼈员,对他们进⾏年龄状况和接受教育程度(学历)的调查,其结果(⼈数分布)如下表:在这个公司的专业技术⼈员中按年龄状况⽤分层抽样的⽅法抽取N个⼈,其中35岁以下48⼈,50岁以上10⼈,再从这N个⼈中随机抽取出1⼈,此⼈的年龄为50岁以上的概率为,则的值为( )A. B.4 C. D.83.(2017湖北七市(州)联考)⼴告投⼊对商品的销售额有较⼤影响.某电商对连续5个年度的⼴告费x 和销售额y进⾏统计,得到统计数据如下表(单位:万元):由上表可得回归⽅程为=10.2x+,据此模型,预测⼴告费为10万元时销售额约为A.101.2万元 B.108.8万元 C.111.2万元 D.118.2万元4.某中学⾼中部有300名学⽣.为了研究学⽣的周平均学习时间,从中抽取60名学⽣,先统计了他们某学期的周平均学习时间(单位:⼩时),再将学⽣的周平均学习时间分成5组:[40,50),[50,60),[60,70),[70,80),[80,90],并加以统计,得到如图所⽰的频率分布直⽅图,则⾼中部学⽣的周平均学习时间为(同⼀组中的数据⽤该组区间的中点值代表)()A.63.5⼩时B.62.5⼩时C.63⼩时D.60⼩时5.总体由编号为01,02,…,19,20的20个个体组成.利⽤下⾯的随机数表选取5个个体,选取⽅法是从随机数表第1⾏的第5列和第6列数字由左到右依次选取两个数字,则选出的第5个个体的编号为 .6.(2017陕西宝鸡质量检测(⼀))对⼀批产品的长度(单位:毫⽶)进⾏抽样检测,样本容量为200,如图为检测结果的频率分布直⽅图.根据产品标准,单件产品长度在区间[25,30)的为⼀等品,在区间[20,25)和[30,35)的为⼆等品,其余均为三等品,则该样本中三等品的件数为 .7.(2017湖南长沙模拟)空⽓质量指数(Air Quality Index,简称AQI)是定量描述空⽓质量状况的指数,空⽓质量按照AQI ⼤⼩分为六级,0~50为优;51~100为良;101~150为轻度污染;151~200为中度污染;201~300为重度污染;⼤于300为严重污染.从某地⼀环保⼈⼠某年的AQI 记录数据中,随机抽取10个,⽤茎叶图记录如下.根据该统计数据,估计此地该年AQI ⼤于100的天数约为 .(该年为365天)8.(2017福建福州五校第⼆次联考)为了参加某数学竞赛,某⾼级中学对⾼⼆年级理、⽂两个数学兴趣⼩组的同学进⾏了赛前模拟测试,成绩(单位:分)记录如下. 理 :79,81,81,79,94,92,85,89 ⽂ :94,80,90,81,73,84,90,80(1)画出理、⽂两组同学成绩的茎叶图;(2)计算理、⽂两组同学成绩的平均值和⽅差,并从统计学的⾓度分析,哪组同学在此次模拟测试中发挥⽐较好;(3)若在成绩不低于90分的同学中随机抽出3⼈进⾏培训,求抽出的3⼈中既有理组同学⼜有⽂组同学的概率.(参考公式:样本数据x 1,x 2,…,x n 的⽅差:s 2=[(x 1-)2+(x 2-)2+…+(x n-)2],其中为样本平均数)9.(2017河南郑州质量预测(⼀))近年郑州空⽓污染较为严重,现随机抽取⼀年(365天)内100天的空⽓中PM2.5指数的检测数据,统计结果如下表:记某企业每天由空⽓污染造成的经济损失为S(单位:元),PM2.5指数为x.当x 在区间[0,100]内时对企业没有造成经济损失;当x 在区间(100,300]内时对企业造成的经济损失成直线模型(当PM2.5指数为150时造成的经济损失为500元,当PM2.5指数为200时,造成的经济损失为700元);当PM2.5指数⼤于300时造成的经济损失为2 000元.(1)试写出S(x)的表达式;(2)试估计在本年内随机抽取⼀天,该天经济损失S ⼤于500元且不超过900元的概率;(3)若本次抽取的样本数据有30天是在供暖季,其中有8天为重度污染,完成下⾯列联表,并判断是否有95 的把握认为郑州市本年度空⽓重度污染与供暖有关.附:K 2=,其中n=a+b+c+d.B组提升题组时间:25分钟分值:35分1.(2017⼭东理,5,5分)为了研究某班学⽣的脚长x(单位:厘⽶)和⾝⾼y(单位:厘⽶)的关系,从该班随机抽取10名学⽣,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线⽅程为=x+.已知xi=225,yi=1 600,=4.该班某学⽣的脚长为24,据此估计其⾝⾼为( )A.160B.163C.166D.1702.(2017四川成都第⼆次诊断性检测)在⼀个容量为5的样本中,数据均为整数,已求出其平均数为10,但墨⽔污损了两个数据,其中⼀个数据的⼗位数字1未被污损,即9,10,11,1■,■,那么这组数据的⽅差s2可能的最⼤值是.3.(2017福建福州综合质量预测)在国际风帆⽐赛中,成绩以低分为优胜,⽐赛共11场,并以最佳的9场成绩计算最终的名次.在⼀次国际风帆⽐赛中,前7场⽐赛结束后,排名前8位的选⼿积分如下表:(1)根据表中的⽐赛数据,⽐较运动员A与B的成绩及稳定情况;(2)从前7场平均分低于6.5分的运动员中,随机抽取2个运动员进⾏兴奋剂检查,求⾄少1个运动员平均分不低于5分的概率;(3)请依据前7场⽐赛的数据,预测冠亚军选⼿,并说明理由.4.某地随着经济的发展,居民收⼊逐年增长,下表是该地⼀建设银⾏连续五年的储蓄存款(年底余额):为了研究计算的⽅便,⼯作⼈员将上表的数据进⾏了处理,t=x-2 010,z=y-5得到下表:(1)求z关于t的线性回归⽅程,并⽤相关系数说明拟合效果;(2)通过(1)中的⽅程,求出y关于x的回归⽅程;(3)⽤所求回归⽅程预测到2020年年底,该建设银⾏储蓄存款额可达多少.参考公式:相关系数r=,回归⽅程=x+中斜率和截距的最⼩⼆乘估计分别为=,=-.附:≈6.083.答案精解精析A组基础题组1.B 由题可知该组数据的极差为48-20=28,则该组数据的中位数为61-28=33,易得被污染的数字为2.2.D 由题意得=,解得N=78.∴35~50岁中被抽取的⼈数为78-48-10=20.∴==,解得x=40,y=5.∴=8.3.C =×(2+3+4+5+6)=4,=×(29+41+50+59+71)=50,⽽回归直线=10.2x+经过样本点的中⼼(4,50),∴50=10.2×4+,解得=9.2,∴回归⽅程为=10.2x+9.2,∴当x=10时,y=10.2×10+9.2=111.2,故选C.4.A在⾼中部抽取的60名学⽣中,周平均学习时间分别落在[40,50),[50,60),[60,70),[70,80),[80,90]的⼈数依次为6,15,24,12,3.所以⾼中部学⽣的周平均学习时间为(6×45+15×55+24×65+12×75+3×85)÷60=63.5(⼩时),故选A.5.答案01解析由题意知前5个个体的编号依次为08,02,14,07,01.6.答案50解析根据题中的频率分布直⽅图可知,三等品的频率为1-(0.050 0+0.062 5+0.037 5)×5=0.25,因此该样本中三等品的件数为200×0.25=50.7.答案146解析该样本中AQI⼤于100的频数是4,频率为,由此估计该地全年AQI⼤于100的频率为,估计此地该年AQI⼤于100的天数约为365×=146.8.解析(1)理、⽂两组同学成绩的茎叶图如下:(2)=×(79+81+81+79+94+92+85+89)=85,=×(94+80+90+81+73+84+90+80)=84,则=×[(79-85)2+(81-85)2+(81-85)2+(79-85)2+(94-85)2+(92-85)2+(85-85)2+(89-85)2]=31.25,=×[(94-84)2+(80-84)2+(90-84)2+(81-84)2+(73-84)2+(84-84)2+(90-84)2+(80-84)2]=41.75. 由于>,<,所以理组同学在此次模拟测试中发挥⽐较好.(3)设理组同学中成绩不低于90分的2⼈分别为A,B,⽂组同学中成绩不低于90分的3⼈分别为a,b,c,则从他们中随机抽出3⼈有以下10种可能:ABa,ABb,ABc,Aab,Aac,Abc,Bab,Bac,Bbc,abc.其中全是⽂组同学的情况只有abc ⼀种,没有全是理组同学的情况,记“抽出的3⼈中既有理组同学⼜有⽂组同学”为事件M,则P(M)=1-=. 9.解析 (1)依题意,可得S(x)=(2)设“在本年内随机抽取⼀天,该天经济损失S ⼤于500元且不超过900元”为事件A,由500(3)根据题中数据得到如下2×2列联表:。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高二文科数学统计案例专项练习
1.某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人.现采用分
层抽样抽取容量为30的样本,则抽高级职称的人数为 A .2 B .3 C .5 D .10
2.为了判断高一学生是否选修文科与性别的关系,现随机抽取
50名学生,得到右侧2×2列联表:则认为选修文科与性别有 关系出错的可能性不超过
A .0.005
B .0.05
C .0.95
D .0.095
3.某人对一地区人均工资x (千元)与该地区人均消费y (千元)进行统计调查,y 与x 有相
关关系,得到回归直线方程ˆ0.5 1.5y
x =+.若该地区的人均消费水平为3.5千元,估计该地区的人均消费额占人均工资收入的百分比约为
A .80%
B .82.5%
C .87.5%
D .92.3%
4.某化工厂为预测产品的回收率y ,需要研究它和原料有效成分含量x 之间的相关关系.现取
8对观测值,计算得8
1
40i i x ==∑,8
1
240i i y ==∑,8
1
1800i i i x y ==∑,8
21
400i i x ==∑,则其线性回归方
程为 .
5.某地区调查了2~9岁儿童的身高,由此建立的身高y (cm )与年龄x (岁)的回归模型为
ˆ8.2560.13y
x =+. ①该地区一个10岁儿童的身高为142.63 cm ;②该地区2~9岁的儿童每年身高约增加8.25 cm ; ③该地区9岁儿童的平均身高是134.38 cm ;④利用这个模型可以准确地预算该地区每个2~9岁儿童的身高. 上述叙述正确的有.
6.某位同学进行寒假社会实践活动,为了对白天平均气温与某奶茶店的某种饮料销量之间的关
系进行分析研究,他分别记录了1月11日至1月15日的白天平均气温x (°C )与该奶茶店
(
(2)请根据所给五组数据,求出y 关于x 的线性回归方程ˆˆˆy
bx a =+. (参考公式:()()
()
1
2
1
ˆˆˆn
i
i
i n
i
i x x y y b
a y bx x x ==--==--∑∑,.)
高二文科数学统计案例专项练习参考答案
BAC ˆ315y
x =+ ②
6.(1)2
5
;(2)ˆ 2.14y
x =+. 分析:(1)利用列举法写出抽出2组数据的所有基本事件,并从中找出2组数据恰好是相邻2天数据的基本事件,利用古典概型公式求出概率;(2)先求出x 和y ,再利用参考公式算
出ˆb
和ˆa ,代入即可得线性回归方程. 解析:(1)解:设“选取的2组数据恰好是相邻2天数据”为事件A .
所有基本事件(m ,n )(其中m ,n 为1月份的日期数)有:(11,12),(11,13),(11,14),(11,15),(12,13),(12,14),(12,15),(13,14),(13,15),(14,15)共10种.
事件A 包括的基本事件有(11,12),(12,13),(13,14),(14,15)共4种. ∴42
()105
P A =
=. (2)由数据,求得91012118105x ++++=
=,2325302621
255
y ++++==.
()()()()()()()()()()()()()()()
91023251010252512103025111026258102125ˆ 2.1910101012101110810b --+--+--+--+--==-+-+-+-+-,
ˆˆ4a
y bx =-= ∴y 关于x 的线性回归方程为ˆ 2.14y
x =+. 考点:1、古典概型;2、回归直线方程.。