高二统计案例

合集下载

高中数学 阶段质量检测(五)统计案例 苏教版选修2-3-苏教版高二选修2-3数学试题

高中数学 阶段质量检测(五)统计案例 苏教版选修2-3-苏教版高二选修2-3数学试题

阶段质量检测(五)统计案例(时间120分钟,满分150分)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.已知回归方程y ^=b ^x +a ^,其中a ^=3,且样本点的中心为(1,2),则回归直线方程为( )A.y ^=x +3B.y ^=-2x +3 C.y ^=-x +3 D.y ^=x -3解析:选C 因为回归方程一定经过样本点的中心,所以只需将样本点的中心坐标代入方程,用待定系数法求出即可.2.每一吨铸铁成本y (元)与铸件废品率x %建立的回归方程y ^=56+8x ,下列说法正确的是( )A .废品率每增加1%,成本每吨增加64元B .废品率每增加1%,成本每吨增加8%C .废品率每增加1%,成本每吨增加8元D .如果废品率增加1%,则每吨成本为56元解析:选C 根据回归方程知y 是关于x 的单调增函数,并且由系数知x 每增加一个单位,y 平均增加8个单位.3.下表是某厂1~4月份用水量(单位:百吨)的一组数据:月份x 1 2 3 4 用水量y4.5432.5由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归方程是y ^=-0.7x +a ^,则a ^等于( )A .10.5B .5.15C .5.2D .5.25解析:选D 样本点的中心为(2.5,3.5),将其代入线性回归方程可解得a ^=5.25. 4.下表显示出样本中变量y 随变量x 变化的一组数据,由此判断它最可能是( )x 4 5 6 7 8 9 10 y14181920232528AC .指数函数模型D .对数函数模型解析:选A 画出散点图(图略)可以得到这些样本点在某一条直线上或该直线附近,故最可能是线性函数模型.5.试验测得四组(x ,y )的值为(1,2),(2,3),(3,4),(4,5),则y 与x 之间的回归直线方程为( )A.y ^=x +1B. y ^=x +2 C.y ^=2x +1 D.y ^=x -1解析:选A 由题意发现,(x ,y )的四组值均满足y ^=x +1,故y ^=x +1为回归直线方程. 6.下列说法中,错误说法的个数是( )①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变; ②回归方程y ^=3-5x ,变量x 增加1个单位时,y ^平均增加5个单位; ③线性回归方程y ^=b ^x +a ^必过样本点的中心(x ,y );④在一个2×2列联表中,若χ2的观测值k =13.079,则有99.9%以上的把握认为这两个变量之间有关系.A .0B .1C .2D .3解析:选B 数据的方差与加了什么样的常数无关,故①正确;对于回归方程y ^=3-5x ,变量x 增加1个单位时,y ^平均减少5个单位,故②错误;易知③正确;若k =13.079>10.828,则有99.9%以上的把握认为这两个变量之间有关系,故④正确.7.根据一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的散点图分析存在线性相关关系,求得其回归方程y ^=0.85x -85.7,则在样本点(165,57)处的残差为( )A .54.55B .2.45C .3.45D .111.55解析:选B 把x =165代入y ^=0.85x -85.7,得y =0.85×165-85.7=54.55,故残差为57-54.55=2.45.8.某高校《统计》课程的教师随机给出了选修该课程的一些情况,具体数据如下:χ2>3.841,所以可以判断选修该课程与性别有关.那么这种判断出错的可能性不超过( )A .5%B .95%C .1%D .99%解析:选A 若χ2>3.841,说明在犯错误的概率不超过0.05的前提下认为选修该课程与性别有关,也就是选修该课程与性别有关出错的可能性不超过5%.9.为考察数学成绩与物理成绩的关系,某老师在高二随机抽取了300名学生,得到下面的列联表:A .0.5%B .1%C .2%D .5%解析:选D 由表中数据代入公式得χ2的观测值 χ2=300×(37×143-85×35)2122×178×72×228≈4.514>3.841,所以有95%以上的把握认为数学成绩与物理成绩有关,因此,判断的出错率不超过5%. 10.已知x 与y 之间的几组数据如下表所示.假设根据上表数据所得回归方程为y =b x +a ,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′B.b ^>b ′,a ^<a ′ C.b ^<b ′,a ^>a ′ D.b ^<b ′,a ^<a ′解析:选C 由题意可得,b ′=2,a ′=-2,x =72,y =136.由公式b ^=∑i =16(x i -x )(y i -y)∑i =16(x i -x)2求得b ^=57,a ^=y -b ^x =136-57×72=-13,∴b ^<b ′,a ^>a ′.11.假设有两个分类变量X 和Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其2×2列联表如下:( ) A .a =9,b =8,c =7,d =6 B .a =9,b =7,c =6,d =8 C .a =8,b =6,c =9,d =7 D .a =6,b =7,c =8,d =9解析:选B 对于同一样本,|ad -bc |越大,说明X 与Y 之间的关系越强,故检验知选B.12.两个分类变量X 和Y, 值域分别为{x 1,x 2}和{y 1,y 2}, 其样本频数分别是a =10, b =21, c +d =35. 若X 与Y 有关系的可信程度不小于97.5%, 则c 等于( )A .3B .4C .5D .6解析:选A 列2×2列联表如下:故K 2的观测值k =31×35×(10+c )(56-c )≥5.024. 把选项A, B, C, D 代入验证可知选A.二、填空题(本大题共4小题,每小题5分,共20分.请把正确答案填在题中的横线上) 13.已知高三某学生的高考成绩y (分)与高三期间有效复习时间x (天)正相关,且回归方程是y ^=3x +50,若期望他高考达到500分,则他的有效复习时间应不低于________天.解析:本题主要考查运用线性回归方程来预测变量的取值.当y ^=500时,易得x =500-503=150. 答案:15014.若一组观测值(x 1,y 1),(x 2,y 2),…,(x n ,y n )之间满足y i =bx i +a +e i (i =1,2,…,n ),若e i 恒为0,则r 2为________.解析:e i 恒为0,说明随机误差总为0,于是y i =y ^,故r 2=1. 答案:115.欲知作者的性别是否与读者的性别有关,某出版公司派工作人员到各书店随机调查了500位买书的顾客,结果如下表所示.________.(填“有关”或“无关”)解析:由公式得χ2=500×(142×133-122×103)2264×236×245×255≈5.131>5.024,所以在犯错误的概率不超过0.025的前提下作者的性别与读者的性别有关.答案:有关16.已知x ,y 之间的一组数据如下表,对于表中数据,甲、乙两同学给出的拟合直线分别为l 1:y =13x +1与l 2:y =12x +12,利用最小二乘法判断拟合程度更好的直线是______________.解析:用y =13x +1作为拟合直线时,所得y 的实际值与y 的估计值的差的平方和为:S 1=⎝⎛⎭⎪⎫1-432+(2-2)2+(3-3)2+⎝⎛⎭⎪⎫4-1032+⎝⎛⎭⎪⎫5-1132=73.用y =12x +12作为拟合直线时,所得y 的实际值与y 的估计值的差的平方和为:S 2=(1-1)2+(2-2)2+⎝⎛⎭⎪⎫3-722+(4-4)2+⎝⎛⎭⎪⎫5-922=12. 因为S 2<S 1,故用直线l 2:y =12x +12,拟合程度更好.答案:y =12x +12三、解答题(本大题共6小题,共70分,解答时写出必要的文字说明、证明过程或演算步骤)17.(本小题满分10分)对某校小学生进行心理障碍测试得如下列联表:(其中焦虑、说谎、懒惰都是心理障碍)解:对于上述三种心理障碍分别构造三个随机变量χ21,χ22,χ23, 由表中数据可得χ21=110×(5×60-25×20)230×80×25×85≈0.863,χ22=110×(10×70-20×10)230×80×20×90≈6.366,χ23=110×(15×30-15×50)230×80×65×45≈1.410.因为χ22的值最大,所以说谎与性别关系最大.18.(本小题满分12分)某房地产公司有6名产品推销员,其中5名推销员的工作年限与年推销金额的数据如表:(1)求这5 (2)若第6名推销员的工作年限为11年,试估计他的推销金额.解:(1)设所求的线性回归方程为y ^=b ^x +a ^,由题表数据得x =6,y =3.4,则b ^=∑i =15(x i -x )(y i -y)∑i =15(x i -x)2=1020=0.5,a ^=y -b ^x =0.4. 所以这5名推销员的年推销金额y 关于工作年限x 的线性回归方程为y ^=0.5x +0.4. (2)当x =11时,y ^=0.5×11+0.4=5.9.所以估计第6名推销员的年推销金额为5.9百万元.19.(本小题满分12分)淘宝网卖家在某商品的所有买家中,随机选择男女买家各50位进行调查,他们的评分等级如下:(2)规定:评分等级在[0,3]为不满意该商品,在(3,5]为满意该商品.完成下列2×2列联表,并帮助卖家判断能否95%的把握的认为是否满意该商品与性别有关系.解:(1)20种选法,其中恰有1人为男性的共有C 112C 18=96种选法,所以所求概率P =96190=4895.(2)2×2列联表如下:假设H 0由公式得χ2=100×(32×30-20×18)250×50×52×48≈5.769>3.841,所以能95%的把握认为是否满意该商品与性别有关.20.(本小题满分12分)某工厂用甲、乙两种不同工艺生产一大批同一种零件,零件尺寸均在[21.7,22.3](单位:cm)之间,把零件尺寸在[21.9,22.1)的记为一等品,尺寸在[21.8,21.9)∪[22.1,22.2)的记为二等品,尺寸在[21.7,21.8)∪[22.2,22.3]的记为三等品,现从甲、乙工艺生产的零件中各随机抽取100件产品,所得零件尺寸的频率分布直方图如图所示:(1)根据上述数据完成下列2×2列联表,根据此数据你认为选择不同的工艺与生产出一等品是否有关?甲工艺乙工艺总计一等品非一等品总计附:P(χ2≥k0)0.100.050.01k0 2.706 3.841 6.635χ2=n(ad2(a+b)(c+d)(a+c)(b+d)(2)以上述各种产品的频率作为各种产品发生的概率,若一等品、二等品、三等品的单件利润分别为30元、20元、15元,你认为以后该工厂应该选择哪种工艺生产该种零件?请说明理由.解:(1)2×2列联表如下:甲工艺乙工艺总计一等品5060110非一等品504090总计100100200K2=200×(110×90×100×100≈2.02<2.706,所以没有理由认为选择不同的工艺与生产出一等品有关.(2)由题知运用甲工艺生产单件产品的利润X的分布列为X的数学期望为E(X)24,X的方差为V(X)=(30-24)2×0.5+(20-24)2×0.3+(15-24)2×0.2=39.乙工艺生产单件产品的利润Y的分布列为Y的数学期望为E(Y),Y的方差为V(Y)=(30-24.5)2×0.6+(20-24.5)2×0.1+(15-24.5)2×0.3=47.25.由上述结果可以看出V(X)<V(Y),即甲工艺波动小,虽然E(X)<E(Y),但相差不大,所以以后应选择甲工艺.21.(本小题满分12分)某区卫生部门成立了调查小组,调查常吃零食与患龋齿的关系,对该区六年级的800名学生进行检查,按患龋齿和不患龋齿分类,得汇总数据:不常吃零食且不患龋齿的学生有60名,常吃零食但不患龋齿的学生有100名,不常吃零食但患龋齿的学生有140名.(1)完成下列2×2列联表,并分析能否在犯错概率不超过0.001的前提下,认为该区的学生常吃零食与患龋齿有关系?(2)4负责数据处理.求工作人员甲分到负责收集数据组,工作人员乙分到负责数据处理组的概率.解:(1)由题意可得列联表如下所示.因为K2的观测值k=≈16.667>10.828,160×640×200×600所以能在犯错概率不超过0.001的前提下,认为该区的学生常吃零食与患龋齿有关系.(2)设其他工作人员为丙和丁,4人分组的所有情况有:收集数据组:甲乙;甲丙;甲丁;乙丙;乙丁;丙丁;相应的处理数据组:丙丁;乙丁;乙丙;甲丁;甲丙;甲乙.共有6种情况. 记事件A 为“工作人员甲分到负责收集数据组,工作人员乙分到负责数据处理组”, 则满足条件的情况有:甲丙收集数据,乙丁处理数据或 甲丁收集数据,乙丙处理数据,共2种情况. 所以P (A )=26=13.22.(本小题满分12分)某市为了对学生的数理(数学与物理)学习能力进行分析,从10 000名学生中随机抽出100位学生的数理综合学习能力等级分数(6分制)作为样本,分数频数分布如下表: 等级得分 (0,1] (1,2] (2,3] (3,4] (4,5] (5,6] 人数 3173030173(1)如果以能力等级分数大于4分作为良好的标准,从样本中任意抽取2名学生,求恰有1名学生为良好的概率.(2)统计方法中,同一组数据常用该组区间的中点值(例如区间(1,2]的中点值为1.5)作为代表:①据此,计算这100名学生数理学习能力等级分数的期望μ及标准差σ(精确到0.1); ②若总体服从正态分布,以样本估计总体,估计该市这10 000名学生中数理学习能力等级在(1.9,4.1)X 围内的人数.(3)从这10 000名学生中任意抽取5名同学,他们数学与物理单科学习能力等级分数如下表:x (数学学习能力) 2 3 4 5 6 y (物理学习能力)1.534.556①请画出上表数据的散点图;②请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^(附参考数据:129≈11.4).解:(1)样本中学生为良好的人数为20人.故从样本中任意抽取2名学生,则仅有1名学生为良好的概率为C 120×C 180C 2100=3299.word 11 / 11 (2)①总体数据的期望约为:μ=0.5×0.03+1.5×0.17+2.5×0.30+3.5×0.30+4.5×0.17+5.5×0.03=3.0,标准差σ=[(0.5-3)2×0.03+(1.5-3)2×0.17+(2.5-3)2×0.3+(3.5-3)2×0.3+(4.5-3)2×0.17+(5.5-3)2×0.03]12= 1.29≈1.1, ②由于μ=3,σ=1.1当x ∈(1.9,4.1)时,即x ∈(μ-σ,μ+σ),故数理学习能力等级分数在(1.9,4.1)X 围中的概率约为0.682 7.数理习能力等级分数在(1.9,4.1)X 围中的学生的人数约为10 000×0.682 7=6 827人.(3)①数据的散点图如图:②设线性回归方程为y ^=b ^x +a ^,则x =4,y =4.b ^=∑i =15(x i -x )(y i -y)∑i =15(x i -x)2=1.1,a ^=y -b ^x =-0.4. 故回归直线方程为y ^=1.1x -0.4.。

(必考题)高中数学选修1-2第一章《统计案例》测试卷(答案解析)(3)

(必考题)高中数学选修1-2第一章《统计案例》测试卷(答案解析)(3)

一、选择题1.某校高二(1)班甲、乙两同学进行投篮比赛,他们进球的概率分别是34和45,现甲、乙各投篮一次,恰有一人进球的概率是( ) A .120B .320C .15D .7202.某校学生会为研究该校学生的性别与语文、数学、英语成绩这3个变量之间的关系,随机抽查了100名学生,得到某次期末考试的成绩数据如表1至表3,根据表中数据可知该校学生语文、数学、英语这三门学科中( )表1表2表3 语文 性别不及格 及格 总计 数学 性别不及格 及格 总计 英语 性别不及格 及格 总男 14 36 50 男 10 40 50 男 25 25 女 16 34 50 女 20 30 50 女 5 45 总计3070100总计3070100总计30701A .语文成绩与性别有关联性的可能性最大,数学成绩与性别有关联性的可能性最小B .数学成绩与性别有关联性的可能性最大,语文成绩与性别有关联性的可能性最小C .英语成绩与性别有关联性的可能性最大,语文成绩与性别有关联性的可能性最小D .英语成绩与性别有关联性的可能性最大,数学成绩与性别有关联性的可能性最小 3.某人射击一次命中目标的概率为12,且每次射击相互独立,则此人射击 7次,有4次命中且恰有3次连续命中的概率为( ) A .3761()2CB .2741()2AC .2741()2CD .1741()2C4.在一次抗洪抢险中,准备用射击的方法引爆漂流的汽油桶.现有5发子弹,第一次命中只能使汽油流出,第二次命中才能引爆,每次射击相互独立,且命中概率都是34.则打光子弹的概率是( ) A .9256B .13256C .45512D .910245.针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的女生人数是男生人数的,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数,若有的把握认为是否喜欢抖音和性别有关,则男生至少有( )参考公式:0.10 0.05 0.025 0.010 0.005 0.001 2.7063.8415.0246.6357.87910.828A .12人B .18人C .24人D .30人6.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的12,男生追星的人数占男生人数的16,女生追星的人数占女生人数的23.若有95%的把握认为是否追星和性别有关,则男生至少有( ) 参考数据及公式如下:20()P K k ≥ 0.050 0.0100.0010k3.841 6.635 10.8282()=()()()()n ad bc K a b c d a c b d -++++A .12B .11C .10D .187.为了解某班学生喜爱打篮球是否与性别有关,对该班60名学生进行问卷调查,得到如下图所示的22⨯列联表,则至少有( )的把握认为喜爱打篮球与性别有关.喜爱打篮球 不喜爱打篮球 合计男生 25530 女生 151530合计40 20 60附参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.20()P K k ≥ 0.100.050.025 0.010 0.005 0.001 0k 2.706 3.8415.0246.6357.78910.828A .99.9%B .99.5%C .99%D .97.5%8.甲、乙两名同学参加2018年高考,根据高三年级一年来的各种大、中、小型数学模拟考试总结出来的数据显示,甲、乙两人能考140分以上的概率分别为12和45,甲、乙两人是否考140分以上相互独立,则预估这两个人在2018年高考中恰有一人数学考140 分以上的概率为( ) A .12B .23C .34D .139.2018年元旦期间,某高速公路收费站的三个高速收费口每天通过的小汽车数X (单位:辆)均服从正态分布()2600,Nσ,若()5007000.6P X <<=,假设三个收费口均能正常工作,则这个收费口每天至少有一个超过700辆的概率为( ) A .1125B .12125 C .61125 D .6412510.下列说法中正确的是( )A .设随机变量~(10,0.01)X N ,则1(10)2P X >= B .线性回归直线不一定过样本中心点(,)x yC .若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1D .先把高三年级的2000名学生编号:1到2000,再从编号为1到50的50名学生中随机抽取1名学生,其编号为m ,然后抽取编号为50m +,100m +,150m +,……的学生,这样的抽样方法是分层抽样11.为了解学生对街舞的喜欢是否与性别有关,在全校学生中进行抽样调查,根据数据,求得2K 的观测值0 4.804k ≈,则至少有( )的把握认为对街舞的喜欢与性别有关.参考数据:A .90%B .95%C .97.5%D .99%12.甲、乙两队进行篮球决赛,采取五场三胜制(当一队赢得三场胜利时,该队获胜,比赛结束).根据前期比赛成绩,甲队的主客场安排依次为“主主客客主”.设甲队主场取胜的概率为0.6,客场取胜的概率为0.5,且各场比赛结果相互独立,则甲队不超过4场即获胜的概率是( ) A .0.18B .0.21C .0.39D .0.42二、填空题13.有7个评委各自独立对A 、B 两位选手投票表决,两位选手旗鼓相当,每位评委公平投票且不得弃权.若7位评委依次揭晓票选结果,则A 选手在每位评委投票揭晓后票数始终保持领先的概率是______.14.有9粒种子分种在3个坑内,每坑放3粒,每粒种子发芽概率为0.5,若一个坑内至少有1粒种子发芽,则这个坑不需要补种;若一个坑内的种子都没有发芽,则这个坑需要补种,假定每个坑至多补种一次,需要补种的坑数为2的概率等于_______.15.已知如下四个命题:①在线性回归模型中,相关指数2R 表示解释变量x 对于预报变量y 的贡献率,2R 越接近于0,表示回归效果越好;②在回归直线方程ˆ0.812yx =-中,当解释变量x 每增加一个单位时,预报变量ˆy平均增加0.8个单位;③两个变量相关性越强,则相关系数的绝对值就越接近于1;④对分类变量X 与Y ,对它们的随机变量2K 的观测值k 来说,k 越小,则“X 与Y 有关系”的把握程度越大.其中正确命题的序号是__________. 16.三个元件正常工作的概率分别为,,,将两个元件并联后再和串联接入电路,如图所示,则电路不发生故障的概率为_________.17.从包括甲乙两人的6名学生中选出3人作为代表,记事件A :甲被选为代表,事件B :乙没有被选为代表,则()P B A │等于_________.18.甲袋中装有2个白球,2个黑球,乙袋中装有2个白球,4个黑球,从甲、乙两袋中各取一球均为白球的概率为______________19.把一枚硬币任意抛掷三次,事件A =“至少出现一次反面”,事件B =“恰好出现一次正面”,则(/)P B A =__________.20.投到某出版社的稿件,先由两位初审专家进行评审,若能通过两位初审专家的评审,则直接予以录用,若两位初审专家都未予通过,则不予录用,若恰能通过一位初审专家的评审,则再由第三位专家进行复审,若能通过复审专家的评审,则予以录用,否则不予录用.设稿件能通过各初审专家评审的概率均为12,复审的稿件能通过评审的概率为14,各专家独立评审,则投到该出版社的1篇稿件被录用的概率为__________.三、解答题21.为落实中央“坚持五育并举,全面发展素质教育,强化体育锻炼”的指示精神,小明和小亮两名同学每天利用课余时间进行羽毛球比赛.规定每一局比赛中获胜方记2分,失败方记0分,没有平局,谁先获得10分就获胜,比赛结束.假设每局比赛小明获胜的概率都是23. (1)求比赛结束时恰好打了7局的概率;(2)若现在是小明6:2的比分领先,记X 表示结束比赛还需打的局数,求X 的分布列及期望.22.某航空公司规定:国内航班(不构成国际运输的国内航段)托运行李每件重量上限为50kg ,每件尺寸限制为40cm 60cm 100cm ⨯⨯,其中头等舱乘客免费行李额为40kg ,经济舱乘客免费行李额为20kg .某调研小组随机抽取了100位国内航班旅客进行调查,得到如表所示的数据:(1)请完成22⨯列联表,并判断是否在犯错概率不超过0.05的前提下,认为托运超额行李与乘客乘坐座位的等级有关?(2)调研小组为感谢参与调查的旅客,决定从托运行李超出免费行李额且不超出的旅客中(其中女性旅客4人)随机抽取4人,对其中的女性旅客赠送“100元超额行李补贴券”,记赠送的补贴券总金额为X 元,求X 的分布列与数学期望.参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:23.某工厂A ,B 两条相互独立的生产线生产同款产品,在产量一样的情况下,通过日常监控得知,A ,B 生产线生产的产品为合格品的概率分别为p 和21(0.51)p p -.(1)从A ,B 生产线上各抽检一件产品,若使得产品至少有一件合格的概率不低于99.5%,求p 的最小值0p ;(2)假设不合格的产品均可进行返工修复为合格品,以(1)中确定的0p 作为p 的值. ①已知A ,B 生产线的不合格品返工后每件产品可分别挽回损失5元和3元,若从两条生产线上各随机抽检1000件产品,以挽回损失的平均数为判断依据,估计哪条生产线的挽回损失较多?②若最终的合格品(包括返工修复后的合格品)按照一、二、三等级分类后,每件可分别获利10元、8元、6元,现从A ,B 生产线的最终合格品中各随机抽取100件进行分级检测,结果统计如图所示,用样本的频率分布估计总体分布,记该工厂生产一件产品的利润为X ,求X 的分布列并估计该厂产量2000件时利润的期望值.24.某种疾病可分为Ⅰ、Ⅱ两种类型.为了解该疾病类型与性别的关系,在某地区随机抽取了患该疾病的病人进行调查,其中女性是男性的2倍,男性患Ⅰ型病的人数占男性病人的56,女性患Ⅰ型病的人数占女性病人的13. (1)若在犯错误的概率不超过0.005的前提下认为“所患疾病类型”与“性别”有关,求男性患者至少有多少人?(2)某药品研发公司欲安排甲乙两个研发团队来研发此疾病的治疗药物.两个团队各至多安排2个接种周期进行试验.甲团队研发的药物每次接种后产生抗体的概率为p ,每人每次接种花费()0m m >元,每个周期至多接种3次,第一个周期连续2次出现抗体则终止本接种周期进入第二个接种周期,否则需依次接种至第一周期结束,再进入第二周期;第二接种周期连续2次出现抗体则终止试验,否则需依次接种至至试验结束;乙团队研发的药物每次接种后产生抗体的概率为q ,每人每次花费()0n n >元,每个周期接种3次,每个周期必须完成3次接种,若一个周期内至少出现2次抗体,则该周期结束后终止试验,否则进入第二个接种周期.假设两个研发团队每次接种后产生抗体与否均相互独立.①若甲团队的试验平均花费大于乙团队的试验平均花费,求p 、q 、m 、n 满足的关系式;②若m n =,2p q =,从两个团队试验的平均花费考虑,该公司应选择哪个团队进行药品研发?附:()()()()()22n ad bc K a b c d a c b d -=++++,()20P K k ≥ 0.100.05 0.01 0.005 0.001 0k 2.7063.8416.6357.87910.82825.某大型运动会的组委会为了搞好接待工作,招募了30名男志愿者和20名女志愿者.调查发现,这些志愿者中有部分志愿者喜爱运动,另一部分志愿者不喜欢运动,并得到了如下等高条形图和22⨯列联表:喜爱运动 不喜爱运动 总计 男生 ab30 女生 cd20 总计50(1)求出列联表中a 、b 、c 、d 的值;(2)是否有99%的把握认为喜爱运动与性别有关?附:参考公式和数据:22()()()()()n ad bc K a b c d a c b d -=++++,(其中n a b c d =+++)20()P K k ≥ 0.5000.100 0.050 0.010 0.001 0k 0.4552.7063.8416.63510.82826.某花圃为提高某品种花苗质量,开展技术创新活动,分别用甲、乙两种方法培育该品种花苗.为比较两种培育方法的效果,选取了40棵花苗,随机分成两组,每组20棵.第一组花苗用甲方法培育,第二组用乙方法培育.培育完成后,对每棵花苗进行综合评分,绘制了如图所示的茎叶图:(1)分别求两种方法培育的花苗综合评分的中位数.你认为哪一种方法培育的花苗综合评分更高?并说明理由.(2)综合评分超过80的花苗称为优质花苗,填写下面的列联表,并判断是否有99.5%的把握认为优质花苗与培育方法有关?优质花苗 非优质花苗 合计甲培育法 乙培育法 合计附:()()()()()22n ad bc K a b c d a c b d -=++++. ()20P K k ≥ 0.0100.050 0.025 0.010 0.005 0.001 0k 2.7063.8415.0246.6357.87910.828【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】利用相互独立事件的概率乘法公式求得 甲投进而乙没有投进的概率,以及乙投进而甲没有投进的概率,相加即得所求. 【详解】甲投进而乙没有投进的概率为343(1)4520⨯-=,乙投进而甲没有投进的概率为341(1)455-⨯=,故甲、乙各投篮一次,恰有一人投进球的概率是 31720520+=,故选:D 【点睛】本题主要考查了相互独立事件的概率乘法公式的应用,体现了分类讨论的数学思想,属于中档题.2.C解析:C 【分析】根据题目所给的数据填写2×2列联表即可;计算K 的观测值K 2,对照题目中的表格,得出统计结论. 【详解】因为()()2210014341636100103020403070505030705050⨯⨯-⨯⨯⨯-⨯<⨯⨯⨯⨯⨯⨯()2100254552530705050⨯⨯-⨯<⨯⨯⨯,所以英语成绩与性别有关联性的可能性最大,语文成绩与性别有关联性的可能性最小. 故选C 【点睛】本题考查了独立性检验的应用问题,也考查了计算能力的应用问题,是基础题目. 3.B解析:B 【分析】由于射击一次命中目标的概率为12,所以关键先求出射击7次有4次命中且恰有3次连续命中的所有可能数,即根据独立事件概率公式得结果. 【详解】因为射击7次有4次命中且恰有3次连续命中有24A 种情况,所以所求概率为7241A 2⎛⎫⋅ ⎪⎝⎭.选B. 【点睛】本题考查排列组合以及独立事件概率公式,考查基本分析求解能力,属中档题.4.B解析:B 【分析】打光所有子弹,分中0次、中一次、中2次. 【详解】5次中0次:5 1 4⎛⎫ ⎪⎝⎭5次中一次:4 153144 C⎛⎫⨯⨯ ⎪⎝⎭5次中两次:前4次中一次,最后一次必中314331 444C⎛⎫⨯⨯⨯ ⎪⎝⎭则打光子弹的概率是514⎛⎫⎪⎝⎭+4153144C⎛⎫⨯⨯ ⎪⎝⎭+314331444C⎛⎫⨯⨯⨯ ⎪⎝⎭=13256,选B【点睛】本题需理解打光所有子弹的含义:可能引爆,也可能未引爆.5.B解析:B【解析】【分析】设男生人数为,女生人数为,完善列联表,计算解不等式得到答案.【详解】设男生人数为,女生人数为喜欢抖音不喜欢抖音总计男生女生总计男女人数为整数故答案选B【点睛】本题考查了独立性检验,意在考查学生的计算能力和应用能力.6.A解析:A【分析】设男生人数为x ,依题意可得列联表;根据表格中的数据,代入求观测值的公式,求出观测值同临界值进行比较,列不等式即可得出结论. 【详解】设男生人数为x ,依题意可得列联表如下:则2 3.841K >,由222235236183 3.841822x x x K x x x x x ⎛⎫- ⎪⎝⎭==>⋅⋅⋅,解得10.24x >, ,26x x为整数, ∴若在犯错误的概率不超过95%的前提下认为是否喜欢追星和性别有关,则男生至少有12人,故选A. 【点睛】本题主要考查独立性检验知识,考查学生的计算能力,考查学生分析解决问题的能力,属于中档题. 独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.7.C解析:C 【解析】分析:根据列联表中数据,利用公式求得27.333k ≈,对照临界值即可的结果. 详解:根据所给的列联表, 得到()226025151557.333 6.63540203030k ⨯-⨯=≈>⨯⨯⨯,∴至少有0099的把握认为喜爱打篮球与性别有关,故选C.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.8.A解析:A 【解析】分析:根据互斥事件概率加法公式以及独立事件概率乘积公式求概率.详解:因为这两个人在2018年高考中恰有一人数学考140 分以上的概率为甲考140 分以上乙未考到140 分以上事件概率与乙考140 分以上甲未考到140 分以上事件概率的和,而 甲考140 分以上乙未考到140 分以上事件概率为14(1)25⨯-,乙考140 分以上甲未考到140 分以上事件概率为14(1)25-⨯,因此,所求概率为14(1)25⨯-1451(1)25102+-⨯==, 选A.点睛:本题考查互斥事件概率加法公式以及独立事件概率乘积公式,考查基本求解能力.9.C解析:C 【解析】分析:根据正态曲线的对称性求解即可.详解:根据正态曲线的对称性,每个收费口超过700辆的概率()()()111700150070010.60.2225P X P X ⎡⎤≥=-<<=⨯-==⎣⎦, ∴这三个收费口每天至少有一个超过700辆的概率 3161115125P ⎛⎫=--=⎪⎝⎭,故选C. 点睛:本题主要考查正态分布的性质与实际应用,属于中档题.有关正态分布的应用题考查知识点较为清晰,只要掌握以下两点,问题就能迎刃而解:(1)仔细阅读,将实际问题与正态分布“挂起钩来”;(2)熟练掌握正态分布的性质,特别是状态曲线的对称性以及各个区间概率之间的关系.10.A解析:A 【解析】在A 中,设随机变量X 服从正态分布N (10,0.01),则由正态分布性质得1(10)2P X >=,故A 正确; 在B 中,线性回归直线一定过样本中心点(),x y ,故B 错误;在C 中,若两个随机变量的线性相关性越强,则相关系数r 的绝对值越接近于1,故C 错误;在D 中,先把高三年级的2000名学生编号:1到2000,再从编号为1到50的50名学生中随机抽取1名学生,其编号为m ,然后抽取编号为m+50,m+100,m+150…的学生,这样的抽样方法是系统抽样法,故D 错误. 故选:A11.B解析:B 【解析】因为4.804>3.841,所以有95%的把握认为对街舞的喜欢与性别有关.12.C解析:C 【分析】利用相互独立事件概率乘法公式和互斥事件概率加法公式直接求解. 【详解】解:甲、乙两队进行排球决赛,采取五场三胜制(当一队赢得三场胜利时,该队获胜,决赛结束).根据前期比赛成绩,甲队的主客场安排依次为“主主客客主”.设甲队主场取胜的概率为0.6,客场取胜的概率为0.5,且各场比赛结果相互独立, 则甲队以3:1获胜的概率是:()()()10.60.610.50.50.610.60.50.510.60.60.50.50.21P =⨯⨯-⨯+⨯-⨯⨯+-⨯⨯⨯=.甲队以3:0获胜的概率是: 20.60.60.50.18P =⨯⨯=则甲队不超过4场即获胜的概率120.210.180.39P P P =+=+= 故选:C 【点睛】本题考查概率的求法,考查相互独立事件概率乘法公式和互斥事件概率加法公式等基础知识,考查运算求解能力,属于中档题.二、填空题13.【分析】将比分分为四种情况讨论计算概率【详解】由条件可知前两名投票的都投给选手并且投给每位选手的概率是若投票给两位选手的比分为则概率为若比分为则投给选手的方法有种所以概率为若比分为则投给选手的两票不 解析:532【分析】将比分分为7:0,6:1,5:2,4:3四种情况讨论计算概率. 【详解】由条件可知前两名投票的都投给选手A ,并且投给每位选手的概率是12P =. 若投票给A 、B 两位选手的比分为7:0,则概率为712⎛⎫ ⎪⎝⎭, 若比分为6:1,则投给选手B 的方法有155C =种,所以概率为7152⎛⎫⋅ ⎪⎝⎭若比分为5:2,则投给选手B 的两票不能在第三和第四的位置,有2519C -=种,所以概率为7192⎛⎫⋅ ⎪⎝⎭, 若比分为4:3,则投给A 的票不能是最后一位,且不能占5,6位,有2415C -=种,所以概率为7152⎛⎫⋅ ⎪⎝⎭, 所以概率()7151595232P ⎛⎫=+++⋅=⎪⎝⎭. 故答案为:532【点睛】本题考查独立事件同时发生的概率,重点考查分类的思想,属于中档题型.14.【分析】先计算出粒种子都没有发芽的概率即得出每个坑需要补种的概率然后利用独立重复试验的概率得出所求事件的概率【详解】由独立事件的概率乘法公式可知粒种子没有粒发芽的概率为所以一个坑需要补种的概率为由独 解析:21512【分析】先计算出3粒种子都没有发芽的概率,即得出每个坑需要补种的概率,然后利用独立重复试验的概率得出所求事件的概率. 【详解】由独立事件的概率乘法公式可知,3粒种子没有1粒发芽的概率为31128⎛⎫= ⎪⎝⎭, 所以,一个坑需要补种的概率为18, 由独立重复试验的概率公式可得,需要补种的坑数为2的概率为223172188512C ⎛⎫⋅⋅= ⎪⎝⎭, 故答案为21512. 【点睛】本题考查独立事件概率乘法公式的应用,同时也考查了独立重复试验恰有()k k N *∈次发生的概率,要弄清楚事件的基本类型,并结合相应的概率公式进行计算,考查分析问题和理解问题的能力,属于中等题.15.②③【分析】①根据相关指数的性质进行判断;②根据回归方程的性质进行判断;③根据相关系数的性质进行判断;④根据随机变量的观测值k 的关系进行判断【详解】①在线性回归模型中相关指数表示解释变量对于预报变量解析:②③ 【分析】①根据相关指数2R 的性质进行判断;②根据回归方程的性质进行判断;③根据相关系数的性质进行判断;④根据随机变量2K 的观测值k 的关系进行判断. 【详解】①在线性回归模型中,相关指数2R 表示解释变量x 对于预报变量y 的贡献率,2R 越接近于1,表示回归效果越好,所以①错误;②在回归直线方程ˆy=0.8x−12中,当解释变量x 每增加一个单位时,预报变量ˆy 平均增加0.8个单位,正确;③两个变量相关性越强,则相关系数的绝对值就越接近于1,正确;④对分类变量X 与Y ,对它们的随机变量K2的观测值k 来说,k 越小,则“X 与Y 有关系”的把握程度越小,所以④错误; 故正确命题的序号是②③. 【点睛】该题考查的是有关统计的问题,涉及到的知识点有线性回归分析,两个变量之间相关关系强弱的判断,独立性检验,属于简单题目.16.【解析】分析:组成的并联电路可从反面计算即先计算发生故障的概率然后用对立事件概率得出不发生故障概率详解:由题意故答案为点睛:零件不发生故障的概率分别为则它们组成的电路中如果是串联电路则不发生故障的概 解析:【解析】分析:23,T T 组成的并联电路可从反面计算,即先计算发生故障的概率,然后用对立事件概率得出不发生故障概率. 详解:由题意11115(1)24432P =⨯-⨯=. 故答案为1532. 点睛:零件12,,,k a a a 不发生故障的概率分别为12,,,k p p p ,则它们组成的电路中,如果是串联电路,则不发生故障的概率易于计算,即为12k p p p ,如果组成的是并联电路,则发生故障的概率易于计算,即为12(1)(1)(1)k p p p ---.17.【解析】因为所以应填答案解析:35【解析】因为()()2254336613,210C C P A P AB C C ====,所以3(|)5P B A =。

2.4正态分布与统计案例

2.4正态分布与统计案例

高二理科数学导学案
当堂测试
1.对线性相关性系数r 的以下叙述,正确的是( )
A.||),,0(||r r +∞∈越大,相关性程度越大;反之,相关性程度越小.
B.||),,(||r r +∞-∞∈越大,相关性程度越大;反之,相关性程度越小.
C.||,1||r r ≤越接近于1,相关性程度越大;反之, ||r 越接近于0,相关性程度越小.
D.以上说法都不对.
2.工人工资y(元)和劳动生产率x(千元)的回归方程为x y
8050ˆ+=,则下列判断正确的是( )
A.劳动生产率为1000元时,工资为130元
B.劳动生产率提高1000元时,工资提高80元
C.劳动生产率提高1000元时,工资提高130元
D.工资为120元时,劳动生产率为2000元. 3.对四对变量y 和x 进行相关性检验,已知n 是观测值的组数,r 是相关系数,且知 ①n=3,r=0.9950;②n=7,r=0.9533;③n=15,r=0.3012;④n=17,r=0.4991;(已知n=3时,997.005.0=r ; n=7时,754.005.0=r ; n=15时,514.005.0=r ; n=17时482.005.0=r )则变量y 和x 具有线性相关关系的是( )
A.①和②
B.①和③
C.②和④
D.③和④
4.已知回归直线斜率的估计值是1.23,样本平均数5,4==y x ,则回归直线方程为( )
A. 423.1ˆ+=x y
B. 523.1ˆ+=x y
C. 08.023.1ˆ+=x y
D. 23.108.0ˆ+=x y。

(2021年整理)高二数学典型统计案例章末测试题

(2021年整理)高二数学典型统计案例章末测试题

(完整)高二数学典型统计案例章末测试题编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望((完整)高二数学典型统计案例章末测试题)的内容能够给您的工作和学习带来便利。

同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。

本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为(完整)高二数学典型统计案例章末测试题的全部内容。

第四章 统计案例 测试题一、选择题1.已知盒中装有3只螺口与7只卡口灯泡,这些灯泡的外形与功率都相同且灯口向下放着,现需要一只卡口灯泡,电工师傅每次从中任取一只并不放回,则在他第1次抽到的是螺口灯泡的条件下,第2次抽到的是卡口灯泡的概率为 ( ) A 。

错误! B 。

错误! C.错误! D 。

错误! 2.如图所示,图中有5组数据,去掉组数据后(填字母代号),剩下的4组数据的线性相关性最大( )A.E B 。

C C.DD 。

A3.为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)根据表中数据,你认为吸烟与患肺癌有关的把握有( )A.90% B.95%C.99%D.100%4. 调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表:不患肺病患肺病合计 不吸烟7775427817 吸烟 2099 492148 合计9874919965晚上白天合计你认为婴儿的性别与出生时间有关系的把握为( )A.80%B.90%C.95%D.99%5.已知有线性相关关系的两个变量建立的回归直线方程为y a bx =+,方程中的回归系数b ( )A.可以小于0 B.只能大于0 C.可以为0D.只能小于06.每一吨铸铁成本c y (元)与铸件废品率x %建立的回归方程568c y x =+,下列说法正确的是( )A.废品率每增加1%,成本每吨增加64元 B.废品率每增加1%,成本每吨增加8% C.废品率每增加1%,成本每吨增加8元 D.如果废品率增加1%,则每吨成本为56元7.下列说法中正确的有:①若0r >,则x 增大时,y 也相应增大;②若0r <,则x 增大时,y 也相应增大;③若1r =,或1r =-,则x 与y 的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上( ) A.①②B.②③ C.①③ D.①②③8.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:如果某天气温是2℃,则这天卖出的热饮杯数约为()A.100 B.143 C.200 D.2439.甲、乙两个班级进行一门考试,按照学生考试成绩优秀和不优秀统计成绩后,得到如下列联表:利用独立性检验估计,你认为推断“成绩与班级有关系”错误的概率介于()A.0。

统计案例分析报告及典型例题

统计案例分析报告及典型例题

统计案例分析及典型例题§11.1 抽样方法1.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,总体的一个样本是 . 答案 200个零件的长度2.某城区有农民、工人、知识分子家庭共计2 004户,其中农民家庭1 600户,工人家庭303户,现要从中抽取容量为40的样本,则在整个抽样过程中,可以用到下列抽样方法:①简单随机抽样,②系统抽样,③分层抽样中的 . 答案 ①②③3.某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人.现采用分层抽样抽取容量为30的样本,则抽取的各职称的人数分别为 . 答案 3,9,184.某工厂生产A 、B 、C 三种不同型号的产品,其相应产品数量之比为2∶3∶5,现用分层抽样方法抽出一个容量为n 的样本,样本中A 型号产品有16件,那么此样本的容量n= . 答案 80例1 某大学为了支援我国西部教育事业,决定从2007应届毕业生报名的18名志愿者中,选取6人组成志愿小组.请用抽签法和随机数表法设计抽样方案. 解 抽签法:第一步:将18名志愿者编号,编号为1,2,3, (18)第二步:将18个号码分别写在18张外形完全相同的纸条上,并揉成团,制成号签; 第三步:将18个号签放入一个不透明的盒子里,充分搅匀; 第四步:从盒子中逐个抽取6个号签,并记录上面的编号;基础自测第五步:所得号码对应的志愿者,就是志愿小组的成员. 随机数表法:第一步:将18名志愿者编号,编号为01,02,03, (18)第二步:在随机数表中任选一数作为开始,按任意方向读数,比如第8行第29列的数7开始,向右读;第三步:从数7开始,向右读,每次取两位,凡不在01—18中的数,或已读过的数,都跳过去不作记录,依次可得到12,07,15,13,02,09.第四步:找出以上号码对应的志愿者,就是志愿小组的成员.例2 某工厂有1 003名工人,从中抽取10人参加体检,试用系统抽样进行具体实施. 解 (1)将每个人随机编一个号由0001至1003. (2)利用随机数法找到3个号将这3名工人剔除. (3)将剩余的1 000名工人重新随机编号由0001至1000. (4)分段,取间隔k=100001=100将总体均分为10段,每段含100个工人.(5)从第一段即为0001号到0100号中随机抽取一个号l.(6)按编号将l ,100+l ,200+l,…,900+l 共10个号码选出,这10个号码所对应的工人组成样本. 例3 (14分)某一个地区共有5个乡镇,人口3万人,其中人口比例为3∶2∶5∶2∶3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.解 应采取分层抽样的方法.3分过程如下:(1)将3万人分为五层,其中一个乡镇为一层.5分(2)按照样本容量的比例随机抽取各乡镇应抽取的样本. 300×153=60(人);300×152=40(人); 300×155=100(人);300×152=40(人); 300×153=60(人),10分因此各乡镇抽取人数分别为60人,40人,100人,40人,60人.12分(3)将300人组到一起即得到一个样本.14分练习:一、填空题1.(安庆模拟)某校高中生共有900人,其中高一年级300人,高二年级200人,高三年级400人,现分层抽取容量为45的样本,那么高一、高二、高三年级抽取的人数分别为 .答案15,10,202.某牛奶生产线上每隔30分钟抽取一袋进行检验,则该抽样方法为①;从某中学的30名数学爱好者中抽取3人了解学习负担情况,则该抽样方法为②.那么①,②分别为 .答案系统抽样,简单随机抽样3.下列抽样实验中,最适宜用系统抽样的是(填序号).①某市的4个区共有2 000名学生,且4个区的学生人数之比为3∶2∶8∶2,从中抽取200人入样②某厂生产的2 000个电子元件中随机抽取5个入样③从某厂生产的2 000个电子元件中随机抽取200个入样④从某厂生产的20个电子元件中随机抽取5个入样答案③4.(2013·重庆文)某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是 .答案分层抽样法5.某中学有高一学生400人,高二学生300人,高三学生200人,学校团委欲用分层抽样的方法抽取18名学生进行问卷调查,则下列判断不正确的是(填序号).①高一学生被抽到的概率最大②高三学生被抽到的概率最大③高三学生被抽到的概率最小④每名学生被抽到的概率相等答案①②③6.某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测,若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是 .答案 67.(天津文,11)一个单位共有职工200人,其中不超过45岁的有120人,超过45岁的有80人.为了调查职工的健康状况,用分层抽样的方法从全体职工中抽取一个容量为25的样本,应抽取超过45岁的职工 人. 答案 108.将参加数学竞赛的1 000名学生编号如下0001,0002,0003,…,1000,打算从中抽取一个容量为50的样本,按系统抽样的方法分成50个部分,如果第一部分编号为0001,0002,…,0020,从第一部分随机抽取一个号码为0015,则第40个号码为 . 答案 07959.某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人,上级机关为了了解政府机构改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,如何抽取? 解 用分层抽样抽取. (1)∵20∶100=1∶5, ∴510=2,570=14,520=4∴从副处级以上干部中抽取2人,一般干部中抽取14人,从工人中抽取4人.(2)因副处级以上干部与工人人数较少,可用抽签法从中分别抽取2人和4人;对一般干部可用随机数表法抽取14人.(3)将2人、4人、14人编号汇合在一起就得到了容量为20的样本.10.某单位有工程师6人,技术员12人,技工18人,要从这些人中抽取一个容量为n 的样本.如果采用系统抽样法和分层抽样法抽取,不用剔除个体;如果样本容量增加一个,则在采用系统抽样时,需要在总体中先剔除1个个体,求样本容量n.解 总体容量为6+12+18=36.当样本容量是n 时,由题意知,系统抽样的间隔为n36,分层抽样的比例是36n ,抽取工程师36n ×6=6n (人),抽取技术人员36n ×12=3n (人),抽取技工36n×18=2n (人).所以n 应是6的倍数,36的约数即n=6,12,18,36.当样本容量为(n+1)时,在总体中剔除1人后还剩35人,系统抽样的间隔为135+n ,因为135+n 必须是整数,所以n 只能取6,即样本容量为6.总体分布的估计与总体特征数的估计1.一个容量为20的样本,已知某组的频率为0.25,则该组的频数为 . 答案 52.(2008·山东理)右图是根据《山东统计年鉴2007》中的资料作成的1997年至2006年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字.从图中可以得到1997年至2006年我省城镇居民百户家庭人口数的平均数为 . 答案 303.63.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a ,b )是其中的一组,抽查出的个体在该组上的频率为m,该组在频率分布直方图的高为h ,则|a-b|= . 答案 hm4.(2008·山东文,9)从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为 .答案 51025.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁~18岁的男生体重(kg ),得到频率分布直方图如下:根据上图可得这100名学生中体重在[56.5,64.5)的学生人数是 . 答案 40基础自测典型例题:例1 在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日,评委会把同学们上交 作品的件数按5天一组分组统计,绘制了频率分布直方图(如图所示),已知从左到右各长方形高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题: (1)本次活动共有多少件作品参加评比? (2)哪组上交的作品数量最多?有多少件?(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率高? 解 (1)第三组的频率为1464324+++++=51又因为第三组的频数为12,∴参评作品数为5112=60.(2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有60×1464326+++++=18(件).(3)第四组的获奖率是1810=95,第六组上交的作品数量为60×1464321+++++=3(件),∴第六组的获奖率为32=96,显然第六组的获奖率高.例4(14分)某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30 min 抽取一包产品,称其重量,分别 记录抽查数据如下: 甲:102, 101, 99, 98, 103, 98,99;乙:110, 115, 90,85,75,115, 110.(1)这种抽样方法是哪一种? (2)将这两组数据用茎叶图表示;(3)将两组数据比较,说明哪个车间产品较稳定. 解 (1)因为间隔时间相同,故是系统抽样. 2分(2)茎叶图如下:5分(3)甲车间: 平均值:1x =71(102+101+99+98+103+98+99)=100,7分方差:s 12=71[(102-100)2+(101-100)2+…+(99-100)2]≈3.428 6.9分乙车间:平均值:2x =71(110+115+90+85+75+115+110)=100,11分方差:s 22=71[(110-100)2+(115-100)2+…+(110-100)2]≈228.571 4.13分∵1x =2x ,s 12<s 22,∴甲车间产品稳定.14分练习:1.为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得数据整理后,画出频率分布直方图如图所示,已知图中从左到右前三个小组的频率分别是0.1,0.3,0.4,第一小组的频数为5.(1)求第四小组的频率;(2)参加这次测试的学生人数是多少?(3)在这次测试中,学生跳绳次数的中位数落在第几小组内? 解 (1)第四小组的频率=1-(0.1+0.3+0.4)=0.2. (2)设参加这次测试的学生人数是n, 则有n=第一小组频率第一小组频数=5÷0.1=50(人).(3)因为0.1×50=5,0.3×50=15,0.4×50=20,0.2×50=10,即第一、第二、第三、第四小组的频数分别为5、15、20、10,所以学生跳绳次数的中位数落在第三小组内. 练习:一、填空题1.下列关于频率分布直方图的说法中不正确的是 . ①直方图的高表示取某数的频率②直方图的高表示该组上的个体在样本中出现的频率 ③直方图的高表示该组上的个体数与组距的比值④直方图的高表示该组上的个体在样本中出现的频率与组距的比值 答案 ①②③2.甲、乙两名新兵在同样条件下进行射击练习,每人打5发子弹,命中环数如下:甲:6,8,9,9,8;乙:10,7,7,7,9.则这两人的射击成绩 比 稳定. 答案 甲 乙4.某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果分成六组:右图是得到的频率分布直方图.设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y ,则从频率分布直方图中可分析出x 和y 分别为 . 答案 0.9, 356.甲、乙两名同学在5次体育测试中的成绩统计的茎叶图如图所示,若甲、乙两人的平均成绩分别是x 甲、x 乙,则x 甲 x 乙, 比 稳定. 答案 < 乙 甲7.(上海,9)已知总体的各个体的值由小到大依次为2,3,3,7,a ,b ,12,13.7,18.3,20,且总体的中位数为10.5.若要使该总体的方差最小,则a 、b 的取值分别是 . 答案 10.5、10.5二、解答题10.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少? (3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由. 解 (1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小, 因此第二小组的频率为:391517424+++++=0.08.又因为频率=样本容量第二小组频数, 所以样本容量=第二小组频率第二小组频数=08.012=150. (2)由图可估计该学校高一学生的达标率约为39151742391517++++++++×100%=88%.(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.线性回归方程1.下列关系中,是相关关系的为 (填序号). ①学生的学习态度与学习成绩之间的关系;基础自测②教师的执教水平与学生的学习成绩之间的关系;③学生的身高与学生的学习成绩之间的关系;④家庭的经济条件与学生的学习成绩之间的关系.答案①②2.为了考察两个变量x、y之间的线性相关关系,甲、乙两同学各自独立地做10次和15次试验,并利用最小二乘法求得回归直线分别为l1和l2.已知在两人的试验中发现变量x的观测数据的平均值恰好相等,都为s,变量y的观测数据的平均值也恰好相等,都为t,那么下列说法中正确的是(填序号).①直线l1,l2有交点(s,t)②直线l1,l2相交,但是交点未必是(s,t)③直线l1,l2由于斜率相等,所以必定平行④直线l1,l2必定重合答案①3.下列有关线性回归的说法,正确的是(填序号).①相关关系的两个变量不一定是因果关系②散点图能直观地反映数据的相关程度③回归直线最能代表线性相关的两个变量之间的关系④任一组数据都有回归直线方程答案①②③4.下列命题:①线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;③通过回归直线yˆ=bˆx+aˆ及回归系数bˆ,可以估计和预测变量的取值和变化趋势. 其中正确命题的序号是 .答案①②③5.已知回归方程为yˆ=0.50x-0.81,则x=25时,yˆ的估计值为 .答案11.69例1下面是水稻产量与施化肥量的一组观测数据:施化肥量15 20 25 30 35 40 45水稻产量320 330 360 410 460 470 480(1)将上述数据制成散点图;(2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗?解(1)散点图如下:(2)从图中可以发现施化肥量与水稻产量具有线性相关关系,当施化肥量由小到大变化时,水稻产量由小变大,图中的数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,但水稻产量只是在一定范围内随着化肥施用量的增加而增长.例2(14分)随着我国经济的快速发展,城乡居民的生活水平不断提高,为研究某市家庭平均收入与月平均生活支出的关系,该市统计部门随机调查了10个家庭,得数据如下:(1)判断家庭平均收入与月平均生活支出是否相关?(2)若二者线性相关,求回归直线方程.解(1)作出散点图:5分观察发现各个数据对应的点都在一条直线附近,所以二者呈线性相关关系. 7分(2)x =101 (0.8+1.1+1.3+1.5+1.5+1.8+2.0+2.2+2.4+2.8)=1.74,y=101(0.7+1.0+1.2+1.0+1.3+1.5+1.3+1.7+2.0+2.5)=1.42,9分bˆ=∑∑==-∙-ni ini i i x n xyx n y x 1221≈0.813 6,aˆ=1.42-1.74×0.813 6≈0.004 3,13分 ∴回归方程yˆ=0.813 6x+0.004 3.14分例3 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y (吨)标准煤的几组对照数据.(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程yˆ=b ˆx+a ˆ; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:3×2.5+4×3+5×4+6×4.5=66.5) 解 (1)散点图如下图:(2)x =46543+++=4.5,y =45.4435.2+++=3.5∑=41i ii yx =3×2.5+4×3+4×5+6×4.5=66.5.∑=412i ix=32+42+52+62=86∴bˆ=24124144x x yx yx i i i ii -∙-∑∑===25.44865.45.345.66⨯-⨯⨯-=0.7aˆ =y -bˆx =3.5-0.7×4.5=0.35. ∴所求的线性回归方程为yˆ=0.7x+0.35. (3)现在生产100吨甲产品用煤 y=0.7×100+0.35=70.35,∴降低90-70.35=19.65(吨)标准煤.1.科研人员为了全面掌握棉花新品种的生产情况,查看了气象局对该地区年降雨量与年平均气温的统计数据(单位分别是mm,℃),并作了统计.(1)试画出散点图;(2)判断两个变量是否具有相关关系. 解 (1)作出散点图如图所示,(2)由散点图可知,各点并不在一条直线附近,所以两个变量是非线性相关关系.2.在研究硝酸钠的可溶性程度时,对于不同的温度观测它在水中的溶解度,得观测结果如下:由资料看y 与x 呈线性相关,试求回归方程. 解 x =30,y =50.1283.1120.850.767.66++++=93.6.bˆ=25125155x xyx yx i ii ii -∙-∑∑==≈0.880 9.aˆ=y -bˆx =93.6-0.880 9×30=67.173. ∴回归方程为yˆ=0.880 9x+67.173.3.某企业上半年产品产量与单位成本资料如下:(1)求出线性回归方程;(2)指出产量每增加1 000件时,单位成本平均变动多少? (3)假定产量为6 000件时,单位成本为多少元? 解 (1)n=6,∑=61i i x =21,∑=61i i y =426,x =3.5,y =71,∑=612i i x =79,∑=61i i i y x =1 481,bˆ=26126166x xyx yx i ii ii -∙-∑∑===25.3679715.364811⨯-⨯⨯-=-1.82.aˆ=y-bˆx=71+1.82×3.5=77.37.回归方程为yˆ=aˆ+bˆx=77.37-1.82x.(2)因为单位成本平均变动bˆ=-1.82<0,且产量x的计量单位是千件,所以根据回归系数b的意义有: 产量每增加一个单位即1 000件时,单位成本平均减少1.82元.(3)当产量为6 000件时,即x=6,代入回归方程:yˆ=77.37-1.82×6=66.45(元)当产量为6 000件时,单位成本为66.45元.一、填空题1.观察下列散点图,则①正相关;②负相关;③不相关.它们的排列顺序与图形对应顺序是 .答案a,c,b2.回归方程yˆ=1.5x-15,则下列说法正确的有个.①y=1.5x-15②15是回归系数a③1.5是回归系数a④x=10时,y=0答案 13.(2009.湛江模拟)某地区调查了2~9岁儿童的身高,由此建立的身高y(cm)与年龄x(岁)的回归模型为yˆ=8.25x+60.13,下列叙述正确的是 .①该地区一个10岁儿童的身高为142.63 cm②该地区2~9岁的儿童每年身高约增加8.25 cm③该地区9岁儿童的平均身高是134.38 cm④利用这个模型可以准确地预算该地区每个2~9岁儿童的身高答案 ②4.三点(3,10),(7,20),(11,24)的回归方程是 .答案 yˆ=1.75x+5.75 5.某人对一地区人均工资x(千元)与该地区人均消费y(千元)进行统计调查,y 与x 有相关关系,得到回归直线方程yˆ=0.66x+1.562.若该地区的人均消费水平为7.675千元,估计该地区的人均消费额占人均工资收入的百分比约为 . 答案 83%6.某化工厂为预测产品的回收率y,需要研究它和原料有效成分含量x 之间的相关关系,现取8对观测值,计算,得∑=81i i x =52, ∑=81i i y =228, ∑=812i i x =478, ∑=81i i i y x =1 849,则其线性回归方程为 .答案 yˆ=11.47+2.62x 7.有下列关系:①人的年龄与他(她)拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其断面直径与高度之间的关系.其中,具有相关关系的是 . 答案 ①③④8.已知关于某设备的使用年限x 与所支出的维修费用y(万元),有如下统计资料:若y 对x 呈线性相关关系,则回归直线方程yˆ=b ˆx+a ˆ表示的直线一定过定点 . 答案 (4,5) 二、解答题9.期中考试结束后,记录了5名同学的数学和物理成绩,如下表:(1)数学成绩和物理成绩具有相关关系吗?(2)请你画出两科成绩的散点图,结合散点图,认识(1)的结论的特点. 解 (1)数学成绩和物理成绩具有相关关系.(2)以x 轴表示数学成绩,y 轴表示物理成绩,可得相应的散点图如下:由散点图可以看出,物理成绩和数学成绩对应的点不分散,大致分布在一条直线附近. 10.以下是某地搜集到的新房屋的销售价格y 和房屋的面积x 的数据:(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线. 解 (1)数据对应的散点图如图所示:(2)x =109,y =23.2,∑=512i i x =60 975,∑=51i iiy x=12 952,bˆ=25125155x xyx yx i ii ii -∙-∑∑==≈0.196 2aˆ=y -bˆx ≈1.814 2 ∴所求回归直线方程为yˆ=0.196 2x+1.814 2.11.某公司利润y 与销售总额x(单位:千万元)之间有如下对应数据:(1)画出散点图; (2)求回归直线方程;(3)估计销售总额为24千万元时的利润. 解 (1)散点图如图所示:(2)x =71(10+15+17+20+25+28+32)=21,y=71(1+1.3+1.8+2+2.6+2.7+3.3)=2.1,∑=712i ix=102+152+172+202+252+282+322=3 447,∑=71i iiy x=10×1+15×1.3+17×1.8+20×2+25×2.6+28×2.7+32×3.3=346.3,bˆ=27127177x x yx yx i i i ii -∙-∑∑===221744731.22173.346⨯-⨯⨯-≈0.104, aˆ=y -bˆx =2.1-0.104×21=-0.084, ∴yˆ=0.104x-0.084. (3)把x=24(千万元)代入方程得,yˆ=2.412(千万元).∴估计销售总额为24千万元时,利润为2.412千万元.12.某种产品的广告费支出x 与销售额y(单位:百万元)之间有如下对应数据:(1)画出散点图;(2)求回归直线方程;(3)试预测广告费支出为10百万元时,销售额多大? 解 (1)根据表中所列数据可得散点图如下:(2)列出下表,并用科学计算器进行有关计算:因此,x =525=5,y =5250 =50,∑=512i i x =145, ∑=512i i y =13 500, ∑=51i i i y x =1 380.于是可得:bˆ=25125155x xyx yx i ii ii -∙-∑∑===55514550553801⨯⨯-⨯⨯-=6.5;aˆ=y -bˆx =50-6.5×5=17.5. 因此,所求回归直线方程为:yˆ=6.5x+17.5. (3)根据上面求得的回归直线方程,当广告费支出为10百万元时,yˆ=6.5×10+17.5=82.5(百万元),即这种产品的销售收入大约为82.5百万元.§11.4 统计案例1.对有线性相关关系的两个变量建立的回归直线方程y ˆ=a ˆ+b ˆx 中,回归系数bˆ与0的大小关系为 .(填序号) ①大于或小于 ②大于 ③小于 ④不小于答案 ①2.如果有90%的把握说事件A 和B 有关系,那么具体计算出的数据 2 2.706.(用“>”,“<”,“=”填空) 答案 >3.对两个变量y 与x 进行回归分析,分别选择不同的模型,它们的相关系数r 如下,其中拟合效果最好的模型是 .①模型Ⅰ的相关系数r 为0.98 ②模型Ⅱ的相关系数r 为0.80 ③模型Ⅲ的相关系数r 为0.50 ④模型Ⅳ的相关系数r 为0.25 答案 ①4.下列说法中正确的有:①若r >0,则x 增大时,y 也相应增大;②若r <0,则x 增大时,y 也相应增大;③若r=1或r=-1,则x 与y 的关系完全对应(有函数关系),在散点图上各个点均在一条直线上 . 答案 ①③基础自测例1 (14分)调查339名50岁以上人的吸烟习惯与患慢性气管炎的情况,获数据如下:试问:(1)吸烟习惯与患慢性气管炎是否有关? (2)用假设检验的思想给予证明. (1)解 根据列联表的数据,得到χ2=))()()(()(2c d b d c a b a bc ad n ++++-2分 =13428356205)1316212143(3392⨯⨯⨯⨯-⨯⨯=7.469>6.6356分 所以有99%的把握认为“吸烟与患慢性气管炎有关”.9分(2)证明 假设“吸烟与患慢性气管炎之间没有关系”,由于事件A={χ2≥6.635}≈0.01,即A 为小概率事件,而小概率事件发生了,进而得假设错误,这种推断出错的可能性约有1%.14分例2 一台机器使用时间较长,但还可以使用.它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有 缺点零件的多少,随机器运转的速度而变化,下表为抽样试验结果:(1)对变量y 与x 进行相关性检验;(2)如果y 与x 有线性相关关系,求回归直线方程;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么,机器的运转速度应控制在什么范围内?解 (1)x =12.5,y =8.25,∑=41i iiy x=438,4x y =412.5,∑=412i i x =660,∑=412i i y =291,所以r=)4)(4(42412241241y yx xyx yx i ii ii ii --∙-∑∑∑====)25.272291()625660(5.412438-⨯--=25.6565.25≈62.2550.25≈0.995 4.因为r >r 0.05,所以y 与x 有很强的线性相关关系.(2)yˆ=0.728 6x-0.857 1. (3)要使yˆ≤10⇒0.728 6x-0.857 1≤10, 所以x ≤14.901 3.所以机器的转速应控制在14.901 3转/秒以下.例3 下表是某年美国旧轿车价格的调查资料,今以x 表示轿车的使用年数,y 表示相应的年均价格,求y 关于x 的回归 方程.解 作出散点图如图所示.可以发现,各点并不是基本处于一条直线附近,因此,y 与x 之间应是非线性相关关系.与已学函数图象比较,用y ˆ=e a x b ˆˆ来刻画题中模型更为合理,令zˆ=ln y ˆ,则z ˆ=b ˆx+a ˆ,题中数据变成如下表所示:相应的散点图如图所示,从图中可以看出,变换的样本点分布在一条直线附近,因此可以用线性回归方程拟合.由表中数据可得r ≈-0.996.|r|>r 0.05.认为x 与z之间具有线性相关关系,由表中数据得bˆ≈-0.298,a ˆ≈8.165,所以z ˆ=-0.298x+8.165,最后回代z ˆ=ln y ˆ,即y ˆ=e -0.298x+8.165为所求.1.某班主任对全班50名学生学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?(2)试运用独立性检验的思想方法分析:学生的学习积极性与对待班级工作的态度是否有关系?说明理由.解 (1)随机抽查这个班的一名学生,有50种不同的抽查方法,由于积极参加班级工作的学生有18+6=24人,所以有24种不同的抽法,因此由古典概型的计算公式可得抽到积极参加班级工作的学生的概率是P 1=5024=2512,又因为不太主动 参加班级工作且学习积极性一般的学生有19人,所以抽到不太主动参加班级工作且学习积极性一般的学生的概率是P 2=5019.(2)由2χ统计量的计算公式得2χ=25252624)761918(502⨯⨯⨯⨯-⨯⨯≈11.538,由于11.538>10.828,所以可以有99.9%的把握认为“学生的学习积极性与对待班级工作的态度有关系”.2.某个体服装店经营某种服装,一周内获纯利y (元)与该周每天销售这种服装的件数x 之间的一组数据如下:已知∑=712i i x =280, ∑=712i i y =45 309, ∑=71i i i y x =3 487,此时r 0.05=0.754.(1)求x ,y ;(2)判断一周内获纯利润y 与该周每天销售件数x 之间是否线性相关,如果线性相关,求出回归直线方程.解 (1)x =71(3+4+5+6+7+8+9)=6,y=71 (66+69+73+81+89+90+91)≈79.86.(2)根据已知∑=712i i x =280, ∑=712i i y =45 309, ∑=71i i i y x =3 487,得相关系数 r=)86.79730945)(67280(86.7967487322⨯-⨯-⨯⨯-≈0.973.由于0.973>0.754,所以纯利润y与每天销售件数x 之间具有显著线性相关关系. 利用已知数据可求得回归直线方程为yˆ=4.746x+51.386.3.某种书每册的成本费y (元)与印刷册数x (千册)有关,经统计得到数据如下:检验每册书的成本费y 与印刷册数的倒数x1之间是否具有线性相关关系,如有,求出y 对x 的回归方程.解 首先作变量置换,令u=x1,题目所给数据变成如下表所示的10对数据:然后作相关性检验.经计算得r ≈0.999 8>0.75,从而认为u 与y 之间具有线性相关关系.由公式得aˆ≈1.125,b ˆ≈8.973, 所以yˆ=1.125+8.973u, 最后回代u=x1,可得y ˆ=1.125+x973.8,这就是题目要求的y 对x 的回归曲线方程.回归曲线的图形如图所示,它是经过平移的反比例函数图象的一个分支.一、填空题1.对于独立性检验,下列说法中正确的是 . ①2χ的值越大,说明两事件相关程度越大 ②2χ的值越小,说明两事件相关程度越小 ③2χ≤2.706时,有90%的把握说事件A 与B 无关 ④2χ>6.635时,有99%的把握说事件A 与B 有关 答案 ①②④2.工人月工资y (元)依劳动生产率x(千元)变化的回归方程为y ˆ=50+80x ,下列判断正确的是 .①劳动生产率为1 000元时,工资为130元。

高中数学 第三章 统计案例综合训练学案 新人教A版选修2-3-新人教A版高二选修2-3数学学案

高中数学 第三章 统计案例综合训练学案 新人教A版选修2-3-新人教A版高二选修2-3数学学案

第三章统计案例(综合训练1)一、学习要求1.通过典型案例的探究,了解统计学中对两个变量统计分析的思想方法和步骤;2.能综合运用概率、统计的知识解决有关问题。

二、问题探究■合作探究例1.【10新课标(文19)】为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:性别是否需要志愿者男女需要40 30不需要160 270(1)估计该地区老年人中,需要志愿者提供帮助的老年人比例;(2)能否有的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.附:0.050 0.010 0.0013.841 6.635 10.828。

【解析】(1)样本中,该地区的老年人需要志愿者提供帮助的有:403070+=(人),∴估计该地区老年人中,需要志愿者提供帮助的老年人比例为:707 50050=。

(2)根据表中数据,得到:,∵,∴有的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关。

(3)根据(2)的结论可知,地区的老年人是否需要志愿者提供帮助与性别有关,所以可按性别进行分层抽样调查,从而能更好地估计该地区的老年人中需要志愿者提供帮助的老年人的比例。

■自主探究1.为了解某班学生喜爱打篮球是否与性别有关,对本班50人进行了问卷调查,得到了如下的列联表:喜爱打篮球不喜爱打篮球合计男生 5女生10合计50已知在全部50人中随机抽取1人,抽到喜爱打篮球的学生的概率为。

(Ⅰ)补充完整上面的列联表,并判断是否有的把握认为喜爱打篮球与性别有关?(Ⅱ)若采用分层抽样的方法从喜爱打篮球的学生中随机抽取3人,则男生和女生抽取的人数分别是多少?解:(Ⅰ)这50人中喜爱打篮球的人数为:(人)。

列联表补充如下:喜爱打篮球不喜爱打篮球合计男生20 5 25女生10 15 25合计30 20 50,∵,∴有的把握认为喜爱打篮球与性别有关。

厦门市高中数学选修2-3第三章《统计案例》检测(包含答案解析)

厦门市高中数学选修2-3第三章《统计案例》检测(包含答案解析)

一、选择题1.设(1+x)n =a 0+a 1x+…+a n x n ,若a 1+a 2+…+a n =63,则展开式中系数最大的项是( ) A .15x 2B .20x 3C .21x 3D .35x 32.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( ) 表1表2表3表4A .成绩B .视力C .智商D .阅读量3.假设有两个分类变量X 和Y 的22⨯列联表为:对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .5,35b d ==B .15,25b d ==C .20,20b d ==D .30,10b d ==4.对两个分类变量A ,B 的下列说法中正确的个数为( ) ①A 与B 无关,即A 与B 互不影响; ②A 与B 关系越密切,则K 2的值就越大; ③K 2的大小是判定A 与B 是否相关的唯一依据 A .0 B .1 C .2 D .3 5.下列命题正确的个数是:( )①对于两个分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握程度越大;②在相关关系中,若用211c x y c e =拟合时的相关指数为21R ,用2y bx a =+拟合时的相关指数为22R ,且2212R R >,则1y 的拟合效果好;③利用计算机产生0~1之间的均匀随机数a ,则事件“310a ->”发生的概率为23; ④“0,0a b >>”是“2b aa b+≥”的充分不必要条件 A .1B .2C .3D .46.某中学共有5000人,其中男生3500人,女生1500人,为了了解该校学生每周平均体育锻炼时间的情况以及该校学生每周平均体育锻炼时间是否与性别有关,现在用分层抽样的方法从中收集300位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如下:附:22()=()()()()n ad bc K a c b d a d b c -++++,其中n a b c d =+++.20()P K k ≥0.100.050.01 0.0050k 2.7063.8416.6357.879已知在样本数据中,有60位女生的每周平均体育锻炼时间超过4小时,根据独立性检验原理,我们( )A .没有理由认为“该校学生每周平均体育锻炼时间与性别有关”B .有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”C .有95%的把握认为“该校学生每周平均体育锻炼时间与性别无关”D .有99.5%的把握认为“该校学生每周平均体育锻炼时间与性别有关”7.近年来,由于大学生不理智消费导致财务方面的新闻层出不穷,无力偿还校园贷,跳楼自杀也偶有发生,一时间人们对大学生的消费观充满了质疑.为进一步了解大学生的消费情况,对S 城某大学的10000名(其中男生6000名,女生4000名)在校本科生,按性别采用分层抽样的方式抽取了1000名学生进行了问卷调查,其中有一项是针对大学生每月的消费金额进行调查统计,通过整理得如图所示的频率分布直方图.已知在抽取的学生中,月消费金额超过2000元的女生有150人.根据上述数据和频率分布直方图,判断下列说法正确的是( )参考数据与参考公式:003 1.732,sin150.258,sin7.50.1305=≈≈.A .月消费金额超过2000元的女生人数少于男生人数B .所调查的同学中月消费金额不超过500元的共有4人C .样本数据的中位数约为1750元D .在犯错的概率不超过0.1%的情况下认为月消费金额在2000元以上的大学生与性别有关 8.某中学采取分层抽样的方法从高二学生中按照性别抽出20名学生,其选报文科、理科的情况如下表所示,男 女文科2 5理科 10 3参考公式和数据:22()()()()()n ad bc K a c b d a b c d -=++++,其中n a b c d =+++.20()P K k ≥0.25 0.15 0.10 0.05 0.025 0.010 0.0050k 1.323 2.072 2.706 3.841 5.024 6.635 7.879则以下判断正确的是A .至少有97.5%的把握认为学生选报文理科与性别有关B .至多有97.5%的把握认为学生选报文理科与性别有关C .至少有95%的把握认为学生选报文理科与性别有关D .至多有95%的把握认为学生选报文理科与性别有关9.某种产品的广告费支出x 与销售额y (单位:万元)之间有下表关系: x 2 4 5 6 8 y3040605070y 与x 的线性回归方程为 6.5175ˆ.y x =+,当广告支出5万元时,随机误差的效应(残差)为( ) A .40 B .20 C .30D .1010.为了普及环保知识,增强环保意识,随机抽取某大学30名学生参加环保知识测试,得分如图所示,若得分的中位数为m e ,众数为m 0,平均数为x -,则( )A .m e =m 0=x -B .m 0<x -<m e C .m e <m 0<x -D .m 0<m e <x -11.通过随机询问72名不同性别的大学生在购买食物时是否看营养说明,得到如下列联表:性别与读营养说明列联表请问性别和读营养说明之间在多大程度上有关系 ()A.99%的可能性B.99.75%的可能性C.99.5%的可能性D.97.5%的可能性12.为考察数学成绩与物理成绩的关系,在高二随机抽取了300名学生,统计数据如下表附:经计算2 4.514K≈,现判断数学成绩与物理成绩有关系,则判断出错的概率不会超过A.0.5% B.1% C.2% D.5%二、填空题13.针对时下的“韩剧热”,某校团委对“学生性别和喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的13,男生喜欢韩剧的人数占男生人数的16,女生喜欢韩剧的人数占女生人数的23.若有95%的把握认为是否喜欢韩剧和性别有关,求男生至少有______人.k 3.841 6.63510.828PM是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物,下图是14. 2.5PM监测点统计的数据(单位:毫克/每立方据某地某日早7点至晚8点甲、乙两个2.5米)列出的茎叶图,则甲、乙两地浓度的方差较小的是_________.15.已知方程是根据女大学生的身高预报她的体重的回归方程,其中的单位是,的单位是,那么针对某个体的残差是______.16.已知下列说法:①分类变量A与B的随机变量越大,说明“A与B有关系”的可信度越大;②以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则的值分别是和;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为,若,,,则.其中说法正确的为_____________.(填序号)17.在2017年3月15日,某市物价部门对本市的5家商场的某种商品的一天销售量及其价格进行调查,5家商场的售价x元和销售量y件之间的一组数据如下表所示:价格x99.51010.511销售量y1110865由散点图可知,销售量y与价格x之间有较好的线性相关关系,其线性回归方程是:=-+,则a=__________.y x a3.218.某班运动队由足球运动员18人、篮球运动员12人、乒乓球运动员6人组成(每人只参加一项),现从这些运动员中抽取一个容量为n的样本,若分别采用系统抽样法和分层抽样法,则都不用剔除个体;当样本容量为n+1时,若采用系统抽样法,则需要剔除1个个体,那么样本容量n为________.19.已知x、y之间的一组数据如下:x0123y8264则线性回归方程ˆy a bx=+所表示的直线必经过点________.20.为了了解司机开车时礼让斑马线行人的情况,交警部门调查了100名机动车司机,得到以下统计数据:若以2χ为统计量进行独立性检验,则2χ的值是__________.(结果保留2位小数)参考公式()11221221 21212n n n n nn n n nχ++++-=三、解答题21.司机在开机动车时使用手机是违法行为,会存在严重的安全隐患,危及自己和他人的生命. 为了研究司机开车时使用手机的情况,交警部门调查了100名机动车司机,得到以下统计:在55名男性司机中,开车时使用手机的有40人,开车时不使用手机的有15人;在45名女性司机中,开车时使用手机的有20人,开车时不使用手机的有25人.(1)完成下面的22⨯列联表,并判断是否有99.5%的把握认为开车时使用手机与司机的性别有关;(2)以上述的样本数据来估计总体,现交警部门从道路上行驶的大量机动车中随机抽检3辆,记这3辆车中司机为男性且开车时使用手机的车辆数为X,若每次抽检的结果都相互独立,求X的分布列和数学期望()E X.参考公式与数据:参考数据:参考公式()()()()()22n ad bc a b c d a c b d χ-=++++,其中n a b c d =+++.22.为提高全民身体素质,加强体育运动意识,某校体育部从全校随机抽取了男生、女生各100人进行问卷调查,以了解学生参加体育运动的积极性是否与性别有关,得到如下列联表(单位:人):(1)根据以上数据,判断能否在犯错误的概率不超过10%的情况下认为该校参加体育运动的积极性与性别有关;(2)用频率估计概率,现从该校所有女生中随机抽取3人.记被抽取的3人中“偶尔运动或不运动”的人数为X ,求X 的分布列、期望()E X 和方差()D X .附:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.2.07223.为了促进我国人口均衡发展,从2016年1月1日起,全国统一实施全面放开二孩政策,这也是为了重建大国人口观,重新认识人口价值、人口规律、人口问题,某研究机构为了了解人们对全面放开生育二孩政策的态度,随机调查了200人,得到的统计数据如下面的不完整的2×2列联表所示(单位:人):(1)完成2×2列联表,并求是否有90%的把握认为是否“支持生育二孩”与性别有关? (2)该研究机构从样本中筛选出4名男性和3名女性共7人作为代表,这7个代表中有2名男性和2名女性支持生育二孩现从这7名代表中任选3名男性和2名女性参加座谈会,记ξ为参加会议的支持生育二孩的人数,求ξ的分布列及数学期望()E ξ.参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:24.某媒体对“男女延迟退休”这一公众关注的问题进行了民意调查,下表是在某单位调查后得到的数据(人数):(1)能否有90%以上的把握认为对这一问题的看法与性别有关? (2)进一步调查:①从赞同“男女延迟退休”的16人中选出3人进行陈述发言,求事件“男士和女士各至少有1人发言”的概率;②从反对“男女延迟退休”的9人中选出3人进行座谈,设选出的3人中女士人数为X ,求X 的分布列和数学期望.附:()21122122121212n n n n n n n n n χ++++-=25.某企业是否支持进军新的区域市场,在全体员工中进行了抽样调查,调查结果如下表所示:(1)根据表中数据,问是否有99%的把握认为“新员工和老员工是否支持进军新的区域市场有差异”;(2)已知在被调查的新员工中有6名来自市场部,其中2名支持进军新的区域市场,现在从这6人中随机抽取3人,设其中支持进军新的区域市场人数为随机变量X,求X的分布列和数学期望.附:()22()()()()n ac bdKa b a c b d c d-=++++26.为了了解某班学生喜欢数学是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表,已知在全部50人中随机抽取1人抽到喜欢数学的学生的概率为3 5 .(1)能否在犯错误的概率不超过0.005的前提下认为喜欢数学与性别有关?说明你的理由;()20P K k ≥ 0.150.100.050.025 0.010 0.005 0.001 0k 2.702 2.7063.8415.0246.6357.87910.828(2)现从女生中抽取2人进一步调查,设其中喜欢数学的女生人数为ξ,求ξ的分布列与期望.临界表供参考:(参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++)【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【解析】 令x=1,则(1+1)n =++…+=64.∴n=6.故(1+x)6的展开式中系数最大的项为T 4=x 3=20x 3.2.D解析:D 【分析】计算得到22322214χχχχ>>>,得到答案. 【详解】计算得到:222152(6221410)5281636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯; 222252(4201612)521121636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯ ; 222352(824128)52961636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯ ; 222452(143062)524081636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯;故22322214χχχχ>>>. 故选:D . 【点睛】本题考查了独立性检验,意在考查学生的计算能力和应用能力.3.D解析:D 【解析】【分析】根据公式()()()()()22n ad bcKa b c d a c b d-=++++,分别利用4个选项中所给数据求出2K的值,比较所求值的大小即可得结果.【详解】选项A:22160(535155)3204010502K⨯⨯-⨯==⨯⨯⨯,选项B:22260(5251515)152040204016K⨯⨯-⨯==⨯⨯⨯,选项C:22360(5201520)24204025357K⨯⨯-⨯==⨯⨯⨯,选项D:22 460(5101530)96 204035257K⨯⨯-⨯==⨯⨯⨯,可得222431K K K>>22K>,所以由选项D中的数据得到的2K值最大,说明X与Y有关系的可能性最大,故选D.【点睛】本题主考查独立性检验的基本性质,意在考查对基本概念的理解与应用,属于基础题.解答独立性检验问题时,要注意应用2K越大两个变量有关的可能性越大这一性质.4.B解析:B【解析】【分析】根据独立性检验的思想,对题目中的命题进行分析、判断正误即可.【详解】对于①,对事件A与B无关时,说明两事件的影响较小,不是两个互不影响,①错误;对于②,事件A与B关系密切,说明事件A与B的相关性就越强,K2就越大,②正确;对于③,K2的大小不是判定事件A与B是否相关的唯一根据,判定两事件是否相关除了公式外;还可以用三维柱形图和二维条形图等方法来判定,③错误;故选:B.【点睛】本题考查了独立性检验思想的应用问题,属于基础题.K2值是用来判断两个变量相关的把握度的,不是用来判断两个变量是否相关的.5.C解析:C【解析】分析:根据独立性检验的性质可判断①;根据回归分析的基本原理可判断②;根据几何概型概率公式可判断③;根据不等式的性质可判断④.详解:①对于两个分类变量X与Y的随机变量2K的观测值k来说,k越小,判断“X与Y 有关系”的把握程度越小,①错误;②在相关关系中,若用211c xy c e =拟合时的相关指数为21R ,用2y bx a =+拟合时的相关指数为22R ,且2212R R >,则1y 的拟合效果好,②正确;③利用计算机产生0~1之间的均匀随机数a ,则事件“310a ->”发生的概率为1123103-=-,正确;④“0,0a b >>”可得到“2b a a b +≥”, “2b aa b+≥”时“0,0a b >>”不一定成立,所以“0,0a b >>”是“2b aa b+≥”的充分不必要条件,正确,即正确命题的个数是3,故选C. 点睛:本题主要通过对多个命题真假的判断,主要综合独立性检验、回归分析、几何概型概率公式、不等式的性质,属于中档题.这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.6.B解析:B 【解析】分析:根据题设收集的数据,得到男生学生的人数,进而得出22⨯的列联表,利用计算公式,求解2K 的值,即可作出判断.详解:由题意得,从5000人中,其中男生3500人,女生1500人,抽取一个容量为300人的样本,其中男女各抽取的人数为35003002105000⨯=人,1500300905000⨯=人, 又由频率分布直方图可知,每周体育锻炼时间超过4小时的人数的频率为0.75,所以在300人中每周体育锻炼时间超过4小时的人数为3000.75225⨯=人, 又在每周体育锻炼时间超过4小时的人数中,女生有60人,所以男生有22560165-=人,可得如下的22⨯的列联表:结合列联表可算得22300(456016530) 4.762 3.8412109075225K ⨯⨯-⨯=≈>⨯⨯⨯,所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”, 故选B.点睛:本题主要考查了独立性检验的基础知识的应用,其中根据题设条件得到男女生的人数,得出22⨯的列联表,利用公式准确计算是解答的关键,着重考查了分析问题和解答问题的能力.7.D解析:D 【解析】分析:由题意首先求得a 的值,然后结合分层抽样的定义和独立性检验的结论逐一考查所给选项是否正确即可.详解:由直方图知,(0.004+0.013+0.014+a +0.027+0.039+0.08)×5=1,解得a =0.023, 故月消费金额超过2000元的大学生人数为(0.023+0.014+0.013)×5×1000=250人, 由分层抽样知,男生、女生抽样的人数分别为600人和400人, 由题知,月消费金额超过2000元的男生人数为100人,故A 选项错误; 月消费金额不超过500元的人数为0.004×5×1000=20人,故选项B 错误; 又由频率分布直方图知,当消费金额小于1750元时, 频率为(0.004+0.027+0.039)×5+0.08×5×12=0.55>0.5.选项C 错误; 由条件可以列出列联表:故K 2的观测值()()()()50010.8289n ad bc k a b c d a c b d -==>++++, 所以在犯错的概率不超过0.1%的情况下可以判断月消费金额在2000元以上的大学生与性别有关. 本题选择D 选项.点睛:解决频率分布直方图的问题,关键在于找出图中数据之间的联系.这些数据中,比较明显的有组距、频率组距,间接的有频率、小长方形的面积,合理使用这些数据,再结合两个等量关系:小长方形面积=组距×频率组距=频率,小长方形面积之和等于1,即频率之和等于1,就可以解决直方图的有关问题.8.C解析:C由题易得22⨯列联表如下:则2K 的观测值为()22023510 4.432 3.841128713k ⨯⨯-⨯=≈>⨯⨯⨯,所以至少有95%的把握认为学生选报文理科与性别有关,故选:C .【解题必备】(1)独立性检验是对两个分类变量有关系的可信程度的判断,而不是对其是否有关系的判断.独立性检验的结论只能是有多大的把握认为两个分类变量有关系,而不能是两个分类变量一定有关系或没有关系.(2)列联表中的数据是样本数据,它只是总体的代表,具有随机性,因此,需要用独立性检验的方法确认所得结论在多大程度上适用于总体.即独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释. (3)独立性检验的具体做法:①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α, 然后查下表确定临界值0k ; ②利用公式()()()()()22n ad bc K a c b d a b c d -=++++,计算随机变量2K 的观测值k ;③如果0k k ≥,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 有关系”,或者在样本数据中没有发现足够证据支持结论“X 与Y 有关系”.说明:通常认为 2.706k ≤时,样本数据就没有充分的证据显示“X 与Y 有关系”.9.D解析:D 【解析】∵y 与x 的线性回归方程为 6.5175ˆ.y x =+ 当5x =时,ˆ50y=. 当广告支出5万元时,由表格得:60y = 故随机误差的效应(残差)为605010.-=10.D解析:D 【解析】由条形图知,30名学生的得分情况依次为2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分,中位数为第15,16个数(分别为5,6)的平均数,即m e =5.5,5出现的次数最多,故众数为m 0=5,平均数为x =130(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97,故m 0<m e <x . 故答案为D.点睛:这个题目考查的是条型分布直方表的应用,以及基本量:均值,平均数的考查;一般在这类图中平均数就是将数据加到一起除以数据的个数即可,在频率分布直方表中是取每个长方条的中点乘以相应的频率并相加即可.11.C解析:C 【详解】由题意可知16,28,20,8a b c d ====,44,28,36,36a b c d a c c d +=+=+=+=,72n a b c d =+++=,代入公式()()()()()22n ad bc K a b c d a c b d -=++++得()227216828208.4244283636K ⨯⨯-⨯=≈⨯⨯⨯,由于28.427.879K ≈>,我们就有0099.5的把握认为性别和读营养说明之间有关系,即性别和读营养说明之间有0099.5的可能是有关系的,故选C .12.D解析:D 【解析】23.841 4.514 6.635k <=<,则0.010.05P <<,出错概率不超过5%选D.二、填空题13.【分析】设男生人数为依题意填写列联表计算观测值列出不等式求出的取值范围再根据题意求出男生的人数【详解】设男生人数为由题意可得列联表如下: 喜欢韩剧 不喜欢韩剧 总计 男生 女生 总 解析:18【分析】设男生人数为x ,依题意填写列联表,计算观测值,列出不等式求出x 的取值范围,再根据题意求出男生的人数. 【详解】设男生人数为x ,由题意可得列联表如下:喜欢韩剧 不喜欢韩剧 总计男生6x 56x x女生29x 9x 3x 总计718x 718x 43x 若有的把握认为是否喜欢韩剧和性别有关,则 3.841k >,即2452()3636969 3.84171711931818x x x x x x k x x x x ⋅-⋅==>⋅⋅⋅, 解得12.697x >.因为各部分人数均为整数,所以若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有18人. 故答案为:18. 【点睛】本题考查独立性检验的应用,解题关键是列出列联表,然后进行计算,属于常考题.14.甲【解析】根据茎叶图中的数据可知甲地的数据都集中在006和007之间数据分布比较稳定而乙地的数据分布比较分散不如甲地数据集中故甲地的方差小故答案为甲解析:甲 【解析】根据茎叶图中的数据可知,甲地的数据都集中在0.06和0.07之间,数据分布比较稳定,而乙地的数据分布比较分散,不如甲地数据集中,故甲地的方差小,故答案为甲.15.【解析】试题分析:由回归直线方程可知当时所以针对个体的残差是考点:线性回归方程 解析:0.29-【解析】试题分析:由回归直线方程可知当160x =时,53.29y =,所以针对个体的残差是5353.290.29-=-.考点:线性回归方程.16.①②③【解析】①正确因为k2越大说明A 和B 有关系的把握性就越大;②正确因为y=cekx 那么lny=lncekx=kx+lnc 即z=kx+lnc=03x+4解得k=03lnc=4解得:k=03c=e4解析:①②③【解析】①正确,因为越大,说明“和有关系”的把握性就越大;②正确,因为,那么,即,解得,解得:所以正确;③在回归直线上,所以,解得:,所以正确,那么正确的有①②③.【点睛】本题是以命题形式考查了回归方程和独立性检验的相关知识,样本中心点必在回归直线上,独立性检验中越大,说明犯错误的概率越小,即认为两个变量有关的把握性就越大.17.40【解析】根据题意:解析:40【解析】根据题意:99.51010.511105x++++==,111086585y++++==,3.2y x a=-+, 3.210840a∴=⨯+=18.6【解析】n为18+12+6=36的正约数因为18:12:6=3:2:1所以n为6的倍数因此因为当样本容量为时若采用系统抽样法则需要剔除1个个体所以n+1为35的正约数因此解析:6【解析】n为18+12+6=36的正约数,因为18:12:6=3:2:1,所以n为6的倍数,因此6,12,18,24,30,36n=因为当样本容量为1n+时,若采用系统抽样法,则需要剔除1个个体,所以n+1为35的正约数,因此6n=19.(155)【解析】由题意可得:线性回归方程过样本中心点即线性回归方程所表示的直线必经过点(155)点睛:(1)正确理解计算的公式和准确的计算是求线性回归方程的关键(2)回归直线方程必过样本点中心解析:(1.5,5)【解析】由题意可得:01231.54x+++==,826454y+++==,线性回归方程过样本中心点,即线性回归方程ˆy a bx=+所表示的直线必经过点(1.5,5)点睛:(1)正确理解计算,b a的公式和准确的计算是求线性回归方程的关键.(2)回归直线方程y bx a=+必过样本点中心(),x y.20.【解析】分析:根据题意填写2×2列联表计算观测值对照临界值得出结论详解:填写2×2列联表如下:根据数表计算=≈825>7879所以有995的把握认为开车时使用手机与司机的性别有关;点睛:独立性检验的 解析:8.25【解析】分析:根据题意填写2×2列联表,计算观测值,对照临界值得出结论. 详解:填写2×2列联表,如下:根据数表,计算()()()()()22n ad bc a b c d a c b d -X =++++=()21004025201555456040⨯⨯-⨯⨯⨯⨯≈8.25>7.879,所以有99.5%的把握认为开车时使用手机与司机的性别有关;点睛:独立性检验的一般步骤:(I )根据样本数据制成22⨯列联表;(II )根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(III ) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)三、解答题21.(1)列联表见解析,有;(2)分布列见解析,1.2. 【分析】(1)根据已知数据即可得到列联表;计算出28.2497.879χ≈>,对比临界值表可得到结果;(2)由样本估计总体思想,可得到随机抽检1辆,司机为男性且开车使用手机的概率为25,可知235X B ⎛⎫⎪⎝⎭,,由二项分布概率公式可计算得到每个取值所对应的概率,从而得到分布列;由二项分布数学期望计算公式可得()E X . 【详解】(1)由已知数据可得22⨯列联表如下:开车时使用手机 开车时不使用手机合计男性司机人数 40 1555女性司机人数2025 45()2100402515208.2497.87960405545χ⨯⨯-⨯=≈⨯⨯⨯>∴有99.5%的把握认为开车时使用手机与司机的性别有关(2)随机抽检1辆,司机为男性且开车时使用手机的概率4021005p == 有题意可知:X 可取值是0,1,2,3,且235XB ⎛⎫ ⎪⎝⎭, ()03032327055125P X C ⎛⎫⎛⎫∴=== ⎪ ⎪⎝⎭⎝⎭;()12132354155125P X C ⎛⎫⎛⎫=== ⎪⎪⎝⎭⎝⎭; ()21232336255125P X C ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭;()333238355125P X C ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭ 则X 的分布列为:数学期望()3 1.25E X =⨯= 【点睛】本题考查独立性检验的应用、二项分布的分布列及数学期望的求解等知识,对学生的计算和求解能力有一定要求,属于常考题型.22.(1)不能在犯错误的概率不超过10%的情况下认为该校参加体育运动的积极性与性别有关;(2)分布列答案见解析,6()5E X =,18()25D X =. 【分析】(1)代入2K 即可得出结论;(2)X 服从二项分布,分别求出概率,即可得出X 的分布列,然后代入数据求出期望和方差即可. 【详解】(1)由列联表可知2200(70406030)2002.1981307010010091k ⨯⨯-⨯==≈⨯⨯⨯,因为2.198 2.706<,所以不能在犯错误的概率不超过10%的情况下认为该校参加体育运动的积极性与性别有关. (2)由题意可知2(3,)5XB ,X 的所有可能取值为0,1,2,3,033327(0)()5125P X C ===,1232354(1)()()55125P X C ==⨯=,2232336(2)()55125P X C ==⨯=,33328(3)()5125P X C ===. 所以X 的分布列为()355E X =⨯=,()3(1)5525D X =⨯⨯-=.【点睛】本题主要考查独立性检验原理以及利用二项分布求期望和方差.属于中档题. 23.(1)答案见解析,没有;(2)答案见解析,176. 【分析】(1)由表中的已知数据先补充列联表,再计算2K 与临界值2.706比较大小即可; (2))设参加座谈会的男性中支持生育二孩的人数为m ,女性中支持生育二孩的人数为n ,则m n ξ=+,且ξ的可能取值为2,3,4,利用离散型随机变量的取值求概率,画出分布列,求出数学期望即可. 【详解】(1)补充完整的2×2列联表如下:()()()()()()220070403060 2.198 2.70613070100100n ad bc K a b c d a c b d -⨯⨯-⨯==≈<++++⨯⨯⨯,所以没有90%的把握认为是否“支持生育二孩”与性别有关.(2)设参加座谈会的男性中支持生育二孩的人数为m ,女性中支持生育二孩的人数为n ,则m n ξ=+,且ξ的可能取值为2,3,4.()()121122213243121,13C C C C P P m n C C ξ======, ()()()2111122222122232324343132,11,22C C C C C C C P P m n P m n C C C C ξ====+===+=, 22222324131(4)(2,2)6C C C P P m n C C ξ======, 所以ξ的分布列为。

(压轴题)高中数学高中数学选修2-3第三章《统计案例》测试题(含答案解析)(1)

(压轴题)高中数学高中数学选修2-3第三章《统计案例》测试题(含答案解析)(1)

一、选择题1.假设有两个分类变量X 和Y 的22⨯列联表为:对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .5,35b d ==B .15,25b d ==C .20,20b d ==D .30,10b d ==2.已知x 与y 之间的几组数据如下表: x 1 2 4 5 y 0 2 3 5假设根据上表数据所得线性回归直线方程y=bx+a,若某同学根据上表中的前两组数据(1,0)和(2,2),求得的直线方程为y=b'x+a',则以下结论正确的是( ) A .b>b',a>a' B .b<b',a<a' C .b>b',a<a' D .b<b',a>a'3.经过对K 2的统计量的研究,得到了若干个观测值,当K 2≈6.706时,我们认为两分类变量A 、B ( )A .有67.06%的把握认为A 与B 有关系 B .有99%的把握认为A 与B 有关系C .有0.010的把握认为A 与B 有关系D .没有充分理由说明A 与B 有关系 4.有如下几个结论: ①相关指数R 2越大,说明残差平方和越小,模型的拟合效果越好; ②回归直线方程:y bx a =+,一定过样本点的中心:(,)x y ③残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适; ④在独立性检验中,若公式()()()()()22n ad bc K a b c d a c b d -=++++,中的|ad-bc|的值越大,说明“两个分类变量有关系”的可能性越强.其中正确结论的个数有( )个. A .1B .2C .3D .45.下列判断错误的是A .若随机变量ξ服从正态分布()()21,,30.72N P σξ≤=,则()10.28P ξ≤-=;B .若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上,则相关系数1r =-;C .若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭, 则()1E ξ=; D .am bm >是a b >的充分不必要条件;6.已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据:x 2 4 5 6 8 y3040506070根据上表可得回归方程y bx a =+,计算得7b =,则当投入10万元广告费时,销售额的预报值为 A .75万元 B .85万元 C .99万元D .105万元7.下列说法中,不正确的是A .两个变量的任何一组观测值都能得到线性回归方程B .在平面直角坐标系中,用描点的方法得到表示两个变量的关系的图象叫做散点图C .线性回归方程反映了两个变量所具备的线性相关关系D .线性相关关系可分为正相关和负相关8.为考察数学成绩与物理成绩的关系,在高二随机抽取了300名学生,得到下面的列联表:数学85~100分 数学85分以下 总计 物理85~100分 37 85 122 物理85分以下 35 143 178 总计72228300现判断数学成绩与物理成绩有关系,则犯错误的概率不超过 ( ) A .0.005 B .0.01C .0.02D .0.059.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是( )A .男、女人患色盲的频率分别为0.038,0.006B .男、女人患色盲的概率分别为,C .男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的D .调查人数太少,不能说明色盲与性别有关10.已知,x y 的取值如下表:( )x0 1, 2 3 4 y11.33.25.68.9若依据表中数据所画的散点图中,所有样本点()(,)1,2,3,4,5i i x y i =都在曲线212y x a =+附近波动,则a =( ) A .1B .12C .13D .12-11.已知变量x ,y 的一组观测数据如表所示: x 3 4 5 6 7 y4.02.5-0.50.5-2.0据此得到的回归方程为y bx a =+,若a =7.9,则x 每增加1个单位,y 的预测值就( ) A .增加1.4个单位 B .减少1.2个单位C .增加1.2个单位D .减少1.4个单位12.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,2,1,3b x y ===,则1a =.④如果两个变量x 与y 之间不存在着线性关系,那么根据它们的一组数据()(,1,2,,)i i x y i n =不能写出一个线性方程正确的个数是( )A .1B .2C .3D .4二、填空题13.x ,y 的取值如下表: x-2-1.5-1-0.50.51y 0.26 0.35 0.51 0.71 1.1 1.41 2.05则x ,y 之间的关系可选用函数___进行拟合.14.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程=3-5x ,变量x 增加一个单位时,y 平均增加5个单位;③线性回归方程=x +必过(,);④曲线上的点与该点的坐标之间具有相关关系;⑤在一个2×2列联表中,由计算得K 2=13.079,则其两个变量之间有关系的可能性是90%.其中错误的个数是________. 15.教材上一例问题如下:一只红铃虫的产卵数y 和温度x 有关,现收集了7组观测数据如下表,试建立y 与x 之间的回归方程. 温度 x /℃ 21 23 25 27 29 32 35 产卵数y /个711212466115325某同学利用图形计算器研究它时,先作出散点图(如图所示),发现两个变量不呈线性相关关系. 根据已有的函数知识,发现样本点分布在某一条指数型曲线21c xy c e =的附近(1c 和2c 是待定的参数),于是进行了如下的计算:根据以上计算结果,可以得到红铃虫的产卵数y 对温度x 的回归方程为__________.(精确到0.0001) (提示:21c xy c e =利用代换可转化为线性关系) 16.给出下列命题:①线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;②由变量x 和y 的数据得到其回归直线方程:l ˆybx a =+,则l 一定经过点(),x y P ; ③从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;④在回归分析模型中,残差平方和越小,说明模型的拟合效果越好;⑤在回归直线方程0.110ˆyx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 增加0.1个单位,其中真命题的序号是___________.17.以下四个命题中:①从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量的线性相关性越强,相关系数的绝对值越接近于1; ③某项测量结果服从正太态布,则; ④对于两个分类变量和的随机变量的观测值来说,越小,判断“与有关系”的把握程度越大.以上命题中其中真命题的个数为___________.18.在吸烟与患肺病这两个分类变量的计算中,“若2x 的观测值为6.635,我们有99%的把握认为吸烟与患肺病有关系”这句话的意思: ①是指“在100个吸烟的人中,必有99个人患肺病 ②是指“有1%的可能性认为推理出现错误”; ③是指“某人吸烟,那么他有99%的可能性患有肺病”; ④是指“某人吸烟,如果他患有肺病,那么99%是因为吸烟”. 其中正确的解释是______.19.一个三位自然数百位,十位,个位上的数字依次为a ,b ,c ,当且仅当有两个数字的和等于第三个数字时称为“有缘数”(如213,134等),若{},,1234a b c ∈,,,,且a ,b ,c 互不相同,则这个三位数为”有缘数”的概率是__________. 20.下列说法:①线性回归方程y bx a =+必过(),x y ;②命题“21,34x x ∀≥+≥”的否定是“21,34x x ∃<+<” ③相关系数r 越小,表明两个变量相关性越弱;④在一个22⨯列联表中,由计算得28.079K =,则有99%的把握认为这两个变量间有关系;其中正确..的说法是__________.(把你认为正确的结论都写在横线上) 本题可参考独立性检验临界值表:三、解答题21.今年疫情期间,许多老师进行抖音直播上课某校团委为了解学生喜欢抖音上课是否与性别有关,从高三年级中随机抽取30名学生进行了问卷调查,得到如下列联表:男生 女生 合计 喜欢抖音上课 10不喜欢抖音上课8合计 30已知在这30人中随机抽取1人抽到喜欢抖音上课的学生的概率是815. (1)请将上面的列联表补充完整,并据此资料分析能否有95%的把握认为喜欢抖音上课与性别有关?(2)若从这30人中的女生中随机抽取2人,记喜欢抖音上课的人数为X ,求X 的分布列、数学期望. 附临界值表:()20P K k ≥0.10 0.05 0.010 0.005 0k2.7063.8416.637.879参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.22.某校从高三年级的男女生中各随机抽取了100人的体育测试成绩(以下称体测成绩,单位:分),数据都落在[)60100,内,其统计数据如表所示(其中不低于80分的学生为优秀).(1)请根据如表数据完成22⨯列联表,并通过计算判断,是否有95%的把握认为体测成绩与性别有关?(2)视频率为概率,在全校的高三学生中任取3人,记取出的3人中优秀的人数为X ,求X 的分布列和数学期望.附:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++23.支付宝和微信支付是目前市场占有率较高的支付方式,某第三方调研机构对使用这两种支付方式的人数作了对比,从全国随机抽取了100个地区作为研究样本,计算了各个地区样本的使用人数,其频率分布直方图如下,(1)记A表示事件“微信支付人数低于50千人”,估计A的概率;(2)填写下面2╳2列联表,并根据2╳2列联表判断是否有99%的把握认为支付人数与支付方式有关;支付人数<50千支付人数≥50千人总计人微信支付 支付宝支付 总计附:2()P K k ≥0.050 0.010 0.001 k3.8416.63510.828()()()()()22n ad bc K a b c d a c b d -=++++.24.2020突如其来的疫情让我们经历了最漫长、最特殊的一个假期,教育行政部门部署了“停课不停学”的行动,全力帮助学生在线学习.复课后某校进行了摸底考试,某数学教师为了调查高二学生这次摸底考试的数学成绩与每天在线学习数学的时长之间的相关关系,对在校高二学生随机抽取45名进行调查,了解到其中有25人每天在线学习数学的时长不超过1小时,并得到如下的等高条形图:(1)根据等高条形图填写下面22⨯列联表,并根据列联表判断能否在犯错误的概率不超过0.05的前提下认为“高二学生的这次摸底考试数学成绩与其每天在线学习数学的时长有关”;数学成绩不超过120分 数学成绩超过120分 总计 每天在线学习数学不超过1小时 25每天在线学习数学超过1小时总计45(2)从被抽查的,且这次数学成绩超过120分的学生中,再随机抽取3人,求抽取的3人中每天在线学习数学的时长超过1小时的人数ξ的分布列与数学期望. 附临界值表()20P K k ≥0.050 0.010 0.001 0k3.8416.63510.828参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.25.某单位组织开展“学习强国”的学习活动,活动第一周甲、乙两个部门员工的学习情况统计如下:学习活跃的员工人数 学习不活跃的员工人数甲 18 12 乙328(1)根据表中数据判断能否有95%的把握认为员工学习是否活跃与部门有关; (2)活动第二周,单位为检查学习情况,从乙部门随机抽取2人,发现这两人学习都不活跃,能否认为乙部门第二周学习的活跃率比第一周降低了?说明理由.参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:2(0.1) 2.706P K ≥=,2(0.05) 3.841P K ≥=,2(0.01) 6.635P K ≥=. 26.根据国家统计局数据,1999年至2019年我国进出口贸易总额从3万亿元跃升至31.6万亿元,中国在国际市场上的贸易份额越来越大对外贸易在国民经济中的作用日益突出.将年份1999,2004,2009,2014,2019分别用1,2,3,4,5代替,并表示为t ,y 表示全国进出口贸易总额.(1)根据以上统计数据及图表,给出了下列两个方案,请解决方案1中的问题. 方案1:用y bt a =+作为全国进出口贸易总额y 关于t 的回归方程,根据以下参考数据,求出y 关于t 的回归方程,并求相关指数21R .方案2:用dt y ce =作为全国进出口贸易总额y 关于t 的回归方程,求得回归方程0.57212.3259x y e =,相关指数22R .(2)通过对比(1)中两个方案的相关指数,你认为哪个方案中的回归方程更合适,并利用此回归方程预测2020年全国进出口贸易总额. 参考数据:①0.140.340.66 1.86 2.048.192++++=②222220.140.34 1.86 2.04 2.1412.336++++=③8.1920.0147555.792≈④12.3360.0222555.792≈参考公式:线性回归方程中的斜率和截距的最小二乘法估计公式分别为:()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-,相关指数()()221211ni ii n ii y y R yy==-=--∑∑.【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】 【分析】 根据公式()()()()()22n ad bc K a b c d a c b d -=++++,分别利用4个选项中所给数据求出2K 的值,比较所求值的大小即可得结果. 【详解】选项A :22160(535155)3204010502K ⨯⨯-⨯==⨯⨯⨯,选项B :22260(5251515)152040204016K ⨯⨯-⨯==⨯⨯⨯,选项C :22360(5201520)24204025357K ⨯⨯-⨯==⨯⨯⨯,选项D :22460(5101530)96204035257K ⨯⨯-⨯==⨯⨯⨯,可得222431K K K >>22K >,所以由选项D 中的数据得到的2K 值最大,说明X 与Y 有关系的可能性最大,故选D . 【点睛】本题主考查独立性检验的基本性质,意在考查对基本概念的理解与应用,属于基础题.解答独立性检验问题时,要注意应用2 K 越大两个变量有关的可能性越大这一性质.2.D解析:D 【解析】 【分析】先根据()()1,0,2,2求得直线y b x a ='+'的方程.然后计算出回归直线方程y bx a =+,由此比较大小,得出正确的结论. 【详解】由于直线y b x a ='+'过()()1,0,2,2,将两点坐标代入直线方程得022b a b a +=⎧⎨+=''''⎩,解得2,2b a ''==-.124534x +++==,02352.54y +++==,1122334414122542x y x y x y x y +++=+++=.2222123414162546x x x x +++=+++=,故24243 2.54230121.24643463610b -⨯⨯-====-⨯-, 2.5 1.23 2.5 3.6 1.1a =-⨯=-=-.所以,a a b b >'<',故选D.【点睛】本小题主要考查利用直线上的两点坐标求直线方程的方法,考查回归直线方程的计算,属于中档题.3.B解析:B 【分析】根据所给的观测值,同临界值表中的临界值进行比较,根据P (K 2>3.841)=0.05,得到我们有1-0.05=95%的把握认为A 与B 有关系. 【详解】 依据下表:2 6.635K > , 2 6.6350.01P K =(>)∴我们在错误的概率不超过0.01的前提下有99%的把握认为A 与B 有关系, 故选B . 【点睛】本题考查独立性检验的应用,本题解题的关键是正确理解临界值对应的概率的意义,本题不用运算只要理解概率的意义即可.4.D解析:D 【分析】根据相关指数定义、残差平方和含义可得①为真,根据回归直线方程特征可得②为真,根据残差点含义可得③为真,根据卡方含义可得④为真. 【详解】相关指数R 2越大,则残差平方和越小,模型的拟合效果越好;回归直线方程:ˆy bx a =+,一定过点() ,x y ;若残差点比较均匀地落在水平的带状区域中,则选用的模型比较合适; 在独立性检验中,若公式()()()()()22n ad bc K a b c d a c b d -=++++,中的|ad-bc|的值越大,则2K 越大, “两个分类变量有关系”的可能性越强.选D. 【点睛】相关指数R 2越大,残差平方和越小,残差点比较均匀地落在水平的带状区域,则模型的拟合效果越好;在独立性检验中,若2 K 越大,则两个变量有关系越强;回归直线方程:ˆy bx a =+,一定过点() ,x y .5.D解析:D 【解析】分析:根据正态分布的对称性求出()1P ξ≤-的值,判断A 正确; 根据线性相关关系与相关系数的定义,判断B 正确; 根据二项分布的均值计算公式求出()E ξ的值,判断C 正确; 判断充分性和必要性是否成立,得出D 错误.详解:对于A ,随机变量ξ服从正态分布()21,N σ,∴曲线关于1ξ=对称,131310.720.28PP P ξξξ∴≤-=≥=-≤=-=()()(),A 正确;对于B ,若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上, 则x y ,成负相关,且相关关系最强,此时相关系数1r =-,B 正确;对于C ,若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭,则1515E(),ξ=⨯= C 正确;对于D ,am >bm 时,a >b 不一定成立,即充分性不成立,a b am bm >时,> 不一定成立,即必要性不成立,是既不充分也不必要条件,D 错误. 故选:D .点睛:本题考查了命题真假的判断问题,是综合题.6.B解析:B 【解析】分析:根据表中数据求得样本中心(,)x y ,代入回归方程ˆ7ˆyx a =+后求得ˆa ,然后再求当10x =的函数值即可. 详解:由题意得11(24568)5,(3040506070)5055x y =++++==++++=, ∴样本中心为(5,50).∵回归直线ˆ7ˆyx a =+过样本中心(5,50), ∴ˆ5075a=⨯+,解得ˆ15a =, ∴回归直线方程为ˆ715yx =+. 当10x =时,710158ˆ5y=⨯+=, 故当投入10万元广告费时,销售额的预报值为85万元. 故选B .点睛:本题考查回归直线过样本中心这一结论和平均数的计算,考查学生的运算能力,属容易题.7.A解析:A 【解析】要得到线性回归方程应至少有两个变量的两组观测值,因此A 不正确.根据散点图、线性回归方程、线性相关关系的概念可得B ,C ,D 都正确.故选A .8.D解析:D 【解析】因为K 2的观测值k=2300(371433585)12217872228⨯-⨯⨯⨯⨯≈4.514>3.841, 所以在犯错误的概率不超过0.05的前提下认为数学成绩与物理成绩有关系. 选D.9.C解析:C 【解析】男人中患色盲的比例为,要比女人中患色盲的比例大,其差值为,差值较大,所以认为患色盲与性别是有关的.考点:独立性检验.10.A解析:A 【解析】 设2t x = ,则11(014916)6,(1 1.3 3.2 5.68.9)455t y =++++==++++=,所以点(6,4)在直线12y t a =+上,求出1a =,选A. 点睛:本题主要考查了散点图,属于基础题.样本点的中心(),x y 一定在直线回归直线上,本题关键是将原曲线变形为12y t a =+,将点(6,4)代入,求出值. 11.D解析:D 【解析】由表格得 5x =, 0.9y =,∵回归直线方程为7ˆ9ˆ.y bx=+,过样本中心, ∴57.90.9b +=,即75b =-,则方程为77.95ˆyx =-+,则x 每增加1个单位,y 的预测值就减少1.4个单位,故选D.12.C解析:C 【解析】①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大,正确; ②∵kx y ce =,∴两边取对数,可得lny ln =(kx ce )kx lnc lnce lnc kx =+=+, 令z lny =,可得z lnc kx =+, ∵0.34z x =+, ∴40.3lnc k ==, ∴4c e =.即②正确;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y =a +bx 中,2,1,3b x y ===,则a =1,正确。

昆山市选修1-2第一章《统计案例》测试(有答案解析)

昆山市选修1-2第一章《统计案例》测试(有答案解析)

一、选择题1.某校高二(1)班甲、乙两同学进行投篮比赛,他们进球的概率分别是34和45,现甲、乙各投篮一次,恰有一人进球的概率是()A.120B.320C.15D.7202.下列命题不正确的是()A.研究两个变量相关关系时,相关系数r为负数,说明两个变量线性负相关B.研究两个变量相关关系时,相关指数R2越大,说明回归方程拟合效果越好.C.命题“∀x∈R,cos x≤1”的否定命题为“∃x0∈R,cos x0>1”D.实数a,b,a>b成立的一个充分不必要条件是a3>b33.为了提升全民身体素质,学校十分重视学生体育锻炼.某校篮球运动员进行投篮练习,若他前一球投进则后一球投进的概率为34,若他前一球投不进则后一球投进的概率为1 4.若他第1球投进的概率为34,则他第3球投进的概率为()A.34B.58C.116D.9164.甲、乙、丙、丁4个人进行网球比赛,首先甲、乙一组,丙、丁一组进行比赛,两组的胜者进入决赛,决赛的胜者为冠军、败者为亚军.4个人相互比赛的胜率如右表所示,表中的数字表示所在行选手击败其所在列选手的概率.那么甲得冠军且丙得亚军的概率是( )A.0.15B.0.105C.0.045D.0.215.为了解某班学生喜爱打篮球是否与性别有关,对该班60名学生进行问卷调查,得到如下图所示的22列联表,则至少有()的把握认为喜爱打篮球与性别有关.附参考公式:()()()()()22n ad bcKa b c d a c b d-=++++,n a b c d=+++.A.99.9%B.99.5%C.99%D.97.5%6.某市通过随机询问100名不同年级的学生是否能做到“扶跌倒老人”,得到如下列联表:则下列结论正确的是()附参照表:参考公式:22()()()()()n ad bcka b c d a c b d-=++++,其中n a b c d=+++A.在犯错误的概率不超过90%的前提下,认为“学生能否做到‘扶跌倒老人’与年级高低有关”B.在犯错误的概率不超过1%的前提下,“学生能否做到‘扶跌倒老人’与年级高低无关”C.有90%以上的把握认为“学生能否做到‘扶跌倒老人’与年级高低有关”D.有90%以上的把握认为“学生能否做到‘扶跌倒老人’与年级高低无关”7.某射手射击一次命中的概率为0.8,连续两次射击均命中的概率是0.6,已知该射击手某次射中,则随后一次射中的概率是()A .34B .45C .35D .7108.从装有形状大小相同的3个黑球和2个白球的盒子中依次不放回地任意抽取3次,若第二次抽得黑球,则第三次抽得白球的概率等于( ) A .15B .14C .13D .129.根据如下样本数据:得到回归方程 1.412.ˆ4yx =-+,则 A .5a =B .变量x 与y 线性正相关C .当x =11时,可以确定y =3D .变量x 与y 之间是函数关系10.甲、乙两人同时报考某一所大学,甲被录取的概率为0.6,乙被录取的概率为0.7,两人是否被录取互不影响,则其中至少有一人被录取的概率为( ) A .0.12B .0.42C .0.46D .0.8811.为了解学生对街舞的喜欢是否与性别有关,在全校学生中进行抽样调查,根据数据,求得2K 的观测值0 4.804k ≈,则至少有( )的把握认为对街舞的喜欢与性别有关.参考数据:A .90%B .95%C .97.5%D .99%12.甲、乙两位同学各自独立地解答同一个问题,他们能够正确解答该问题的概率分别是23和12,在这个问题至少被一个人正确解答的条件下,甲、乙两位同学都能正确解答该问题的概率为( ) A .27B .25C .15D .19二、填空题13.甲、乙两位同学进行篮球三分球投篮比赛,甲每次投中的概率为13,乙每次投中的概率为12,每人分别进行三次投篮.乙恰好比甲多投进2次的概率是______.14.为了了解司机开车时礼让斑马线行人的情况,交警部门调查了100名机动车司机,得到以下统计数据:礼让斑马线行人不礼让斑马线行人男性司机人数4015女性司机人数2025若以2χ为统计量进行独立性检验,则2χ的值是__________.(结果保留2位小数)参考公式()1122122121212n n n n nn n n nχ++++-=15.机动车驾驶的考核过程中,科目三又称道路安全驾驶考试,是机动车驾驶人考试中道路驾驶技能和安全文明驾驶常识考试科目的简称假设某人每次通过科目三的概率均为45,且每次考试相互独立,则至多考两次就通过科目三的概率为__________.16.甲、乙两队进行排球比赛,已知在一局比赛中甲队获胜的概率是23,没有平局,若采用三局两胜制比赛,即先胜两局者获胜且比赛结束,则甲队获胜的概率等于__________. 17.把一枚硬币任意抛掷三次,事件A=“至少出现一次反面”,事件B=“恰好出现一次正面”,则(/)P B A=__________.18.甲、乙两个小组各10名学生的英语口语测试成绩的茎叶图如图所示.现从这 20名学生中随机抽取一人,将“抽出的学生为甲小组学生”记为事件A;“抽出的学生英语口语测试成绩不低于85分”记为事件B.则P(A|B)的值是_____.19.2020年新型冠状病毒疫情期间,大学生小白同学在家里根据某款运动软件安排的训练计划进行运动,每天训练一次,连续3天为一个运动周期,若小白每天不能参加训练的概率为14,假设小白每天的训练是相互独立的,若一个训练周期内出现2次不能参加训练,则停止该训练计划,则这个训练计划在第二个完整周期后结束的概率为______.20.已知甲、乙两位射手,甲击中目标的概率为0.7,乙击中目标的概率为0.6,如果甲乙两仁射手的射击相互独立,那么甲乙两射手同时瞄准一个目标射击,目标被射中的概率为_________.三、解答题21.一个口袋中有4个红球和3个黑球.(1)从口袋中随机地连续取出三个球,取出后不放回,求:(i)三个球中有两个红球一个黑球的概率;(ii)第二次取出的是红球且第三次取出的也是红球的概率.(2)从口袋中随机地连续取出三个球,取出后放回,求至少有两个是红球且第三个是红球的概率22.在我国抗疫期间,素有“南抖音,北快手”之说的小视频除了给人们带来生活中的快乐外,更在于传递了一种正能量,为抗疫起到了积极的作用,但一个优秀的作品除了需要有很好的素材外,更要有制作上的技术要求,某同学学习利用“快影”软件将已拍摄的素材进行制作,每次制作分三个环节来进行,其中每个环节制作合格的概率分别为34,45,23,只有当每个环节制作都合格才认为一次成功制作,该小视频视为合格作品.(1)求该同学进行3次制作,恰有一次合格作品的概率;(2)若该同学制作10次,其中合格作品数为X,求X的数学期望与方差;(3)该同学掌握技术后制作的小视频被某广告公司看中,聘其为公司做广告宣传,决定试用一段时间,每天制作小视频(注:每天可提供素材制作个数至多40个),其中前7天制作合格作品数y与时间t如下表:(第t天用数字t表示)时间(t)1234567合格作品数(y)3434768其中合格作品数(y)与时间(t)具有线性相关关系,求y关于t的线性回归方程(精确到0.01),并估算第14天能制作多少个合格作品(四舍五入取整)?(参考公式()()()1221121ni iinniniiiiiix y nx ybnx xxxyxxy====-=---=-∑∑∑∑,a y bx=-,参考数据:71163i iit y==∑.)23.一商场对每天进店人数和商品销售件数进行了统计对比,得到如下表格:(1)在给定的坐标系中画出表中数据的散点图,并由散点图判断销售件数y与进店人数x是否线性相关?(给出判断即可,不必说明理由)(2)建立y 关于x 的回归方程(系数精确到0.01),预测进店人数为80时,商品销售的件数(结果保留整数) (参考数据:713245i ii x y==∑,25x =,15.43y =,7215075i i x ==∑,()274375x =,72700xy =)24.新生儿某疾病要接种三次疫苗免疫(即0、1、6月龄),假设每次接种之间互不影响,每人每次接种成功的概率相等为了解新生儿该疾病疫苗接种剂量与接种成功之间的关系,现进行了两种接种方案的临床试验:10μg /次剂量组与20μg/次剂量组,试验结果如下:接种成功 接种不成功 总计(人) 10μg /次剂量组 900 100 1000 20μg/次剂量组 973 27 1000 总计(人)18731272000(1)根据数据说明哪种方案接种效果好?并判断能否有99.9%的把握认为该疾病疫苗接种成功与两种接种方案有关?(2)以频率代替概率,若选用接种效果好的方案,参与该试验的1000人的成功人数比此剂量只接种一次的成功人数平均提高多少人.参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++参考附表:()20P K k ≥0.050 0.010 0.001 0k 3.8416.63510.82825.某班主任对全班50名学生的学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:积极参加班级工作不太主动参加班级工作合计学习积极性高18725学习积极性一般61925合计242650(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?(2)试运用独立性检验的思想方法分析:学生的学习积极性与对待班级工作的态度是否有关?并说明理由.参考公式与临界值表:()()()()()22n ac bdKa b c d a c b d-=++++.P(K2≥k)0.1000.0500.0250.0100.001k 2.706 3.841 5.024 6.63510.82826.某花圃为提高某品种花苗质量,开展技术创新活动,分别用甲、乙两种方法培育该品种花苗.为比较两种培育方法的效果,选取了40棵花苗,随机分成两组,每组20棵.第一组花苗用甲方法培育,第二组用乙方法培育.培育完成后,对每棵花苗进行综合评分,绘制了如图所示的茎叶图:(1)分别求两种方法培育的花苗综合评分的中位数.你认为哪一种方法培育的花苗综合评分更高?并说明理由.(2)综合评分超过80的花苗称为优质花苗,填写下面的列联表,并判断是否有99.5%的把握认为优质花苗与培育方法有关?优质花苗非优质花苗合计甲培育法乙培育法附:()()()()()22n ad bc K a b c d a c b d -=++++.【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】利用相互独立事件的概率乘法公式求得 甲投进而乙没有投进的概率,以及乙投进而甲没有投进的概率,相加即得所求. 【详解】甲投进而乙没有投进的概率为343(1)4520⨯-=,乙投进而甲没有投进的概率为341(1)455-⨯=,故甲、乙各投篮一次,恰有一人投进球的概率是 31720520+=,故选:D 【点睛】本题主要考查了相互独立事件的概率乘法公式的应用,体现了分类讨论的数学思想,属于中档题.2.D解析:D 【分析】根据相关系数、相关指数的知识、全称命题的否定的知识,充分、必要条件的知识对四个选项逐一分析,由此得出命题不正确的选项. 【详解】相关系数r 为负数,说明两个变量线性负相关,A 选项正确. 相关指数2R 越大,回归方程拟合效果越好,B 选项正确.根据全称命题的否定是特称命题的知识可知C 选项正确.对于D 选项,由于33a b a b >⇔>,所以33a b >是a b >的充分必要条件,故D 选项错误.所以选D. 【点睛】本小题主要考查相关系数、相关指数的知识,考查全称命题的否定是特称命题,考查充要条件的判断,属于基础题.3.D解析:D 【分析】分两种情况讨论:第2球投进和第2球投不进,利用独立事件的概率公式可得出所求事件的概率. 【详解】分以下两种情况讨论: (1)第2球投进,其概率为3311544448⨯+⨯=,第3球投进的概率为53158432⨯=; (2)第2球投不进,其概率为53188-=,第3球投进的概率为3138432⨯=. 综上所述:第3球投进的概率为1539323216+=,故选D. 【点睛】本题考查概率的求法,考查独立事件概率乘法公式的应用,同时也考查对立事件概率公式的应用,解题时要注意对事件进行分类讨论,考查运算求解能力,属于中等题.4.C解析:C 【分析】若甲得冠军且丙得亚军,则甲、乙比赛甲获胜,丙、丁比赛丙获胜,决赛甲获胜. 【详解】甲、乙比赛甲获胜的概率是0.3, 丙、丁比赛丙获胜的概率是0.5, 甲、丙决赛甲获胜的概率是0.3, 根据独立事件的概率等于概率之积,所以, 甲得冠军且丙得亚军的概率:0.30.50.30.045⨯⨯=. 故选C. 【点睛】本题考查独立事件的概率,考查分析问题解决问题的能力.5.C解析:C 【解析】分析:根据列联表中数据,利用公式求得27.333k ≈,对照临界值即可的结果. 详解:根据所给的列联表, 得到()226025151557.333 6.63540203030k ⨯-⨯=≈>⨯⨯⨯,∴至少有0099的把握认为喜爱打篮球与性别有关,故选C.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.6.C解析:C 【解析】分析:根据列联表中数据,利用公式求得2 3.03K ≈,参照临界值表即可得到正确结论. 详解:由公式()()()()()22n d bc k a b c d a c b d -=++++可得2 3.03K ≈,参照临界值表,2.7063.030 3.841<<,∴0090以上的把握认为,“学生能否做到‘扶跌倒老人’与年级高低有关”,故选C.点睛:本题考查了独立性检验的应用,属于基础题. 独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.7.A解析:A 【解析】分析:某次射中,设随后一次射中的概率为p ,利用相互独立事件概率乘法公式能求出p 的值.详解:某次射中,设随后一次射中的概率为p ,∵某射击手射击一次命中的概率为0.8,连续两次均射中的概率是0.5,0.80.6p ,∴= 解得34p =.故选:A .点睛:本题考查概率的求法,涉及到相互独立事件概率乘法公式的合理运用,考查推理论证能力、运算求解能力、数据处理能力,考查化归与转化思想,是基础题.8.D解析:D分析:这是一个条件概率,可用古典概型概率公式计算,即从5个球中取三个排列,总体事件是第二次是黑球,可在第二次是黑球的条件下抽排第一次和第三次球.详解:111223122412C C CPC A==.点睛:此题是一个条件概率,条件是第二次抽取的是黑球,不能误以为是求第二次抽到黑球,第三次抽到白球的概率,如果那样求得错误结论为1132353310 C CA⨯=.9.A解析:A 【解析】由题意可得:357964x+++==,6321144a ay++++==,回归方程过样本中心点,则:111.4612.4 4a+=-⨯+,求解关于实数a的方程可得:5a=,由 1.40ˆb=-<可知变量x与y线性负相关;当x=11时,无法确定y的值;变量x与y之间是相关关系,不是函数关系.本题选择A选项.点睛:一是回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.二是根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.10.D解析:D【解析】由题意知,甲、乙都不被录取的概率为(1-0.6)(1-0.7)=0.12.∴至少有一人被录取的概率为1-0.12=0.88.故选D.考点:相互独立事件的概率.11.B解析:B【解析】因为4.804>3.841,所以有95%的把握认为对街舞的喜欢与性别有关.12.B解析:B【分析】先计算“这个问题至少被一个人正确解答”和“甲、乙两位同学都能正确解答该问题”概率,再利用条件概率公式计算即可.由已知,不妨设A =“这个问题至少被一个人正确解答”,B =“甲、乙两位同学都能正确解答该问题”,因为甲、乙两位同学各自独立正确解答该问题的概率分别是23和12, 故215()111326P A ⎛⎫⎛⎫=---= ⎪⎪⎝⎭⎝⎭,121()233P B =⨯=, 易知1()()3P AB P B ==. 故()1()235()56P AB P BA P A ===∣. 故选:B. 【点睛】本题考查了条件概率的应用,属于中档题.二、填空题13.;【分析】将事件拆分为乙投进3次甲投进1次和乙投进2次甲投进0次再根据二项分布的概率计算公式和独立事件的概率计算即可求得【详解】根据题意甲和乙投进的次数均满足二项分布且甲投进和乙投进相互独立;根据题解析:16; 【分析】将事件拆分为乙投进3次,甲投进1次和乙投进2次,甲投进0次,再根据二项分布的概率计算公式和独立事件的概率计算即可求得. 【详解】根据题意,甲和乙投进的次数均满足二项分布,且甲投进和乙投进相互独立; 根据题意:乙恰好比甲多投进2次,包括乙投进3次,甲投进1次和乙投进2次,甲投进0次.则乙投进3次,甲投进1次的概率为32131********C ⎛⎫⎛⎫⨯⨯⨯= ⎪ ⎪⎝⎭⎝⎭;乙投进2次,甲投进0次的概率为232311212239C ⎛⎫⎛⎫⎛⎫⨯⨯= ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭.故乙恰好比甲多投进2次的概率为111 1896+=. 故答案为:16.本题考查二项分布的概率计算,属综合基础题.14.【解析】分析:根据题意填写2×2列联表计算观测值对照临界值得出结论详解:填写2×2列联表如下:根据数表计算=≈825>7879所以有995的把握认为开车时使用手机与司机的性别有关;点睛:独立性检验的 解析:8.25【解析】分析:根据题意填写2×2列联表,计算观测值,对照临界值得出结论. 详解:填写2×2列联表,如下:根据数表,计算()()()()()22n ad bc a b c d a c b d -X =++++=()21004025201555456040⨯⨯-⨯⨯⨯⨯≈8.25>7.879,所以有99.5%的把握认为开车时使用手机与司机的性别有关;点睛:独立性检验的一般步骤:(I )根据样本数据制成22⨯列联表;(II )根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(III ) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)15.【解析】第一类:考一次就通过的概率为;第二类:第一次未通过第二次通过的概率为;综上则至多考两次就通过科目三的概率为故答案为 解析:2425【解析】第一类:考一次就通过的概率为45; 第二类:第一次未通过,第二次通过的概率为44415525⎛⎫-⨯=⎪⎝⎭; 综上,则至多考两次就通过科目三的概率为442452525+=. 故答案为2425.16.【解析】甲队获胜分2种情况①第12两局中连胜2场概率为;②第12两局中甲队失败1场而第3局获胜概率为因此甲队获胜的概率为 解析:2027【解析】甲队获胜分2种情况①第1、2两局中连胜2场,概率为1224339P =⨯=; ②第1、2两局中甲队失败1场,而第3局获胜,概率为1222228133327P C ⎛⎫=-⨯=⎪⎝⎭ 因此,甲队获胜的概率为122027P P P =+=. 17.【解析】表示在已经发生事件的情况下事件发生的概率又事件恰有一次出现正面包含于事件至少一次出现反面所以所以解析:37【解析】(/)P B A 表示在已经发生事件A 的情况下,事件B 发生的概率,又事件B = “恰有一次出现正面”包含于事件A =“至少一次出现反面”,所以()()(/)()()P AB P B P B A P A P A ==,37(),()88P B P A ==,所以()3()7P B P A =. 18.【解析】试题分析:抽出的学生英语口语测试成绩不低于85分的有9种其中抽出的学生为甲小组学生的事件有5种所以概率为考点:条件概率 解析:【解析】试题分析:抽出的学生英语口语测试成绩不低于85分的有9种,其中抽出的学生为甲小组学生”的事件有5种,所以概率为59. 考点:条件概率.19.【分析】由题意求得一个周期内就停止训练的概率再结合相互独立事件的概率计算公式即可求解【详解】由题意小白每天不能参加训练的概率为若一个训练周期内出现2次不能参加训练可得一个周期内就停止训练的概率为这个解析:811024【分析】由题意,求得一个周期内就停止训练的概率,再结合相互独立事件的概率计算公式,即可求解.由题意,小白每天不能参加训练的概率为14,若一个训练周期内出现2次不能参加训练, 可得一个周期内就停止训练的概率为221135244432⎛⎫⎛⎫+⨯⨯= ⎪ ⎪⎝⎭⎝⎭, 这个训练计划持续两个周期的概率为2513811232441024⎛⎫⎛⎫-⨯⨯⨯= ⎪ ⎪⎝⎭⎝⎭. 故答案为:811024. 【点睛】本题主要考查了相互独立事件的概率的计算,其中解答中正确理解题意,结合独立事件的概率计算公式求得一个周期内就停止训练的概率是解答的关键,着重考查分析问题和解答问题的能力.20.【分析】目标被射中的对立事件为目标未被击中即甲乙均未射中利用对立事件概率计算公式直接求解【详解】甲乙两位射手甲击中目标的概率为07乙击中目标的概率为06甲乙两位射手的射击相互独立甲乙两射手同时未中的解析:0.88. 【分析】目标被射中的对立事件为目标未被击中,即甲乙均未射中,利用对立事件概率计算公式直接求解. 【详解】甲、乙两位射手,甲击中目标的概率为0.7,乙击中目标的概率为0.6,甲乙两位射手的射击相互独立,甲乙两射手同时未中的概率为()()10.710.60.12--=, 所以目标被射中的概率为10.120.88-=,故答案为0.88. 【点睛】本题考查概率的求法,考查对立事件概率计算公式等基础知识,考查运算求解能力,考查函数与方程思想,是基础题.三、解答题21.(1)(i )1835;(ii )27;(2)160343.【分析】(1)(i )利用排列、组合计数原理结合古典概型的概率公式可求得所求事件的概率; (ii )分两种情况讨论:a.三次取出的球都是红球;b.第一次取黑球后两次取的都是红球,利用古典概型的概率公式可求得所求事件的概率;(2)分两种情况讨论:a 取出的三个球都是红球;b.取出的第三个球是红球,前两个球一个红球、一个白球.利用独立事件的概率公式可求得所求事件的概率.(1)(i )记事件:A 三个球中有两个红球一个黑球,则()213433371835C C A P A A ==; (ii )记事件:B 第二次取出的是红球且第三次取出的也是红球,则()3124343727A C A PB A +==; (2)分两种情况讨论:a 取出的三个球都是红球;b.取出的第三个球是红球,前两个球一个红球、一个白球.记事件:C 从口袋中随机地连续取出三个球,取出后放回,至少有两个是红球且第三个是红球,所以,()3212443160777343P C C ⎛⎫⎛⎫=+⋅⋅= ⎪ ⎪⎝⎭⎝⎭. 【点睛】方法点睛:求解古典概型概率的方法如下: (1)列举法; (2)列表法; (3)数状图法;(4)排列组合数的应用.22.(1)54125;(2)()4E X =,()125D X =;(3)ˆ0.82 1.72yt =+,13个. 【分析】(1)根据题意可直接求出制作一次视频成功的概率,进而可以求出该同学进行三次制作,恰有一次合格作品的概率; (2)首先判断出2105XB ⎛⎫⎪⎝⎭,,从而可以利用二项分布的期望与方差公式直接求出随机变量X 的数学期望与方差;(3)根据题干给出的公式直接计算ˆb、ˆa ,即可求出对应的回归方程,令14t =,即可故算出第14天能制作13个合格作品. 【详解】(1)由题意知:制作一次视频成功的概率为34224535P =⨯⨯=, 所以该同学进行3次制作,恰有一次合格作品的概率2132354=55125C ⎛⎫⎛⎫⨯⨯ ⎪ ⎪⎝⎭⎝⎭. (2)根据题意可得:2105X B ⎛⎫ ⎪⎝⎭,, 所以()21045E X np ==⨯=,()()2312110555D X np p =-=⨯⨯=, (3)根据表格数据可计算出:123456747t ++++++==,343476857y ++++++==, 所以 1221163745230.82114071628ni ii ni i t y nt yb t nx==-⨯⨯=-=-=≈-⨯∑∑,所以50.8214 1.72a y bt =-=-⨯=,所以y 关于t 的线性回归方程为ˆ0.82 1.72yt =+, 令14t =,得ˆ0.8214 1.7213.213y=⨯+=≈, 即估计第14天能制作13个合格作品. 【点睛】本题主要考查了事件与概率、随机变量与分布列,及统计案例. 23.(1)见解析;(2)见解析. 【分析】(1)根据所给的这一组数据,得到7个点的坐标,把这几个点的坐标在直角坐标系中描出对应的点,得到散点图,从散点图可以看出,这两个两之间是线性相关;(2)根据所给的数据,做出x ,y 的平均数,进而求出线性回归方程的系数,写出线性回归方程.把x=80的值代入方程,预报出对应的y 的值. 【详解】 (1)由散点图可以判断,商品件数y 与进店人数x 线性相关 (2)因为713245i ii x y==∑,25x =,15.43y =,7215075i i x ==∑,()274375x =,72700xy =, 所以()7172217324527000.785075437ˆ57i i i ii x y xybx x ==--==≈--∑∑,^^y x a b =- 15.430.7825 4.07=-⨯=- 所以回归方程0.7847ˆ.0yx =-, 当80x =时,0.7880 4.0ˆ758y=⨯-≈(件) 所以预测进店人数为80时,商品销售的件数为58件. 【点睛】在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,可通过线性回归方程来估计预测.24.(1)方案20μg/次剂量组接种效果好,有99.9%的把握认为该疾病疫苗接种成功与两种接种方案有关;(2)273人 【分析】(1)比较两种方案的成功人数可得,按公式计算2K 得结论;(2)按题意成功人数是973人,假设接种一次成功概率为p ,由独立重复试验的概率公式可计算出0.7p =,设参与试验的1000人此剂量只接种一次成功的人数为X ,显然()~1000,0.7X B ,计算出期望即平均人数后可得提高的人数.【详解】(1)由于两种接种方案都是1000人接受临床试验,接种成功人数10μg /次剂量组900人,20μg /次剂量组973人,973>900,所以方案20μg /次剂量组接种效果好; 由公式()()()()()()22220009002710097344.80610.828100010001873127n ad bc K a b c d a c b d -⨯⨯-⨯==≈>++++⨯⨯⨯所以有99.9%的把握认为该疾病疫苗接种成功与两种接种方案有关 (2)假设20μg /次剂量组临床试验接种一次成功的概率为p ,由数据,三次接种成功的概率为9730.9731000=,不成功的概率为270.0271000=, 由于三次接种之间互不影响,每人每次接种成功的概率相等,所以()310.027p -=,得0.7p =,设参与试验的1000人此剂量只接种一次成功的人数为X , 显然()~1000,0.7X B ,()10000.7700E X =⨯=参与试验的1000人此剂量只接种一次成功的人数平均为700人, 且973-700=273,所以选用20μg /次剂量组方案,参与该试验的1000人比此剂量只接种一次成功人数平均提高273人. 【点睛】本题考查独立性检验,考查独立重复试验的概率,考查二项分布及其期望,按所给数据计算是解题的基本方法.本题考查学生的数据处理能力,运算求解能力,属于中档题.。

高中数学 第一章 统计案例 1.2 回归分析学业分层测评 新人教B版选修1-2-新人教B版高二选修1

高中数学 第一章 统计案例 1.2 回归分析学业分层测评 新人教B版选修1-2-新人教B版高二选修1

1.2 回归分析(建议用时:45分钟)[学业达标]一、选择题1.在画两个变量的散点图时,下面叙述正确的是( ) A.预报变量在x 轴上,解释变量在y 轴上 B.解释变量在x 轴上,预报变量在y 轴上 C.可以选择两个变量中任意一个变量在x 轴上 D.可以选择两个变量中任意一个变量在y 轴上【解析】 结合线性回归模型y =bx +a +ε可知,解释变量在x 轴上,预报变量在y 轴上,故选B.【答案】B2.在回归分析中,相关指数r 的绝对值越接近1,说明线性相关程度( ) A.越强 B.越弱 C.可能强也可能弱D.以上均错【解析】 ∵r =∴|r |越接近于1时,线性相关程度越强,故选A. 【答案】A3.已知x 和y 之间的一组数据x 0 1 2 3 y1357则y 与x 的线性回归方程y =b x +a 必过点( ) A.(2,2) B.⎝ ⎛⎭⎪⎫32,0 C.(1,2)D.⎝ ⎛⎭⎪⎫32,4 【解析】 ∵x -=14(0+1+2+3)=32,y -=14(1+3+5+7)=4,∴回归方程y ^=b ^x +a ^必过点⎝ ⎛⎭⎪⎫32,4.【答案】D4.已知人的年龄x 与人体脂肪含量的百分数y 的回归方程为y ^=0.577x -0.448,如果某人36岁,那么这个人的脂肪含量( )【导学号:37820004】A.一定是20.3%B.在20.3%附近的可能性比较大C.无任何参考数据D.以上解释都无道理【解析】 将x =36代入回归方程得y ^=0.577×36-0.448≈20.3.由回归分析的意义知,这个人的脂肪含量在20.3%附近的可能性较大,故选B.【答案】B5.某产品的广告费用x (万元)与销售额y (万元)的统计数据如下表所示,根据表中数据可得回归方程y ^=b ^x +a ^中的b ^=10.6.据此模型预测广告费用为10万元时的销售额为( )万元 万元D.113.9万元【解析】 由题表中数据得x -=3.5,y -=43.由于回归直线y ^=b ^x +a ^过点(x -,y -),且b ^=10.6,解得a ^=5.9,所以线性回归方程为y ^=10.6x +5.9,于是x =10时,y ^=111.9. 【答案】C 二、填空题6.已知x ,y 的取值如下表所示,由散点图分析可知y 与x 线性相关,且线性回归方程为y =0.95x +2.6,那么表格中的数据m 的值为________.【解析】x -=04=2,y -=4=4,把(x -,y -)代入回归方程得11.3+m4=0.95×2+2.6,解得m =6.7.【答案】 6.77.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为________.【解析】 根据样本相关系数的定义可知,当所有样本点都在直线上时,相关系数为1.【答案】 18.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.【解析】 以x +1代x ,得y ^=0.254(x +1)+0.321,与y ^=0.254x +0.321相减可得,年饮食支出平均增加0.254万元.【答案】 0.254 三、解答题9.关于某设备的使用年限x 和所支出的维修费用y (万元),有如下的统计资料:x 2 3 4 5 6 y2.23.85.56.57.0如由资料可知y 对x 呈线性相关关系.试求:(1)线性回归方程;(2)估计使用年限为10年时,维修费用是多少? 【解】 (1)x -=2+3+4+5+65=4,y -=2.2+3.8+5.5+6.5+7.05=5,于是a ^=y --b ^x =5-1.23×4=0.08.所以线性回归方程为:y ^=b ^x +a ^=1.23x +0.08. (2)当x =10时,y ^=1.23×10+0.08=12.38(万元), 即估计使用10年时维修费用是12.38万元.10.在一次抽样调查中测得样本的5个样本点,数值如下表:x 0.25 0.5 1 2 4 y1612521试建立y 与x 之间的回归方程.【解】 作出变量y 与x 之间的散点图如图所示.由图可知变量y 与x 近似地呈反比例函数关系.设y =k x,令t =1x ,则y =kt .由y 与x 的数据表可得y 与t 的数据表:t 4 2 1 0.5 0.25 y1612521作出y 与t 的散点图如图所示.由图可知y 与t 呈近似的线性相关关系.又t -=1.55,y -=7.2,∑5i =1t i y i =94.25,∑5i =1t 2i =21.312 5,b ^=∑5i =1t i y i -5t -y -∑5i =1t 2i -5t -2=94.25-5×1.55×7.221.312 5-5×1.552≈4.134 4,a ^=y --b ^t -=7.2-4.134 4×1.55≈0.8,∴y ^=4.134 4t +0.8.即y 与x 之间的回归方程为y ^=4.134 4x+0.8.[能力提升]1.对于下列表格所示的五个散点,已知求得的线性回归直线方程为y ^=0.8x -155.则实数m 的值为( )C.8.4D.8.5【解析】 依题意得x -=15×(196+197+200+203+204)=200,y -=15×(1+3+6+7+m )=17+m 5,因为回归直线必经过样本点的中心,所以17+m5=0.8×200-155,解得m =8,选A.【答案】A2.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:A.y =x -1B.y =x +1C.y =88+12xD.y =176【解析】 因为x -=174+176+176+176+1785=176,y -=175+175+176+177+1775=176,而回归方程经过样本中心点,所以排除A ,B ,又身高的整体变化趋势随x 的增大而增大,排除D ,所以选C.【答案】C3.以模型y =c e kx去拟合一组数据时,为了求出回归方程,设z =ln y ,其变换后得到线性回归方程z =0.3x +4,则c =________.【导学号:37820005】【解析】 由题意得:ln(c e kx)=0.3x +4, ∴ln c +kx =0.3x +4, ∴ln c =4,∴c =e 4. 【答案】e 44.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.图1­2­2(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题:①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为【解】 (1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型.(2)令w =x ,先建立y 关于w 的线性回归方程. 由于d ^==108.81.6=68,,所以y 关于w 的线性回归方程为y ^=100.6+68w ,因此y 关于x 的回归方程为y ^=100.6+68x . (3)①由(2)知,当x =49时,年销售量y 的预报值y ^=100.6+6849=576.6, 年利润z 的预报值z ^=576.6×0.2-49=66.32. ②根据(2)的结果知,年利润z 的预报值 z ^=0.2(100.6+68x )-x =-x +13.6x +20.12.所以当x =13.62=6.8,即x =46.24时,z ^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.。

学生意外伤亡事故统计

学生意外伤亡事故统计

校园学生意外伤亡事件案例1.云南墨江一中校园暴力案件致1死2伤。

2009年12月2日17时20分许,墨江哈尼族自治县墨江一中发生一起学生伤亡事件,造成1名学生死亡,1名学生重伤,1名学生轻伤。

据墨江县公安局初步调查,2日17时许,墨江一中高一学生文某某、白某某两人发生口角纠纷。

17时20分许,文某某、阳某、李某某、阳某与白某某在墨江一中球场旁相遇后发生冲突,白某某用水果刀将高三学生阳某、李某某和高一学生阳某刺伤,高三学生阳某在送往医院途中死亡,李某某重伤,阳某轻伤。

2.安徽省长丰县长丰学生课堂打架死亡事件:死者家属获赔20.5万。

2008年6月12日上午,安徽省长丰县吴店中学七(2)班杨某与同学陈某在课堂上打架,导致杨某意外死亡。

27日,各方就此事达成了协议:陈某的监护人陈长斌、授课老师杨经贵、吴店中学赔付死者家属20.5万元。

但是,至今尸检结果还没有出来。

27日下午,记者了解到,事情发生后,双墩镇党委副书记仇多馥出面主持调解,陈家、杨家、杨经贵、吴店中学、县教育局、双墩镇政府均参与其中。

杨炳香、陈长斌告诉记者,21日,“下午5点多,教育局有人拿给我们一份协议。

”具体这份协议如何草拟的他们并不知情。

见到协议后,陈长斌并未同意,因为最初的协议要求陈家赔付10万元,“我拿不出那么多钱”。

杨炳香说,协议同样要求授课老师杨经贵支付10万元,但杨老师当时也不同意,没有签字。

直到21日夜间10点多,各方才最终签署了修改后的协议。

记者在这份协议上看到,费用的具体分摊方式为:1、陈某负有责任,应承担费用50%,费用为10万元,因其家庭困难,暂付费用3万元,不足部分由吴店中学捐赠垫付。

(其余7万元不再要陈长斌支付);2、事发时的授课教师杨经贵负有重要责任,承担赔偿费用10万元;3、吴店中学负有一定责任,承担赔偿费用为7.5万元(含捐款垫付款7万元)。

根据协议规定,6月27日,杨家一次性拿到了20.5万元赔偿费。

3.2008年6月12日安徽长丰县吴店中学两名学生打架,其中一名学生不治身亡,当时在上课的杨经贵老师因未有效控制事态被停职检查,并赔死者家属10万元。

统计案例练习题(附答案)

统计案例练习题(附答案)

统计案例练习题(附答案)一、选择题1.对具有线性相关关系的两个变量建立的线性回归方程y=a+bx中,回归系数b()A.可以小于0B.只能大于0C.可能等于0D.只能小于0【解析】b可能大于0,也可能小于0,但当b=0时,x,y不具有线性相关关系.【答案】A2.下列两个变量间的关系不是函数关系的是()A.正方体的棱长与体积B.角的弧度数与它的正弦值C.单产为常数时,土地面积与粮食总产量D.日照时间与水稻亩产量【解析】∵A、B、C都可以得出一个函数关系式,而D不能写出确定的函数关系式,它只是一个不确定关系.【答案】D3.某产品的广告费用x与销售额y的统计数据如下表:广告费用x(万元)4235销售额y(万元)49263954根据上表可得回归方程y=bx+a中的b为9.4,据此模型预报广告费用为6万元时销售额为()A.63.36万元B.65.5万元C.67.7万元D.72.0万元【解析】x=4+2+3+54=3.5,y=49+26+39+544=42,∴a=y-bx=42-9.4×3.5=9.1,∴回归方程为y=9.4x+9.1,∴当x=6时,y=9.4×6+9.1=65.5,故选B.【答案】B4.由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)得到回归直线方程y=bx+a,那么下列说法中不正确的是()A.直线y=bx+a必经过点(x,y)B.直线y=bx+a至少经过点(x1,y1)(x2,y2),…,(xn,bn)中的一个点C.直线y=bx+a的斜率为∑ni=1xiyi-nx•y∑ni=1x2i-nx2D.直线y=bx+a的纵截距为y-bx【解析】回归直线可以不经过任何一个点.其中A:由a=y-bx代入回归直线方程y=bx+y-ax,即y=b(x-x)+y过点(x,y).∴B错误.【答案】B5.已知两个变量x和y之间具有线性相关性,甲、乙两个同学各自独立地做了10次和15次试验,并且利用线性回归的方法求得回归直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均数都为s,对变量y的观测数据的平均数都是t,则下列说法正确的是()A.l1与l2一定有公共点(s,t)B.l1与l2相交,但交点一定不是(s,t)C.l1与l2必定平行D.l1与l2必定重合【解析】由于回归直线y=bx+a恒过(x,y)点,又两人对变量x的观测数据的平均值为s,对变量y的观测数据的平均值为t,所以l1和l2恒过点(s,t).【答案】A二、填空题6.从某大学随机选取8名女大学生,其身高x(cm)和体重y(kg)的线性回归方程为y=0.849x-85.712,则身高172cm的女大学生,由线性回归方程可以预测其体重约为________.【解析】将x=172代入线性回归方程y=0.849x-85.712,有y=0.849×172-85.712=60.316(kg).【答案】60.316kg7.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量(单位:千箱)与单位成本的资料进行线性回归分析,结果如下:x=72,y=71,∑6i=1x2i=79,∑6i=1xiyi=1481.b=1481-6×72×7179-6× 72 2≈-1.8182,a=71-(-1.8182)×72≈77.36,则销量每增加1000箱,单位成本下降________元.【解析】由上表可得,y=-1.8182x+77.36,销量每增加1千箱,则单位成本下降1.8182元.【答案】1.81828.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:y=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.【解析】由题意知0.254(x+1)+0.321]-(0.254x+0.321)=0.254.【答案】0.254三、解答题9.某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:推销员编号12345工作年限x/年35679推销金额y/万元23345(1)求年推销金额y关于工作年限x的线性回归方程;(2)若第6名推销员的工作年限为11年,试估计他的年推销金额.【解】(1)设所求的线性回归方程为y=bx+a,则b=i=15 xi-x yi-y i=15 xi-x 2=1020=0.5,a=y-bx=0.4.所以年推销金额y关于工作年限x的线性回归方程为y=0.5x+0.4. (2)当x=11时,y=0.5x+0.4=0.5×11+0.4=5.9(万元).所以可以估计第6名推销员的年推销金额为5.9万元.10.一种机器可以按各种不同速度运转,其生产物件中有一些含有缺点,每小时生产有缺点物件的多少随机器运转速度而变化,用x表示转速(单位:转/秒),用y表示每小时生产的有缺点物件个数.现观测得到(x,y)的4组值为(8,5),(12,8),(14,9),(16,11).(1)假设y与x之间存在线性相关关系,求y与x之间的线性回归方程.(2)若实际生产中所容许的每小时最大有缺点物件数为10,则机器的速度不得超过多少转/秒?(精确到1)【解】(1)设回归方程为y=a+bx,则x=8+12+14+164=12.5,y=5+8+9+114=8.25,∑4i=1x2i=660,∑4i=1xiyi=438,b=∑4i=1xiyi-4xy∑4i=1x2i-4x2=438-4×12.5×8.25660-4×12.52≈0.73,a=y-bx=8.25-0.73×12.5=-0.875,所以所求回归方程为y=-0.875+0.73x.(2)由y≤10,即-0.875+0.73x≤10,得x≤10.8750.73≈15,即机器速度不得超过15转/秒.11.高二(3)班学生每周用于数学学习的时间x(单位:小时)与数学成绩y(单位:分)之间有如下数据:x24152319161120161713y92799789644783687159若某同学每周用于数学学习的时间为18小时,试预测该同学的数学成绩.【解】显然学习时间与学习成绩间具有相关关系,可以列出下表,并用科学计算器进行计算.i12345678910xi24152319161120161713yi92799789644783687159xiyi22081185223116911024517166010881207767∑10i=1x2i=3182,∑10i=1xiyi=13578于是可得b=∑10i=1xiyi-10xy∑10i=1x2i-10x2=545.4154.4≈3.53,a=y-bx=74.9-3.53×17.4≈13.5.因此可求得回归直线方程为y=3.53x+13.5.当x=18时,y=3.53×18+13.5≈77.故该同学预计可得77分左右.。

高二数学统计案例试题

高二数学统计案例试题

高二数学统计案例试题1.下列结论正确的是()①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.A.①②B.①②③C.①②④D.①②③④【答案】C【解析】①函数关系是一种确定性关系,这是一个正确的结论.②相关关系是一种非确定性关系,是一个正确的结论.③回归分析是对具有相关关系的两个变量进行统计分析的一种方法,所以③不对.与③对比,依据定义知④是正确的,故答案为C。

【考点】本题主要考查相关关系。

点评:本题主要考查相关关系,对本题的正确判断需要对相关概念的熟练掌握。

2.在分析两个分类变量之间是否有关系时,常用到的图表有.【答案】列联表、三维柱形图、二维条形图【解析】在分析两个分类变量之间是否有关系时,常用到的图表有列联表、三维柱形图、二维条形图。

【考点】本题主要考查变量的相关关系。

点评:用列联表、三维柱形图、二维条形图等研究变量关系。

3.在回归分析中,通过模型由解释变量计算预报变量的值时,应注意什么问题?【答案】应注意下列问题:(1)回归方程只适用于我们所研究的样本的总体;(2)我们所建立的回归方程一般都有时间性;(3)样本取值的范围会影响回归方程的适用范围;(4)不能期望回归方程得到的预报值就是预报变量的精确值【解析】应注意下列问题:(1)回归方程只适用于我们所研究的样本的总体;(2)我们所建立的回归方程一般都有时间性;(3)样本取值的范围会影响回归方程的适用范围;(4)不能期望回归方程得到的预报值就是预报变量的精确值.【考点】本题主要考查回归分析的基本思想和方法及其应用。

点评:明确概念,牢记性质。

4.某10名同学的数学、物理、语文成绩如下表:试分别研究他们的数学成绩与物理成绩的关系、数学成绩与语文成绩的关系,你能发现什么规律?【答案】数学成绩好的同学,一般来说物理成绩也较好,它们之间的联系较紧密,而数学成绩好的同学,语文成绩也可能好,也可能差,它们之间的关系不大.【解析】可求出物理成绩与数学成绩的相关系数,从而认为物理成绩与数学成绩之间具有很强的线性相关关系.而由语文成绩与数学成绩的相关系数远小于0.75,说明语文成绩与数学成绩不具有线性相关关系.因此,数学成绩好的同学,一般来说物理成绩也较好,它们之间的联系较紧密,而数学成绩好的同学,语文成绩也可能好,也可能差,它们之间的关系不大.【考点】本题主要考查回归分析、相关系数。

新北师大版高中数学高中数学选修2-3第三章《统计案例》测试(答案解析)(2)

新北师大版高中数学高中数学选修2-3第三章《统计案例》测试(答案解析)(2)

一、选择题1.在一次对性别与是否说谎有关的调查中,得到如下数据,根据表中数据判断如下结论中正确的是( )A .在此次调查中有95%的把握认为是否说谎与性别有关B .在此次调查中有99%的把握认为是否说谎与性别有关C .在此次调查中有99.5%的把握认为是否说谎与性别有关D .在此次调查中没有充分证据显示说谎与性别有关2.利用独立性检验的方法调查大学生的性别与爱好某项运动是否有关,通过随机询问400名不同的大学生是否爱好某项运动,利用22⨯列联表,计算可得2K 的观测值7.556k ≈,附表:参照附表,得到的正确结论是A .有99%以上的把握认为“爱好该项运动与性别无关”B .有99%以上的把握认为“爱好该项运动与性别有关”C .在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过1%的前提下,认为“爱好该项运动与性别无关” 3.对于独立性检验,下列说法正确的是( ) A .2 3.841K >时,有95%的把握说事件A 与B 无关 B .2 6.635K >时,有99%的把握说事件A 与B 有关 C .2 3.841K ≤时,有95%的把握说事件A 与B 有关 D .2 6.635K >时,有99%的把握说事件A 与B 无关 4.对两个分类变量A ,B 的下列说法中正确的个数为( ) ①A 与B 无关,即A 与B 互不影响; ②A 与B 关系越密切,则K 2的值就越大; ③K 2的大小是判定A 与B 是否相关的唯一依据A .0B .1C .2D .35.某研究型学习小组调查研究学生使用智能手机对学习的影响.部分统计数据如下表:附表:经计算2K 的观测值10k =,则下列选项正确的是( ) A .有99.5%的把握认为使用智能手机对学习有影响 B .有99.5%的把握认为使用智能手机对学习无影响 C .有99.9%的把握认为使用智能手机对学习有影响 D .有99.9%的把握认为使用智能手机对学习无影响6.为了普及环保知识,增强环保意识,随机抽取某大学30名学生参加环保知识测试,得分如图所示,若得分的中位数为m e ,众数为m 0,平均数为x -,则( )A .m e =m 0=x -B .m 0<x -<m e C .m e <m 0<x -D .m 0<m e <x -7.在独立性检验中,统计量2χ有三个临界值:2.706、3.841和6.635,在一项打鼾与患心脏病的调查中,共调查了1000人,经计算的2χ=18.87,根据这一数据分析,认为打鼾与患心脏病之间 ( )A .有95%的把握认为两者无关B .约有95%的打鼾者患心脏病C .有99%的把握认为两者有关D .约有99%的打鼾者患心脏病8.某班主任对全班50名学生进行了作业量的调查,数据如下表:认为作业量大认为作业量不大合计 男生 18 9 27 女生 8 15 23 合计262450( )附:()()()()()22n ad bc K a b c d a c b d -=++++ P(K 2>k 0) 0.15 0.10 0.05 0.025 0.01 0.001 k 02.0722.7063.8415.0246.63510.828A .0.01B .0.025C .0.10D .0.059.假设有两个分类变量X 和Y 的22⨯列联表如下:注:2K 的观测值2()()()()()()()n ad bc a b a ck n a b c d a c b d a c b d a b c d-==--++++++++.对于同一样本,以下数据能说明X 和Y 有关系的可能性最大的一组是( ) A .45,15a c ==B .40,20a c ==C .35,25a c ==D .30,30a c ==10.某商场为了解毛衣的月销售量y (件)与月平均气温()x C 之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表: 月平均气温()xC17 1382月销售量y (件)2433 40 55由表中数据算出线性回归方程ˆybx a =+中的2b =-,气象部门預测下个月的平均气温约为6C ,据此估计该商场下个月毛衣销售量约为( )件. A .46B .40C .38D .5811.为考察数学成绩与物理成绩的关系,在高二随机抽取了300名学生,统计数据如下表 数学 物理 85~100分 85分以下 合计 85~100分 37 85 122 85分以下35143178附:经计算2 4.514K ≈,现判断数学成绩与物理成绩有关系,则判断出错的概率不会超过 A .0.5%B .1%C .2%D .5%12.已知回归方程0.8585.7y x ∧=-,则该方程在样本()165,57 处的残差为( ) A .111.55B .54.5C .3.45D .2.45二、填空题13.在吸烟与患肺病是否相关的判断中,有下面的说法:(1)从独立性分析可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.(2)从独立性分析可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;(3)若2 6.635K >,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病; 其中说法正确的是________.14.登山族为了了解某山高y (km)与气温x (℃)之间的关系,随机统计了4次山高与相应的气温,并制作了对照表: 气温x (℃) 18 13 10 -1 山高y (km)24343864由表中数据,得到线性回归方程ˆy=-2x+ˆa (ˆa ∈R),由此估计出山高为72(km)处的气温为_____℃.15.为了解适龄公务员对放开生育二胎政策的态度,某部门随机调查了200位30~40岁之间的公务员,得到的情况如下表:不生二胎 40 40则________(填“有”或“没有”)99%以上的把握认为“生二胎与性别有关”. 附:K 2=. P (K 2≥k 0) 0.10 0.05 0.025 0.010 0.005 0.001 k 02.7063.8415.0246.6357.87910.82816.在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考查某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:附表:参照附表,在犯错误的概率不超过______(填百分比)的前提下,认为“小动物是否被感染与有没有服用疫苗有关”.17.为了判断高中二年级学生是否喜欢足球运动与性别的关系,现随机抽取50名学生,得到22⨯列联表:喜欢 不喜欢 总计 男 15 10 25 女520 25 总计 203050(参考公式22()()()()()n ad bc k a b c d a c b d -=++++,()n a b c d =+++)20()P K k ≥ 0.010 0.005 0.0010k 6.635 7.879 10.828则有___________以上的把握认为“喜欢足球与性别有关”. 18.给出下列结论:(1)在回归分析中,可用相关指数R 2的值判断模型的拟合效果,R 2越大,模型的拟合效果越好;(2)某工产加工的某种钢管,内径与规定的内径尺寸之差是离散型随机变量; (3)随机变量的方差和标准差都反映了随机变量的取值偏离于均值的平均程度,它们越小,则随机变量偏离于均值的平均程度越小;(4)若关于x 的不等式2x x a a -+-≥在R 上恒成立,则a 的最大值是1;(5)甲、乙两人向同一目标同时射击一次,事件A :“甲、乙中至少一人击中目标”与事件B :“甲,乙都没有击中目标”是相互独立事件.其中结论正确的是 .(把所有正确结论的序号填上) 19.下列命题中,正确的命题有__________.①回归直线ˆˆˆy bx a =+恒过样本点的中心(),x y ,且至少过一个样本点;②将一组数据的每个数据都加一个相同的常数后,方差不变;③用相关指数2R 来刻面回归效果;表示预报变量对解释变量变化的贡献率,越接近于1,说明模型的拟合效果越好;④若分类变量X 和Y 的随机变量2K 的观测值K 越大,则“X 与Y 相关”的可信程度越小;⑤.对于自变量x 和因变量y ,当x 取值一定时,y 的取值具有一定的随机性,x ,y 间的这种非确定关系叫做函数关系;⑥.残差图中残差点比较均匀的地落在水平的带状区域中,说明选用的模型比较合适; ⑦.两个模型中残差平方和越小的模型拟合的效果越好. 20.已知下列命题:①从匀速传递的产品生产流水线上,质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样;②两个变量的线性相关程度越强,则相关系数的值越接近于1;③两个分类变量X 与Y 的观测值2k ,若2k 越小,则说明“X 与Y 有关系”的把握程度越大;④随机变量X ~(0,1)N ,则(1)2(1)1P X P X <=<-. 其中为真命题的是__________.三、解答题21.2019年4月,中国电信公布了2019年的终端洞察报告,其中,国产手机品牌表现抢眼,统治地位不容置疑.在2018年6~11月上市的新机中,用户最满意机型与用户推荐机型的项目中国产手机优势明显,华为及荣耀手机分别占据不同价位段的榜单第一,OPPO 、vivo 、小米、魅族均有机型占据榜单.在用户满意机型调研项目中,曾经位于神坛地位的苹果手机也仅仅只有iPhone XR 一款位列第三.(1)从上表中15个机型中任取3个,求这3个机型恰好有2个是“华为”或“荣耀”的概率; (2)测试数据源于消费者的反馈,从反馈信息中随机抽取500个“华为畅享9plus ”消费者,其中来自城市300个,来自农村200个,统计他们对“华为畅想9plus ”的满意情况如下:满意 不满意城市 270 30农村170 30根据上表数据,问是否有95%的把握认为消费者是否满意与城市用户还是农村用户有关? (附:()()()()()22n ad bc a b c d a c b d χ-=++++,当2 3.841χ>时,有95%的把握说事件A 与B 有关;当26.635χ>时,有99%的把握说事件A 与B 有关;当2 3.841χ≤时,认为事件A 与B 是无关的)22.我国新型冠状病毒肺炎疫情期间,以网络购物和网上服务所代表的新兴消费展现出了强大的生命力,新兴消费将成为我国消费增长的新动能.某市为了了解本地居民在2020年2月至3月两个月网络购物消费情况,在网上随机对1000人做了问卷调查,得如表频数分布表:(1)作出这些数据的频率分布直方图,并估计本市居民此期间网络购物的消费平均值; (2)在调查问卷中有一项是填写本人年龄,为研究网购金额和网购人年龄的关系,以网购金额是否超过4000元为标准进行分层抽样,从上述1000人中抽取200人,得到如表列联表,请将表补充完整并根据列联表判断,在此期间是否有95%的把握认为网购金额与网购人年龄有关.参考公式和数据:()()()()()22n ad bc K a b c d a c b d -=++++.(其中n a b c d =+++为样本容量)23.为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:质量监督员甲在生产现场时,990件产品中合格品有982件,次品有8件;甲不在生产现场时,510件产品中合格品有493件,次品有17件,试分别用列联表、独立性检验的方法分析监督员甲是否在生产现场对产品质量好坏有无影响?24.某火锅店为了解气温对营业额的影响,随机记录了该店1月份中5天的日营业额y (单位:千元)与该地当日最低气温x (单位:℃)的数据,如下表: x 2 5 8 9 11 y1210887(1)求y 关于x 的回归方程y bx a =+;(2)判定y 与x 之间是正相关还是负相关;若该地1月份某天的最低气温为6℃,用所求回归方程预测该店当日的营业额;附:①a y bx =-;1221ni ii nii x y nx yb xnx==-⋅=-∑∑.②参考数据如下: i i xi y2i xi i x y1 2 12 4 24 2510255038864644988172511712177∑354529528725.2016年欧洲杯将于2016年6月10日到7月10日在法国举行.为了使得赛会有序进行,欧足联在全球范围内选聘了30名志愿者(其中男性16名,女性14名).调查发现,男性中有10人会英语,女性中有6人会英语.(1)根据以上数据完成以下2×2列联表:并回答能否在犯错的概率不超过0.10的前提下认为性别与会英语有关?参考公式:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++参考数据:(2)会英语的6名女性志愿者中曾有4人在法国工作过,若从会英语的6名女性志愿者中随机抽取2人做导游,则抽出的2人都在法国工作过的概率是多少?26.为了了解某班学生喜欢数学是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表,已知在全部50人中随机抽取1人抽到喜欢数学的学生的概率为3 5 .喜欢数学不喜欢数学合计男生5女生10(1)能否在犯错误的概率不超过0.005的前提下认为喜欢数学与性别有关?说明你的理由;(2)现从女生中抽取2人进一步调查,设其中喜欢数学的女生人数为ξ,求ξ的分布列与期望.临界表供参考:(参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++)【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】根据上表数据可求得20.027 1.323k ≈<,再结合课本上的概率附表可知在此次调查中没有充分证据显示说谎与性别有关,故选D2.B解析:B 【分析】根据2K 的观测值7.556k ≈,对照表中数据,即可得到相应的结论. 【详解】根据2K 的观测值7.556k ≈,对照表中数据得出有0.01的几率说明这两个变量之间的关系是不可信的,即有10.0199%-=的把握说明两个变量之间有关系,故选B . 【点睛】本题主要考查独立性检验的应用,独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式计算2K 的观测值k ;(3)查表比较k 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误)3.B解析:B 【分析】根据独立性检验中卡方的概念知,选B. 【详解】根据独立性检验中卡方的概念知,2 6.635K >时,有99%的把握说事件A 与B 有关选B. 【点睛】本题主要考查了独立性检验中卡方的概念,属于中档题.4.B解析:B 【解析】 【分析】根据独立性检验的思想,对题目中的命题进行分析、判断正误即可. 【详解】对于①,对事件A 与B 无关时,说明两事件的影响较小,不是两个互不影响,①错误; 对于②,事件A 与B 关系密切,说明事件A 与B 的相关性就越强,K 2就越大,②正确; 对于③,K 2的大小不是判定事件A 与B 是否相关的唯一根据,判定两事件是否相关除了公式外;还可以用三维柱形图和二维条形图等方法来判定,③错误; 故选:B . 【点睛】本题考查了独立性检验思想的应用问题,属于基础题.K 2值是用来判断两个变量相关的把握度的,不是用来判断两个变量是否相关的.5.A解析:A 【解析】 【分析】由题意结合2K 的观测值k 由独立性检验的数学思想给出正确的结论即可. 【详解】由于2K 的观测值10k =7.879>,其对应的值0.0050.5%=,据此结合独立性检验的思想可知:有99.5%的把握认为使用智能手机对学习有影响. 本题选择A 选项. 【点睛】独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.6.D解析:D由条形图知,30名学生的得分情况依次为2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分,中位数为第15,16个数(分别为5,6)的平均数,即m e =5.5,5出现的次数最多,故众数为m 0=5,平均数为x =130(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97,故m 0<m e <x . 故答案为D.点睛:这个题目考查的是条型分布直方表的应用,以及基本量:均值,平均数的考查;一般在这类图中平均数就是将数据加到一起除以数据的个数即可,在频率分布直方表中是取每个长方条的中点乘以相应的频率并相加即可.7.C解析:C 【解析】因为统计量2χ有三个临界值:2.706、3.841和6.635,而2χ=18.87>6.635,所以有99%的把握认为两者有关,选C.8.B解析:B 【解析】 K 2=≈5.059>5.024,因为P(K 2>5.024)=0.025,所以这种推断犯错误的概率不超过0.025.选B9.A解析:A 【解析】根据独立性检验的方法和22⨯列联表可得,当10a a +与10cc +相差越大,则分类变量X 和Y 有关系的可能性越大,即,a c 相差越大,10a a +与10cc +相差越大.由各选项可得A 满足条件,选A .10.A解析:A 【解析】试题分析:根据题意,样本中心点的坐标为()10,38,所以38210,58a a =-⨯+∴=,因此回归直线方程为2ˆ58yx =-+,所以当6x =时,估计该商场下个月毛衣销售量约为26ˆ5846y=-⨯+=,故选A. 考点:回归直线方程.11.D解析:D23.841 4.514 6.635k <=<,则0.010.05P <<,出错概率不超过5%选D.12.D解析:D 【解析】57(0.85165ˆ85.7) 2.45Y Y σ=-=-⨯-= 二、填空题13.(1)【分析】根据题意利用独立性检验的定义与基本思想对题目中的命题进行逐个分析判断即可求解出答案【详解】根据独立性检验的基本思想在犯错误的概率不超过005的前提下认为吸烟与患肺病有关系的意思为有的把解析:(1) 【分析】根据题意,利用独立性检验的定义与基本思想,对题目中的命题进行逐个分析、判断,即可求解出答案. 【详解】根据独立性检验的基本思想,在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系的意思为有95%的把握认为这个推理是正确的,所以(1)正确.从独立性分析可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系的意思为有99%的把握认为这个推理是正确的,而不是说某个人吸烟就有99%的可能患有肺病,所以(2)错误.同(2)中的推论,所以也不能在100个吸烟的人中必有99人患有肺病,故(3)错误.故答案为(1). 【点睛】本题主要考查了独立性检验的基本思想,2K 是检验两个事件相关程度的量,是相关关系,是反映有关和无关的概率.14.-6【解析】由题意可得=10=40所以+2=40+2×10=60所以=-2x+60当=72时-2x+60=72解得x=-6解析:-6 【解析】由题意可得x =10,y =40,所以ˆay =+2x =40+2×10=60,所以ˆy =-2x+60,当ˆy =72时,-2x+60=72,解得x=-6.15.没有【解析】由于K2=<6635故没有99以上的把握认为生二胎与性别有关解析:没有 【解析】由于K 2=2200(80404040)5012080120809⨯-⨯=⨯⨯⨯<6.635,故没有99%以上的把握认为“生二胎与性别有关”.16.%【解析】试题分析:所以在犯错误不超过%的前提下认为小动物是否被感染与有没有服用疫苗有关考点:1卡方统计量2统计;【易错点晴】本题主要考查的是统计中的卡方统计量属于容易题解题时一定要注意计算问题很多解析:% 【解析】 试题分析:,所以在犯错误不超过%的前提下,认为“小动物是否被感染与有没有服用疫苗有关” . 考点:1.卡方统计量,2.统计;【易错点晴】本题主要考查的是统计中的卡方统计量,属于容易题.解题时一定要注意计算问题,很多同学列式正确计算错误,从而不能正确得到结果.另外,学生容易把答案写为%,所以一定要注意本题中的问题是什么,否则很容易出现错误.17.%【解析】试题分析:根据表中数据计算得所以有%以上的把握认为喜欢足球与性别有关考点:1列联表;2独立性假设检验解析:99.5% 【解析】试题分析:根据表中数据计算得,2250(1520105)8.3337.87925252030k ⨯⨯-⨯=≈>⨯⨯⨯,所以有99.5%以上的把握认为“喜欢足球与性别有关”.考点:1.列联表;2.独立性假设检验.18.(1)(3)(4)【分析】根据相关指数离散型随机变量随机变量的方差和标准差绝对值不等式和相互独立事件相关的知识对五个结论逐一分析由此得出正确结论的序号【详解】对于(1)R2越大模型的拟合效果越好结论解析:(1),(3),(4) 【分析】根据相关指数、离散型随机变量、随机变量的方差和标准差、绝对值不等式和相互独立事件相关的知识,对五个结论逐一分析,由此得出正确结论的序号. 【详解】对于(1),R 2越大,模型的拟合效果越好,结论正确.对于(2),内径与规定的内径尺寸之差是连续型随机变量,结论错误.对于(3),根据随机变量的方差和标准差的知识可判断出结论正确.对于(4),根据绝对值不等式有22x x a a a -+-≥-≥,所以2a a -≤-或2a a -≥,前者解得1a ≤,后者无解,故a 的最大值为1,结论正确.对于(5),事件A :“甲、乙中至少一人击中目标”与事件B :“甲,乙都没有击中目标”是对立事件,不是相互独立事件,结论错误.综上所述,正确结论为(1),(3),(4). 【点睛】本小题主要考查关指数、离散型随机变量、随机变量的方差和标准差、绝对值不等式和相互独立事件相关的知识,考查分析与解决问题的能力,属于基础题.19.②⑥⑦【解析】①回归直线恒过样本点的中心可以不过任何一个样本点;②将一组数据中的每个数据都加上同一个常数后根据方差公式可知方差恒不变;③用相关指数来刻面回归效果;表示预报变量对解释变量变化的贡献率越解析:②⑥⑦ 【解析】①回归直线ˆˆˆy bx a =+恒过样本点的中心(),x y ,可以不过任何一个样本点;②将一组数据中的每个数据都加上同一个常数后,根据方差公式可知方差恒不变; ③用相关指数2R 来刻面回归效果;表示预报变量对解释变量变化的贡献率,越接近于0,说明模型的拟合效果越好;④若分类变量X 和Y 的随机变量2K 的观测值K 越大,则“X 与Y 相关”的可信程度越大;⑤.对于自变量x 和因变量y ,当x 取值一定时,y 的取值具有一定的随机性,x ,y 间的这种非确定关系叫做相关关系;⑥.残差图中残差点比较均匀的地落在水平的带状区域中,说明选用的模型比较合适; ⑦.两个模型中残差平方和越小的模型拟合的效果越好. 故答案为:②⑥⑦20.①④【解析】对于①从匀速传递的产品生产流水线上质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测这样的抽样方法是系统抽样故①正确;对于②两个变量的线性相关程度越强则相关系数的绝对值越接近于1解析:①④ 【解析】对于①,从匀速传递的产品生产流水线上,质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样,故①正确;对于②,两个变量的线性相关程度越强,则相关系数的绝对值越接近于1,故②错误; 对于③,两个分类变量X 与Y 的观测值2k ,若2k 越小,则说明“X 与Y 有关系”的把握程度越小,故③错误;对于④,∵随机变量X ∼N (0,1),设P (|X |<1)=p ,则1(1)(1)2pP X P X ->=<-=, ∴11(1)1(1)122p pP X P X -+<=->=-=, ∴2(1)1P X p <-=,即(1)2(1)1P X P X <=<-,故④正确。

2018届高二数学第1章统计案例1.2回归分析14

2018届高二数学第1章统计案例1.2回归分析14

1.2 回归分析1.线性回归模型(1)线性回归模型y =a +bx +ε,其中a +bx 是确定性函数,ε称为随机误差. (2)随机误差产生的原因主要有以下几种: ①所用的确定性函数不恰当引起误差; ②忽略了某种因素的影响; ③存在观测误差.(3)在线性回归方程y ^=a ^+b ^x 中b ^=∑i =1nx i -x-y i -y-∑i =1nx i -x-2=∑i =1nx i y i -n x -y-∑i =1nx 2i -n x -2,a ^=y --b ^x -(其中x -=1n ∑i =1n x i ,y -=1n ∑i =1ny i ).其中,a ^,b ^分别为a ,b 的估计值,a ^称为回归截距,b ^称为回归系数,y ^称为回归值. 2.相关系数(1)计算两个随机变量间线性相关系数的公式∑i =1nx i -x-2∑i =1ny i -y-2=∑i =1nx i y i -n x -y-∑i =1nx 2i -n x-2∑i =1ny 2i -n y -2(2)r 具有如下性质:①|r |≤1;②|r |越接近于1,x ,y 的线性相关程度越强; ③|r |越接近于0,x ,y 的线性相关程度越弱. 3.对相关系数进行显著性检验的基本步骤(1)提出统计假设H 0:变量x ,y 不具有线性相关关系;(2)如果以95%的把握作出判断,那么可以根据1-0.95=0.05与n -2在教材附录1中查出一个r 的临界值r 0.05(其中1-0.95=0.05称为检验水平);(3)计算样本相关系数r ;(4)作出统计推断:若|r |>r 0.05,则否定H 0,表明有95%的把握认为x 与y 之间具有线性相关关系;若|r |≤r 0.05,则没有理由拒绝原来的假设H 0,即就目前数据而言,没有充分理由认为y 与x 之间有线性相关关系.我们把相关关系(不确定性关系)转化为函数关系(确定性关系),当两个具有相关关系的变量近似地满足一次函数关系时,我们所求出的函数关系式y ^=a ^+b ^x 就是回归直线方程.求回归直线方程的一般方法是借助于工作软件求出回归直线方程,也可以利用计算器计算出b ^,再由a ^=y --b ^x -求出a ^,写出回归直线方程y ^=b ^x +a ^.计算时应注意:(1)求b ^时,利用公式b ^=∑i =1nx i y i -n x - y-∑i =1nx 2i -n x-2,先求出x -=1n (x 1+x 2+…+x n ),y -=1n(y 1+y 2+…+y n ),∑i =1nx i y i =x 1y 1+x 2y 2+…+x n y n ,∑i =1nx 2i =x 21+x 22+…+x 2n .再由a ^=y --b ^x -求出a ^的值,并写出回归直线方程.(2)线性回归方程中的截距a ^和斜率b ^都是通过样本估计而来的,存在着误差,这种误差可能导致估计结果的偏差.(3)回归直线方程y ^=a ^+b ^x 中的b ^表示x 增加1个单位时,y ^的变化量为b ^,而a ^表示y ^不随x 的变化而变化的部分.(4)可以利用回归直线方程y ^=a ^+b ^x 求在x 取某一个值时y 的估计值.[例1] 假设关于某设备的使用年限x (年)和所支出的维修费用y (万元)有如下的统计资料:若由数据可知,y 对x 呈线性相关关系. (1)求线性回归方程;(2)估计使用年限为10年时,维修费用是多少?[思路点拨] 由于题目条件已经指明y 对x 呈线性相关关系,所以可直接利用公式求a ^与b ^,然后求出线性回归方程,最后把10代入,估计维修费用.[精解详析] (1)列表如下:经计算得:x -=4,y -=5,∑i =15x 2i =90,∑i =15x i y i =112.3,于是b ^=∑i =15x i y i -5x -y-∑i =15x 2i -5x -2=1.23,a ^=y --b ^·x -=0.08,所以线性回归方程为y ^=b ^x +a ^=1.23x +0.08.(2)当x =10时,y ^=1.23×10+0.08=12.38(万元),即若估计使用年限为10年时,维修费用为12.38万元.[一点通] 若题目中没有指明y 对x 呈线性相关关系,而只给出资料,则需根据散点图或利用线性相关系数先确定变量是否线性相关,再求线性回归方程.1.(辽宁高考)调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析:以x +1代x ,得y ^=0.254(x +1)+0.321,与y ^=0.254x +0.321相减可得,年饮食支出平均增加0.254万元.答案:0.2542.(湖北高考改编)四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -6.423; ②y 与x 负相关且y ^=-3.476x +5.648; ③y 与x 正相关且y ^=5.437x +8.493; ④y 与x 正相关且y ^=-4.326x -4.578. 其中一定不正确的结论的序号是________.解析:由回归直线方程y ^=b ^x +a ^,知当b ^>0时,x 与y 正相关,当b ^<0时,x 与y 负相关,所以①④一定错误.答案:①④3.某产品的广告费用x 与销售额y 的统计数据如下表:根据上表可得回归方程y ^=b ^x +a ^中的b ^为9.4,据此模型预报广告费用为6万元时的销售额为________万元.解析:∵x -=4+2+3+54=72,y -=49+26+39+544=42.又y ^=b ^x +a ^必过(x -,y -), ∴42=72×9.4+a ^,∴a ^=9.1.∴线性回归方程为y ^=9.4x +9.1.∴当x =6时,y ^=9.4×6+9.1=65.5(万元). 答案:65.54.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程y ^=bx +a ,其中b =-20,a =y --b x -;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解:(1)由于x =16(x 1+x 2+x 3+x 4+x 5+x 6)=8.5,y =16(y 1+y 2+y 3+y 4+y 5+y 6)=80.所以a =y -bx =80+20×8.5=250,从而回归直线方程为y ^=-20x +250. (2)设工厂获得的利润为L 元,依题意得L =x (-20x +250)-4(-20x +250)=-20x 2+330x -1 000=-20⎝⎛⎭⎪⎫x -3342+361.25.当且仅当x =8.25时,L 取得最大值.故当单价定为8.25元时,工厂可获得最大利润.[例2] 10名同学在高一和高二的数学成绩如下表:其中x 为高一数学成绩,y 为高二数学成绩. (1)y 与x 是否具有相关关系?(2)如果y 与x 具有线性相关关系,求回归直线方程.[思路点拨] 可先计算线性相关系数r 的值,然后与r 0.05比较,进而对x 与y 的相关性做出判断.[精解详析] (1)由已知表格中的数据,求得x -=71,y -=72.3,r=∑i =110x i -x-y i -y-∑i =110x i -x-2∑i =110y i -y-2≈0.78.由检验水平0.05及n -2=8,在课本附录1中查得r 0.05=0.632,因为0.78>0.632, 所以y 与x 之间具有很强的线性相关关系. (2)y 与x 具有线性相关关系,设回归直线方程为y ^=a ^+b ^x ,则有b ^=∑i =110x i -x-y i -y-∑i =110x i -x-2≈1.22,a^=y --b ^x -=72.3-1.22×71=-14.32.所以y 关于x 的回归直线方程为y ^=1.22x -14.32.[一点通] 判断x 与y 是否具有线性相关关系,还可以先作出散点图,从点的分布特征来判定是否线性相关.有些同学不对问题进行必要的相关性检验,直接求x 与y 的回归直线方程,它就没有任何实际价值,也就不能准确反映变量x 与y 间的变化规律.另外,要注意计算的正确性.5.变量X 与Y 相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U 与V 相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r 1表示变量Y 与X 之间的线性相关系数,r 2表示变量V 与U 之间的线性相关系数,则r 1与r 2的关系为________.解析:对于变量Y 与X 而言,Y 随X 的增大而增大,故Y 与X 正相关,即r 1>0;对于变量V 与U 而言,V 随U 的增大而减小,故V 与U 负相关,即r 2<0,所以有r 2<0<r 1.答案:r 2<0<r 16.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为________.解析:样本相关系数越接近1,相关性越强,现在所有的样本点都在直线y =12x +1上,样本的相关系数应为1.答案:17.为了了解某地母亲身高x 与女儿身高y 的相关关系,现随机测得10对母女的身高,所得数据如下表所示:试对x 与y 进行线性回归分析,并预测当母亲身高为161 cm 时,女儿的身高为多少? 解:作线性相关性检验. x -=110×(159+160+…+157)=158.8, y -=110×(158+159+…+156)=159.1,∑i =110x 2i -10(x -)2=(1592+1602+…+1572)-10×158.82=47.6, ∑i =110x i y i -10x -y -=(159×158+160×159+…+157×156)-10×158.8×159.1=37.2,∑i =110y 2i -10(y -)2=(1582+1592+…+1562)-10×159.12=56.9, 因此r =∑i =110x i y i -10x -y-[∑i =110x 2i -x-2][∑i =110y 2i -y-2]=37.247.6×56.9≈0.71.由检验水平0.05及n -2=8,在课本附录1中查得r 0.05=0.632,因为0.71>0.632,所以可以认为x 与y 有较强的相关关系,因而求回归直线方程有必要.又b ^=∑i =110x i y i -10x -y -∑i =110x 2i -x-2=37.247.6≈0.78, a ^=159.1-0.78×158.8≈35.2,由此得回归直线方程为y ^=35.2+0.78x ,回归系数b ^=0.78反映出当母亲身高每增加1 cm 时女儿身高平均增加0.78 cm ,a ^=35.2可以理解为女儿身高中不受母亲身高影响的部分,当母亲身高为161 cm 时女儿身高为y ^=0.78×161+35.2=160.78≈161(cm),这就是说当母亲身高为161 cm 时,女儿身高大致也为161 cm.1.求线性回归方程的方法 确定线性回归方程的基本步骤为:(1)先求b ^;(2)再求a ^;(3)写出方程y ^=b ^x +a ^. 2.分析两个变量的相关关系常用的方法(1)散点图法.该法主要是用来直观地分析两变量间是否存在相关关系.(2)相关系数法.该法主要是从量上分析两个变量间相互联系的密切程度,|r |越接近于1,相关程度越强,|r|越接近于0,相关程度越弱.一、填空题1.设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 个样本点,直线l 是由这些样本点得到的线性回归直线(如图),以下结论正确的序号是________.①直线l 过点(x ,y );②x 和y 的相关系数为直线l 的斜率; ③x 和y 的相关系数在0到1之间;④当n 为偶数时,分布在l 两侧的样本点的个数一定相同.解析:因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的绝对值越接近于1,两个变量的线性相关程度越强,所以②③错误;④中n 为偶数时,分布在l 两侧的样本点的个数可以不相同,所以④错误;根据回归直线方程一定经过样本中心点可知①正确.答案:①2.(湖北高考改编)根据如下样本数据得到的回归方程为y ^=bx +a ,则下列说法正确的是________.(填序号) ①a >0,b >0 ②a >0,b <0 ③a <0,b >0 ④a <0,b <0 解析:由表中数据画出散点图,如图,由散点图可知b <0,a >0,故②正确. 答案:②3.设有一个回归方程为y ^=2-2.5x ,则变量x 每增加一个单位时,y ________. 解析:由回归系数的意义可知当变量x 增加一个单位时,y ^的平均改变量为b ^,由题目回归方程y ^=2-2.5x ,可得当变量x 增加一个单位时,y ^平均减少2.5个单位.答案:平均减少2.5个单位4.某数学老师的身高是176 cm ,他爷爷、父亲和儿子的身高分别是173 cm 、170 cm 和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________ cm.解析:设父亲身高为x cm ,儿子身高为y cm ,则x =173,y =176,b ^=0×(-6)+(-3)×0+3×602+9+9=1,a ^=y -b ^x -=176-1×173=3,∴y ^=x +3,当x =182时,y ^=185.答案:1855.为了对学业水平测试成绩进行分析,在得分60分以上的全体同学中随机抽取8位.他们的物理、化学成绩如下:若用变量x ,y 分别记作物理成绩和化学成绩,则x ,y 之间的线性相关系数r 为________. (参考数据:x -≈85,y -=81,∑i =18(x i -x -)2≈457,∑i =18(y i -y -)2≈550,∑i =18(x i -x -)(y i-y -)≈501,457≈21.4,550≈23.5)解析:r =∑i =18(x i -x -)(y i -y -)∑i =18(x i -x -)2∑i =18(y i -y -)2≈501457×550≈50121.4×23.5≈0.996.答案:0.996 二、解答题6.某企业上半年产品产量与单位成本资料如下:且已知产量x 与单位成本y 具有线性相关关系. (1)求出线性回归方程;(2)指出产量每增加1 000件时,单位成本平均变动多少? (3)假定产量为6 000件时,单位成本为多少元? 解:(1)n =6,x -=3.5,y -=71,=1 481-6×3.5×7179-6×3.52≈-1.82, a ^=y --b ^x -=71+1.82×3.5=77.37,则线性回归方程为y ^=b ^x +a ^=-1.82x +77.37.(2)因为单位成本平均变动b ^=-1.82<0,且产量x 的计量单位是千件,所以根据回归系数b ^的意义有产量每增加一个单位即1 000件时,单位成本平均减少1.82元.(3)当产量为6 000件, 即x =6时,代入线性回归方程, 得y ^=77.37-1.82×6=66.45(元).即当产量为6 000件时,单位成本大约为66.45元.7.一台机器使用的时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器运转速度的变化而变化,下表为抽样试验的结果:(1)利用散点图或相关系数r 的大小判断变量y 对x 是否线性相关?为什么? (2)如果y 对x 有线性相关关系,求线性回归方程;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么机器的运转速度应控制在什么范围内?(最后结果精确到0.001,参考数据:656.26≈25.617,16×11+14×9+12×8+8×5=438,162+142+122+82=660,112+92+82+52=291)解:(1)∵x -=12.5,y -=8.25,∑i =14(x i -x -)(y i -y -)=25.5,∑i =14x i -x-2∑i =14y i -y-2=656.25≈25.617,∴r 0.05≈0.995,由检验水平0.05及n -2=2,在附录1中查得r 0.05=0.950,因为0.995>0.950,∴y 与x 有线性相关关系.(2)∵∑i =14(x i -x -)2=35,∴b ^≈0.729,a ^=y --b ^x -≈-0.863.∴线性回归方程为y ^=0.729x -0.863. (3)0.729x -0.863≤10,解得x ≤14.901. 故机器运转速度应在14转/秒之内.8.(重庆高考)从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑i =110x i =80,∑i =110y i =20,∑i =110x i y i =184,∑i =110x 2i =720.(1)求家庭的月储蓄y 对月收入x 的线性回归方程y ^=b ^x +a ^; (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄. 解:(1)依题意得:b ^=∑i =1nx i y i -n x - y-∑i =1nx 2i -n x -2=184-10×8×2720-10×82=0.3,a ^=y --b ^x -=2-0.3×8=-0.4,故所求回归方程为y =0.3x -0.4.(2)由于变量y 的值随x 的值增加而增加(b ^=0.3>0),故x 与y 之间是正相关. (3)将x =7代入回归方程可以预测该家庭的月储蓄为y =0.3×7-0.4=1.7(千元).。

上海国和中学选修1-2第一章《统计案例》测试(含答案解析)

上海国和中学选修1-2第一章《统计案例》测试(含答案解析)

一、选择题1.某校高二(1)班甲、乙两同学进行投篮比赛,他们进球的概率分别是34和45,现甲、乙各投篮一次,恰有一人进球的概率是()A.120B.320C.15D.7202.针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的女生人数是男生人数的,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数,若有的把握认为是否喜欢抖音和性别有关,则男生至少有()参考公式:0.100.050.0250.0100.0050.0012.7063.841 5.024 6.6357.87910.828A.12人B.18人C.24人D.30人3.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取60名高中生做问卷调查,得到以下数据:作文成绩优秀作文成绩一般总计课外阅读量较大221032课外阅读量一般82028总计303060由以上数据,计算得到2K的观测值9.643k ,根据临界值表,以下说法正确的是() P(K2≥k0)0.500.400.250.150.100.050.050.0100.005 k00.4550.708 1.323 2.072 2.706 3.841 5.024 6.6357.879A.在样本数据中没有发现足够证据支持结论“作文成绩优秀与课外阅读量大有关”B.在犯错误的概率不超过0.001的前提下,认为作文成绩优秀与课外阅读量大有关C .在犯错误的概率不超过0.05的前提下,认为作文成绩优秀与课外阅读量大有关D .在犯错误的概率不超过0.005的前提下,认为作文成绩优秀与课外阅读量大有关 4.为了解某班学生喜爱打篮球是否与性别有关,对该班60名学生进行问卷调查,得到如下图所示的22⨯列联表,则至少有( )的把握认为喜爱打篮球与性别有关.附参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.A .99.9%B .99.5%C .99%D .97.5%5.已知变量,X Y ,由它们的样本数据计算得到2K 的观测值 4.328k ≈,2K 的部分临界值表如下:以下判断正确的是( )A .在犯错误的概率不超过0.05的前提下认为变量,X Y 有关系B .在犯错误的概率不超过0.05的前提下认为变量,X Y 没有关系C .有97.5%的把握说变量,X Y 有关系D .有97.5%的把握说变量,X Y 没有关系6.甲罐中有5个红球,2个白球和3个黑球,乙罐中有6个红球,2个白球和2个黑球,先从甲罐中随机取出一个球放入乙罐,分别以1A ,2A ,3A 表示由甲罐取出的球是红球、白球和黑球的事件,再从乙罐中随机取出一个球,以B 表示由乙罐取出的球是红球的事件,下列结论中不正确...的是( ) A .事件B 与事件1A 不相互独立B .1A 、2A 、3A是两两互斥的事件C .17(|)11P B A =D .3()5P B =7.某光学仪器厂生产的透镜,第一次落地打破的概率为0.3;第一次落地没有打破,第二次落地打破的概率为0.4;前两次落地均没打破,第三次落地打破的概率为0.9.则透镜落地3次以内(含3次)被打破的概率是( ). A .0.378 B .0.3C .0.58D .0.9588.抛掷红、黄两颗骰子,当红色骰子的点数为4或6时,两颗骰子的点数之积大于20的概率是( )A .35 B .14 C .12D .13 9.若y 关于x 的线性回归方程0.70.35y x =+是由表中提供的数据求出,那么表中m 的值为( )x3 4 5 6 y3m4.54A .3.5B .3C .2.5D .210.两个变量y 与x 的回归模型中,分别选择了4个不同模型,对于样本点()11,x y ,()22,x y ,…,(),n n x y ,可以用()()22121ˆ1niii n ii y yR y y ==-=--∑∑来刻画回归的效果,已知模型1中20.96R =,模型2中23{5x yy x -==-,模型3中20.55R =,模型4中20.41R =,其中拟合效果最好的模型是( ) A .模型1B .模型2C .模型3D .模型411.通过随机询问100名性别不同的高二学生是否爱吃零食,得到如下的列联表:其中()()()()()22,.n ad bc K n a b c d a b c d a c b d -==+++++++则下列结论正确的是A .在犯错误的概率不超过0.05的前提下,认为“是否爱吃零食与性别有关”B .在犯错误的概率不超过0.05的前提下,认为“是否爱吃零食与性别无关”C .在犯错误的概率不超过0.025的前提下,认为“是否爱吃零食与性别有关”D .在犯错误的概率不超过0.025的前提下,认为“是否爱吃零食与性别无关”12.甲、乙两人同时报考某一所大学,甲被录取的概率为0.6,乙被录取的概率为0.7,两人是否被录取互不影响,则其中至少有一人被录取的概率为( ) A .0.12B .0.42C .0.46D .0.88二、填空题13.在一次三人象棋对抗赛中,甲胜乙的概率为0.4,乙胜丙的概率为0.5,丙胜甲的概率为0.6,比赛顺序如下:第一局,甲对乙;第二局,第一局胜者对丙;第三局,第二局胜者对第一局败者;第四局,第三局胜者对第二局败者.则乙连胜四局的概率为____.14.某校组织甲、乙、丙、丁、戊、己等6名学生参加演讲比赛,采用抽签法决定演讲顺序,在“学生甲和乙都不是第一个出场,且甲不是最后一个出场”的前提下,学生丙第一个出场的概率为__________. 15.已知x 、y 之间的一组数据如下:则线性回归方程ˆya bx =+所表示的直线必经过点________. 16.某学生在上学路上要经过4个路口,假设在各路口是否遇到红灯是相互独立的,遇到红灯的概率都是13,那么该生在上学路上到第3个路口首次遇到红灯的概率为__________.17.已知一组数据的回归直线方程为 1.51y x =-+,且4y =,发现有两组数据( 1.7,2.9)-,( 2.3,5.1)-的误差较大,去掉这两组数据后,重新求得回归直线方程为y x a '''=-+,则当3x '=-时,y '=_____. 18.2019年7月15日,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x 元和销售量y 件之间的一组数据如下表所示:可知,销售量y 与价格x 之间有较强的线性相关关系,其线性回归方程是3.240y x =-+,且20m n +=,则其中的n =______.19.现有A ,B 两队参加关于“十九大”知识问答竞赛,每队3人,每人回答一个问题,答对者为本队赢1分,答错得0分;A 队中每人答对的概率均为23,B 队中3人答对的概率分别为23,23,13,且各答题人答题正确与否之间互不影响,若事件M表示“A队得2分”,事件N表示“B队得1分”,则()P MN=______.20.一名信息员维护甲乙两公司的5G网络,一天内甲公司需要维护和乙公司需要维护相互独立,它们需要维护的概率分别为0.4和0.3,则至少有一个公司不需要维护的概率为________三、解答题21.为落实中央“坚持五育并举,全面发展素质教育,强化体育锻炼”的指示精神,小明和小亮两名同学每天利用课余时间进行羽毛球比赛.规定每一局比赛中获胜方记2分,失败方记0分,没有平局,谁先获得10分就获胜,比赛结束.假设每局比赛小明获胜的概率都是23.(1)求比赛结束时恰好打了7局的概率;(2)若现在是小明6:2的比分领先,记X表示结束比赛还需打的局数,求X的分布列及期望.22.随着生活质量的提升,家庭轿车保有量逐年递增.方便之余却加剧了交通拥堵和环保问题.绿色出行引领时尚,共享单车进驻城市黄泽市有统计数据显示.2020年该市共享单车用户年龄等级分布如图1所示,一周内市民使用单车的频率分布扇形图如图2所示.若将共享单车用户按照年齡分为“年轻人”(20岁~391岁)和“非年轻人”( 19岁及以下或者40岁及以上)两类,将一周内使用的次数为6次或6次以上的经常使用共享单车的称为“单车族”.使用次数为5次或不足5次的称为“非单车族”.已知在“单车族”中有56是“年轻人”.(1)现对该市市民进行“经常使用共享单车与年龄关系”的调查,采用随机抽样的方法,抽取一个容量为400的样本,请你根据图表中的数据,补全下列22⨯列联表,并判断是否有95%的把握认为经常使用共享单车与年龄有关?使用共享单车情况与年龄列联表年轻人 非年轻人 合计单车族 非单车族 合计是“非年轻人”的人数为随机变量,X 求X 的分布列与期望. 参考数据:独立性检验界值表20()P K k ≥0.15 0.100.050.025 0.010k2.0722.7063.8415.0246.635其中,()()()()()2,n ad bc n a b c d K a b c d a c b d -=+++=++++(注:保留三位小数). 23.奶茶是年轻人非常喜欢的饮品.某机构对于奶茶的消费情况在一商圈附近做了一些调查,发现女性喜欢奶茶的人数明显高于男性,每月喝奶茶的次数也比男性高,但单次奶茶消费金额男性似乎明显高于女性.针对每月奶茶消费是否超过百元进行调查,已知在调查的200人中女性人数是男性人数的4倍,统计如下:超过百元 未超过百元 合计男8关?(2)在月消费超百元的调查者中,同时进行对于品牌喜好的调查.发现喜欢A 品牌的男女均为3人,现从喜欢A 品牌的这6人中抽取2人送纪念品,求这两人恰好都是女性的概率. 附:()()()()()2n ad bc K a b c d a c b d -=++++. 24.小张举办了一次抽奖活动.顾客花费3元钱可获得一次抽奖机会.每次抽奖时,顾客从装有1个黑球,3个红球和6个白球(除颜色外其他都相同)的不透明的袋子中依次不放回地摸出3个球,根据摸出的球的颜色情况进行兑奖.顾客中一等奖,二等奖,三等奖,四等奖时分别可领取的奖金为a 元,10元,5元,1元.若经营者小张将顾客摸出的3个球的颜色分成以下五种情况::1A 个黑球2个红球;:3B 个红球;:c 恰有1个白球;:D 恰有2个白球;:3E 个白球,且小张计划将五种情况按发生的机会从小到大的顺序分别对应中一等奖,中二等奖,中三等奖,中四等奖,不中奖.(1)通过计算写出中一至四等奖分别对应的情况(写出字母即可); (2)已知顾客摸出的第一个球是红球,求他获得二等奖的概率;(3)设顾客抽一次奖小张获利X 元,求变量X 的分布列;若小张不打算在活动中亏本,求a 的最大值.25.某花圃为提高某品种花苗质量,开展技术创新活动,在A ,B 实验地分别用甲、乙方法培育该品种花苗.为观测其生长情况,分别在实验地随机抽取各50株,对每株进行综合评分,将每株所得的综合评分制成如图所示的频率分布直方图,记综合评分为80分及以上的花苗为优质花苗.(1)用样本估计总体,以频率作为概率,若在A ,B 两块实验地随机抽取3株花苗,求所抽取的花苗中优质花苗数的分布列和数学期望;(2)填写下面的列联表,并判断是否有99%的把握认为优质花苗与培育方法有关.优质花苗 非优质花苗 合计甲培育法 20乙培育法 10合计附:下面的临界值表仅供参考.20()P K k ≥0.050 0.010 0.001 0k 3.8416.63510.828(参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++)26.某班主任对全班50名学生的学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:积极参加班级工作不太主动参加班级工作合计 学习积极性高 18 7 25 学习积极性一般6 19 25 合计242650(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?(2)试运用独立性检验的思想方法分析:学生的学习积极性与对待班级工作的态度是否有关?并说明理由.参考公式与临界值表:()()()()()22n ac bd K a b c d a c b d -=++++. P(K 2≥k) 0.100 0.050 0.025 0.010 0.001 k2.7063.8415.0246.63510.828【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】利用相互独立事件的概率乘法公式求得 甲投进而乙没有投进的概率,以及乙投进而甲没有投进的概率,相加即得所求. 【详解】甲投进而乙没有投进的概率为343(1)4520⨯-=,乙投进而甲没有投进的概率为341(1)455-⨯=,故甲、乙各投篮一次,恰有一人投进球的概率是 31720520+=,故选:D 【点睛】本题主要考查了相互独立事件的概率乘法公式的应用,体现了分类讨论的数学思想,属于中档题.2.B解析:B 【解析】 【分析】设男生人数为,女生人数为,完善列联表,计算解不等式得到答案.【详解】设男生人数为,女生人数为喜欢抖音 不喜欢抖音 总计 男生女生总计男女人数为整数 故答案选B 【点睛】本题考查了独立性检验,意在考查学生的计算能力和应用能力.3.D解析:D 【解析】分析:根据临界值表,确定犯错误的概率详解:因为根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为作文成绩优秀与课外阅读量大有关. 选D.点睛:本题考查卡方含义,考查基本求解能力.4.C解析:C 【解析】分析:根据列联表中数据,利用公式求得27.333k ≈,对照临界值即可的结果. 详解:根据所给的列联表, 得到()226025151557.333 6.63540203030k ⨯-⨯=≈>⨯⨯⨯,∴至少有0099的把握认为喜爱打篮球与性别有关,故选C.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.5.A解析:A 【解析】分析:根据所给的观测值,对照临界值表中的数据,即可得出正确的结论. 详解:∵观测值 4.328 3.841k ≈>, 而在观测值表中对应于3.841的是0.05,∴在犯错误的概率不超过0.05的前提下认为变量,X Y 有关系. 故选:A .点睛:本题考查了独立性检验的应用问题,是基础题.6.D解析:D 【解析】分析:由题意1A ,2A ,3A是两两互斥事件,条件概率公式求出1(|)P B A ,()()()()123P B P A B P A B P A B =++,对照选项即可求出答案.详解:由题意1A ,2A ,3A是两两互斥事件, ()()()12351213,,10210510P A P A P A =====, ()()()111177211|1112P BA P B A P A ⨯===,()23|11P B A =,()33|11P B A =,而()()()()123P B P A B P A B P A B =++()()()()()()112233|||P A P B A P A P B A P A P B A =++1713332115111011=⨯+⨯+⨯ 511=. 所以D 不正确. 故选:D.点睛:本题考查相互独立事件,解题的关键是理解题设中的各个事件,且熟练掌握相互独立事件的概率简洁公式,条件概率的求法,本题较复杂,正确理解事件的内蕴是解题的关键.7.D解析:D 【详解】分析:分别利用独立事件的概率公式求出恰在第一次、恰在第二次、恰在第三次落地打破的概率,然后由互斥事件的概率公式求解即可.详解:透镜落地3次,恰在第一次落地打破的概率为10.3P=,恰在第二次落地打破的概率为20.70.40.28P=⨯=,恰在第三次落地打破的概率为30.70.60.90.378P=⨯⨯=,∴落地3次以内被打破的概率1230.958P P P P=++=.故选D.点睛:本题主要考查互斥事件、独立事件的概率公式,属于中档题. 解答这类综合性的概率问题一定要把事件的独立性、互斥性结合起来,要会对一个复杂的随机事件进行分析,也就是说能把一个复杂的事件分成若干个互斥事件的和,再把其中的每个事件拆成若干个相互独立的事件的积,这种把复杂事件转化为简单事件,综合事件转化为单一事件的思想方法在概率计算中特别重要.8.D解析:D【解析】抛掷红、黄两枚骰子,第一个数字代表红色骰子,第二个数字代表黄色骰子,当红色骰子的点数为4或6时有(4,1),(4,2),(4,3),(4,4),(4,5),(4,6),(6,1),(6,2),(6,3),(6,4),(6,5),(6,6)共12种,两颗骰子的点数之积大于20的种数有(4,6),6,4),(6,5),(6,6)4种,根据概率公式得,两颗骰子的点数之积大于20的概率41123P==.本题选择D选项.点睛:有关古典概型的概率问题,关键是正确求出基本事件总数和所求事件包含的基本事件数.(1)基本事件总数较少时,用列举法把所有基本事件一一列出时,要做到不重复、不遗漏,可借助“树状图”列举.(2)注意区分排列与组合,以及计数原理的正确使用.9.C解析:C【解析】由表可得样本中心点的坐标为11.54.5,4m+⎛⎫⎪⎝⎭,根据线性回归方程的性质可得11.5 0.7 4.50.354m+⨯+=,解出 2.5m=,故选C. 10.A解析:A【解析】2R值越大效果越好,所以选A.11.A解析:A【解析】由题意得,22100(10302040)4.762 3.84150503070K⨯-⨯=≈>⨯⨯⨯,又因为2 3.841)0.05(P K>=,所以犯错误的概率不超过5%的前提下,认为“是否爱吃零食与性别有关”,故选A. 12.D解析:D【解析】由题意知,甲、乙都不被录取的概率为(1-0.6)(1-0.7)=0.12.∴至少有一人被录取的概率为1-0.12=0.88.故选D.考点:相互独立事件的概率.二、填空题13.09【分析】当乙连胜四局时对阵情况是第一局:甲对乙乙胜;第二局:乙对丙乙胜;第三局:乙对甲乙胜;第四局:乙对丙乙胜然后利用概率公式进行求解即可【详解】当乙连胜四局时对阵情况如下:第一局:甲对乙乙胜;解析:09.【分析】当乙连胜四局时,对阵情况是第一局:甲对乙,乙胜;第二局:乙对丙,乙胜;第三局:乙对甲,乙胜;第四局:乙对丙,乙胜,然后利用概率公式进行求解即可【详解】当乙连胜四局时,对阵情况如下:第一局:甲对乙,乙胜;第二局:乙对丙,乙胜;第三局:乙对甲,乙胜;第四局:乙对丙,乙胜.所求概率为P1=(1﹣0.4)2×0.52=0.32=0.09∴乙连胜四局的概率为0.09【点睛】考查运用概率知识解决实际问题的能力,相互独立事件是指,两事件发生的概率互不影响,而对立事件是指同一次试验中,不会同时发生的事件.14.【分析】由条件概率计算方式分别计算事件A:学生甲和乙都不是第一个出场且甲不是最后一个出场的基本事件个数其中分两类乙在最后与乙不在最后计数与事件AB的基本事件个数最后由公式求解即可【详解】设事件A:学解析:1 4【分析】由条件概率计算方式,分别计算事件A:“学生甲和乙都不是第一个出场,且甲不是最后一个出场”的基本事件个数,其中分两类乙在最后与乙不在最后计数,与事件AB的基本事件个数,最后由公式求解即可.【详解】设事件A :“学生甲和乙都不是第一个出场,且甲不是最后一个出场”;事件B :“学生丙第一个出场”,对事件A ,甲和乙都不是第一个出场,第一类:乙在最后,则优先从中间4个位置中选一 个给甲,再将余下的4个人全排列有1444C A ⋅种;第二类:乙没有在最后,则优先从中间4 个位置中选两个给甲乙,再将余下的4个人全排列有2444A A ⋅种,故总的有()14244444n A C A A A =⋅+⋅.对事件AB ,此时丙第一个出场,优先从除了甲以外的4人中选一人安排在最后,再将余下的4人全排列有1444C A ⋅种故()()()14441424444414n AB C A P B A n A C A A A ⋅===⋅+⋅. 故答案为:14【点睛】本题考查条件概率实际应用,属于中档题.15.(155)【解析】由题意可得:线性回归方程过样本中心点即线性回归方程所表示的直线必经过点(155)点睛:(1)正确理解计算的公式和准确的计算是求线性回归方程的关键(2)回归直线方程必过样本点中心解析:(1.5,5) 【解析】由题意可得:0123 1.54x +++==,826454y +++==, 线性回归方程过样本中心点,即线性回归方程ˆya bx =+所表示的直线必经过点(1.5,5) 点睛:(1)正确理解计算,b a 的公式和准确的计算是求线性回归方程的关键. (2)回归直线方程y bx a =+必过样本点中心(),x y .16.【解析】前两个不是红灯第三个是红灯所以概率为 解析:427【解析】前两个不是红灯,第三个是红灯,所以概率为2114(1)3327-= 17.5【分析】分别求出原数据和新数据的样本中心点即可【详解】由回归直线方程过样本中心点可将代入得所以原数据的样本中心点为则去掉两组数据后的新数据的新数据的样本中心点为设新数据的回归直线方程为将代入得当时解析:5 【分析】分别求出原数据和新数据的样本中心点即可【详解】由回归直线方程过样本中心点(,)x y ,可将4y =代入 1.51y x =-+,得2x =-, 所以原数据的样本中心点为(2,4)-,则去掉两组数据( 1.7,2.9)-,( 2.3,5.1)-后的新数据的2( 1.7 2.3)22n x n '----==--,4(2.9 5.1)42n y n '-+==-,新数据的样本中心点为(2,4)-,设新数据的回归直线方程为y x a '''=-+,将(2,4)-代入得2a '=,∴当3x '=-时,5y '=.故答案为:5 【点睛】回归直线一定经过样本中心点(,)x y18.10【分析】计算代入回归直线方程与结合求解出的值【详解】依题意代入回归直线方程得①根据题意②解①②组成的方程组得故填【点睛】本小题主要考查回归直线方程过样本中心点考查方程的思想属于基础题解析:10 【分析】计算,x y ,代入回归直线方程,与20m n +=结合,求解出n 的值. 【详解】 依题意4030,55m n x y ++==,代入回归直线方程得30403.24055n m++=-⨯+①,根据题意20m n +=②,解①②组成的方程组得10m n ==,故填10. 【点睛】本小题主要考查回归直线方程过样本中心点(),x y ,考查方程的思想,属于基础题.19.【分析】事件为队三人有一人答错其余两人答对计算其概率事件为队三人人答错其余一人答对计算其概率再根据独立事件同时发生的概率公式求出【详解】队总得分为分即事件为队三人有一人答错其余两人答对其概率队得分即 解析:427【分析】事件M 为A 队三人有一人答错,其余两人答对,计算其概率()P M ,事件N 为B 队三人2人答错,其余一人答对,计算其概率()P N ,再根据独立事件同时发生的概率公式求出()P MN .【详解】A 队总得分为2分,即事件M 为A 队三人有一人答错,其余两人答对,其概率()2232241339P M C ⎛⎫⎛⎫=⨯-= ⎪ ⎪⎝⎭⎝⎭, “B 队得1分,即事件N 即为B 队三人2人答错,其余一人答对,则()22122221111111133333331333P N ⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫=-⨯-⨯+-⨯⨯-+⨯-⨯-= ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭, A 队得2分B 队得一分,即事件,M N 同时发生,则()()()7491432P MN P M P N ==⨯=. 故答案为:427. 【点睛】本题考查了独立事件同时发生的概率计算,还考查了学生的分析理解能力,运算能力,属于中档题.20.88【分析】根据相互独立事件概率计算公式和对立事件的概率计算公式直接求解即可【详解】"至少有一个公司不需要维护"的对立事件是"两公司都需要维护"所以至少有一个公司不需要维护的概率为故答案为088【点解析:88 【分析】根据相互独立事件概率计算公式和对立事件的概率计算公式直接求解即可. 【详解】"至少有一个公司不需要维护"的对立事件是"两公司都需要维护", 所以至少有一个公司不需要维护的概率为10.30.40.88p =-⨯=, 故答案为0.88. 【点睛】本题主要考查概率的求法以及相互独立事件概率计算公式和对立事件的概率计算公式的应用.三、解答题21.(1)2081;(2)分布列见解析,()23681E X =. 【分析】(1)利用事件的独立性,分两种情况,恰 好打了7局小明获胜和恰好打了7局小亮获胜,再概率相加即可.(2)X 的可能取值为2,3,4,5,利用二项分布,分别求出其相应的概率,列出分布列即可. 【详解】(1)恰 好打了7局小明获胜的概率是525416721152C 333P ⨯⎛⎫⎛⎫== ⎪ ⎪⎝⎭⎝⎭,恰好打了7局小亮获胜的概率为252426721152333P C ⨯⎛⎫⎛⎫== ⎪ ⎪⎝⎭⎝⎭, ∴比赛结束时恰好打了7局的概率为5212715215220381P P P ⨯+⨯=+==. (2)X 的可能取值为2,3,4,5,()224239P X ⎛⎫=== ⎪⎝⎭,()2312321283C 33327P X ⎛⎫==⨯⨯==⎪⎝⎭, ()2241434421113134C C 333381P X ⎛⎫⎛⎫⎛⎫==⨯⨯+⨯== ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭, ()2341344521212485C C 3333381P X ⎛⎫⎛⎫⎛⎫==⨯⨯+⨯⨯== ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭ 或()334421885C 33381P X ⎛⎫==⨯⨯== ⎪⎝⎭. ∴X 的分布列如下:()2345927818181E X =⨯+⨯+⨯+⨯=.【点睛】方法点睛:求解离散型随机变量X 的分布列的步骤:①理解X 的意义,写出X 可能取的全部值;②求X 取每个值的概率;③写出X 的分布列.求离散型随机变量的分布列的关键是求随机变量所取值对应的概率.22.(1)表格见解析,有;(2)分布列见解析,0.3. 【分析】(1)补全的列联表,利用公式求得2 4.167 3.841K ≈>,即可得到结论;(2)由(1)的列联表可知,经常使用单车的“非年轻人”的概率,即可利用独立重复试验求解随机变量X 取每个数值的概率,列出分布列,求解数学期望. 【详解】(1)补全的列联表如下:()24002004012040 4.167 3.84124016032080K ⨯⨯-⨯=≈>⨯∴⨯⨯,(2K 要求保留三位小数,否则扣一分)即有95%的把握可以认为经常使用共享单车与年龄有关. (2)由(1)的列联表可知,既是“单车族”又是“非年轻人”占样本总数的频率为40100%10%400⨯=, 即在抽取的用户中既是“单车族”又是“非年轻人”的概率为0.1, 随机变量X 可取0,1,2,3()()330010. 10.729,P X C ==-=()()211310.110.10.243P X C ==-=()()12320.1210.10.027,P X C ==-=()33330.130.001,P X C ===则()~3,0.1,X BX ∴的分布列为X ∴的数学期望30.10.3E X =⨯=.【点睛】方法点睛:本题主要考查了22⨯列联表,独立性检验,二项分布,二项分布的期望,解题方法如下:(1)根据题意,找出对应数据,补全列联表,求得K2K2的值,对比数据,得出结论; (2)根据题意,得到经常使用单车的“非年轻人”的概率,之后利用独立重复试验,结合二项分布的相关公式求得结果. 23.(1)表格见解析,有;(2)15. 【分析】(1)设男性每月奶茶消费未超过百元的人数为x ,根据题中条件得出关于x 的方程,解出x 的值,进而可完善22⨯列联表,计算出2K 的观测值,结合临界值表可得出结论;(2)设喜欢A 品牌的女性为1A 、2A 、3A ,男性为1B 、2B 、3B ,利用列举法列举出所有的基本事件,并确定事件“这两人恰好都是女性”所包含的基本事件,利用古典概型的概率公式可求得所求事件的概率. 【详解】(1)设男性每月奶茶消费未超过百元的人数为x ,则()848200x x +++=,32x ∴=,2K 的观测值()200814432161003.030 2.706401602417633k ⨯-⨯==≈>⨯⨯⨯,因此,有90%的把握认为月消费奶茶超过百元与性别有关.(2)设喜欢A 品牌的女性为1A 、2A 、3A ,男性为1B 、2B 、3B ,从喜欢A 品牌的这6人中抽取2人送纪念品,所有的基本事件有:()12,A A 、()13,A A 、()11,A B 、()12,A B 、()13,A B 、()23,A A 、()21,A B 、()22,A B 、()23,A B 、()31,A B 、()32,A B 、()33,A B 、()12,B B 、()13,B B 、()23,B B ,共15种,设“这两人恰好都是女性”为事件M ,则事件M 包含的基本事件有:()12,A A 、()13,A A 、()23,A A ,共3种,()31155P M ∴==, 因此,抽取的这两人恰好都是女性的概率为15. 【点睛】方法点睛:求解古典概型概率的方法如下: (1)列举法; (2)列表法; (3)数状图法; (4)排列组合数的应用.24.(1)中一至四等奖分别对应的情况是,,,B A E C .(2)118;(3)194. 【分析】(1)求出一至四等奖的概率,即可写出分别对应的类别;(2)顾客摸出的第一个球是红球的条件下,利用条件概率计算公式即可得出他获得二等奖的概率.(3)若经营者不打算在这个游戏的经营中亏本,求出分布列得到期望,即可求a 的最大值. 【详解】。

高中数学《统计与统计案例》课件

高中数学《统计与统计案例》课件
^
设施投资额的变化规律呈线性增长趋势,利用 2010 年至 2016 年的数据建立的线性模型y =99+17.5t 可以较好地描述 2010 年以后的环境基础设施投资额的变化趋势,因此利用 模型②得到的预测值更可靠.
13
考点整合
1.抽样方法 抽样方法包括简单随机抽样、系统抽样、分层抽样,三种抽样方法都是等概率抽样, 体现了抽样的公平性,但又各有其特点和适用范围.
位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为( )
A.0.5
B.0.6
C.0.7
D.0.8
解析 法一 设调查的 100 位学生中阅读过《西游记》的学生人数为 x,则 x+80-60
=90,解得 x=70,所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计
值为17000=0.7.故选 C.
解 (1)由调查数据,男顾客中对该商场服务满意的比率为4500=0.8,因此男顾客对该商场
服务满意的概率的估计值为 0.8.女顾客中对该商场服务满意的比率为3500=0.6,因此女顾
客对该商场服务满意的概率的估计值为 0.6.
8
(2)K2 的观测值 k=100×5(0×405×0×207-0×303×010)2≈4.762. 由于4.762>3.841,故有95%的把握认为男、女顾客对该商场服务 的评价有差异.
^
利用模型②,该地区 2018 年的环境基础设施投资额的预测值为y=99+17.5×9=256.5(亿 元).
12
(2)利用模型②得到的预测值更可靠. 理由如下: 从折线图可以看出,2000 年至 2016 年的数据对应的点没有随机散布在直线 y=-30.4+ 13.5t 上下,这说明利用 2000 年至 2016 年的数据建立的线性模型①不能很好地描述环境 基础设施投资额的变化趋势.2010 年相对 2009 年的环境基础设施投资额有明显增加, 2010 年至 2016 年的数据对应的点位于一条直线的附近,这说明从 2010 年开始环境基础

202新数学复习第九章统计统计案例9.2用样本估计总体学案含解析

202新数学复习第九章统计统计案例9.2用样本估计总体学案含解析

第二节用样本估计总体课标要求考情分析1。

了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(平均数、标准差),并给出合理解释.4.会用样本的频率分布估计总体的分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.5.会用随机抽样的基本1。

本节是用样本估计总体,是统计学的基础,以考查频率分布直方图、茎叶图、平均数、方差、标准差为主,同时考查对样本估计总体的思想的理解.2.本节在高考题中主要是以选择题和填空题为主,属于中低档题目。

方法和样本估计总体的思想解决一些简单的实际问题。

知识点一用样本的频率分布估计总体分布1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差).(2)决定组距与组数.(3)将数据分组.(4)列频率分布表.(5)画频率分布直方图.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.频率分布直方图中的常见结论(1)众数的估计值为最高矩形的中点对应的横坐标.(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.3.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.知识点二用样本的数字特征估计总体的数字特征1.众数、中位数、平均数平均数如果有n个数据x1,x2,…,x n,那么这n个数的平均数错误!=错误!平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低2.标准差和方差(1)标准差是样本数据到平均数的一种平均距离.(2)标准差:s=错误!。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
【例题精讲】 【例 1 】 有下列关系:
R2 越接近于 1,则回归效果越好。
1
( 1)人的年龄与他(她)拥有的财富之间的关系;
( 2)曲线上的点与该点的坐标之间的关系;
( 3)苹果的产量与气候之间的关系;
( 4)森林中的同一种树木,其断面直径与高度之间的关系;
( 5)学生与他(她)的学号之间的关系,其中有相关关系的是

A. y =0.08 x- 1.23
B. y =0.08 x+1.23
C. y =1.23 x- 0.08
D. y =1.23 x+0.08
二、填空题. 8.若有一组数据的总偏差平方和为
100,相关指数为 0.5 ,则其残差平方和为 _________.
9.在求两个变量 x 和 y 的线性回归方程过程中,计算得
相关系数最大,则应去掉的一组数据所对应的点是(

A. (3 , 10)
B. (4 , 5)
C. (10 , 12)
D. (1 , 2)
7.假设关于某设备的使用年限 x 和所支出的维修费用 y(万元),有如下的统计资料:
x
2
3
4
5
6
y
2.2
3.8
5.5
6.5
7.0
若由资料可知 y 对 x 呈线性相关关系,则线性回归方程为(
该回归方程是

,则
4
11
9
8
5
( 1)变量 y 对 x 进行相关性检验;( 2)如果 y 对 x 有线性相关关系,求回归直线方程;
( 3)若实际生产中,允许每小时的产品中有缺点的零件最多为
10 个,那么机器的运转速度应控制在什么
范围内 ?
8.许多因素都会影响贫穷,教育也许是其中之一,在研究这两个因素的关系时收集了美国 人受过 9 年或更少教育的百分比 ( x) 和收入低于官方规定的贫困线的人数占本州人数的百分比

A.回归分析
B.独立性检验分析
C.残差分析
D.散点图分析
【能力提高】
7.一台机器使用的时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,
每小时生产有缺点零件的多少,随机器的运转的速度而变化,下表为抽样试验的结果:
转速 x(转 / 秒)
16 14 12 8
每小时生产有缺点的零件数 y(件)
线性回归方程 ①变量之间的两类关系:函数关系与相关关系;②制作散点图,判断线性相关关系;
③线性回归方程: y bx a (最小二乘法)
n
xi yi nx y
b
i1
n
xi2
2
nx
i1
a y bx
注意:线性回归直线经过定点 (x, y) .
相关系数(判定两个变量线性相关性):
r
n
( xi x)( yi y)
个性化教学辅导教案
学科: 数学 教学 课题
年级: 十一年级
任课教师:
授课时间: 2018 年 月 日
导函数求参数范围问题
教学 目标
1、熟练运用统计案例中的公式进行计算 2、学会分析统计数据
教学 重点 : 统计案例公式的运用 重难点 难点 : 数据的分析
【知识要点】
教学过程
§1.1 回归分析的基本思想及其初步应用
y 对 x 的回归方程.
【例 3 】营养学家为研究食物中蛋白质含量对婴幼儿生长的影响,调查了一批年龄在两个月到三岁的婴幼 儿,将他们按食物中蛋白质含量的高低分为高蛋白食物组和低蛋白食物组两组,并测量身高,得到下面的 数据:高蛋白食物组
年龄 0.2 0.5 0.8
1
1 1.4 1.8 2
2 2.5 2.5 3 2.7
( y i y ) 2 ; ⑵残差: ei y i yi ; ⑶残差平方和:
( yi yi ) 2 ;
i1
i1
⑷回归平方和:
n
( yi
i1
n
y) 2 - ( yi yi ) 2 ;⑸相关指数 R 2 1
i1
n
(yi
i1 n
(yi
i1
yi )2

yi )2
注: ① R 2 的值越大,说明残差平方和越小,则模型拟合效果越好;②
y=7.19 x+73.93 ,用这个模
型预测这个孩子 10 岁时的身高,则正确的叙述是(

A.身高一定是 145.83 cm
B.身高在 145.83 cm以上
C.身高在 145.83 cm以下
D.身高在 145.83 cm左右
2
3.两个变量 y 与 x 的回归模型中,分别选择了
好的模型是(

A.模型 1 的相关指数

【例 2 】 某种书每册的成本费 y(元)与印刷册数 x(千册)有关,经统计得到数据如下:
x
1
2
3
5
10
20
30
50 100 200
y 10.15 5.52 4.08 2.85 2.11 1.62 1.41 1.30 1.21 1.15
检验每册书成本费 y 与印刷册数倒数 1 之间是否具有线性相关关系,如有,求 x
i1
n
n
( xi x)2 ( yi y) 2
i1
i1
注: ⑴ r >0 时,变量 x, y 正相关; r <0 时,变量 x, y 负相关;
⑵① | r | 越接近于 1,两个变量的线性相关性越强;
② | r | 接近于 0 时,两个变量之间几乎不存在线性相关关系.
回归分析中回归效果的判定:
n
n
⑴总偏差平方和:
A.总偏差平方和
B.残差平方和
C.回归平方和
) D.相关指数 R2
2.已知回归直线的斜率的估计值是 1.23 ,样本点的中心为 (4 , 5) ,则回归直线的方程是(

A. y =1.23 x+ 4
B. y =1.23 x+5
C. y =1.23 x+0.08
D. y =0.08 x+1.23
3.相关系数 r 可用来衡量两个变量之间线性相关关系的强弱, 其计算公式为:
C.模型 3 的相关指数
R2 为 0.98 R2 为 0.50
4 个不同模型,它们的相关指数 R2 如下,其中拟合效果最
B.模型 2 的相关指数 R2 为 0.80 D.模型 4 的相关指数 R2 为 0.25
4.工人月工资(元)依劳动生产率(千元)变化的回归直线方程为
y =60+90x,下列判断正确的是(

A.劳动生产率为 1000 元时,工资为 50 元
B.劳动生产率提高 1000 元时,工资提高 150 元
C.劳动生产率提高 1000 元时,工资提高 90 元
D.劳动生产率为 1000 元时,工资为 90 元
5.在回归分析中,残差图中纵坐标为(

A.残差
B.样本编号
C. x
D. en
6.通过 e1,e2,, , en 来判断模拟型拟合的效果, 判断原始数据中是否存在可疑数据, 这种分工称为 (

A.越大
B.越小
C.无法判断
D.以上都不对
5.利用独立性检验来考虑两个分类变量 X 和 Y是否有关系时,通过查阅下表来确定断言“ X 和 Y有关系”
的可信度.如果 k >5.024 ,那么就有把握认为“ X 和 Y 有关系”的百分比为(

P K 2 k 0.50 0.40 0.25
0.15
0.10
0.05
0.025 0.010 0.005 0.001
k
0.455 0.708 1.323 2.072 2.706 3.84 5.024 6.635 7.879 10.83
A. 25%
B. 75%
C. 2.5 %
D.97.5 %
6.如图所示,有 5 组 ( x, y) 数据,去掉其中一组后,剩下的 4 组数据的线性
பைடு நூலகம்
【基础达标】
1.在画两个变量的散点图时,下面哪个叙述是正确的(

A.预报变量在 x 轴上,解释变量在 y 轴上
B.解释变量在 x 轴上,预报变量在 y 轴上
C.可以选择两个变量中任意一个变量在 x 轴上 D.可以选择两个变量中任意一个变量在 y 轴上
2.一位母亲记录了儿子 3~9 岁的身高,由此建立的身高与年龄的回归模型为

则以下正确的命题是( A. r 只能取正值
B. r 可以取任意实数
) C. r 只有大于 0.75 时才认为两个变量有很强的线性相关关系
D. r 大于 0.75 时才认为两个变量有很强的线性相关关系
4.在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上的两个柱形的高度的乘积相差越大两
个变量有关系的可能性就(
50 个州的成年 ( y) 的数据,
建立的回归直线方程如下 y 0.8x 4.6 ,斜率的估计等于 0.8 说明 或更少教育的百分比 ( x) 和收入低于官方的贫困线的人数占本州人数的百分比
“大于 0”或“小于 0” )
;成年人受过 9 年
( y) 之间的相关系数
.(填
3
课后练习
一、选择题.
1.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是(
身高 54 54.3 63 66 69 73 82 83 80.3 91 93.2 94 94 低蛋白食物组
年龄 0.4 0.7 1 1 1.5 2 2 2.4 2.8 3 1.3 1.8 0.2 3
身高 52 55 61 63.4 66 68.5 67.9 72 76 74 65 69 51 77 身高与年龄近似有线性关系, 检验: 不同食物的婴幼儿的身高有无差异; 若存在, 这种差异有何特点 ?
相关文档
最新文档