高中数学人教a版选修1-2第一章统计案例章末复习【练习】(学生版)
(压轴题)高中数学选修1-2第一章《统计案例》测试(有答案解析)(1)

一、选择题1.如图是九江市2019年4月至2020年3月每月最低气温与最高气温(℃)的折线统计图:已知每月最低气温与最高气温的线性相关系数r =0.83,则下列结论错误的是( )A .每月最低气温与最高气温有较强的线性相关性,且二者为线性正相关B .月温差(月最高气温﹣月最低气温)的最大值出现在10月C .9﹣12月的月温差相对于5﹣8月,波动性更大D .每月最高气温与最低气温的平均值在前6个月逐月增加2.小红和小明利用体育课时间进行投篮游戏,规定双方各投两次,进球次数多者获胜.已知小红投篮命中的概率为35,小明投篮命中的概率为12,且两人投篮相互独立,则小明获胜的概率为( ) A .1225B .25C .825D .6253.变量X 与Y 相对应的一组数据为(10 , 1),(11.3 , 2),(11.8 , 3),(12.5 , 4),(13 , 5);变量U 与V 相对应的一组数据为(10 , 5),(11.3 , 4),(11.8 , 3),(12.5 , 2),(13 , 1).1r 表示变量Y X 之间的线性相关系数,2r 表示变量V 与U 之间的线性相关系数,则( )A .120r r <<B .210r r <<C .210r r <<D .21r r =4.某研究性学习小组调查研究学生玩手机对学习的影响,部分统计数据如表玩手机 不玩手机 合计 学习成绩优秀 4 8 12 学习成绩不优秀 16 2 18 合计201030经计算2K 的值,则有( )的把握认为玩手机对学习有影响. A .95%B .99%C .99.5%D .99.9%5.某市通过随机询问100名不同年级的学生是否能做到“扶跌倒老人”,得到如下列联表:则下列结论正确的是( ) 附参照表:参考公式:22()()()()()n ad bc k a b c d a c b d -=++++,其中n a b c d =+++A .在犯错误的概率不超过90%的前提下,认为“学生能否做到‘扶跌倒老人’与年级高低有关”B .在犯错误的概率不超过1%的前提下,“学生能否做到‘扶跌倒老人’与年级高低无关”C .有90%以上的把握认为“学生能否做到‘扶跌倒老人’与年级高低有关”D .有90%以上的把握认为“学生能否做到‘扶跌倒老人’与年级高低无关”6.袋中装有10个形状大小均相同的小球,其中有6个红球和4个白球.从中不放回地依次摸出2个球,记事件A =“第一次摸出的是红球”,事件B =“第二次摸出的是白球”,则(|)P B A =( )A .25B .415C .49 D .597.下列说法中正确的是( )A .设随机变量~(10,0.01)X N ,则1(10)2P X >= B .线性回归直线不一定过样本中心点(,)x yC .若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1D .先把高三年级的2000名学生编号:1到2000,再从编号为1到50的50名学生中随机抽取1名学生,其编号为m ,然后抽取编号为50m +,100m +,150m +,……的学生,这样的抽样方法是分层抽样8.先后抛掷骰子两次,落在水平桌面后,记正面朝上的点数分别为,x y ,设事件A 为x y +为偶数,事件B 为x y ≠ ,则概率(|)P B A =( )A .14B .13C .12D .239.在5道题中有3道理科题和2道文科题,如果一次性抽取 2道题,已知有一道是理科题的条件下,则另一道也是理科题的概率为A .13B .14C .12D .3510.下列有关结论正确的个数为( )①小赵、小钱、小孙、小李到4个景点旅游,每人只去一个景点,设事件A =“4个人去的景点不相同”,事件B =“小赵独自去一个景点”,则()2|9P A B =; ②设,a b ∈R ,则“22log log a b >”是“21a b ->的充分不必要条件;③设随机变量ξ服从正态分布(),7N μ,若()()24P P ξξ<=>,则μ与D ξ的值分别为3,7D μξ==. A .0B .1C .2D .311.把一枚硬币任意掷两次,事件A=“第一次出现正面”,事件B=“第二次出现正面”,则P(B/A )=( ) A .14B .13C .12D .2312.甲、乙两队进行篮球决赛,采取五场三胜制(当一队赢得三场胜利时,该队获胜,比赛结束).根据前期比赛成绩,甲队的主客场安排依次为“主主客客主”.设甲队主场取胜的概率为0.6,客场取胜的概率为0.5,且各场比赛结果相互独立,则甲队不超过4场即获胜的概率是( ) A .0.18B .0.21C .0.39D .0.42二、填空题13.某人进行射击训练,射击一次命中靶心的概率是0.9,各次射击相互独立,他连续射击3次,则“第一次没有命中靶心后两次命中靶心” 的概率是______.14.2018年春季,世界各地相继出现流感疫情,这已经成为全球性的公共卫生问题.为了考察某种流感疫苗的效果,某实验室随机抽取100只健康小鼠进行试验,得到如下列联表:关系.(参考公式:()()()()()22n ad bc K a b c d a c b d -=++++.)15.已知下列命题:①从匀速传递的产品生产流水线上,质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样;②两个变量的线性相关程度越强,则相关系数的值越接近于1;③两个分类变量X 与Y 的观测值2k ,若2k 越小,则说明“X 与Y 有关系”的把握程度越大;④随机变量X ~(0,1)N ,则(1)2(1)1P X P X <=<-. 其中为真命题的是__________.16.从包括甲乙两人的6名学生中选出3人作为代表,记事件A :甲被选为代表,事件B :乙没有被选为代表,则()P BA │等于_________. 17.某学生在上学路上要经过4个路口,假设在各路口是否遇到红灯是相互独立的,遇到红灯的概率都是13,那么该生在上学路上到第3个路口首次遇到红灯的概率为__________.18.在一场对抗赛中,,A B 两人争夺冠军,若比赛采用“五局三胜制”,A 每局获胜的概率均为23,且各局比赛相互独立,则A 在第一局失利的情况下,经过五局比赛最终获得冠军的概率是_____.19.下列说法正确的个数有_________(1)已知变量x 和y 满足关系23y x =-+,则x 与y 正相关;(2)线性回归直线必过点(),x y ;(3)对于分类变量A 与B 的随机变量2k ,2k 越大说明“A 与B 有关系”的可信度越大 (4)在刻画回归模型的拟合效果时,残差平方和越小,相关指数2R 的值越大,说明拟合的效果越好.20.2020年新型冠状病毒疫情期间,大学生小白同学在家里根据某款运动软件安排的训练计划进行运动,每天训练一次,连续3天为一个运动周期,若小白每天不能参加训练的概率为14,假设小白每天的训练是相互独立的,若一个训练周期内出现2次不能参加训练,则停止该训练计划,则这个训练计划在第二个完整周期后结束的概率为______.三、解答题21.某航空公司规定:国内航班(不构成国际运输的国内航段)托运行李每件重量上限为50kg ,每件尺寸限制为40cm 60cm 100cm ⨯⨯,其中头等舱乘客免费行李额为40kg ,经济舱乘客免费行李额为20kg .某调研小组随机抽取了100位国内航班旅客进行调查,得到如表所示的数据:(1)请完成22⨯列联表,并判断是否在犯错概率不超过0.05的前提下,认为托运超额行李与乘客乘坐座位的等级有关?(2)调研小组为感谢参与调查的旅客,决定从托运行李超出免费行李额且不超出的旅客中(其中女性旅客4人)随机抽取4人,对其中的女性旅客赠送“100元超额行李补贴券”,记赠送的补贴券总金额为X元,求X的分布列与数学期望.参考公式:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.参考数据:22.为推动更多人阅读,联合国教科文组织确定每年的4月23日为“世界读书日”.设立目的是希望居住在世界各地的人,无论你是年老还是年轻,无论你是贫穷还是富裕,都能享受阅读的乐趣,都能尊重和感谢为人类文明做出过巨大贡献的思想大师们,都能保护知识产权.为了解不同年龄段居民的主要阅读方式,某校兴趣小组在全市随机调查了200名居民,经统计这200人中通过电子阅读与纸质阅读的人数之比为3:1,将这200人按年龄分组,其中统计通过电子阅读的居民得到的频率分布直方图如图所示.(1)求a的值及通过电子阅读的居民的平均年龄;(2)把年龄在第123,,组的居民称为青少年组,年龄在第45,组的居民称为中老年组,若选出的200人中通过纸质阅读的中老年有30人,请完成上面22⨯列联表,则是否有97.5%的把握认为阅读方式与年龄有关?()()()()()22n ad bc K a b a d b c c d -=++++()2P K k >0.15 0.10 0.05 0.025 0.010 0.005 0.001 k2.0722.7063.8415.0246.6357.87910.82823.下表是我国大陆地区从2013年至2019年国内生产总值(GDP )近似值(单位:万亿元人民币)的数据表格: 年份 2013 2014 2015 2016 2017 2018 2019 年份代号x1234567中国大陆地区GDP :y (单位:万亿元人民币)59.3 64.1 68.6 74.0 82.1 90.0 99.1以x 为解释变量,y 为预报变量,若以11y b x a =+为回归方程,则相关指数210.9808R ≈;若以22ln y a b x =+为回归方程,则相关指数220.8457R ≈.(1)判断11y b x a =+与22ln y a b x =+哪一个更适宜作为国内生产总值(GDP )近似值y 关于年份代号x 的回归方程,并说明理由;(2)根据(1)的判断结果及表中数据,求出y 关于年份代号x 的回归方程(系数精确到0.01);(3)党的十九大报告中指出:从2020年到2035年,在全面建成小康社会的基础上,再奋斗15年,基本实视社会主义现代化.若到2035年底我国人口增长为14.4亿人,假设到2035年世界主要中等发达国家的人均国民生产总值的频率直方图如图所示.以(2)的结论为依据,预测我国在2035年底人均国民生产总值是否可以超过假设的2035年世界主要中等发达国家的人均国民生产总值平均数的估计值. 参考数据:71537.2ii y==∑,712333.5i i i x y ==∑.参考公式:回归方程ˆˆˆybx a =+中斜率和截距的最小二乘估计公式分别为:()()()1122211ˆn niii ii i nni ii i x x y y x y nxybx x xnx ====---==--∑∑∑∑,ˆˆay bx =-. 24.在疫情这一特殊时期,教育行政部门部署了“停课不停学”的行动,全力帮助学生在线学习.复课后进行了摸底考试,某校数学教师为了调查高三学生这次摸底考试的数学成绩与在线学习数学时长之间的相关关系,对在校高三学生随机抽取45名进行调查.知道其中有25人每天在线学习数学的时长是不超过1小时的,得到了如下的等高条形图:(Ⅰ)是否有99%的把握认为“高三学生的这次摸底考试数学成绩与其在线学习时长有关”;(Ⅱ)将频率视为概率,从全校高三学生这次数学成绩超过120分的学生中随机抽取10人,求抽取的10人中每天在线学习时长超过1小时的人数的数学期望和方差.()()()()()22n ad bc K a b c d a c b d -=++++25.自然资源部门对某市饮用水厂中的地下水质量进行监测,随机抽查了100眼水井进行监测,得到溶解性总固体浓度(单位:mg L )和硫酸盐浓度(单位:mg L )的分布如下表:(1)估计事件“该市某一水井中溶解性总固体浓度不超过500,且硫酸盐浓度不超过150”的概率;(2)根据所给数据,完成下面的22⨯列联表:(3)根据(2)中的列联表,判断是否有99%的把握认为该市水井中溶解性总固体浓度与硫酸盐浓度有关?附:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.()2P K k ≥0.050 0.010 0.001 k 3.8416.63510.82826.2019年,中国的国内生产总值(GDP )已经达到约100万亿元人民币,位居世界第二,这其中实体经济的贡献功不可没实体经济组织一般按照市场化原则运行,某生产企业一种产品的成本由原料成本及非原料成本组成,每件产品的非原料成本y (元)与生产该产品的数量x (千件)有关,经统计得到如下数据:x1 2 3 4 5 6 7 8 y 1126144.53530.5282524根据以上数据,绘制了如下的散点图.现考虑用反比例函数模型b y a x=+和指数函数模型dxy ce =分别对两个变量的关系进行拟合.为此变换如下:令1xμ=,则y a b μ=+,即y 与μ满足线性关系;令ln νμ=,则ln c dx ν=+,即ν与x 也满足线性关系.这样就可以使用最小二乘法求得非线性的回归方程.已求得用指数函数模型拟合的回归方程为96.54dx y e =,ν与x 的相关系数10.94r =-,其他参考数据如表(其中1ln i i i iy x μν==). 81iii yμ=∑ μ2μ821ii μ=∑81i i y =∑ 821ii y=∑ 0.616185.5⨯ 2e -ln96.54 ν(1)求指数函数模型和反比例函数模型中y 关于x 的回归方程;(2)试计算y 与μ的相关系数2r ,并用相关系数判断:选择反比例函数和指数函数两个模型中的哪一个拟合效果更好(计算精确到0.01)?(3)根据(2)小题的选择结果,该企业采取订单生产模式(即根据订单数量进行生产,产品全部售出).根据市场调研数据,该产品单价定为100元时得到签订订单的情况如表:已知每件产品的原料成本为10元,试估算企业的利润是多少?(精确到1千元) 参考公式:对于一组数据()11,μν,()22,μν,⋅⋅⋅,(),n n μν,其回归直线ναβμ=+的斜率和截距的最小二乘估计分别为:1221ni i i nii n n μνμνβμμ==-=-∑∑,ανβμ=-,相关系数ni in r μνμν-=∑【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】根据相关系数的性质判断A ;根据所给折线图,对B ,C ,D 逐项进行判断. 【详解】每月最低气温与最高气温的线性相关系数r =0.83,比较接近于1,则每月最低气温与最高气温有较强的线性相关性,且二者为线性正相关,则A 正确;由所给的折线图可以看出月温差(月最高气温﹣月最低气温)的最大值出现在10月,则B 正确;5﹣8月的月温差分别为18,17,16,16,9﹣12月的月温差分别为20,31,24,21,则9﹣12月的月温差相对于5﹣8月,波动性更大,C 正确;每月的最高气温与最低气温的平均值在前5个月逐月增加,第六个月开始减少,所以A 正确,则D 错误; 故选:D 【点睛】本题主要考查了根据折线图解决实际问题以及相关系数的性质的应用,对于相关系数r ,r 越接近于1,两个变量的线性相关程度越强,属于中档题. 2.D解析:D 【分析】由题意可知,用(,)x y 表示小明、小红的进球数 ,所以当小明获胜时,进球情况应该是(2,0),(2,1),(1,0),由相互独立事件同时发生的乘法公式以及互斥事件的概率加法公式,即可求得. 【详解】由题意可知,用(,)x y 表示小明、小红的进球数 ,所以当小明获胜时,进球情况应该是(2,0),(2,1),(1,0),小明获胜的概率是22222112213133131326111252552525252525P C C ⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫=⨯-+⨯⨯⨯-+⨯⨯-=++= ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭故选D . 【点睛】本题主要考查相互独立事件同时发生的乘法公式以及互斥事件的概率加法公式的应用,意在考查学生分类讨论思想意识以及运算能力.3.C解析:C 【分析】求出1r ,2r ,进行比较即可得到结果 【详解】变量X 与Y 相对应的一组数据为()()()()()10111.3211.8312.54135,,,,,,,,,()1011.311.812.513511.72X ∴=++++÷= ()1234553Y =++++÷=即17.20.375519.172r ==变量U 与V 相对应的一组数据为()()()()()10511.3411.8312.52131,,,,,,,,,1234535U ++++==∴这一组数据的相关系数20.3755r =-则第一组数据的相关系数大于0,第二组数据的相关系数小于0 则210r r << 故选C 【点睛】本题主要考查的是变量的相关性,属于基础题.4.C解析:C 【解析】分析:利用公式求得观测值2K ,对照数表,即可得出正确的结论. 详解:根据列联表可得()223042168=1020101218K ⨯⨯-⨯=⨯⨯⨯,27.8791010.828K <=<,对照数表知,有99.5%的把握认为玩手机对学习有影响,故选C.点睛:本题考查了独立性检验的应用问题,是基础题目. 独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.5.C解析:C 【解析】分析:根据列联表中数据,利用公式求得2 3.03K ≈,参照临界值表即可得到正确结论. 详解:由公式()()()()()22n d bc k a b c d a c b d -=++++可得2 3.03K ≈,参照临界值表,2.7063.030 3.841<<,∴0090以上的把握认为,“学生能否做到‘扶跌倒老人’与年级高低有关”,故选C.点睛:本题考查了独立性检验的应用,属于基础题. 独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.6.C解析:C 【解析】分析:利用概率的计算公式,求解事件A 和事件A B 的概率,即可利用条件概率的计算公式,求解答案.详解:由题意,事件A =“第一次摸出的是红球”时,则63()105P A ==, 事件A =“第一次摸出的是红球”且事件B =“第二次摸出白球”时,则6412()10945P AB =⨯=, 所以()4(|)()9P AB P B A P A ==,故选C . 点睛:本题主要考查了条件概率的计算,其中熟记条件概率的计算公式和事件的概率是解答的关键,着重考查了分析问题和解答问题的能力,以及推理与计算能力.7.A解析:A 【解析】在A 中,设随机变量X 服从正态分布N (10,0.01),则由正态分布性质得1(10)2P X >=,故A 正确; 在B 中,线性回归直线一定过样本中心点(),x y ,故B 错误;在C 中,若两个随机变量的线性相关性越强,则相关系数r 的绝对值越接近于1,故C 错误;在D 中,先把高三年级的2000名学生编号:1到2000,再从编号为1到50的50名学生中随机抽取1名学生,其编号为m ,然后抽取编号为m+50,m+100,m+150…的学生,这样的抽样方法是系统抽样法,故D 错误. 故选:A8.D解析:D 【解析】因为事件A 的基本事件分别为A(1,1),(1,3),(3,1),(2,2),(2,4),(4,2),(3,3),(4,4),(4,6),(6,4),(5,5),(1,5),(5,1),(6,6),(3,5),(5,3),(2,6),(6,2),共18种情形;其中x y =的情形(1,1),(2,2),(3,3),(4,4),(5,5),(6,6),共6种情形,所以事件B 为x y ≠的情形有12种,则所求条件事件的概率()122|183P B A ==,应选答案D 。
人教版A版高中数学选修1-2课后习题解答

人教版A版高中数学选修1-2课后习题解答高中数学选修1-2课后题答案第一章统计案例1.1 回归分析的基本思想及其初步应用回归分析是一种统计分析方法,用于探究自变量与因变量之间的关系。
它的基本思想是通过建立数学模型,利用已知数据进行拟合,从而预测或解释未知数据。
回归分析的初步应用包括简单线性回归和多元线性回归。
1.2 独立性检验的基本思想及其初步应用独立性检验是一种用于检验两个变量之间是否存在关联的方法。
其基本思想是通过观察两个变量之间的频数或频率分布,来判断它们是否相互独立。
独立性检验的初步应用包括卡方检验和Fisher精确检验。
第二章推理证明2.1 合情推理与演绎推理合情推理是指根据已知事实和常识,推断出可能的结论。
演绎推理是指根据已知的前提和逻辑规则,推导出必然的结论。
两种推理方法都有其适用的场合,需要根据具体情况进行选择。
2.2 直接证明与间接证明直接证明是指通过逻辑推理,直接证明所要证明的命题成立。
间接证明是指采用反证法或归谬法,证明所要证明的命题的否定不成立,从而推出所要证明的命题成立。
第三章数系的扩充与复数的引入3.1 数系的扩充与复数的概念数系的扩充是指在实数系的基础上引入新的数,使得一些原来不可解的方程可以得到解。
复数是指由实部和虚部组成的数,可以表示在平面直角坐标系中的点。
复数的引入扩充了数系,使得一些原本无解的方程可以得到解。
3.2 复数的代数形式的四则运算复数的代数形式是指将复数表示为实部和虚部的和的形式。
复数的四则运算包括加减乘除四种运算,可以通过对实部和虚部分别进行运算来得到结果。
第四章框图4.1 流程图流程图是一种用图形表示算法或过程的方法。
它由各种基本符号和连线构成,用于描述算法或过程的各个步骤及其执行顺序。
流程图可以帮助人们更好地理解算法或过程,从而提高效率。
4.2 结构图结构图是一种用于描述程序结构的图形表示方法。
它包括顺序结构、选择结构和循环结构三种基本结构,可以用来表示程序的控制流程。
高中数学选修1-2(人教A版)第一章统计案例1.2知识点总结含同步练习及答案

为研究不同的给药方式(口服或注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,调查结果 如表所示.根据所选择的
193
个病人的数据,能否作出药的效果与给药方式有关的结论? 有效 口服 注射 合计
58 64 122
无效
40 31 71
合计
98 95 193
解:提出假设
H 0 :药的效果与给药方式没有关系.
) 的前提下,认为"爱好该项运动与性别有关" 的前提下,认为"爱好该项运动与性别无关"
以上的把握认为"爱好该项运动与性别有关" 以上的把握认为"爱好该项运动与性别无关"
0.01 = 1% 1%
的机会错误,即有
99%
以上的把握认为“爱好这项运动与性别有
关”.同时,在犯错误的概率不超过
的前提下,认为“爱好该项运动与性别有关”.
答案: C 解析: 由题意
K 2 = 7.8 > 6.635 ,有 0.01 = 1% 的机会错误,即有 99% 以上的把握认为“爱好这项运 动与性别有关”.同时,在犯错误的概率不超过 1% 的前提下,认为“爱好该项运动与性别有关”;
高考不提分,赔付1万元,关注快乐学了解详情。
≈ 7.8
附表:
P (K 2 ⩾ k) k 0.050 3.841 0.010 6.635 0.001 10.828
参照附表,得到的正确结论是( A.在犯错误的概率不超过 B.在犯错误的概率不超过 C.有 D.有 解:C 由题意
K 2 = 7.8 > 6.635 ,有 99% 99% 0.1% 0.1%
答案: A
B.①③
C.②③
D.①②③
3. 分类变量 X 和 Y 的列联表如下:
则下列说法中正确的是 (
高中数学人教A版选修1-2 第一章 统计案例章末复习学案

第一章统计案例复习教案一、本章知识脉络:二、本章要点追踪: 1.样本点的中心(x -,y -) 其中x -=1nn ∑i =1x i ,y -= n ∑i =1 y i .2.线性回归模型的完美表达式 ⎩⎨⎧y =bx +a +e E (e )=0,D (e )=σ23.类比样本方差估计总体方差的思想,可以用 σ2∧=1n -2 n∑i =1e 2∧i =1n -2Q (a ∧,b ∧)(n >2)作为σ2的估计量 其中a ∧=y --b ∧x -b ∧= n∑i =1(x i -x -)(y i -y -) n∑i =1(x i -x -)24.我们可以用相关指数R 2来刻画回归的效果,其计算公式是: R 2=1- n∑i =1(y i -y i ∧)2 n∑i =1(y i -y i -)2R 2取值越大,意味着残差平方和越小,也就是说模型的拟合效果越好.5.建立回归模型的基本步骤:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等);(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程y =bx +x );(4)按一定规则估计回归方程中的参数(如最小二乘法);(5)得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差呈现不随机的规律性等等),若存在异常,则检查数据是否有误,或模型是否合适等。
6.作K 2来确定结论“X 与 Y 有关系”的可信程度. 三、几个典型例题:例1 某地区10名健康儿童头发和全血中的硒含量(1000ppm )如下,(1)画出散点图; (2)求回归方程;(3)如果某名健康儿童的血硒含量为94(1000ppm )预测他的发硒含量.例2 某地大气中氰化物测定结果如下:(1)试建立氰化物浓度与距离之间的回归方程.(2)求相关指数.(3)作出残差图,并求残差平方和例3某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机制取了189名员工进行调查,所得数据如下表所示:对于人力资源部的研究项目,根据上述数据能得出什么结论?例4有人统计了同一个省的6个城市某一年的人均国内生产总值(即人均GDP)和这一年各城市患白血病的儿童数量,如下表:(1)画出散点图;(2)求y对x的回归直线方程;(3)如果这个省的某一城市同时期年人均GDP为12万元,估计这个城市一年患白血病的儿童数目;例5寒假中,某同学为组织一次爱心捐款,于2008年2月1日在网上给网友发了张帖子,并号召网友转发,下表是发帖后一段时间的收到帖子的人数统计:(1)作出散点图,并猜测x 与y 之间的关系; (2)建立x 与y 的关系,预报回归模型并计算残差;(3)如果此人打算在2008年2月12日(即帖子传播时间共10天)进行募捐活动,根据上述回归模型,估计可去多少人.例6 有人发现了一个有趣的现象,中国人的邮箱名称里含有数字的比较多,而外国人邮箱名称里含有数字的比较少.为了研究国籍和邮箱名称里是否含有数字的关系,他收集了124个邮箱名称,其中中国人的70个,外国人的54个,中国人的邮箱中有43个含数字,外国人的邮箱中有27个含数字.(1)根据以上数据建立一个2×2的列联表;(2)他发现在这组数据中,外国人邮箱名称里含数字的也不少,他不能断定国籍和邮箱名称里含有数字是否有关,你能帮他判断一下吗?例7 针对时下的“韩剧热”,某校团委对“学生性别和是否喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的21,男生喜欢韩剧的人数占男生人数的61,女生喜欢韩剧人数占女生人数的32. (1)若有0095的把握认为是否喜欢韩剧和性别有关,则男生至少有多少人; (2)若没有充分的证据显示是否喜欢韩剧和性别有关,则男生至多有多少人.。
高中数学人教A版选修1-2习题:第一章统计案例1.2

D.180
3 某人研究中学生的性别与成绩、视力、智商、阅读量这 4 个变量的关系,随机抽查了 52 名中学生,得到统计数据如表 1 至表 4, 则与性别有关联的可能性最大的变量是 ( )
表1
成
绩
不及 及 总
格 格计
性别
男
6
女
10
总 计 16
14 20 22 32 36 52
表2
力 性别
视
好
差
总 计
1.2 独立性检验的基本思想及其初步应用 课时过关·能力提升
基础巩固
1 在独立性检验中,可以粗略地判断两个分类变量是否有关的是( )
A.散点图
B.等高条形图
C.假设检验的思想 D.以上都不对
解析等高条形图可以粗略地判断两个分类变量是否有关,但无法精确地给出结论的可靠程度.故选 B.
答案 B
2 判断两个分类变量是彼此相关还是相互独立的常用的方法中,最为精确的是( )
2 在一次独立性检验中得到如下列联表:
A
总计
B 200 800 1 000
180 a 180+a
总 计
380
800+a
1 180+a
且最后发现,两个分类变量 A 和 B 没有关系,则 a 的可能值是( )
A.200
B.720
C.100
解析|ad-bc|越小,A 和 B 有关的可能性越小,故选 B.
答案 B
附:K2
P(K2≥k0) 0.500 0.400 0.100 0.010 0.001
k0
0.455 0.708 2.706 6.635 10.828
解由题意得 2×2 列联表:
(压轴题)高中数学选修1-2第一章《统计案例》测试(答案解析)

一、选择题1.某校高二(1)班甲、乙两同学进行投篮比赛,他们进球的概率分别是34和45,现甲、乙各投篮一次,恰有一人进球的概率是( ) A .120B .320C .15D .7202.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的12,男生追星的人数占男生人数的16,女生追星的人数占女生人数的23.若有95%的把握认为是否追星和性别有关,则男生至少有( ) 参考数据及公式如下:2()=()()()()n ad bc K a b c d a c b d -++++A .12B .11C .10D .183.变量X 与Y 相对应的一组数据为(10 , 1),(11.3 , 2),(11.8 , 3),(12.5 , 4),(13 , 5);变量U 与V 相对应的一组数据为(10 , 5),(11.3 , 4),(11.8 , 3),(12.5 , 2),(13 , 1).1r 表示变量Y X 之间的线性相关系数,2r 表示变量V 与U 之间的线性相关系数,则( )A .120r r <<B .210r r <<C .210r r <<D .21r r =4.从1,2,3,4,5中不放回地依次选取2个数,记事件A =“第一次取到的是奇数”,事件B =“第二次取到的是奇数”,则(|)P B A =( ) A .12B .25C .310D .155.甲、乙两名同学参加2018年高考,根据高三年级一年来的各种大、中、小型数学模拟考试总结出来的数据显示,甲、乙两人能考140分以上的概率分别为12和45,甲、乙两人是否考140分以上相互独立,则预估这两个人在2018年高考中恰有一人数学考140 分以上的概率为( ) A .12B .23C .34D .136.甲罐中有5个红球,2个白球和3个黑球,乙罐中有6个红球,2个白球和2个黑球,先从甲罐中随机取出一个球放入乙罐,分别以1A ,2A ,3A 表示由甲罐取出的球是红球、白球和黑球的事件,再从乙罐中随机取出一个球,以B 表示由乙罐取出的球是红球的事件,下列结论中不正确...的是( ) A .事件B 与事件1A 不相互独立 B .1A 、2A 、3A 是两两互斥的事件 C .17(|)11P B A =D .3()5P B =7.2018年元旦期间,某高速公路收费站的三个高速收费口每天通过的小汽车数X (单位:辆)均服从正态分布()2600,Nσ,若()5007000.6P X <<=,假设三个收费口均能正常工作,则这个收费口每天至少有一个超过700辆的概率为( ) A .1125B .12125C .61125D .641258.根据如下样本数据:得到回归方程 1.412.ˆ4yx =-+,则 A .5a =B .变量x 与y 线性正相关C .当x =11时,可以确定y =3D .变量x 与y 之间是函数关系9.若y 关于x 的线性回归方程0.70.35y x =+是由表中提供的数据求出,那么表中m 的值为( )A .3.5B .3C .2.5D .210.下列关于统计学的说法中,错误的是( ) A .回归直线一定过样本中心点(),x y B .残差带越窄,说明选用的模型拟合效果越好C .在线性回归模型中,相关指数2R 的值趋近于1,表明模型拟合效果越好D .从独立性检验:有99%的把握认为吸烟与患肺病有关系时,可解释为100人吸烟,其中就有99人可能患有肺病11.学生会为了调查学生对2018年俄罗斯世界杯的关注是否与性别有关,抽样调查100人,得到如下数据:根据表中数据,通过计算统计量并参考以下临界数据:若由此认为“学生对2018年俄罗斯世界杯的关注与性别有关”,则此结论出错的概率不超过 A .B .C .D .12.2020年2月,全国掀起了“停课不停学”的热潮,各地教师通过网络直播、微课推送等多种方式来指导学生线上学习.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男、女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程,且有99%的把握但没有99.9%的把握认为是否喜欢网络课程与性别有关,则被调查的男、女学生总数量可能为( )参考公式附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:()20P K k ≥ 0.150.10 0.05 0.025 0.010 0.0050k2.072 2.7063.841 5.024 6.635 7.879A .130B .190C .240D .250二、填空题13.甲、乙两名运动员进行乒乓球单打比赛,已知每一局甲胜的概率为23.比赛采用“五局三胜(即有一方先胜3局即获胜,比赛结束)制”,则甲3:2获胜的概率是____. 14.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,1,1,3b x y ===则1a =.正确的序号是________________.15.一盒子装有只产品,其中有只一等品,只二等品.从中取产品两次,每次任取一只,作不放回抽样.设事件为“第一次取到的是一等品”,事件为“第二次取到的是一等品”,则条件概率___.16.已知某种高炮在它控制的区域内击中敌机的概率为0.2,要使敌机一旦进入这个区域后有0.9以上的概率被击中,需要至少布置___________门高炮?(用数字作答,已知lg 20.3010=,lg30.4771=)17.已知下列说法: ①分类变量A 与B 的随机变量越大,说明“A 与B 有关系”的可信度越大;②以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则的值分别是和;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为,若,,,则.其中说法正确的为_____________.(填序号)18.甲、乙两个小组各10名学生的英语口语测试成绩的茎叶图如图所示.现从这 20名学生中随机抽取一人,将“抽出的学生为甲小组学生”记为事件A ;“抽出的学生英语口语测试成绩不低于85分”记为事件B .则P (A|B )的值是_____.19.某校为了解家长对学校食堂的满意情况,分别从高一、高二年级随机抽取了20位家长的满意度评分,其频数分布表如下: 满意度评分分组 [)50,60[)60,70[)70,80[)80,90[)90,100合计 高一 1 3 6 6 4 20 高二2655220满意度评分 评分<70分 70≤评分<90 评分≥90分 满意度等级不满意满意非常满意假设两个年级家长的评价结果相互独立,根据所给数据,以事件发生的频率作为相应事件发生的概率.现从高一、高二年级各随机抽取1名家长,记事件A :“高一家长的满意度等级高于高二家长的满意度等级”,则事件A 发生的概率为__________.20.近年来,新能源汽车技术不断推陈出新,新产品不断涌现,在汽车市场上影响力不断增大.动力蓄电池技术作为新能源汽车的核心技术,它的不断成熟也是推动新能源汽车发展的主要动力.假定现在市售的某款新能源汽车上,车载动力蓄电池充放电循环次数达到2000次的概率为85%,充放电循环次数达到2500次的概率为35%.若某用户的自用新能源汽车已经经过了2000次充电,那么他的车能够充电2500次的概率为______.三、解答题21.2020年1月24日,中国疾控中心成功分离中国首株新型冠状病毒毒种.6月19日,中国首个新冠mRNA疫苗获批启动临床试验,截至2020年10月20日,中国共计接种了约6万名受试者,为了研究年龄与疫苗的不良反应的统计关系,现从受试者中采取分层抽样抽取100名,其中大龄受试者有30人,舒张压偏高或偏低的有10人,年轻受试者有70人,舒张压正常的有60人.(1)根据已知条件完成下面的22⨯列联表,并据此资料你是否能够以99%的把握认为受试者的年龄与舒张压偏高或偏低有关?6人,从抽出的6人中任取3人,设取出的大龄受试者人数为X,求X的分布列和数学期望.运算公式:()()()()()22n ad bcKa b c d a c b d-=++++,对照表:22.华中师大附中中科教处为了研究高一学生对物理和数学的学习是否与性别有关,从高一年级抽取60名同学(男同学30名,女同学30名),给所有同学物理题和数学题各一题,让每位同学自由选择一题进行解答.选题情况如下表:(单位:人)(1)在犯错误的概率不超过1%的条件下,能否判断高一学生对物理和数学的学习与性别有关?(2)经过多次测试后发现,甲每次解答一道物理题所用的时间为58-分钟,乙每次解答一道物理题所用的时间为68-分钟,现甲、乙解同一道物理题,求甲比乙先解答完的概率;(3)现从选择做物理题的8名女生中任意选取两人,对她们的解答情况进行全程研究,记甲、乙两女生被抽到的人数为X ,求X 的分布列和数学期望. 附表及公式2()P k k ≥0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 2.0722.7063.8415.0246.6357.87910.82822()()()()()n ad bc K a b c d a c b d -=++++23.为推动更多人阅读,联合国教科文组织确定每年的4月23日为“世界读书日”.设立目的是希望居住在世界各地的人,无论你是年老还是年轻,无论你是贫穷还是富裕,都能享受阅读的乐趣,都能尊重和感谢为人类文明做出过巨大贡献的思想大师们,都能保护知识产权.为了解不同年龄段居民的主要阅读方式,某校兴趣小组在全市随机调查了200名居民,经统计这200人中通过电子阅读与纸质阅读的人数之比为3:1,将这200人按年龄分组,其中统计通过电子阅读的居民得到的频率分布直方图如图所示. (1)求a 的值及通过电子阅读的居民的平均年龄;(2)把年龄在第123,,组的居民称为青少年组,年龄在第45,组的居民称为中老年组,若选出的200人中通过纸质阅读的中老年有30人,请完成上面22⨯列联表,则是否有97.5%的把握认为阅读方式与年龄有关?()()()()()22n ad bc K a b a d b c c d -=++++24.某厂生产不同规格的一种产品,根据检测标准,其合格产品的质量()g y 与尺寸(mm)x 之间近似满足关系式b y c x =⋅(b ,c 为大于0的常数).按照某指标测定,当产品质量与尺寸的比在区间(0.302,0.388)内时为优等品.现随机抽取6件合格产品,测得数据如下:(1)现从抽取的6件合格产品中再任选2件,求选中的2件均为优等品的概率; (2)根据测得数据作了初步处理,得相关统计量的值如下表:根据所给统计量,求y 关于x 的回归方程. 附:对于样本(),(1,2,,6)i i v u i =,其回归直线u b v a =⋅+的斜率和截距的最小二乘法估计公式分别为:()()()1122211ˆnniii i i i nni ii i v v u u v u nvubv v vnv ====---==--∑∑∑∑,ˆˆa u bv=-, 2.7183e ≈. 25.在一定范围内,植物的生长受到空气、水、温度、光照和养分等因素的影响,某试验小组为了研究光照时长对某种植物增长高度的影响,在保证其他因素相同的条件下,对该植物进行不同时长的光照试验,经过试验,得到6组该植物每日的光照时间x (单位:h )和每日平均增长高度y (单位:mm )的数据.(1)该小组分别用模型①ˆˆˆybx a =+和模型②ˆˆˆmx n y e +=对以上数据进行拟合,得到回归模型,并计算出模型的残差如下表:(模型①和模型②的残差分别为1ˆe 和2ˆe ,残差ˆˆi i i ey y =-)根据上表的残差数据,应选择哪个模型来刻画该植物每日的光照时间与每日平均增长高度的关系较为合适,简要说明理由;(2)为了优化模型,将(1)中选择的模型残差绝对值最大所对应的一组数据(),x y 剔除,根据剩余的5组数据,求该模型的回归方程,并预测光照时间为11h 时,该植物的平均增长高度.(剔除数据前的参考数据:7.5x =, 5.9y =,61299.8i ii x y==∑,621355i i x ==∑,ln z y =,141z ≈.,6173.10i i i x z =≈∑,n10.7l 2.37≈, 4.03456.49e ≈.)参考公式:()()()1122211ˆn niii ii i nniii i x x y y x y nxybx x xnx ====---==--∑∑∑∑,ˆˆay bx =-. 26.2019年,中国的国内生产总值(GDP )已经达到约100万亿元人民币,位居世界第二,这其中实体经济的贡献功不可没实体经济组织一般按照市场化原则运行,某生产企业一种产品的成本由原料成本及非原料成本组成,每件产品的非原料成本y (元)与生产该产品的数量x (千件)有关,经统计得到如下数据:根据以上数据,绘制了如下的散点图.现考虑用反比例函数模型b y a x=+和指数函数模型dxy ce =分别对两个变量的关系进行拟合.为此变换如下:令1xμ=,则y a b μ=+,即y 与μ满足线性关系;令ln νμ=,则ln c dx ν=+,即ν与x 也满足线性关系.这样就可以使用最小二乘法求得非线性的回归方程.已求得用指数函数模型拟合的回归方程为96.54dx y e =,ν与x 的相关系数10.94r =-,其他参考数据如表(其中1ln i i i iy x μν==). 81iii yμ=∑ μ2μ821ii μ=∑81i i y =∑ 821ii y=∑ 0.616185.5⨯ 2e -ln96.54 ν183.4 0.340.1151.53 360 22385.561.40.1354.63.7(1)求指数函数模型和反比例函数模型中y 关于x 的回归方程;(2)试计算y 与μ的相关系数2r ,并用相关系数判断:选择反比例函数和指数函数两个模型中的哪一个拟合效果更好(计算精确到0.01)?(3)根据(2)小题的选择结果,该企业采取订单生产模式(即根据订单数量进行生产,产品全部售出).根据市场调研数据,该产品单价定为100元时得到签订订单的情况如表: 订单数(千件) 1234567891011概率1012⎛⎫ ⎪⎝⎭ 912⎛⎫⎪⎝⎭812⎛⎫⎪⎝⎭712⎛⎫ ⎪⎝⎭612⎛⎫ ⎪⎝⎭512⎛⎫ ⎪⎝⎭412⎛⎫ ⎪⎝⎭312⎛⎫ ⎪⎝⎭212⎛⎫ ⎪⎝⎭121012⎛⎫ ⎪⎝⎭已知每件产品的原料成本为10元,试估算企业的利润是多少?(精确到1千元) 参考公式:对于一组数据()11,μν,()22,μν,⋅⋅⋅,(),n n μν,其回归直线ναβμ=+的斜率和截距的最小二乘估计分别为:1221ni i i nii n n μνμνβμμ==-=-∑∑,ανβμ=-,相关系数ni in r μνμν-=∑【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】利用相互独立事件的概率乘法公式求得 甲投进而乙没有投进的概率,以及乙投进而甲没有投进的概率,相加即得所求. 【详解】甲投进而乙没有投进的概率为343(1)4520⨯-=,乙投进而甲没有投进的概率为341(1)455-⨯=,故甲、乙各投篮一次,恰有一人投进球的概率是 31720520+=,故选:D 【点睛】本题主要考查了相互独立事件的概率乘法公式的应用,体现了分类讨论的数学思想,属于中档题.2.A解析:A 【分析】设男生人数为x ,依题意可得列联表;根据表格中的数据,代入求观测值的公式,求出观测值同临界值进行比较,列不等式即可得出结论. 【详解】设男生人数为x ,依题意可得列联表如下:则2 3.841K >,由222235236183 3.841822x x x K x x x x x ⎛⎫- ⎪⎝⎭==>⋅⋅⋅,解得10.24x >, ,26x x为整数, ∴若在犯错误的概率不超过95%的前提下认为是否喜欢追星和性别有关,则男生至少有12人,故选A. 【点睛】本题主要考查独立性检验知识,考查学生的计算能力,考查学生分析解决问题的能力,属于中档题. 独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.3.C解析:C 【分析】求出1r ,2r ,进行比较即可得到结果 【详解】变量X 与Y 相对应的一组数据为()()()()()10111.3211.8312.54135,,,,,,,,,()1011.311.812.513511.72X ∴=++++÷= ()1234553Y =++++÷=即17.20.375519.172r ==变量U 与V 相对应的一组数据为()()()()()10511.3411.8312.52131,,,,,,,,,1234535U ++++==∴这一组数据的相关系数20.3755r =-则第一组数据的相关系数大于0,第二组数据的相关系数小于0 则210r r << 故选C 【点睛】本题主要考查的是变量的相关性,属于基础题.4.A解析:A 【解析】分析:利用条件概率公式求(|)P B A .详解:由条件概率得(|)P B A =2311341.2A C C =故答案为A.点睛:(1)本题主要考查条件概率的求法,意在考查学生对该知识的掌握水平.(2) 条件概率的公式:()(|)()P AB P B A P A ==()()n AB n A . 5.A解析:A 【解析】分析:根据互斥事件概率加法公式以及独立事件概率乘积公式求概率.详解:因为这两个人在2018年高考中恰有一人数学考140 分以上的概率为甲考140 分以上乙未考到140 分以上事件概率与乙考140 分以上甲未考到140 分以上事件概率的和,而 甲考140 分以上乙未考到140 分以上事件概率为14(1)25⨯-,乙考140 分以上甲未考到140 分以上事件概率为14(1)25-⨯,因此,所求概率为14(1)25⨯-1451(1)25102+-⨯==, 选A.点睛:本题考查互斥事件概率加法公式以及独立事件概率乘积公式,考查基本求解能力.6.D解析:D 【解析】分析:由题意1A ,2A ,3A 是两两互斥事件,条件概率公式求出1(|)P B A ,()()()()123P B P A B P A B P A B =++,对照选项即可求出答案.详解:由题意1A ,2A ,3A 是两两互斥事件,()()()12351213,,10210510P A P A P A =====,()()()111177211|1112P BA P B A P A ⨯===,()23|11P B A =,()33|11P B A =,而()()()()123P B P A B P A B P A B =++()()()()()()112233|||P A P B A P A P B A P A P B A =++1713332115111011=⨯+⨯+⨯ 511=. 所以D 不正确. 故选:D.点睛:本题考查相互独立事件,解题的关键是理解题设中的各个事件,且熟练掌握相互独立事件的概率简洁公式,条件概率的求法,本题较复杂,正确理解事件的内蕴是解题的关键.7.C解析:C 【解析】分析:根据正态曲线的对称性求解即可.详解:根据正态曲线的对称性,每个收费口超过700辆的概率()()()111700150070010.60.2225P X P X ⎡⎤≥=-<<=⨯-==⎣⎦, ∴这三个收费口每天至少有一个超过700辆的概率3161115125P ⎛⎫=--= ⎪⎝⎭,故选C. 点睛:本题主要考查正态分布的性质与实际应用,属于中档题.有关正态分布的应用题考查知识点较为清晰,只要掌握以下两点,问题就能迎刃而解:(1)仔细阅读,将实际问题与正态分布“挂起钩来”;(2)熟练掌握正态分布的性质,特别是状态曲线的对称性以及各个区间概率之间的关系.8.A解析:A 【解析】 由题意可得:357964x +++==,6321144a ay ++++==, 回归方程过样本中心点,则:11 1.4612.44a+=-⨯+, 求解关于实数a 的方程可得:5a =,由 1.40ˆb=-<可知变量x 与y 线性负相关;当x =11时,无法确定y 的值;变量x 与y 之间是相关关系,不是函数关系. 本题选择A 选项.点睛:一是回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.二是根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.9.C解析:C 【解析】由表可得样本中心点的坐标为11.54.5,4m +⎛⎫⎪⎝⎭,根据线性回归方程的性质可得11.50.7 4.50.354m+⨯+=,解出 2.5m =,故选C. 10.D解析:D 【解析】回归直线一定过样本中心点,A 对.残差带越窄,误差越小,说明选用的模型拟合效果越好,B 对.线性回归模型中,相关指数2R 的值趋近于1,误差越小,表明模型拟合效果越好,C 对.D 中只是有极大可能性认为吸烟与患肺病有关,并不是说吸烟一定得肺病.D 错,选D.11.A解析:A 【解析】 由题意可得,所以, 由此认为“学生对2018年俄罗斯世界杯的关注与性别有关”,则此结论出错的概率不超过,故选A.【方法点睛】本题主要考查独立性检验的应用,属于难题.独立性检验的一般步骤:(1)根据样本数据制成列联表;(2)根据公式计算的值;(3) 查表比较与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)12.B解析:B 【分析】设男、女生的人数都为5x ,列出22⨯列联表,计算2K 的值,查表解不等式即可. 【详解】依题意,设男、女生的人数各为5x ,建立22⨯列联表如下所示:故222831010553721x x xx K x x x x =⋅⋅⋅⋅-=,由题可知106.63510.82821x <<, ∴139.33510227.388x <<,只有B 符合题意. 故选:B. 【点睛】本题主要考查独立性检验,关键点是建立22⨯列联表代入公式计算,考查数学运算、数学建模的核心素养.二、填空题13.;【分析】利用相互独立事件同时发生的概率计算求解甲获胜则比赛打了5局且最后一局甲胜利【详解】由题意知前四局甲乙每人分别胜2局则甲获胜的概率是:【点睛】本题考查相互独立事件同时发生的概率属于基础题解析:1681; 【分析】利用相互独立事件同时发生的概率计算求解,甲3:2获胜,则比赛打了5局,且最后一局甲胜利. 【详解】由题意知,前四局甲、乙每人分别胜2局,则甲3:2获胜的概率是:222421216()()33381P C =⋅⋅=.【点睛】本题考查相互独立事件同时发生的概率,属于基础题.14.①②【解析】①分类变量与的随机变量越大说明与有关系的可信度越大正确;②所以两边取对数可得令可得即②正确;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为中则③错故答案为①②解析:①② 【解析】①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大,正确; ②kx y ce =,所以两边取对数,可得()ln ln ln ln ln kx kxy ce c e c kx ==+=+,令ln z y =,可得4ln ,0.34,ln 4,0.3,z c kx z x c k c e =+=+∴==∴=,即②正确;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+ 中,1,1,3b x === ,则2a =,③错,故答案为①②.15.【解析】试题分析:表示在第一次取出的是一等品的情况下第二次取出的是一等品的概率第一取出一等品的概率为然后还有个一等品和个二等品所以第二次取出的是一等品的概率为则条件概率为考点:条件概率【易错点睛】本 解析:【解析】 试题分析:表示在第一次取出的是一等品的情况下,第二次取出的是一等品的概率.第一取出一等品的概率为,然后还有个一等品和个二等品,所以第二次取出的是一等品的概率为,则条件概率为.考点:条件概率.【易错点睛】本题主要考查的是条件概率的计算,要熟记相关概念即计算公式.条件概率为事件发生的前提下在发生事件的概率,用公式可表示为,容易与且事件的概率计算混淆,且事件概率为事件的概率与事件的概率直接相乘.16.【分析】设需要至少布置门高炮则由此能求出结果【详解】解:设需要至少布置门高炮某种高炮在它控制的区域内击中敌机的概率为02要使敌机一旦进入这个区域后有09以上的概率被击中解得需要至少布置11门高炮故答 解析:11【分析】设需要至少布置n 门高炮,则1(10.2)0.9n -->,由此能求出结果. 【详解】解:设需要至少布置n 门高炮,某种高炮在它控制的区域内击中敌机的概率为0.2, 要使敌机一旦进入这个区域后有0.9以上的概率被击中,1(10.2)0.9n ∴-->, 解得10.3n >,n N ∈,∴需要至少布置11门高炮.故答案为:11. 【点睛】本题考查概率的求法,考查n 次独立重复试验中事件A 恰好发生k 次的概率计算公式等基础知识,考查运算求解能力,考查函数与方程思想,属于中档题.17.①②③【解析】①正确因为k2越大说明A和B有关系的把握性就越大;②正确因为y=cekx那么lny=lncekx=kx+lnc即z=kx+lnc=03x+4解得k=03lnc=4解得:k=03c=e4解析:①②③【解析】①正确,因为越大,说明“和有关系”的把握性就越大;②正确,因为,那么,即,解得,解得:所以正确;③在回归直线上,所以,解得:,所以正确,那么正确的有①②③.【点睛】本题是以命题形式考查了回归方程和独立性检验的相关知识,样本中心点必在回归直线上,独立性检验中越大,说明犯错误的概率越小,即认为两个变量有关的把握性就越大.18.【解析】试题分析:抽出的学生英语口语测试成绩不低于85分的有9种其中抽出的学生为甲小组学生的事件有5种所以概率为考点:条件概率解析:【解析】试题分析:抽出的学生英语口语测试成绩不低于85分的有9种,其中抽出的学生为甲小组学生”的事件有5种,所以概率为5 9 .考点:条件概率.19.42【分析】高一家长的满意度等级高于高二家长的满意度等级有三种情况分别求出三种情况的概率再利用加法公式即可【详解】由已知高一家长满意等级为不满意的概率为满意的概率为非常满意的概率为高二家长满意等级为解析:42【分析】高一家长的满意度等级高于高二家长的满意度等级有三种情况,分别求出三种情况的概率,再利用加法公式即可.【详解】由已知,高一家长满意等级为不满意的概率为15,满意的概率为35,非常满意的概率为15,高二家长满意等级为不满意的概率为25,满意的概率为12,非常满意的概率为110,高一家长的满意度等级高于高二家长的满意度等级有三种情况:1.高一家长满意,高二家长不满意,其概率为35⨯26525=;2.高一家长非常满意,高二家长不满意,其概率为15⨯22525=;3.高一家长非常满意,高二家长满意,其概率为15⨯11210=.由加法公式,知事件A发生的概率为621210.42 25251050++==.故答案为:0.42【点睛】本题考查独立事件的概率,涉及到概率的加法公式,是一道中档题.20.【分析】记某用户的自用新能源汽车已经经过了2000次充电为事件A他的车能够充电2500次为事件B即求条件概率:由条件概率公式即得解【详解】记某用户的自用新能源汽车已经经过了2000次充电为事件A他的解析:7 17【分析】记“某用户的自用新能源汽车已经经过了2000次充电”为事件A,“他的车能够充电2500次”为事件B,即求条件概率:(|)P B A,由条件概率公式即得解.【详解】记“某用户的自用新能源汽车已经经过了2000次充电”为事件A,“他的车能够充电2500次”为事件B,即求条件概率:()35%7 (|)()85%17P A BP B AP A===故答案为:7 17【点睛】本题考查了条件概率的应用,考查了学生概念理解,数学应用,数学运算的能力,属于基础题.三、解答题21.(1)没有99%的把握认为受试者的年龄与舒张压偏高或偏低有关;(2)分布列见解析,()3 2E X=【分析】(1)根据题意列出列联表,再计算2 4.762 6.635K≈<,故没有99%的把握认为受试者的年龄与舒张压偏高或偏低有关;(2)由分层抽样得抽得样本的大龄受试者有3人,年轻受试者有3人,X的可能取值为0,1,2,3,再结合超几何分布求概率和期望即可.【详解】解:()122⨯列联表如下:210010601020 4.762 6.63530702080K ⨯⨯-⨯∴=≈<⨯⨯⨯所以,没有99%的把握认为受试者的年龄与舒张压偏高或偏低有关.(2)由题意得,采用分层抽样抽取的6人中,大龄受试者有3人,年轻受试者有3人, 所以大龄受试者人数为X 的可能取值为0,1,2,3,所以()33361020C P X C ===,()2133369120C C P X C ===, ()1233369220C C P X C ===,()33361320C P X C ===,所以X 的分布列为:所以()0123202020202E X =⨯+⨯+⨯+⨯=. 【点睛】本题第二问解题的关键在于根据题意得抽取的6人中,大龄受试者有3人,年轻受试者有3人,进而根据超几何分布求概率分布列与数学期望,考查运算求解能力,是中档题.22.(1) 在犯错误的概率不超过1%的前提下,不能判断高一学生对物理题和数学题的学习与性别有关.(2) 2()3P A =.(3)分布列见解析,1()2E X =.【分析】(1)先根据卡方公式求2K 值,并与参考数据比较作判断,(2)为几何概型概率,测度为面积,先确定甲、乙解答第一道物理题的时间所构造的矩形面积,再求甲比乙先解答完此题所确定的直角梯形面积,最后根据面积比得概率,(3)先确定随机变量取法,再分别根据组合数求对应概率,列表可得分布列,最后根据数学期望公式求期望.。
高二数学第一章统计案例章末检测新人教A版选修1-2

m 106 115 124 103
则哪位同学的试验结果体现 A, B 两变量有更强的线性相关性 ( D)
A.甲 B.乙 C.丙 D.丁
解析: 如题中表可知:丁的相关系数 r 最大, 而残差平方和 m最小,∴丁同学的实验结
果体现 A,B 两变量有更强的线性相关性,故选 D.
10.为考察数学成绩与物理成绩的关系,在高二随机抽取了
8.下表是降耗技术改造后生产甲产品过程中记录的产品
x( 吨 ) 与相应的生产能耗 y( 吨标准
煤) 的几组对数数据,根据表中提供的数据,求出
y 关于 x 的线性回归方程 y^= 0.7x + 0.35 ,
那么表中 m的值为 ( D)
x3
45 6
y 2.5 m 4 4.5
A.4.5 B. 4 C. 3.5 D. 3
300 名学生,得到下面列联表:
数学 物理
85~ 100 分 85 分以下 合计
85~ 100 分
37
85
122
85 分以下
35
143
178
合计
72
228
300
现判断数学成绩与物理成绩有关系,则判断的出错率为
( D)
A. 0.5% C. 1% B. 2% D. 5%
解析 :由表中数据代入公式得
K2= 300×(y^= 0.65x + a^. 根据回归方程,预测加工 70 个零件所
花费的时间为 ________分钟.
解析: 由数据可得 -x = 30,-y = 76,将中心点 (30 , 76) 代入线性回归方程可得 a^= 76-
0.65 ×30= 56.5 ,所以线性回归方程为
D.模型 4 的相关指数 R2 为 0.25
人教A版高中数学选修1-2《第一章统计案例》章末复习课课件

学习目标
1.会求线性回归方程,并用回归直线进行预报. 2.理解独立性检验的基本思想及实施步骤.
内容索引
知识梳理 题型探究 当堂训练
知识梳理
1.最小二乘法 对于一组数据(xi,yi),i=1,2,…,n,如果它们线性相关,则线性回归方
n
n
xi- x yi- y xiyi-n x y
^^ ^
(2)请根据上表提供的数据,求出 y 关于 x 的线性回归方程y=bx+a;
0+1+2+3+4
解 因为 x =
5
=2,
5+7+8+11+19
y=
5
=10,
0×5+1×7+2×8+3×11+4×19=132,
02+12+22+32+42=30,
^ 132-5×2×10
^
^
所以b= 30-5×22 =3.2,a= y -b x =3.6.
解答
反思与感悟
独立性检验问题的求解策略 (1)等高条形图法:依据题目信息画出等高条形图,依据频率差异来粗略 地判断两个变量的相关性. (2)K2统计量法:通过公式
nad-bc2 k=a+bc+da+cb+d
先计算观测值k,再与临界值表作比较,最后得出结论.
跟踪训练2 某学生对其亲属30人的饮食习惯进行了一次调查,并用茎叶 图表示30人的饮食指数,如图所示.(说明:图中饮食指数低于70的人,饮 食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主). (1)根据茎叶图,帮助这位同学说明其亲 属30人的饮食习惯; 解 30位亲属中50岁以上的人多以食蔬 菜为主,50岁以下的人多以食肉类为主.
男生 女生 合计
喜爱打篮球 10
不喜爱打篮球 6
合计 48
高中数学选修1-2第一章统计案例测试题带详细解答(可编辑修改word版)

1
A、增加3个单位B、增加个单位C、减少3个单位D、减少个单位
3
【答案】C
【解析】
解释变量即回归方程里的自变量xˆ,由回归方程知预报变量yˆ减少 3 个单位
4.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U
与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),r1表示变量Y与X之
选修 1-2 第一章、统计案例测试
一、选择题
1.已知x与y之间的一组数据:
x
0
1
2
3
y
1
3
5
7
则y与x的线性回归方程为ybxa必过点() A.(2,2)B. (1.5 ,4)C.(1.5 ,0)D.(1,2)
【答案】B
【解析】
试题分析:由数据可知x1.5,y4,∴线性回归方程
4
为yb xa必过点(1.5,4)
5 =11.72
. Y =(1+2+3+4+5)
5 =3
∴这组数据的相关系数是r=7.2
19.172 =0.3755,
变量U与V相对应的一组数据为(10,5),(11.3,4),
(11.8,3),(12.5,2),(13,1)
. U =(5+4+3+2+1)
5 =3,
∴这组数据的相关系数是-0.3755,
【解析】
试题分析:由题意,年劳动生产率x(千元)和工人工资y(元)之间回归方程为
y1070x,
故当x增加 1 时,y要增加 70 元,
∴劳动生产率每提高1千元时,工资平均提高70元,故A正确.
【K12小初高学习】新版高中数学人教A版选修1-2习题:第一章 统计案例 1.1

1.1回归分析的基本思想及其初步应用课时过关·能力提升基础巩固1关于线性相关的两个变量y与x之间的回归直线方程叙述正确的是()A.表示y与x之间的一种确定性关系B.表示y与x之间的函数关系C.表示y与x之间的最真实的关系D.表示y与x之间真实关系的一种效果最好的拟合2四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y与x负相关,②y与x负相关,③y与x正相关,④y与x正相关,其中一定不正确的结论的序号是()A.①②B.②③C.③④D.①④y随x的增大而增大,负相关指的是y随x的增大而减小,故一定不正确的为①④,应选D.3已知变量x,y的取值如下表所示:若y与x线性相关,且线性回归方程A.1 B,,得7=4甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得R2与残差平方和m如下表:则试验结果体现A,B两变量有更强的线性相关性的同学是()A.甲B.乙C.丙D.丁5根据如下样本数据得到的回归方程ABCD,可判6为了考察两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做了100次和150次试验,并且利用线性回归方法,求得回归直线分别为l1和l2.已知两个人在试验中发现变量x的观测数据的平均值都是s,变量y的观测数据的平均值都是t,则下列说法正确的是()A.l1和l2有交点(s,t)B.l1与l2相交,但交点不一定是(s,t)C.l1与l2必定平行D.l1与l2必定重合(s,t)是甲、乙两位同学所做试验的样本点的中心,而线性回归直线恒过样本点的中心,故选A.7已知线性回归方x=11代.958下表是某厂1~4月份用水量(单位:百吨)的一组数据,已知用水量y与月份x之间有较好的线性相关关系,其线性回归方程.259在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数型曲线y=e bx+a 的周围,令z=ln y ,求得回归直线方程z=lny得ln故该模型的回归方程10为研究某灌溉渠道水的流速y (单位:m/s)与水深x (单位:m)之间的关系,测得8组数据如下:(1)如果y 与x 之间具有线性相关关系,求出线性回归方程; (2)预测水深为1.95 m 时水的流速.(精确到0.01),计算回归系采用列表方法计续表于5,≈0.733 3,≈1.977 5-0.733 3×1.75≈0.694 2.故y与x之间的线性回归方程(2)将x=1.95代入所求的线性回归方程,≈2.12.计算结果表明当水深为1.95 m时,可以预测水的流速为2.12 m/s.能力提升1已知变量x与y正相关,且由观测数据算得样本平均ACx与y正相关,可知x的系数为正,排除C,D.而所有的回归直线必经过B,故选A.2设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程A.y与x具有正的线性相关关系B.回归直线过样本点的中心C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg选项中,若该大学某女生身高为170 cm,则可断定其体重约为0.85×170-85.71=58.79(kg).故D 项不正确.3已知x与y之间的几组数据如下表:假设根据上表数据所得线性回归直线方程AC★4某市物价部门对本市的5家商场某商品一天的销售量及其价格进行调查,5家商场该商品的价格x元和销售量y件之间的一组数据如下表所示:已知销售量y与价格x之间有较强的线性相关关系,其线性回归直线方程知,又m+n=20,解得m=10,n=10.5关于x与y有如下数据:为了对x,y两个变量进行统计分析,现有以下两种线性模型:甲,对于乙模型因6有一位同学家里开了一个小卖部,他为了研究气温对热茶销售杯数的影响,经过统计,得到一个卖出热茶杯数与当天气温的对比表:(1)求热茶销售杯数与气温的线性回归方程; (2)预测当气温为-10 ℃时热茶的销售杯数.,利用散点图直观分析热茶销售杯数y 与气温x 具有线性相关关系,利用线性回归方程中参数的计算公式可得线性回归方程. 所给数据的散点图如图所示.由图可看出,这些点在一条直线附近,可以用线性回归方程来刻画y 与x 之间的关系.因由公式计算≈-2.352≈147.772,所以y 对x 的线性回归方程(2)当气温为-10 ℃时,由回归方程可以预测热茶的销售杯数≈171.★7假设关于某设备的使用年限x(单位:年)和所支出的维修费用y(单位:万元)的有关统计资料如下表所示:若由资料知y与x呈线性相关关系.(1)求线性回归方(2)求R2;(3)估计当使用年限为10年时,维修费用是多少?由已知数据制成下表:由此可(2)R2=1≈0.958 7.(3)回归直线方程。
高中数学人教A版选修1-2同步练习第一章 统计案例章末总结 Word版含解析

第一章统计案例章末总结新人教版选修回归方程及其应用对所抽取的样本数据进行分析,分析两个变量之间的关系——线性关系或非线性关系,并由一个变量的变化去推测另一个变量的变化,这就是对样本进行回归分析.某商场经营一批进价是元台的小商品,在市场试验中发现,此商品的销售单价(取整数)元与日销售量台之间有如下对应数据:()(方程的斜率保留一个有效数字).()设经营此商品的日销售利润为元,根据()写出关于的函数关系式,并预测当销售单价为多少元时,才能获得最大日销售利润.分析:作出散点图,根据散点图观察是否具有线性相关关系.解析:()散点图如图所示:从图中可以看出这些点大致分布在一条直线附近,因此两个变量具有线性相关关系.()设回归直线方程为=+.∵=,=,∴=错误!=-错误!≈-,错误!=错误!-错误!=-(-)×=.∴=-.()由题意,有=(-)(-)=-+- .∴当=≈时,有最大值.即预测销售单价为元时,能获得最大日销售利润.判断两个变量之间是否有线性相关关系一般有两种方法:一是计算样本相关系数;二是画散点图.两种方法要结合题目的要求合理选取,也可同时使用,则判断更加准确.►变式训练.从某居民区随机抽取个家庭,获得个家庭的月收入(单位:千元)与月储蓄(单位:千元)的数据资料,算得=.()求家庭的月储蓄对月收入的线性回归方程=+;()判断变量与之间是正相关还是负相关;()若该居民区某家庭月收入为千元,预测该家庭的月储蓄.附:线性回归方程=+中,=-(,\(-))),=-,其中,为样本平均值,线性回归方程也可写为=+.解析:()由题意知:=,===,===.又=-(,\(-))=-×=,=∑=)-=-××=,。
(压轴题)高中数学选修1-2第一章《统计案例》测试题(含答案解析)

一、选择题1.某校从6名学生干部(其中女生4人,男生2人)中选3人参加学校的汇演活动,在女生甲被选中的情况下,男生乙也被选中的概率为( ) A .12B .25C .35D .452.下列命题:①在一个22⨯列联表中,由计算得2 6.679K =,则有99%的把握确认这两类指标间有关联②若二项式22nx x ⎛⎫+ ⎪⎝⎭的展开式中所有项的系数之和为243,则展开式中4x -的系数是40 ③随机变量X 服从正态分布()1,2N ,则()()02P X P X <=> ④若正数,x y 满足230x y +-=,则2x yxy+的最小值为3 其中正确命题的序号为( ) A .①②③B .①③④C .②④D .③④3.一张储蓄卡的密码共有6位数字,每位数字都可以从09中任选一个,某人在银行自动提款机上取钱时,忘记了密码最后一位数字,如果任意按最后一位数字,不超过2次就按对的概率为( ) A .25B .310C .15D .1104.某学校10位同学组成的志愿者组织分别由李老师和张老师负责,每次献爱心活动均需该组织4位同学参加.假设李老师和张老师分别将各自活动通知的信息独立,随机地发给4位同学,且所发信息都能收到.则甲同学收到李老师或张老师所发活动通知的信息的概率为( ) A .25B .1225C .1625D .455.从1,2,3,4,5中不放回地依次选取2个数,记事件A =“第一次取到的是奇数”,事件B =“第二次取到的是奇数”,则(|)P B A =( )A .12B .25C .310 D .156.若对于变量x 的取值为3,4,5,6,7时,变量y 对应的值依次分别为4.0,2.5,-0.5,-1,-2;若对于变量u 的取值为1,2,3,4时,变量v 对应的值依次分别为2,3,4,6,则变量x 和y ,变量u 和v 的相关关系是( ) A .变量x 和y 是正相关,变量u 和v 是正相关 B .变量x 和y 是正相关,变量u 和v 是负相关 C .变量x 和y 是负相关,变量u 和v 是负相关 D .变量x 和y 是负相关,变量u 和v 是正相关7.抛掷红、黄两颗骰子,当红色骰子的点数为4或6时,两颗骰子的点数之积大于20的概率是( ) A .35B .14C .12D .138.下面是22⨯列联表:则表中a b ,的值分别为( ) A .84,60 B .42,64C .42, 74D .74, 429.某商品的售价x (元)和销售量y (件)之间的一组数据如下表所示:由散点图可知,销售量y 与价格x 之间有较好的线性相关关系,且回归直线方程是3.ˆ2yx a =-+,则实数a =( ) A .30B .35C .38D .4010.在一次独立性检验中,得出列表如下:且最后发现,两个分类变量A 和B 没有任何关系,则a 的可能值是( ) A .720B .360C .180D .9011.将两枚质地均匀的骰子各掷一次,设事件A ={两个点数互不相同},B ={出现一个5点},则()/P B A =( ) A .13B .518C .16D .1412.学生会为了调查学生对2018年俄罗斯世界杯的关注是否与性别有关,抽样调查100人,得到如下数据:根据表中数据,通过计算统计量并参考以下临界数据:若由此认为“学生对2018年俄罗斯世界杯的关注与性别有关”,则此结论出错的概率不超过 A .B .C .D .二、填空题13.已知如下四个命题:①在线性回归模型中,相关指数2R 表示解释变量x 对于预报变量y 的贡献率,2R 越接近于0,表示回归效果越好;②在回归直线方程ˆ0.812yx =-中,当解释变量x 每增加一个单位时,预报变量ˆy平均增加0.8个单位;③两个变量相关性越强,则相关系数的绝对值就越接近于1;④对分类变量X 与Y ,对它们的随机变量2K 的观测值k 来说,k 越小,则“X 与Y 有关系”的把握程度越大.其中正确命题的序号是__________.14.一盒子中装有6只产品,其中4只一等品,2只二等品,从中取产品两次,每次任取1只,做不放回抽样.则在第一次取到的是一等品的条件下,第二次取到的是二等品的概率为__________.15.以下4个命题中,正确命题的序号为_________.①“两个分类变量的独立性检验”是指利用随机变量2K 来确定是否能以给定的把握认为“两个分类变量有关系”的统计方法;②将参数方程cos sin x y θθ=⎧⎨=⎩(θ是参数,[]0,θπ∈)化为普通方程,即为221x y +=;③极坐标系中,22,3A π⎛⎫⎪⎝⎭与()3,0B 19 ④推理:“因为所有边长相等的凸多边形都是正多边形,而菱形是所有边长都相等的凸多边形,所以菱形是正多边形”,推理错误在于“大前提”错误. 16.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,1,1,3b x y ===则1a =.正确的序号是________________. 17.下列说法正确的个数有_________(1)已知变量x 和y 满足关系23y x =-+,则x 与y 正相关;(2)线性回归直线必过点(),x y ;(3)对于分类变量A 与B 的随机变量2k ,2k 越大说明“A 与B 有关系”的可信度越大 (4)在刻画回归模型的拟合效果时,残差平方和越小,相关指数2R 的值越大,说明拟合的效果越好. 18.下列说法:①线性回归方程y bx a =+必过(),x y ;②命题“21,34x x ∀≥+≥”的否定是“21,34x x ∃<+<” ③相关系数r 越小,表明两个变量相关性越弱;④在一个22⨯列联表中,由计算得28.079K =,则有99%的把握认为这两个变量间有关系;其中正确..的说法是__________.(把你认为正确的结论都写在横线上) 本题可参考独立性检验临界值表:19.在一段线路中有4个自动控制的常用开关A 、B 、C 、D ,如图连接在一起,假定在2019年9月份开关A ,D 能够闭合的概率都是0.7,开关B ,C 能够闭合的概率都是0.8,则在9月份这段线路能正常工作的概率为________.20.投到某出版社的稿件,先由两位初审专家进行评审,若能通过两位初审专家的评审,则直接予以录用,若两位初审专家都未予通过,则不予录用,若恰能通过一位初审专家的评审,则再由第三位专家进行复审,若能通过复审专家的评审,则予以录用,否则不予录用.设稿件能通过各初审专家评审的概率均为12,复审的稿件能通过评审的概率为14,各专家独立评审,则投到该出版社的1篇稿件被录用的概率为__________.三、解答题21.一个口袋中有4个红球和3个黑球.(1)从口袋中随机地连续取出三个球,取出后不放回,求: (i )三个球中有两个红球一个黑球的概率;(ii )第二次取出的是红球且第三次取出的也是红球的概率.(2)从口袋中随机地连续取出三个球,取出后放回,求至少有两个是红球且第三个是红球的概率22.某电器企业统计了近10年的年利润额y (千万元)与投入的年广告费用x (十万元)的相关数据,散点图如图,对数据作出如下处理:令ln i i u x =,ln i i v y =,得到相关数据如表所示:101i i i u v =∑101ii u=∑101i i v =∑1021ii u=∑30.5 15 1546.5(1)从①y bx a =+;②()0,0ky m xm k =⋅>>;③2y cx dx e =++三个函数中选择一个作为年广告费用x 和年利润额y 的回归类型,判断哪个类型符合,不必说明理由; (2)根据(1)中选择的回归类型,求出y 与x 的回归方程;(3)预计要使年利润额突破1亿,下一年应至少投入多少广告费用?(结果保留到万元) 参考数据:103.6788e≈,33.678849.787≈. 参考公式:回归方程ˆy a bt=+中斜率和截距的最小二乘估计公式分别为()()()121ˆniii nii tty y btt==--=-∑∑,a y bt =-.23.某小区停车场的收费标准为:每车每次停车时间不超过2小时免费,超过2小时的部分每小时收费1元(不足1小时的部分按1小时计算).现有甲乙两人独立来停车场停车(各停车一次),且两人停车时间均不超过5小时,设甲、乙两人停车时间(小时)与取车概率如表所示:(1)求甲、乙两人所付车费相同的概率;(2)设甲、乙两人所付停车费之和为随机变量ξ,求ξ的分布列和数学期望()E ξ. 24.某种疾病可分为Ⅰ、Ⅱ两种类型.为了解该疾病类型与性别的关系,在某地区随机抽取了患该疾病的病人进行调查,其中女性是男性的2倍,男性患Ⅰ型病的人数占男性病人的56,女性患Ⅰ型病的人数占女性病人的13. (1)若在犯错误的概率不超过0.005的前提下认为“所患疾病类型”与“性别”有关,求男性患者至少有多少人?(2)某药品研发公司欲安排甲乙两个研发团队来研发此疾病的治疗药物.两个团队各至多安排2个接种周期进行试验.甲团队研发的药物每次接种后产生抗体的概率为p ,每人每次接种花费()0m m >元,每个周期至多接种3次,第一个周期连续2次出现抗体则终止本接种周期进入第二个接种周期,否则需依次接种至第一周期结束,再进入第二周期;第二接种周期连续2次出现抗体则终止试验,否则需依次接种至至试验结束;乙团队研发的药物每次接种后产生抗体的概率为q ,每人每次花费()0n n >元,每个周期接种3次,每个周期必须完成3次接种,若一个周期内至少出现2次抗体,则该周期结束后终止试验,否则进入第二个接种周期.假设两个研发团队每次接种后产生抗体与否均相互独立.①若甲团队的试验平均花费大于乙团队的试验平均花费,求p 、q 、m 、n 满足的关系式;②若m n =,2p q =,从两个团队试验的平均花费考虑,该公司应选择哪个团队进行药品研发?附:()()()()()22n ad bc K a b c d a c b d -=++++,25.下表是我国大陆地区从2013年至2019年国内生产总值(GDP)近似值(单位:万亿元人民币)的数据表格:年份2013201420152016201720182019年份代号x1234567中国大陆地区GDP:y(单位:万亿元人民币)59.364.168.674.082.190.099.1以x为解释变量,y为预报变量,若以11y b x a=+为回归方程,则相关指数210.9808R≈;若以22lny a b x=+为回归方程,则相关指数220.8457R≈.(1)判断11y b x a=+与22lny a b x=+哪一个更适宜作为国内生产总值(GDP)近似值y 关于年份代号x的回归方程,并说明理由;(2)根据(1)的判断结果及表中数据,求出y关于年份代号x的回归方程(系数精确到0.01);(3)党的十九大报告中指出:从2020年到2035年,在全面建成小康社会的基础上,再奋斗15年,基本实视社会主义现代化.若到2035年底我国人口增长为14.4亿人,假设到2035年世界主要中等发达国家的人均国民生产总值的频率直方图如图所示.以(2)的结论为依据,预测我国在2035年底人均国民生产总值是否可以超过假设的2035年世界主要中等发达国家的人均国民生产总值平均数的估计值.参考数据:71537.2iiy==∑,712333.5i iix y==∑.参考公式:回归方程ˆˆˆy bx a=+中斜率和截距的最小二乘估计公式分别为:()()()1122211ˆn ni i i ii in ni ii ix x y y x y nxybx x x nx====---==--∑∑∑∑,ˆˆa y bx=-.26.某科研单位研究人员对某种细菌的繁殖情况进行了研究,发现该细菌繁殖的个数y (单位:个)随时间x(单位:天)的变化情况如表l:x1 23 4 5 6y 5 10 26 50 96 195 表1令ln w y =,w 与y 对应关系如表2:y 510 26 50 96 195w 1.61 2.30 3.26 3.91 4.56 5.27表2根据表1绘制散点图如下:(1)根据散点图判断,y bx a =+与dxy ce =,哪一个更适合作为细菌的繁殖数量y 关于时间x 的回归方程类型(给出判断即可,不必说明理由);(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程(系数精确到0.01); (3)若要使细菌的繁殖数量不超过4030个,请根据(2)的结果预测细菌繁殖的天数不超过多少天?参考公式:对于一组数据()11,u v ,()22,u v ,…,(),n n u v ,其回归直线v u αβ=+的斜率和截距的最小二乘估计分别为()()()121nii i nii uu v v uu β==--=-∑∑,v u αβ=-.参考数据: 3.50x =,63.67y =, 3.49w =,()621117.50i x x =-=∑,()62119.49i w w =-=∑,()()6112.87i i i w w x x =--=∑,()()61519.01i i i x x y y =--=∑,ln 40308.30≈,ln16407.40≈【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】先求出女生甲被选中的情况下的基本事件总数1215C C n =,再求出在女生甲被选中的情况下,男生乙也被选中包含的基本事件个数为2124C C m =,结合条件概率的计算方法,可得m P n=. 【详解】女生甲被选中的情况下,基本事件总数1215C C 10n ==,在女生甲被选中的情况下,男生乙也被选中包含的基本事件个数为2124C C 4m ==,则在女生甲被选中的情况下,男生乙也被选中的概率为42105m P n ===. 故选B. 【点睛】本题考查了条件概率的求法,考查了学生的计算求解能力,属于基础题.2.B解析:B 【解析】 【分析】根据2 6.679 6.635K =>可知①正确;代入1x =可求得5n =,利用展开式通项,可知3r =时,为含4x -的项,代入可求得系数为80,②错误;根据正态分布曲线的对称性可知③正确;由2121223x y x yxy y x y x ⎛⎫++=+=+⋅ ⎪⎝⎭,利用基本不等式求得最小值,可知④正确. 【详解】①2 6.679 6.635K =>,则有99%的把握确认这两类指标间有关联,①正确;②令1x =,则所有项的系数和为:3243n =,解得:5n = 52222n x x x x ⎛⎫⎛⎫∴+=+ ⎪ ⎪⎝⎭⎝⎭则其展开式通项为:()55355222rrrr r r Cx C x x --⎛⎫=⋅⋅ ⎪⎝⎭当534r -=-,即3r =时,可得4x -系数为:335280C ⋅=,②错误;③由正态分布()1,2N 可知其正态分布曲线对称轴为1X = ()()02P X P X ∴<=>,③正确;④212122122533x y x y x yxy y x y x y x ⎛⎫⎛⎫++=+=+⋅=++ ⎪ ⎪⎝⎭⎝⎭0x ,0y > 20x y ∴>,20yx>224x y y x ∴+≥=(当且仅当22x y y x =,即x y =时取等号) ()214533x y xy +∴≥+=,④正确. 本题正确选项:B 【点睛】本题考查命题真假性的判断,涉及到独立性检验的基本思想、二项展开式各项系数和与指定项系数的求解、正态分布曲线的应用、利用基本不等式求解和的最小值问题.3.C解析:C 【分析】利用互斥事件概率加法公式和相互独立事件概率乘法公式直接求解. 【详解】一张储蓄卡的密码共有6位数字,每位数字都可以从0~9中任选一个, 某人在银行自动提款机上取钱时,忘记了密码最后一位数字, 任意按最后一位数字,不超过2次就按对的概率为:p=19110109+⨯=15. 故选C . 【点睛】本题考查概率的求法,考查互斥事件概率加法公式和相互独立事件概率乘法公式等基础知识,考查运算求解能力,考查函数与方程思想,是基础题.4.C解析:C 【分析】甲同学收到李老师或张老师所发活动通知的信息的对立事件是甲同学既没收到李老师的信息也没收到张老师的信息,李老师的信息与张老师的信息是相互独立的,由此可计算概率. 【详解】设甲同学收到李老师的信息为事件A ,收到张老师的信息为事件B ,A 、B 相互独立,42()()105P A P B ===, 则甲同学收到李老师或张老师所发活动通知的信息的概率为33161()1(1())(1())15525P AB P A P B -=---=-⨯=.故选C . 【点睛】本题考查相互独立事件的概率,考查对立事件的概率.在求两个事件中至少有一个发生的概率时一般先求其对立事件的概率,即两个事件都不发生的概率.这样可减少计算,保证正确.5.A解析:A 【解析】分析:利用条件概率公式求(|)P B A .详解:由条件概率得(|)P B A =2311341.2A C C =故答案为A.点睛:(1)本题主要考查条件概率的求法,意在考查学生对该知识的掌握水平.(2) 条件概率的公式:()(|)()P AB P B A P A ==()()n AB n A . 6.D解析:D 【解析】变量x 增加,变量y 减少,所以变量x 和y 是负相关;变量u 增加,变量v 增加,所以变量u 和v 是正相关,因此选D.7.D解析:D 【解析】抛掷红、黄两枚骰子,第一个数字代表红色骰子,第二个数字代表黄色骰子,当红色骰子的点数为4或6时有(4,1),(4,2),(4,3),(4,4),(4,5),(4,6),(6,1),(6,2),(6,3),(6,4),(6,5),(6,6)共12种, 两颗骰子的点数之积大于20的种数有(4,6),6,4),(6,5),(6,6)4种, 根据概率公式得,两颗骰子的点数之积大于20的概率41123P ==. 本题选择D 选项.点睛:有关古典概型的概率问题,关键是正确求出基本事件总数和所求事件包含的基本事件数.(1)基本事件总数较少时,用列举法把所有基本事件一一列出时,要做到不重复、不遗漏,可借助“树状图”列举.(2)注意区分排列与组合,以及计数原理的正确使用.8.B解析:B 【解析】因2163a +=,故42a =,又22a b +=,则64b = ,应选答案B 。
人教新课标版数学高二-人A选修1-2第一章《统计案例》复习课

题型一回归分析思想的应用回归分析是对抽取的样本进行分析,确定两个变量的相关关系,并用一个变量的变化去推测另一个变量的变化.如果两个变量非线性相关,我们可以通过对变量进行变换,转化为线性相关问题.例1 一个车间为了规定工时定额,需确定加工零件所花费的时间,为此进行了10次试验,测得的数据如下表:零件数x/个102030405060708090100加工时间y/min627275818595103108112127(2)若线性相关,求线性回归方程;(3)求出相关指数; (4)作出残差图; (5)进行残差分析;(6)试制订加工200个零件的用时规定. 解 (1)散点图,如图所示.由图可知,x ,y 线性相关.(2)x 与y 的关系可以用线性回归模型来拟合,不妨设回归模型为y ^=a ^+b ^将数据代入相应公式可得数据表:序号 零件个数x i /个加工时间y i /minx i y i x 2i 1 10 62 620 100 2 20 72 1 440 400 3 30 75 2 250 900 4 40 81 3 240 1 600 5 50 85 4 250 2 500 6 60 95 5 700 3 600 7 70 103 7 210 4 900 8 80 108 8 640 6 400 9 90 112 10 080 8 100 10 100 127 12 700 10 000 ∑55092056 13038 500∵x =55y ∴=∑10i =1x i y i -10x y ∑10i =1x 2i -10x 2=56 130-10×55×9238 500-10×552=553825≈0.670, =y - x =92-553825×55=82715≈55.133,故线性回归方程为 =0.670x +55.133. (3)利用所求回归方程求出下列数据:y ^i 61.833 68.533 75.233 81.933 88.633 y i -y ^ i 0.167 3.467 -0.233 -0.933 -3.633 y i -y-30-20-17-11-7y ^ i 95.333 102.033 108.733 115.433 122.133 y i -y ^ i -0.333 0.967 -0.733 -3.433 4.867 y i -y311162035∴R 2=1-∑10i =1 (y i -y ^ i )2∑10i =1(y i -y )2≈0.983.(4)∵e ^i =y i -y ^i ,利用上表中数据作出残差图,如图所示.(5)由散点图可以看出x 与y 有很强的线性相关性,由R 2的值可以看出回归效果很好. 由残差图也可观察到,第2,5,9,10个样本点的残差比较大,需要确认在采集这些样本点的过程中是否有人为的错误.(6)将x =200代入回归方程,得y ^≈189, 所以可以制订189 min 加工200个零件的规定.反思与感悟 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤是先画出散点图,并对样本点进行相关性检验,在此基础上选择适合的函数模型去拟合样本数据,从而建立较好的回归方程,并用该方程对变量值进行分析;有时回归模型可能会有多种选择(如非线性回归模型),此时可通过残差分析或利用相关指数R 2来检验模型的拟合效果,从而得到最佳模型.跟踪训练1 在一段时间内,某种商品的价格x 元和需求量y 件之间的一组数据为:且知x 与y 解x =15×(14+16+18+20+22)=18,y =15×(12+10+7+5+3)=7.4,∑5i =1x 2i =142+162+182+202+222=1 660, ∑5i =1x i y i =14×12+16×10+18×7+20×5+22×3=620,∴b ^=∑5i =1x i y i -5x y ∑5i =1x 2i -5x 2=620-5×18×7.41 660-5×182=-4640=-1.15.∴a ^=7.4+1.15×18=28.1, ∴线性回归方程为y ^=-1.15x +28.1. 列出残差表为:∴∑5i =1(y i -y ^i )2=0.3,∑i =1(y i -y )2=53.2,R 2=1-∑5i =1(y i -y ^i )2∑5i =1 (y i -y )2≈0.994.故R 2≈0.994说明拟合效果较好.题型二 独立性检验思想的应用独立性检验的基本思想是统计中的假设检验思想,类似于数学中的反证法,要确认两个分类变量有关系这一结论成立的可信程度,首先假设该结论不成立,即假设“两个分类变量没有关系”成立,在该假设下我们构造的随机变量K 2应该很小,如果由观测数据计算得到的K 2的观测值很大,则在一定程度上说明假设不合理.例 为了比较注射A ,B 两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A ,另一组注射药物B .下表1和表2分别是注射药物A 和药物B 后的试验结果.(疱疹面积单位:mm 2) 表1:注射药物A 后皮肤疱疹面积的频数分布表疱疹面积 [60,65) [65,70) [70,75) [75,80) 频数30402010表2疱疹面积 [60,65) [65,70) [70,75) [75,80) [80,85) 频数1025203015疱疹面积与注射药物B 后的疱疹面积有差异”. 表3:疱疹面积小于 70 mm 2 疱疹面积不小于70 mm 2 合计 注射药物A a = b = 注射药物B c = d = 合计n =解 列出2×2列联表疱疹面积小于 70 mm 2 疱疹面积不小于70 mm 2 合计 注射药物A a =70 b =30 100 注射药物B c =35 d =65 100 合计10595n =200K 2=200×(70×65-35×30)2100×100×105×95≈24.56,由于K 2>10.828,所以在犯错误概率不超过0.001的前提下,认为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有差异”. 反思与感悟 解决一般的独立性检验问题的步骤:(1)通过列联表确定a ,b ,c ,d ,n 的值;根据实际问题需要的可信程度确定临界值k 0; (2)利用K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )求出K 2的观测值k ;(3)如果k ≥k 0,就推断“两个分类变量有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“两个分类变量有关系”.跟踪训练2 某电视台联合相关报社对“男女同龄退休”这一公众关注的问题进行了民意调查,数据如下表所示:根据表中数据,关系?[P (K 2≥10.828)≈0.001]解 假设“对这一问题的看法与性别无关”,由列联表中的数据,可以得到: K 2的观测值k =n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=1 000×(198×109-217×476)2415×585×674×326≈125.161>10.828, 又P (K 2≥10.828)≈0.001,故在犯错误的概率不超过0.001的前提下认为对“男女同龄退休”这一问题的看法与性别有关.[呈重点、现规律]1.建立回归模型的基本步骤:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.(2)画出散点图,观察它们之间的关系.(3)由经验确定回归方程的类型.(4)按照一定的规则估计回归方程中的参数.(5)得出结果后分析残差图是否有异常.2.独立性检验是对两个分类变量间是否存在相关关系的一种案例分析方法.常用的直观方法为等高条形图,等高条形图由于是等高的,因此它能直观地反映两个分类变量之间的差异的大小,而利用假设的思想方法,计算出某一个随机变量K 2的值来判断更精确些.。
高中数学 第一章 统计案例章末复习检测 新人教A版选修1-2(2021年最新整理)

高中数学第一章统计案例章末复习检测新人教A版选修1-2编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(高中数学第一章统计案例章末复习检测新人教A版选修1-2)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为高中数学第一章统计案例章末复习检测新人教A版选修1-2的全部内容。
第一章统计案例一、填空题1.下列语句表示的事件中的因素不具有相关关系的是________.①瑞雪兆丰年②名师出高徒③吸烟有害健康④喜鹊叫喜,乌鸦叫丧2.下列结论正确的是________.①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.3.独立性检验中,假设H0:变量X与变量Y没有关系,则在H0成立的情况下,P(χ2≥6。
635)≈0。
010表示的意义说法正确的序号为________.①变量X与变量Y有关系的概率为1%;②变量X与变量Y有关系的概率为99。
9%;③变量X与变量Y没有关系的概率为99%;④变量X与变量Y有关系的概率为99%。
4.下表是某厂1~4月份用水量(单位:百吨)的一组数据:月份x1234用水量y4。
5432。
5由散点图可知,用水量y,其线性回归方程是错误!=-0。
7x+错误!,则错误!=________。
5.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的线性回归方程的回归系数为错误!,回归截距是错误!,那么必有________.①错误!与r的符号相同;②错误!与r的符号相同;③错误!与的符号相反;④错误!与r符号相反.6.如下图所示,有5组(x,y)数据,去掉数据________后,剩下的四组数据的线性相关系数量大.7.在一组样本数据(x1,y1),(x2,y2),…,(x n,y n)(n≥2,x1,x2,…,x n不全相等)的散点图中,若所有样本点(x i,y i)(i=1,2,…,n)都在直线y=错误!x+1上,则这组样本数据的样本相关系数为________.8.在两个学习基础相当的班级实行某种教学措施的实验,测试结果见下表,则在犯错误的概率不超过0。
人教A版数学高二选修1-2单元测试第一章统计案例2

阶段质量检测(一)(时间:120分钟满分:150分)一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.有下列关系:①人的年龄与他拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其横断面直径与高度之间的关系,其中有相关关系的是() A.①②③B.①②C.②③D.①③④2.对于回归分析,下列说法中错误的是()A.在回归分析中,若变量间的关系是非确定性关系,则因变量不能由自变量唯一确定B.相关系数可以是正的也可以是负的C.回归分析中,如果R2=1,说明变量x与y之间是完全线性相关D.样本相关系数r∈(-∞,+∞)3.在一次调查后,根据所得数据绘制成如图所示的等高条形图,则()A.两个分类变量关系较弱B.两个分类变量无关系C.两个分类变量关系较强D.无法判断4.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵轴上的截距是a,那么必有()A.b与r的符号相同B.a与r的符号相同C.b与r的符号相反D.a与r的符号相反5.下表显示出样本中变量y随变量x变化的一组数据,由此判断它最可能是()x 45678910y 14181920232528A.C.指数函数模型D.对数函数模型6.下表是某厂1~4月份用水量(单位:百吨)的一组数据:月份x 1 2 3 4 用水量y4.5432.5由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归方程是y ^=-0.7x +a ^,则a ^=( )A .10.5B .5.15C .5.2D .5.257.在研究吸烟与患肺癌的关系中,通过收集数据并整理、分析,得到“吸烟与患肺癌有关”的结论,并且有99%的把握认为这个结论成立.下列说法正确的个数是( )①在100个吸烟者中至少有99个人患肺癌;②如果一个人吸烟,那么这个人有99%的概率患肺癌;③在100个吸烟者中一定有患肺癌的人;④在100个吸烟者中可能一个患肺癌的人也没有.A .4B .3C .2D .18.下表是某小卖部一周卖出热茶的杯数与当天气温的对比表:气温(℃) 18 13 10 4 -1 杯数2434395163若热茶杯数y ( ) A.y ^=x +6 B.y ^=x +42 C.y ^=-2x +60 D.y ^=-3x +789.如图,5个(x ,y )数据,去掉D (3,10)后,下列说法错误的是( )A .相关系数r 变大B .残差平方和变大C .相关指数R 2变大D .解释变量x 与预报变量y 的相关性变强10.根据一位母亲记录儿子3~9岁的身高数据,建立儿子身高(单位:cm)对年龄(单位:岁)的线性回归方程为y ^=7.19x +73.93,若用此方程预测儿子10岁时的身高,有关叙述正确的是( )A .身高一定为145.83 cmB .身高大于145.83 cmC .身高小于145.83 cmD .身高在145.83 cm 左右11.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:( ) A .没有充足的理由认为课外阅读量大与作文成绩优秀有关 B .有0.5%的把握认为课外阅读量大与作文成绩优秀有关 C .有99.9%的把握认为课外阅读量大与作文成绩优秀有关 D .有99.5%的把握认为课外阅读量大与作文成绩优秀有关12.两个分类变量X 和Y ,值域分别为{x 1,x 2}和{y 1,y 2},其样本频数分别是a =10,b =21,c +d =35.若X 与Y 有关系的可信程度不小于97.5%,则c 等于( )A .3B .4C .5D .6 附:二、填空题(本大题共) 13.下面是一个2×2列联表:则表中b -a =________.14.已知样本容量为11,计算得∑i =111x i =510,∑i =111y i =214,回归方程为y ^=0.3x +a ^,则x≈________,a ^≈________.(精确到0.01)15.某单位为了了解用电量y (度)与气温x (℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表,由表中数据得线性回归方程y ^=b ^x +a ^,其中b ^=-2.现预测当气温为-4℃时,用电量的度数约为________.16.某部门通过随机调查89名工作人员的休闲方式是读书还是健身,得到的数据如下表:三、解答题(本大题共6小题,共70分,解答时应写出必要的文字说明、证明过程或演算步骤)17.(本小题10分)x与y有如下五组数据,试分析x与y由.18.(本小题12分)有两个分类变量x与y,其一组观测值如下面的2×2列联表所示:其中a,15-a0.1的前提下认为x与y之间有关系?19.(本小题12分)某学校高三年级有学生1000名,经调查,其中750名同学经常参加体育锻炼(称为A类同学),另外250名同学不经常参加体育锻炼(称为B类同学),现用分层抽样方法(按A类、B类分两层)从该年级的学生中共抽取100名同学,如果以身高达165 cm 作为达标的标准,对抽取的100名学生,得到以下列联表:(1)(2)能否在犯错误的概率不超过0.05的前提下认为经常参加体育锻炼与身高达标有关系(K2的观测值精确到0.001)?20.(本小题12分)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此做了4次试验,得到数据如下:加工的时间y (小时) 2.5 3 4 4.5(1)(2)求y 关于x 的线性回归方程y ^=b ^x +a ^; (3)试预测加工10个零件需要的时间.21.(本小题12分)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分为5组:[50,60),[60,70), [70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?P (K 2≥k )0.100 0.050 0.010 0.001 k2.7063.8416.63510.82822.(本小题)之间的一组数据如下表:价格x 1.4 1.6 1.8 2 2.2 需求量1210753(1)画出散点图;(2)求出y 对x 的线性回归方程,并在(1)的图形上画出它的图象; (3)如果价格定为1.9万元,预测需求量大约是多少.(结果精确到0.01 t).答案1.解析:选D 曲线上的点与该点的坐标之间是确定关系——函数关系,故②不正确.其余均为相关关系.2.解析:选D 在回归分析中,样本相关系数r 的范围是|r |≤1,故选D.3.解析:选C 从条形图中可以看出,在x 1中y 1比重明显大于x 2中y 1的比重,所以两个分类变量的关系较强.4.解析:选A 因为b >0时,两变量正相关,此时r >0;b <0时,两变量负相关,此时r <0.5.解析:选A 画出散点图(图略)可以得到这些样本点在某一条直线上或该直线附近,故最可能是线性函数模型.6.解析:选D 样本点的中心为(2.5,3.5),将其代入线性回归方程可解得a ^=5.25. 7.解析:选D 有99%的把握认为“吸烟与患肺癌有关”,指的是“吸烟与患肺癌有关”这个结论成立的可能性或者可信程度有99%,并不表明在100个吸烟者中至少有99个人患肺癌,也不能说如果一个人吸烟,那么这个人就有99%的概率患肺癌;更不能说在100个吸烟者中一定有患肺癌的人,反而有可能在100个吸烟者中,一个患肺癌的人也没有.故正确的说法仅有④,选D.8.解析:选C 由表格可知,气温与杯数呈负相关关系.把x =4代入y =-2x +60得y =52,e ^=52-51=1.把x =4代入y =-3x +78得y =66,e ^=66-51=15.故应选C.9.解析:选B 由散点图知,去掉D 后,x 与y 的相关性变强,且为正相关,所以r 变大,R 2变大,残差平方和变小.10.解析:选D 用线性回归方程预测的不是精确值,而是估计值.当x =10时,y =145.83,只能说身高在145.83 cm 左右.11.解析:选D 根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.12.解析:选A 列2×2列联表如下:故K 2的观测值k =66×[10(35-c )-21c ]31×35×(10+c )(56-c )≥5.024. 把选项A ,B ,C ,D 代入验证可知选A. 13.解析:b -a =8. 答案:814.解析:由题意得x =111∑i =111x i =51011≈46.36,y =111∑i =111y i =21411,因为y =0.3x +a ^,所以21411=0.3×51011+a ^,可得a ^≈5.55.答案:46.36 5.5515.解析:由题意可知x =14(18+13+10-1)=10,y =14(24+34+38+64)=40,b ^=-2.又回归直线y ^=-2x +a ^过点(10,40),故a ^=60, 所以当x =-4时,y ^=-2×(-4)+60=68. 答案:6816.解析:由列联表中的数据,得K 2的观测值为 k =89×(24×26-31×8)255×34×32×57≈3.689>2.706,因此,在犯错误的概率不超过0.10的前提下认为性别与休闲方式有关系. 答案:0.1017.解:作出散点图,如图所示:由散点图可以看出,x 与y 不具有线性相关关系.18.解:查表可知,要使在犯错误的概率不超过0.1的前提下认为x 与y 之间有关系,则k ≥2.706,而k =65×[a (30+a )-(20-a )(15-a )]220×45×15×50=65×(65a -300)220×45×15×50=13×(13a -60)260×90. 由k ≥2.706得a ≥7.19或a ≤2.04.又a >5且15-a >5,a ∈Z ,解得a =8或9,故a 为8或9时,在犯错误的概率不超过0.1的前提下认为x 与y 之间有关系. 19.解:(1)填写列联表如下:身高达标 身高不达标总计 经常参加体育锻炼 40 35 75 不经常参加体育锻炼101525总计5050100(2)2k=100×(40×15-35×10)275×25×50×50≈1.333<3.841.所以不能在犯错误的概率不超过0.05的前提下认为经常参加体育锻炼与身高达标有关系.20.解:(1)散点图如图所示:(2)由表中数据得x=3.5,y=3.5,∑i=14(x i-x)(y i-y)=3.5,∑i=14(x i-x)2=5,由公式计算得b^=0.7,a^=y--b^x-=1.05,所以所求线性回归方程为y^=0.7x+1.05.(3)当x=10时,y^=0.7×10+1.05=8.05,所以预测加工10个零件需要8.05小时.21.解:(1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名.所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),记为A1,A2,A3;25周岁以下组工人有40×0.05=2(人),记为B1,B2.从中随机抽取2名工人,所有的可能结果共有10种,它们是(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率P=710.(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手有60×0.25=15(人),“25周岁以下组”中的生产能手有40×0.375=15(人),据此可得2×2列联表如下:生产能手非生产能手合计25周岁以上组15456025周岁以下组152540合计3070100所以得K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=100×(15×25-15×45)260×40×30×70=2514≈1.79.因为1.79<2.706,所以没有90%的把握认为“生产能手与工人所在的年龄组有关”.22.解:(1)散点图如图所示.(2)x-=1.8,y-=7.4,∑i=15x i y i=62,∑i=15x2i=16.6,b^=∑i=15x i y i-5x-y-∑i=15x2i-5x-2=62-5×1.8×7.416.6-5×1.82=-4.60.4=-11.5,a^=y--b^x-=7.4+11.5×1.8=28.1.所以y对x的线性回归方程为y^=-11.5x+28.1.画出图象如图.(3)当价格定为1.9万元,即x=1.9时,y=-11.5×1.9+28.1=6.25.所以商品价格定为1.9万元时,需求量大约是6.25t.。
高中数学人教A版选修1-2复习课(一) 统计案例课件

回归分析
(1)变量间的相关关系是高考解答题命题的一个,主 要考查变量间相关关系的判断,求解回归方程并进行预报 估计,题型多为解答题,有时也有小题出现.
(2)掌握回归分析的步骤的是解答此类问题的关键, 另外要掌握将两种非线性回归模型转化为线性回归分析 求解问题.
[考点精要]
1.一个重要方程 对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…, (xn,yn),其线性回归直线方程为^y =^b x+^a .
2.2016 年第三十一届奥运会在巴西首都里约热内卢举行,为 调查某高校学生是否愿意提供志愿者服务,用简单随机抽样 方法从该校调查了 60 人,结果如下:
(1)用分层抽样的方法在愿意提供志愿者服务的学生中抽取 6 人,其中男生抽取多少人? (2)在(1)中抽取的 6 人中任选 2 人,求恰有一名女生的概率.
(3)在犯错误的概率不超过 0.01 的前提下,是否能认为“其 亲属的饮食习惯与年龄有关”?
[解] (1)30 位亲属中 50 岁以上的人多以食蔬菜为主,50 岁以下的人多以食肉类为主.
(2)2×2 列联表如表所示:
(3) 随 机 变 量
K2
的观测值
k
=
30×8-1282 12×18×20×10
i=1
≈2.646.
参考公式:相关系数 r=
n
ti- t yi- y
i=1
,
n
n
ti- t 2 yi- y 2
i=1
i=1
回归方程^y=^a+^bt 中斜率和截距的最小二乘估计公式分别为:^b=
n
ti- t yi- y
i=1
,^a= y -^b t .
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高中数学学习材料
(灿若寒星精心整理制作)
第一章统计案例
班级:姓名:_____________
1.线性回归模型y=bx+a+e中,b=_____________,a=______________e称为_________
2.若有一组数据的总偏差平方和为100,相关指数为0.5,则期残差平方和为_________ 回归平方和为
____________
3.为了调查患慢性气管炎是否与吸烟有关,调查了339名50岁以下的人,调查结果如下表:
患慢性气管炎未患慢性气管炎合计
吸烟43 162 205
不吸烟13 121 134
合计56 283 339
根据列联表数据,求得K2=_________________
4.在两个变量的回归分析中,作散点图的目的是_______________________________
5.在回归分析中,通过模型由解释变量计算预报变量时,应注意什么问题?(本题满分10分)
6.某企业为考察生产同一种产品的甲、乙两条生产线的产品合格率,同时各抽取100件产品,检验后得到
如下联表:
生产线与产品合格率列联表
合格不合格总计
甲线97 3 100
乙线95 5 100
总计192 8 200
请问甲、乙两线生产的产品合格率在多大程度上有关系?(本题满分10分)
7.为了研究某种细菌随时间x变化,繁殖的个数,收集数据如下:
天数x/天 1 2 3 4 5 6 繁殖个数y/个 6 12 25 49 95 190
(1)用天数作解释变量,繁殖个数作预报变量,作出这些数据的散点图
(2)描述解释变量与预报变量之间的关系
(3)计算残差、相关指数R2.(本题满分20分)。