2020版人教A版数学选修2-3同步配套__第三章 统计案例第三章检测(B)
【最新推荐】2019-2020学年人教A版高中数学选修2-3配套限时规范训练:第3章 统计案例 3.1 Word版含解析

第三章 3.1【基础练习】1.对两个变量y 与x 进行回归分析,得到一组样本数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),则下列说法不正确的是( )A .若求得相关系数r =-0.89,则y 与x 具备很强的线性相关关系且为负相关B .同学甲根据这组数据得到的回归模型1的残差平方和E 1=1.8,同学乙根据这组数据得到的回归模型2的残差平方和E 2=2.4,则模型1的拟合效果更好C .用相关指数R 2来刻画回归效果,模型1的相关指数R 21=0.48,模型2的相关指数R 22=0.91,则模型1的拟合效果更好 D .该回归分析只对被调查样本的总体适用 【答案】C2.设有一个线性回归方程y ^=2-3.5x ,则变量x 增加1个单位时( ) A .y 平均增加3.5个单位 B .y 平均增加2个单位 C .y 平均减少3.5个单位 D .y 平均减少2个单位【答案】C3.在对两个变量y 与x 进行回归分析时,分别选择了4个不同模型,它们的相关指数R 2如下,其中拟合效果最好的模型是( )A .模型1,相关指数R 2为0.98B .模型2,相关指数R 2为0.80C .模型3,相关指数R 2为0.50D .模型4,相关指数R 2为0.25 【答案】A4.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确的是( )A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg 【答案】D5.已知x 与y 之间的一组数据如下,则y 与x 的线性回归方程为y ^=bx +a 必过点________.x134【答案】(2,4)6.某次测量发现一组数据(x i ,y i )具有较强的相关性,并计算得y ^=x +1,其中数据(1,y 0)因书写不清,只记得y 0是[0,3]上任意一个值,则该数据对应的残差的绝对值不大于1的概率为________.(残差=真实值-预测值)【答案】23【解析】由题意,其预测值为1+1=2,该数据对应的残差的绝对值不大于1时,1≤y 0≤3,其概率可由几何概型求得,即该数据对应的残差的绝对值不大于1的概率p =3-13=23. 7.(2017年烟台期中)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据.(1)(2)已知该厂技术改造前100吨甲产品的生产能耗为90吨标准煤,试根据(1)求出的线性回归方程预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤.参考公式:b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,a ^=y -b ^x .【解析】(1)x =14×(3+4+5+6)=4.5,y -=14×(2.5+3+4+4.5)=3.5,∑i =14x i y i =3×2.5+4×3+5×4+6×4.5=66.5,∑i =14x 2i =32+42+52+62=86,b ^=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7,a ^=y --b ^x =3.5-0.7×4.5=0.35, 所以所求的回归方程为y =0.7x +0.35. (2)x =100时,y =100×0.7+0.35=70.35,预测生产100吨甲产品的生产能耗比技改前降低了90-70.35=19.65(吨标准煤). 8.某运动员训练次数与成绩之间的数据关系如下:(1)(2)求出回归方程; (3)作出残差图; (4)计算相关指数R 2.【解析】(1)作出该运动员训练次数(x )与成绩(y )之间的散点图如图所示,由散点图可知,它们之间具有线性相关关系.(2)x =39.25,y =40.875,∑i =18x 2i =12 656,∑i =18y 2i =13 731,∑i =18x i y i =13 180,∴b ^=∑i =18x i y i -8x y∑i =18x 2i -8x2≈1.041 5.∴a ^=y -b ^x ≈-0.003 02. ∴回归方程为y ^=1.041 5x -0.003 02. (3)作残差图如图所示,由图,可知残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适. (4)计算得相关指数R 2=0.985 5,说明了该运动员的成绩的差异有98.55%是由训练次数引起的.【能力提升】9.(2019年天津期末)某研究机构在对具有线性相关的两个变量x,y 进行统计分析时,得到如下数据,由表中数据求得y 关于x 的回归方程为^y=0.7x+a ,则在这些样本点中任取一点,该A.14B.12C.34D.0【答案】B【解析】由题意得_x=6,_y=3,所以3=0.7×6+a ,解得a=-1.2,则^y=0.7x-1.2.四个样本点中,(3,1),假设根据上表数据所得线性回归直线方程为y =b x +a ,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y ′=b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′ B.b ^>b ′,a ^<a ′ C.b ^<b ′,a ^>a ′ D.b ^<b ′,a ^<a ′【答案】C【解析】计算得x =3.5,y -=136,画出散点图,并根据各个点和回归中心画出回归直线的大致图形如图所示,由图易知b ^<b ′,a ^>a ′.故选C.11.(2018年珠海阶段性测试)从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,计算得∑i =110x i =80,∑i =110y i =20,∑i =110x i y i=184,∑i =110x 2i =720.已知家庭的月储蓄y 关于月收入x 的线性回归方程为y ^=b ^x +a ^,则变量y与x________(填“正相关”或“负相关”);若该居民区某家庭月收入为8千元,预测该家庭的月储蓄是________千元.【答案】正相关 2【解析】由题意知x=110∑i=110x i=8,y-=110∑i=110y i=2,∴b^=184-10×8×2720-10×82=0.3,a^=2-0.3×8=-0.4,∴y^=0.3x-0.4.∵0.3>0,∴变量y与x正相关.当x=8时,y^=0.3×8-0.4=2(千元).12.(2016年唐山二模)二手车经销商小王对其所经营的某一型号二手汽车的使用年数x(0<x≤10)与销售价格y(单位:万元/辆)进行整理,得到如表的对应数据:(1)试求y关于x(2)已知每辆该型号汽车的收购价格为w=0.05x2-1.75x+17.2万元,根据(1)中所求的回归方程,预测x为何值时,小王销售一辆该型号汽车所获得的利润z最大.【解析】(1)由表中数据得,x=15×(2+4+6+8+10)=6,y=15×(16+13+9.5+7+4.5)=10,所以b^=2×16+4×13+6×9.5+8×7+10×4.5-5×6×1022+42+62+82+102-5×62=-1.45,a^=10-(-1.45)×6=18.7.所以y关于x的回归直线方程为y=-1.45x+18.7.(2)z=y-w=(-1.45x+18.7)-(0.05x2-1.75x+17.2)=-0.05x2+0.3x+1.5,当x=-0.32×(-0.05)=3时,二次函数z取得最大值,即预测x=3时,小王销售一辆该型号汽车所获得的利润z最大.。
2020学年高中数学第三章统计案例单元质量测评新人教A版选修2-3(2021-2022学年)

第三章单元质量测评本试卷分第Ⅰ卷(选择题)和第Ⅱ卷(非选择题)两部分.满分150分,考试时间120分钟.第Ⅰ卷(选择题,共60分)一、选择题(本大题共12小题,每小题5分,共60分)1.下列属于相关关系的是( )A.利息与利率B.居民收入与储蓄存款C.电视机产量与苹果产量D.某种商品的销售额与销售价格答案B解析A与D是函数关系,C中两变量没有关系,B中居民收入与储蓄存款是相关的,但不具有函数关系.2.已知一个线性回归方程为错误!=1.5x+45,其中x的取值依次为1,7,5,13,19,则错误!未定义书签。
=( )A.58。
5ﻩB.46.5C.60 D.75答案A解析错误!=错误!未定义书签。
=9,因为回归直线必过样本点的中心(错误!,错误!未定义书签。
),所以错误!=1.5×9+45=13.5+45=58。
5.故选A。
3.利用独立性检验来考察两个分类变量X和Y是否有关系时,通过查阅下表来确定“X与Y有关系”的可信程度.如果k≥5.024,那么就有把握认为“X与Y有关系”的百分比为()A.25% B.75%ﻬC.2.5% D.97。
5%答案D解析k=5。
024对应的0.025是“X和Y有关系"不合理的程度,因此两个分类变量有关系的可信程度约为97.5%.4.工人月工资(元)依劳动生产率(千元)变化的回归方程为错误!=50+80x,下列判断正确的是()①劳动生产率为1000元时,则工资为130元;②劳动生产率提高1000元时,则工资提高80元;③劳动生产率提高1000元时,则工资提高130元;④当月工资210元,劳动生产率为200元.A.①ﻩB.②C.③ D.④答案B解析∵回归直线斜率为80,∴x每增加1千元,错误!增加80,即劳动生产率提高1000元时,工资提高80元.5.如图,5个(x,y)数据,去掉D(3,10)后,下列说法错误的是( )A.相关系数r变大B.残差平方和变大C.R2变大D.解释变量x与预报变量y的相关性变强答案B解析由散点图知,去掉D后,x,y的相关性变强,且为正相关,所以r变大,R2变大,残差平方和变小.6.如图所示的是一组观测值的四个线性回归模型对应的残差图,则对应的线性回归模型的拟合效果最好的残差图是()答案A解析因为残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适.故选A.7.已知方程错误!=0。
人教A版选修2-3第三章+统计案例+同步练测(数学选修2-3).docx

高中数学学习材料马鸣风萧萧*整理制作第三章 统计案例 同步练测(数学北京师大版选修2-3)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.对于散点图,下列说法中正确的是( ) A.通过散点图一定可以看出变量之间的变化规律 B.通过散点图一定不可以看出变量之间的变化规律C.通过散点图可以看出正相关与负相关有明显区别D.通过散点图看不出正相关与负相关有什么区别2.若回归直线方程为y 2 3 5x ,则变量x 增加一个单位,变量y 平均( ) A.减少3.5个单位 B.增加2个单位 C.增加3.5个单位 D.减少2个单位3.观察图中各图形:① ②③ ④其中两个变量x ,y 具有相关关系的图是( ) A.①②B.①④C.③④D.②③4.在画两个变量的散点图时,下面叙述正确的 是( )A.预报变量在x 轴上,解释变量在y 轴上B.解释变量在x 轴上,预报变量在y 轴上C.可以选择两个变量中的任意一个变量在x 轴上D.可以选择两个变量中的任意一个变量在y 轴上5.下列关系中,是相关关系的为 ( )①学生的学习态度与学习成绩之间的关系;②教师的执教水平与学生的学习成绩之间的关系;③学生的身高与学生的学习成绩之间的关系; ④家庭的经济条件与学生的学习成绩之间的关系. A.①② B.①③ C.②③ D.②④6.为了考察两个变量x 、y 之间的线性相关关系,甲、乙两同学各自独立地做10次和15次试验,并利用最小二乘法求得回归直线分别为l 1和l 2.已知在两人的试验中发现变量x 的观测数据的平均值恰好相等,都为s ,变量y 的观测数据的平均值也恰好相等,都为t ,那么下列说法中正确的是( ) A.直线l 1,l 2有交点(s ,t )B.直线l 1,l 2相交,但是交点未必是(s ,t )C.直线l 1,l 2由于斜率相等,所以必定平行D.直线l 1,l 2必定重合建议用时实际用时满分 实际得分120分钟150分7.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程y =3-5x ,变量x 增加一个单位时,y 平均增加5个单位;③曲线上的点与该点的坐标之间具有相关关系; ④在一个2×2的列联表中,由计算得2χ=13.079,则其两个变量间有关系的可能性是90%. 其中错误的个数是( )A.1B.2C.3D.48.若两个分类变量x 和y 的列联表为:y 1 y 2 x 1 5 15 x 24010则x 与y 之间有关系的可能性为 ( ) A.0.1% B.99.9% C.97.5% D.0.25% 9.若对于变量y 与x 的10组统计数据的回归模型中,相关指数95.02=R ,又知残差平方和为53.120,那么∑=-1012)(i iy y的值为( )A.06.241B.6.2410C.08.253D.8.253010.下表是对于喜欢足球与否的统计列联表依据表中的数据,得到( )A. 2χB.2χC. 2χ706.22<KD. 2χ841.32>K11.由一组样本数据 x y x y x y 得到的回归直线方程为y bx a =+,那么下面说法正确的是( ) A.直线y bx a =+必过点),(--y xB.直线ybx a =+必经过 x ,y , x ,y ,, x y 中的一点 C.直线ybx a =+经过 x ,y , x y , ,x ,y 中某两个特殊点 D.直线ybx a =+必不过点),(--y x12.根据下面的列联表得到如下四个判断:①有0099的把握认为患肝病与嗜酒有关;②认为患肝病与嗜酒有关的出错的可能为 ;③认为患肝病与嗜酒有关的出错的可能为 .其中正确命题的个数为( ) A.0 B.1C.2D.3二、填空题(本大题共4小题,每小题4分,共16分.将答案填写在题中的横线上)13.面对竞争日益激烈的消费市场,众多商家不断扩大自已的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量x (千箱)与单位成本y (元)的资料进行线性回归分析,结果如下:()6621127717914812714816712 1.818277962771 1.818277.362i i i i i x y x x y b a ======-⨯⨯=≈-⎛⎫-⨯ ⎪⎝⎭≈--⨯≈∑∑,,,,,,则销量每增加1 000箱,单位成本约下降_______元.14.下表是关于出生男婴与女婴调查的列联表:晚上 白天 总计 男婴45女婴 35 总计98180那么, , , , , .15.如下表中给出的五组数据),(y x ,从中选出四组使其线性相关最大,且保留第一组)3,5(--,那么,应去掉第 组.x y16.某学校对课程《人与自然》的选修情况进行了统计,得到如下数据:那么,选修《人与自然》与性别有关的把握是 .三、解答题(本大题共6小题,共74分.解答应写出文字说明、证明过程或演算步骤)17.(本小题满分12分)为研究是否喜欢饮酒与性别之间的关系,在某地区随机抽取290人,得到如下列联表:喜欢饮酒 不喜欢饮酒总计 男 101 45 146 女 124 20144 总计22565290利用列联表的独立性检验是否有超过95%的把握认为饮酒与性别有关系?18.(本小题满分12分)有甲、乙两个班,进行数学考试,按学生考试及格与不及格统计成绩后,得到如下的列联表根据表中数据,你有多大把握认为成绩及格与班级有关?19.(本小题满分12分)一机器可以按不同的速度运转,其生产物件有一些会有缺点,每小时生产有缺点物件的多少随机器运转速度而变化,用x 表示转速(单位:转/秒),用y 表示每小时生产的有缺点物件的个数,现观测得到),(y x 的四组观测值为)11,16(),9,14(),8,12(),5,8(.若实际生产中所允许的每小时有缺点物件数不超过10,则机器的速度每秒不得超过多少转?20.(本小题满分12分)在大街上,随机调查339名成人,有关吸烟、不吸烟、患肺炎、不患肺炎的数据如下表:患肺炎 未患肺炎 总计 吸烟 43 162 205 不吸烟 13 121 134 总计 56283339(1)判断:吸烟与患肺炎是否有关?(2)用假设检验的思想予以证明.21.(本小题满分13分)假设关于某种设备的使用年限x (年)与所支出的维修费用y (万元)有如下统计资料:x 2 3 4 5 6 y2.23.85.56.57.0已知∑i =15x 2i =90,∑i =15y 2i =140.8,∑i =15x i y i =112.3.(1)求x ,y ;(2)如果x 与y 具有线性相关关系,求出线性回归 方程;(3)估计使用年限为10年时,维修费用约是多少?22.(本小题满分13分)在综合素质评价的某个维度的测评中,依据评分细则,学生之间相互打分,最终将所有的数据合成一个分数.满分100分,按照大于等于80分为优秀,小于80分为合格.为了解学生在该维度的测评结果,从毕业班中随机抽出一个班的数据.该班共有60名学生,得到如下的列联表.优秀 合格总计 男生 6 女生 18 总计60已知在该班随机抽取1人,测评结果为优秀的概率为13.(1)请完成上面的列联表;(2)能否在犯错误的概率不超过0.10的前提下认为性别与测评结果有关系?(3)现在如果想了解全校学生在该维度的表现情况,采取简单随机抽样的方式在全校学生中抽取少数一部分人来分析,请你选择一个合适的抽样方法,并解释理由.第三章 统计案例 同步练测(数学北京师大版选修2-3)答题纸得分:一、选择题题号 1 2 3 4 5 6 7 8 9 10 11 12 答案二、填空题13. 14. 15. 16.三、计算题17.18.19.20.21.22.第三章 统计案例 同步练测(数学北京师大版选修2-3)答案一、选择题 1.C2.A 解析:由回归直线方程可得3.5,b =-则变量x 增加一个单位,变量y 平均减少3.5个单位.3.C 解析:由相关关系的定义,当散点图中的点集中在一条直线或曲线附近时就称两变量具有相关关系.4.B5.A 解析:学生的学习成绩与学生的学习态度和教师的执教水平是相关的,与学生的身高和家庭经济条件不相关.6.A 解析:由,y bx a a y bx =+=-可知,当x x =时,y y =,故回归方程过定点()x y ,.所以回归直线1l 过点()s t ,,回归直线2l 也过点()s t ,,所以1l 与2l 有交点()s t ,.7.C 解析:根据方差的计算公式,可知①正确,②③④不正确.8.B 解析:()()225154010510401518.822>6.635(515)(4010)(540)(1510)χ+++⨯-⨯≈++++=,∴ 有 以上的把握认为x 与y 之间有关系. 9.B10.D 解析:由2χ841.3722.4))()()(()(22>=++++-=d b c a d c b a bc ad n K .11.A12.C 解析:由2χ635.6828.10632.56))()()(()(22>>=++++-=d b c a d c b a bc ad n K ,可判断出①②正确.二、填空题13.1.818 2 解析:由分析可得,y x ,销量每增加1千箱,则单位成本约下降 元. 14.47 92 88 82 53 15.3 解析:画散点图可以发现.16. 解析:2χ828.108.163))()()(()(22>=++++-=d b c a d c b a bc ad n K ,即有 的把握,认为选修《人与自然》与性别有关. 三、计算题17.解:由列联表中的数据得2χ=290×(101×20-124×45)2146×144×225×65≈11.953.∵ ,∴ 有 的把握认为“是否喜欢饮酒与性别有关”. 18.解:由列联表中的数据,得2χ706.26527.073174545)3573810(90))()()(()(22<=⨯⨯⨯⨯-⨯⨯=++++-=d b c a d c b a bc ad n K ,没有充分的证据显示“成绩及格或不及格与班级有关”. 19.解:由于5.12)1614128(41=+++=x ,25.8)11985(41=+++=y , 5.25))((41=--∑=i i iy y x x,35)(412=-∑=i i x x ,75.18)(412=-∑=i i y y ,那么75.0995.075.18355.25>=⨯=r ,因此,y 与x 之间具有很强的线性相关关系.于是由公式,得0.7290.863b a ≈≈-,,那么y 与x 之间的回归直线方程为0.7290.863y x =-,由0.7290.86310y x =-≤,得14.9015x ≤≈,即每小时有缺点的物件数不超过10时,机器的速度每秒不得超过15转. 20. 解:(1)由列联表中的数据,得2χ635.6469.728356134205)1214316213(339))()()(()(22>=⨯⨯⨯⨯-⨯⨯=++++-=d b c a d c b a bc ad n K ,所以有0099的把握认为吸烟与患肺炎有关.(2)假设吸烟与患肺炎无关,由于2( 6.635)0.01A P χ=>≈,即A 为小概率事件,而小概率事件发生了,进而得出假设错误,得到吸烟与患肺炎有关. 21. 解:(1)x =2+3+4+5+65=4,y =2.2+3.8+5.5+6.5+7.05=5.(2) 5152215()iii ii x y x yb xx =--==∑∑=112.3-5×4×590-5×42=1.23,51.2340.08.a y bx =-⨯=-= 所以线性回归方程为 1.23.0.08y x =+(3)当10x =时,1.23100.0812.38()y ⨯=+=万元,即估计使用10年时,维修费用约为12.38万元.22.解:(1)优秀 合格 总计 男生 6 22 28 女生141832总计 204060(2)提出统计假设:性别与测评结果没有关系,则2=60 6 18 22 14240 20 32 28≈3.348>2.706,因此,有90%的把握认为性别与测评结果有关系.(3)由(2)可知性别很有可能对是否优秀有影响,所以采用分层抽样按男、女生比例抽取一定的学生,这样 得到的结果对学生在该维度测评中的总体表现情况会比较符合实际情况.。
2019-2020学年高中数学人教A版选修2-3同步训练:第三章 章末检测 Word版含答案

第三章 章末检测1、如果散点图中所有的样本点均在同一条直线上,那么残差平方和与相关系数的绝对值分别为( ) A.1,0B.0,1C.0.5,0.5D.0.43,0.572、为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取60名高中生做问卷调查,得到以下数据:由以上数据,计算得到2K 的观测值9.643k ≈,根据临界值表,以下说法正确的是( ) A.在样本数据中没有发现足够证据支持结论"作文成绩优秀与课外阅读量大有关" B.在犯错误的概率不超过0.001的前提下,认为作文成绩优秀与课外阅读量大有关 C.在犯错误的概率不超过0.05的前提下,认为作文成绩优秀与课外阅读量大有关 D.在犯错误的概率不超过0.005的前提下,认为作文成绩优秀与课外阅读量大有关 3、某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位: t )和年利润z (单位:千元)的影响.对近8年的年宣传费i x 和年销售量()1,2,,8i y i =⋯数据作了初步处理,得到下面的散点图及一些统计量的值.有下列5个曲线类型:①;y bx a =+②;y c d =+③;y p qlnx =+④12;y k ek x =⑤122,y c x c =+则较适宜作为年销售量y 关于年宣传费x 的回归方程的是( )A.①②B.②③C.②④D.③⑤ 4、假设有两个变量X 与,Y 它们的取值分别为12,x x 和12,,y y 其列联表为:以下各组数据中,对于同一样本能说明X 与,Y 有关系的可能性最大的一组为( ) A. 50,40,30,20a b c d ==== B. 50,30,40,20a b c d ==== C. 20,30,40,50a b c d ==== D. 20,30,50,40a b c d ====5、某饮料店在某5天的月销售收入y (单位:百元)与当天平均气温x (单位:℃)之间的数据如下表甲、乙、丙、丁四位同学对上述数据进行了研究,分别得到了x 与y 之间的四个线性回归方程①3? y x =-+ ②2ˆ.8yx =-+ ③ 2.6y x =-+ ④ 2.4y x =-+ 其中正确的方程是( )A.①B.②C.③D.④ 6、在两个学习基础相当的班级实行某种教学措施的实验,测试结果见下表,则实验效果与教学措施( )A.有关B.无关C.关系不明确D.以上都不正确 7、为预测某种产品的回收率y ,需要研究它和原料有效成分含量x 之间的相关关系,现取了8组观察值.计算知52,228,478, 1 849i i iyi ====,则y 对x 的回归方程是( ) A. 11.47 2.62y x =+ B. 11.47 2.62y x =-+ C. 2.6211.47y x =+ D. 11.47 2.62y x =-8、下表给出5组数据(),,x y 为选出4组数据使得线性相关程度最大,且保留第1组数据()5,3,--则应去掉()A.第2组数据B.第3组数据C.第4组数据D.第5组数据 9、已知x,y 的值如下表所示:如果y 与x 呈线性相关且回归直线方程为7,2y bx =+则b 等于( ) A. 12- B.12 C. 110-D. 11010、某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是( )A. 10200ˆyx =-+ B. 10200ˆyx =+ C. 10200ˆyx =-- D. 10200ˆyx =- 11、种植小麦的施肥量()x kg 、与产量()y kg 之间的回归直线方程为2504ˆyx =+,当施肥量为50kg 时,预计小麦产量为__________. 12、以下三个命题:①若两个变量的线性相关性越强,则它们的相关系数的值越接近于1; ②在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高;③对分类变量X 与Y 的随机变量2K 的观测值k 来说, k 越小,判断“X 与Y 有关系”的把握越大.其中假命题的序号为________.13、在2013年元旦期间,某市物价部门对本市五个商场销售的某商品一天的销售量及其价格进行了调查,五个商场的价格x 元和销售量y 件之间的一组数据如下表所示:通过分析,发现销售量y 与商品的价格x 具有线性相关关系,则销售量y 关于商品的价格x 的线性回归方程为__________.参考公式: 1221,ˆˆˆni ii nii x y nxybay bx xnx ==-==--∑∑ 14、出下列命题:① 样本方差反映了所有样本数据与样本平均值的偏离程度;② 若随机变量()20.43,0.18X N ~,则此正态曲线在: 0.43x =处达到峰值; ③ 在回归分析模型中,残差平方和越小,说明模型的拟合效果越差;④ 某市政府调査该市市民收入与市民旅游欲望的关系时,抽查了3000人.经过计算得2 6.023K =,根据这一数据査阅下表,则市政府有97.5%以上的把握认为市民收入与旅游欲望有关系.其中正确的命题是__________.15、从某居民区随机抽取10个家庭,获得第i 个家庭的月收入i x (单位:千元)与月储蓄i y (单位:千元)的数据资料,算得10180ii x==∑,10120i i y ==∑,101184i i i x y ==∑,1021720i i x ==∑。
高中数学人教A版选修2-3课件第三章统计案例

^
(2)现有第二个线性模型:y=7x+17,且 R 2=0.82.
若与(1)的线性模型比较,哪一个线性模型拟合效果比较好,请说
明理由.
专题归纳
高考体验
^
^
解:(1)依题意设 y 与 x 的线性回归方程为=6.5x+.
2+4+5+6+8
=
=5,
=
^
5
30+40+60+50+70
来粗略地判断两个变量的相关性.
2
(-)
(2)通过公式 K2=
(+)(+)(+)(+)
表作比较,最后得出结论.
先计算观测值k,再与临界值
专题归纳
高考体验
跟踪训练 2某学生对其亲属30人的饮食习惯进行了一次调查,并
用茎叶图表示30人的饮食指数,如图所示.(说明:图中饮食指数低于
愿意
不愿意
男生
20
10
女生
10
20
性别
(1)用分层抽样的方法在愿意提供志愿者服务的学生中抽取6人,
其中男生抽取多少人?
专题归纳
高考体验
(2)你能否在犯错误的概率不超过0.01的前提下认为该校高中生
是否愿意提供志愿者服务与性别有关?
下面的临界值表供参考:
P(K2≥k0) 0.15
k0
0.10
0.05
5
=50,
^
∵=6.5x+经过(, ),
^
^
∴50=6.5×5+,∴=17.5,
^
∴y 与 x 的线性回归方程为=6.5x+17.5.
人教版数学高二A版选修2-3单元测试第三章统计案例

第三章过关检测(时间90分钟,满分100分)知识点分布表知识点题号散点图1,11线性回归方程2,3,11回归方程的截距、斜率4,8非线性回归7残差平方和9独立性检验6,12回归分析5,10一、选择题(每小题4分,共40分)1.如下图所示,4个散点图中,不适合用线性回归模型拟合其中两个变量的是( )2.已知呈线性相关关系的变量x,y之间的关系如下表所示,则回归直线一定过点( )x0.10.20.30.5y 2.11 2.85 4.0810.15A.(0.1,2.11)B.(0.2,2.85)C.(0.3,4.08)D.(0.275,4.797 5)3.两个变量满足如下关系:x510152025y103105110111114则两个变量线性相关程度( )A.很强B.很弱C.无相关性D.不确定4.一位母亲记录了儿子3~9岁的身高,数据如下表.由此建立的身高与年龄的回归模型为y =7.19x +73.93.用这个模型预测这个孩子10岁时的身高,则正确的叙述是( )A.身高一定在145.83 cmB.身高在145.83 cm 以上C.身高在145.83 cm 左右D.身高在145.83 cm 以下5.对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程的截距和斜率的最小二乘法估计公式分别为_______和∑∑==---=ni ini i ix xy y x xb121)())((ˆ.( )A.a =y -bxB.x by a ˆ-= C.bx y a -=ˆ D.x b y a ˆˆ-= 6.(2009山东潍坊一模)下列关于等高条形图说法正确的是( ) A.等高条形图表示高度相对的条形图 B.等高条形图表示的是分类变量的频数 C.等高条形图表示的是分类变量的百分比 D.等高条形图表示的是分类变量的实际高度 7.身高与体重有关系,可以用分析的方法来判断( )A.残差B.回归C.等高条形图D.独立性检验 8.下列关于K 2的说法中正确的是( )A.K 2在任何相互独立问题中都可以用于检验有关还是无关B.K 2的值越大,两个事件的相关性就越大C.K 2是用来判断两个分类变量是否有关系的随机变量,只对于两个分类变量适合D.K 2的观测值k 的计算公式为))()()(()(d b c a d c b a bc ad n k ++++-=9.设在海拔x m 处的大气压强是y Pa,y 与x 之间的关系为kxce y =,其中c 、k 为常量,如果某游客从大气压为1.01×105 Pa 的海平面地区,到了海拔为2 400 m,大气压为0.90×105 Pa 的一个高原地区,则k 与c 的取值分别是( )A.⎩⎨⎧⨯-=⨯=-5510805.41001.1k cB.⎩⎨⎧⨯-=⨯=-54105.31024.2k cC.⎩⎨⎧⨯=⨯=-54103.2106.3k cD.⎩⎨⎧⨯-=⨯=-54103.2107.2k c10.为了探究色盲是否与性别有关,在调查的500名男性中有39名色盲患者,在500名女性中有6名患有色盲,那么你认为色盲与性别有关的把握为( ) A.0 B.95% C.99% D.都不正确 二、填空题(每小题4分,共16分)11.对于一组数据的两个函数模型,其残差平方和分别为180.2和290.7,若从中选取一个拟合程度较好的函数模型,应选_______.12.(2009广东中山一模)许多因素都会影响贫穷,教育也许是其中之一.在研究这两个因素的关系时,收集了美国50个州的成年人受过9年或更少教育的百分比(x)和收入低于官方规定的贫困线的人数占本州人数的百分比(y)的数据,建立的回归直线方程为6.48.0ˆ+=x y.斜率的估计值为0.8说明________________________________________________.13.若一组观测值(x 1,y 1),(x 2,y 2),…,(x n ,y n )之间满足y i =a +bx i +e i (i =1,2,…,n),若e i 恒为0,则R 2为______.14.下列说法:①回归方程适用于一切样本和总体;②回归方程一般都有时间性;③样本取值的范围会影响回归方程的适用范围;④回归方程得到的预报值是预报变量的精确值,其中正确的是_______.三、解答题(共44分)15.(10分)某地区的人口普查表明,该地区共有男性15 729 245人,其中3 497个是聋哑人,共有女性16 799 031人,其中3 072个是聋哑人,判断该地区性别与是否为聋哑人之间是否有关系.16.(10分)假设关于某设备的使用年限x 和所支出的维修费用y(万元),有如下的统计资料:(1)y 与x 间是否有线性相关关系?若有,求出线性回归方程; (2)估计使用年限为10年时,维修费用是多少? 17.(12分)下表所示是一组试验数据:y 64 138 205 285 360(1)作出散点图,并猜测y 与x 之间的关系; (2)利用所得的模型预报x =10时y 的值.18.(12分)弹簧长度y(cm)随所挂物体质量x(g)不同而变化的情况如下: 物体质量x 5 10 15 20 25 30 弹簧长度y7.258.128.959.9010.9611.80(1)画出散点图;(2)求y 对x 的回归直线方程;(3)预测所挂物体质量为27 g 时的弹簧长度(精确到0.01 cm).参考答案1解析:题图A 中的点不成线性排列,故两个变量不适合线性回归模型.故选A. 答案:A2 解析:回归直线一定过点),(y x ,通过表格中的数据计算出x 和y ,易知选D. 答案:D3 解析:画出散点图如下:由散点图知线性相关性很强. 答案:A4解析:将x =10代入得y =145.83,但这种预测不一定准确,应该在这个值的左右.故选C. 答案:C5解析:由回归方程系数公式可得. 答案:D6解析:由等高条形图的特点及性质进行判断. 答案:C7解析:回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,显然,身高和体重具有相关关系. 答案:B8 解析:独立性检验的实质就是利用随机变量K 2来判断“两个分类变量有关系”. 答案:C9解析:将⎩⎨⎧⨯==51001.1,0y x 和⎩⎨⎧⨯==51090.0,4002y x 分别代入kxe c y •=,⎩⎨⎧⨯-=⨯=-,10805.4,1001.155k c 故选A. 答案:A10解析:根据题意可知相关数据的列联表如下:利用公式,可计算得随机变量k 的值约为25.34>6.635,所以色盲与性别有关的把握为99%,故选C. 答案:C11解析:残差平方和越小,函数模型对数据拟合效果越好,反之残差平方和越大,说明函数模型对数据拟合程度效果越差. 答案:第一种12答案:美国一个地区的成年人受过9年或更少教育的百分比每增加1%,收入低于官方规定的贫困线的人数占本州人数的百分比将增加0.8%左右13解析:若e i 恒为0,则残差平方和0)ˆ(1212==-∑∑==ni i ni i ie yy, 而101)()ˆ(112122=-=---=∑∑==n i ini i iy yyyR . 答案:114解析:①回归方程只适用于我们所研究的样本总体,故①错误.④回归方程得到的预报值可能是取值的平均值,故④错误. 答案:②③ 15解:作列联表:聋哑人 不是聋哑人 总计 男 3 497 15 725 748 15 729 245 女 3 072 16 795 959 16 799 031 总计6 56932 521 70732 528 276828.1063.627075213256960317991624572915)748725150723959795164973(276528322≥≈⨯⨯⨯⨯-⨯⨯=k ,所以有99%的把握认为性别与是否为聋哑人有关. 16 解:(1)作散点图,如图:由散点图可知,y 与x 呈线性相关关系, ,5,4==y x ∑==51290i ix,∑==513.112i i i y x ,所以23.1103.1245905453.112ˆ2==⨯-⨯⨯-=b, 08.0423.15ˆˆ=⨯-=-=x b y a. 所以线性回归方程为yˆ=1.23x +0.08. (2)当x =10年时,yˆ=1.23×10+0.08=12.3+0.08=12.38(万元), 即估计使用10年时,维护费用是12.38万元.17 解:(1)散点图如图所示,从散点图可以看出y 与x 不具有线性相关关系.根据已有知识发现样本点分布在函数a xby +=的图象的周围,其中a,b 为待定参数.设y y xx ='=',1,由已知数据制成下表:序号i x i ′ y i ′ x i ′2 y i ′2 x i ′y i ′ 1 2 64 4 4 096 128 2 4 138 16 19 044 552 3 6 205 36 42 025 1 230 4 8 285 64 81 225 2 280 5 10 360 100 129 600 3 600 ∑301 052220275 9907 7904.210,6='='y x , 故∑=='-'5122405i i x x ,∑=='-'51222.649545i iy y ,计算知b =36.95,a =210.4-36.95×6=-11.3, 所以y′=-11.3+36.95x′. 所求y 对x 的回归曲线方程为3.1195.36-=xy . (2)当x =10时,605.73.111095.36-=-=y . 18 解:(1)散点图如图:(2)采用列表的方法计算aˆ与回归系数b ˆ.50.998.566,5.171056≈⨯==⨯=y x , 183.05.176275250.95.1767.0771ˆ2≈⨯-⨯⨯-=b , 30.65.17183.050.9ˆ≈⨯-=a, y 对x 的回归直线方程为yˆ=6.30+0.183x. (3)当质量为27 g 时,有yˆ=6.30+0.183×27≈11.24 cm. 所以当挂物体的质量为27 kg 时,弹簧的长度大约为11.24 cm.。
(必考题)高中数学高中数学选修2-3第三章《统计案例》检测(含答案解析)

一、选择题1.以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,其变换后得到线性回归方程0.53z x =+,则c =( ) A .3B .3eC .0.5D .0.5e2.已知两个统计案例如下:①为了探究患肺炎与吸烟的关系,调查了339名50岁以上的人,调查结果如下表:②为了解某地母亲与女儿身高的关系,随机测得10对母女的身高如下表:则对这些数据的处理所应用的统计方法是( ) A .①回归分析,②取平均值 B .①独立性检验,②回归分析 C .①回归分析,②独立性检验D .①独立性检验,②取平均值3.假设有两个分类变量X 和Y 的22⨯列联表为:对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .5,35b d ==B .15,25b d ==C .20,20b d ==D .30,10b d ==4.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:2()P K k≥0.0500.0250.0100.0050.001k 3.841 5.024 6.6357.87910.828由以上数据,计算得到K2的观测值k≈9.643,根据临界值表,以下说法正确的是() A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关5.某中学共有5000人,其中男生3500人,女生1500人,为了了解该校学生每周平均体育锻炼时间的情况以及该校学生每周平均体育锻炼时间是否与性别有关,现在用分层抽样的方法从中收集300位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如下:附:22()=()()()()n ad bcKa cb d a d b c-++++,其中n a b c d=+++.2()P K k≥0.100.050.010.005k 2.706 3.841 6.6357.879已知在样本数据中,有60位女生的每周平均体育锻炼时间超过4小时,根据独立性检验原理,我们()A.没有理由认为“该校学生每周平均体育锻炼时间与性别有关”B.有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”C.有95%的把握认为“该校学生每周平均体育锻炼时间与性别无关”D .有99.5%的把握认为“该校学生每周平均体育锻炼时间与性别有关”6.通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘” 能做到“光盘” 男 45 10 女3015则有( )以上的把握认为“该市民能否做到‘光盘’与性别有关”,附表及公式()20P K k ≥0.100 0.050 0.010 0.001 0k 2.7063.8416.63510.828()()()()()22n ad bc K a b c d a c b d -=++++A .90%B .95%C .99%D .99.9%7.为了普及环保知识,增强环保意识,随机抽取某大学30名学生参加环保知识测试,得分如图所示,若得分的中位数为m e ,众数为m 0,平均数为x -,则( )A .m e =m 0=x -B .m 0<x -<m e C .m e <m 0<x -D .m 0<m e <x -8.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据见下表:心脏病 无心脏病 秃发 20 300 不秃发5450根据表中数据得到()277520450530015.96820750320455k ⨯⨯-⨯=≈⨯⨯⨯,因为K 2≥10.828,则断定秃发与心脏病有关系,那么这种判断出错的可能性为( ) A .0.1B .0.05C .0.01D .0.0019.给出以下四个说法:①绘制频率分布直方图时,各小长方形的面积等于相应各组的组距;②在刻画回归模型的拟合效果时,R2的值越大,说明拟合的效果越好;③设随机变量ξ服从正态分布N(4,22),则P(ξ>4)=12;④对分类变量X与Y,若它们的随机变量K2的观测值k越小,则判断“X与Y有关系”的犯错误的概率越小.其中正确的说法是()A.①④B.②③C.①③D.②④10.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力()A.平均数与方差 B.回归分析C.独立性检验 D.概率11.某中学学生会为了调查爱好游泳运动与性别是否有关,通过随机询问110名性别不同的高中生是否爱好游泳运动得到如下的列联表:由()()()()()22n ad bcka b c d a c b d-=++++并参照附表,得到的正确结论是A.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”B.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别无关”C.有99.9%的把握认为“爱好游泳运动与性别有关”D.有99.9%的把握认为“爱好游泳运动与性别无关”12.通过随机询问2016名性别不同的大学生是否爱好某项运动,得到2 6.023K=,则根据这一数据查阅表,则有把握认为“爱好该项运动与性别有关”的可信程度是()2()P K k≥…0.250.150.100.0250.0100.005…k… 1.323 2.072 2.706 5.024 6.6357.879…A.90%B.95%C.97.5%D.99.5%二、填空题13.给出下列结论:①在回归分析中,可用相关指数2R的值判断模型的拟合效果,2R越大,模型的拟合效果越好;②某工厂加工的某种钢管,内径与规定的内径尺寸之差是离散型随机变量;③随机变量的方差和标准差都反映了随机变量的取值偏离均值的平均程度,它们越小,则随机变量偏离均值的平均程度越小;④甲、乙两人向同一目标同时射击一次,事件A:“甲、乙中至少一人击中目标”与事件B:“甲、乙都没有击中目标”是相互独立事件.其中结论正确的是______.14.新闻媒体为了了解观众对央视某节目的喜爱与性别是否有关,随机调查了观看该节目的观众110名,得到如下的2×2列联表:试根据样本估计总体的思想,估计约有________的把握认为“喜爱该节目与否和性别有关”.参考附表:(参考公式:K2=()()()()()2n ad bca b c d a c b d-++++,其中n=a+b+c+d)15.某市电信宽带私人用户月收费标准如下表:假定每月初可以和电信部门约定上网方案.若某用户每月上网时间为66小时,应选择__________方案最合算.16.下列是某厂1~4月份用水量(单位:百吨)的一组数据,由其散点图可知,用水量y与月份x 之间有较好的线性相关关系,其线性回归方程是=﹣0.7x+,则= . 月 份x 1 2 3 4 用水量y4.5432.517.为了判断高中二年级学生是否喜欢足球运动与性别的关系,现随机抽取50名学生,得到22⨯列联表:喜欢 不喜欢 总计 男 15 10 25 女520 25 总计 203050(参考公式22()()()()()n ad bc k a b c d a c b d -=++++,()n a b c d =+++)20()P K k ≥ 0.010 0.005 0.0010k 6.635 7.879 10.828则有___________以上的把握认为“喜欢足球与性别有关”.18.为了判断高中三年级学生选修文理科是否与性别有关,现随机抽取50名学生,得到2×2列联表:理科 文科 总计 男 13 10 23 女 7 20 27 总计203050已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025.根据表中数据,得到≈4.844,则认为选修文理科与性别有关系出错的可能性约为________. 19.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,1,1,3b x y ===则1a =.正确的序号是________________.20.已知下列命题:①从匀速传递的产品生产流水线上,质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样;②两个变量的线性相关程度越强,则相关系数的值越接近于1;③两个分类变量X 与Y 的观测值2k ,若2k 越小,则说明“X 与Y 有关系”的把握程度越大;④随机变量X ~(0,1)N ,则(1)2(1)1P X P X <=<-. 其中为真命题的是__________.三、解答题21.为研究男、女生的身高差异,现随机从高三某班选出男生、女生各10人,并测量他们的身高,测量结果如下(单位:厘米): 男:173 178 174 185 170 169 167 164 161 170 女:165 166 156 170 163 162 158 153 169 172(1)根据测量结果完成身高的茎叶图(单位:厘米),并分别求出男、女生身高的平均值;(2)请根据测量结果得到20名学生身高的中位数h (单位:厘米),将男、女生身高不低于h 和低于h 的人数填入下表中,并判断是否有90%的把握认为男、女生身高有差异? 人数 男生 女生身高h ≥ 身高h <参照公式:()()()()()22n ad bc k a b c d a c b d -=++++()20P K k ≥ 0.100.05 0.025 0.010 0.005 0.001 0k2.7063.8415.0246.6357.87910.828175厘米为偏高.采用分层抽样的方法从以上男生中抽取5人作为样本.若从样本中任取2人,试求恰有1人身高属于正常的概率.22.某实验学校为提高学习效率,开展学习方式创新活动,提出了完成某项学习任务的两种新的学习方式.为比较两种学习方式的效率,选取40名学生,将他们随机分成两组,每组20人,第一组学生用第一种学习方式,第二组学生用第二种学习方式.40名学生完成学习任务所需时间的中位数40min m =,并将完成学习任务所需时间超过min m 和不超过min m 的学生人数得到下面的列联表:(Ⅰ)估计第一种学习方式且不超过m 的概率、第二种学习方式且不超过m 的概率; (Ⅱ)能否有99%的把握认为两种学习方式的效率有差异?附:()()()()()22n ad bc K a b c d a c b d -=++++,23.某科研小组为了验证一种治疗新冠肺炎的新药的效果,选60名患者服药一段时间后,记录了这些患者的生理指标x 和y 的数据,并统计得到如下的22⨯列联表(不完整):在生理指标 1.8x >的人中,设A 组为生理指标65y ≤的人,B 组为生理指标65y >的人,将他们服用这种药物后的康复时间(单位:天)记录如下: A 组:10,11,12,13,14,15,16,17,19. B 组:12,13,14,15,16,17,20,21,25.(1)填写上表,并判断是否有95%95%的把握认为患者的两项生理指标x 和y 有关系; (2)从A ,B 两组人中随机各选1人,A 组选出的人记为甲,B 组选出的人记为乙,求乙的康复时间比甲的康复时间长的概率.附:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.)20k0.2524.在第十五次全国国民阅读调查中,某地区调查组获得一个容量为200的样本,其中城镇居民150人,农村居民50人,在这些居民中,经常阅读的城镇居民100人,农村居民24人.(1)完成上面2×2列联表,并判断是否有95%的把握认为经常阅读与居民居住地有关?(2)从该地区居民城镇的居民中,随机抽取5位居民参加一次阅读交流活动,记这5位居民中经常阅读的人数为X,若用样本的频率作为概率,求随机变量X的分布列和期望.附:K2=2()()()()()n ad bca b c d a c b d-++++,其中n=a+b+c+d.25.某足球运动员进行射门训练,若打进球门算成功,否则算失败.已知某天该球员射门成功次数与射门距离的统计数据如下:(1)请问是否有90%的把握认为该球员射门成功与射门距离是否超过30米有关?参考公式及数据:22(),()()()()n ad bc K n a b c d a b c d a c b d -==+++++++.(2)当该球员距离球门30米射门时,设射门角(射门点与球场底线中点的连线和底线所成的锐角或直角)为([0,])2πθθ∈,其射门成功率为2+3()cos sin 4f θθθθθ=+⋅-,求该球员射门成功率最高时射门角θ的值.26.已知某种新型病毒的传染能力很强,给人们生产和生活带来很大的影响,所以创新研发疫苗成了当务之急.为此,某药企加大了研发投入,市场上这种新型冠状病毒的疫苗A 的研发费用x (百万元)和销量y (万盒)的统计数据如下:(1)根据上表中的数据,建立y 关于x 的线性回归方程y bx a =+(用分数表示); (2)根据所求的回归方程,估计当研发费用为1600万元时,销售量为多少?参考公式:()()()1122211nniii i i i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】根据指对数互化求解即可. 【详解】解:因为0.53z x =+,ln z y =,所以0.53ln x y +=,所以0.5330.5x x y e e e +==⨯,故3c e=.故选:B.【点睛】本题考查非线性回归问题的转化,是基础题.2.B解析:B【分析】根据独立性检验和回归分析的概念,即可作出判定,得到答案.【详解】由题意,独立性检验通常是研究两个分类变量之间是否有关系,所以①采用独立性检验,回归分析通常是研究两个具有相关关系的变量的相关程度,②采用回归分析,综上可知①是独立性检验,②是回归分析,故选B.【点睛】本题主要考查了独立性检验和回归分析的概念及其判定,其中解答中熟记独立性检验和回归分析的概念是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.3.D解析:D【解析】【分析】根据公式()()()()()22n ad bcKa b c d a c b d-=++++,分别利用4个选项中所给数据求出2K的值,比较所求值的大小即可得结果.【详解】选项A:22160(535155)3204010502K⨯⨯-⨯==⨯⨯⨯,选项B:22260(5251515)152040204016K⨯⨯-⨯==⨯⨯⨯,选项C:22360(5201520)24204025357K⨯⨯-⨯==⨯⨯⨯,选项D:22 460(5101530)96 204035257K⨯⨯-⨯==⨯⨯⨯,可得222431K K K>>22K>,所以由选项D中的数据得到的2K值最大,说明X与Y有关系的可能性最大,故选D.【点睛】本题主考查独立性检验的基本性质,意在考查对基本概念的理解与应用,属于基础题.解答独立性检验问题时,要注意应用2K越大两个变量有关的可能性越大这一性质.4.D解析:D【解析】【分析】由题意结合独立性检验的结论和临界值表给出结论即可.【详解】根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.本题选择D选项.【点睛】本题主要考查独立性检验的思想及其应用等知识,意在考查学生的转化能力和计算求解能力.5.B解析:B【解析】分析:根据题设收集的数据,得到男生学生的人数,进而得出22⨯的列联表,利用计算公式,求解2K的值,即可作出判断.详解:由题意得,从5000人中,其中男生3500人,女生1500人,抽取一个容量为300人的样本,其中男女各抽取的人数为35003002105000⨯=人,1500300905000⨯=人,又由频率分布直方图可知,每周体育锻炼时间超过4小时的人数的频率为0.75,所以在300人中每周体育锻炼时间超过4小时的人数为3000.75225⨯=人,又在每周体育锻炼时间超过4小时的人数中,女生有60人,所以男生有22560165-=人,可得如下的22⨯的列联表:结合列联表可算得22300(456016530)4.762 3.8412109075225K⨯⨯-⨯=≈>⨯⨯⨯,所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”,故选B.点睛:本题主要考查了独立性检验的基础知识的应用,其中根据题设条件得到男女生的人数,得出22⨯的列联表,利用公式准确计算是解答的关键,着重考查了分析问题和解答问题的能力.6.A解析:A【解析】分析:根据列联表中数据代入公式计算k 的值,和临界值表比对后即可得到答案. 详解:将列联表中数据代入公式可得()210045153010 3.030 2.70675255545k ⨯⨯-⨯=≈>⨯⨯⨯,所以有0090的把握认为“该市居民能否做到‘光盘’”与性别有关.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)7.D解析:D 【解析】由条形图知,30名学生的得分情况依次为2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分,中位数为第15,16个数(分别为5,6)的平均数,即m e =5.5,5出现的次数最多,故众数为m 0=5,平均数为x =130(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97,故m 0<m e <x . 故答案为D.点睛:这个题目考查的是条型分布直方表的应用,以及基本量:均值,平均数的考查;一般在这类图中平均数就是将数据加到一起除以数据的个数即可,在频率分布直方表中是取每个长方条的中点乘以相应的频率并相加即可.8.D解析:D 【解析】010.828,10.0010.99999.90k ≥∴-==,则有0099.9以上的把握认为秃发与患心脏病有关,故这种判断出错的可能性为10.9990.001-=,故选D.【方法点睛】本题主要考查独立性检验的实际应用,属于难题.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)9.B解析:B 【解析】①中各小长方形的面积等于相应各组的频率;②正确,相关指数R 2越大,拟合效果越好,R 2越小,拟合效果越差;③随机变量ξ服从正态分布N (4,22),正态曲线对称轴为x =4,所以P (ξ>4)=;④对分类变量X 与Y ,若它们的随机变量K 2的观测值k 越小,则说明“X 与Y 有关系”的犯错误的概率越大.故选B.10.C解析:C【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C. 考点:独立性检验的意义.11.A解析:A 【解析】()22110403020207.8 6.63560506050k ⨯-⨯=≈>⨯⨯⨯,所以有99%的把握认为“爱好游泳运动与性别有关”,所以在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”12.C解析:C 【解析】因为2 6.023K =,且5.024 6.023 6.635≤≤,所以有把握认为“爱好该项运动与性别有关”的可信度P 满足10.02510.010P -≤≤-,即0.9750.99P ≤≤,应选答案C 。
数学人教A版选修2-3本章解说:第三章统计案例 含解析

第三章统计案例
本章解说
知识概要
在现实生活中,我们经常会遇到类似下面的问题:肺癌是严重威胁人类生命的一种疾病,吸烟与患肺癌有关系吗?
肥胖是影响人类健康的一个重要因素,身高与体重之间是否存在线性相关关系?等等. 为了回答这些问题,必须明确问题涉及的对象(总体)是什么,用怎样的量来描述要解决的问题,并确定获取变量值(数据)的方法.然后用恰当的方法分析数据,以得到最可靠的结论.
在必修模块中,我们学习过关于抽样,用样本估计总体,线性回归等基础知识.本章中,我们将在此基础上,通过对典型案例的讨论,进一步讨论线性回归分析方法及其应用,并初步了解独立性检验的基本思想,认识统计方法在决策中的作用.
1.本章的主要内容有随机误差、残差、残差分析、列联表及独立性检验等概念.
2.用残差分析、判断线性回归模型的拟合效果.
3.建立回归模型的基本步骤.
4.通过对典型案例的研究,了解回归的基本思想、方法及初步应用.
5.通过对典型案例的研究,了解独立性检验的基本思想、方法及初步应用.
6.根据题目所给的列联表判断结论的可能性.
学法指导
1.在实际问题中,经常会面临需要推断的问题.比如研制出一种新药,需要推断此药是否有效?有人怀疑吸烟的人更易患肺癌,那么吸烟是否与患肺癌有关呢?等等.在对类似的问题作出推断时,我们不能仅凭主观意愿作出结论,需要通过试验来收集数据,并依据独立性检验的原理作出合理的推断.
2.统计方法是可能犯错误的:不管是回归分析还是独立性检验,得出的结论都可能犯错误,好的统计方法就是要尽量降低犯错误的概率,比如在推断吸烟与患肺癌是否有关时,通过收集数据、整理分析数据得到“吸烟与患肺癌有关”的结论,而且这个结论出错的概率在0.01以下.实际上,这是统计思维与确定性思维差异的反应.。
人教版高中数学(选修2-3)第三章统计案例单元测试题

A.52 54
B.54 52
C.94 146
D.146 94
答案 A
解析 由 a+21= 73,得 a= 52, a+ 2=b,得 b=54. 故选 A.
∧
7.设有一个回归方程为 y= 3- 5x,则变量 x 增加一个单位时 ( )
A.y 平均增加 3 个单位
B.y 平均减少 5 个单位
C.y 平均增加 5 个单位
B.v= log 1 t 2
D.v= 2t - 2
答案 C
解析 先画出散点图,利用散点图直观认ຫໍສະໝຸດ 变量间的关系,可选出较合适的模型为
C,或
将数据代入所给选项进行验证.
5.对于一组具有线性相关关系的数据 ( x1, y1) , ( x2, y2) ,…, ( xn, yn) ,其回归方程中
的截距为 (
)
C.(0 , y )
D.( x , y )
答案 D
解析 回归直线方程一定过样本点的中心 ( x , y ) .故选 D.
11.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是
A.总偏差平方和 C.回归平方和
B.残差平方和 D .相关指数 R2
答案 B
()
∧∧
n∧
2
解析 yi - y= ei , e i 为残差平方和.故选 B.
答案 A
解析 求出样本中心 ( x , y ) 代入选项检验知选 A.
4.今有一组实验数据如下:
t 1.99 3.0
4.0 5.1 6.12
v 1.5
4.04 7.5 12 18.01
现准备用下列函数中的一个近似地表示这些数据满足的规律,其中最接近的一个是
()
人教A版高中数学选修2-3全册同步练习及单元检测含答案

⼈教A版⾼中数学选修2-3全册同步练习及单元检测含答案⼈教版⾼中数学选修2~3 全册章节同步检测试题⽬录第1章《计数原理》同步练习 1.1测试1第1章《计数原理》同步练习 1.1测试2第1章《计数原理》同步练习 1.1测试3第1章《计数原理》同步练习 1.2排列与组合第1章《计数原理》同步练习 1.3⼆项式定理第1章《计数原理》测试(1)第1章《计数原理》测试(2)第2章同步练习 2.1离散型随机变量及其分布列第2章同步练习 2.2⼆项分布及其应⽤第2章测试(1)第2章测试(2)第2章测试(3)第3章练习 3.1回归分析的基本思想及其初步应⽤第3章练习 3.2独⽴性检验的基本思想及其初步应⽤第3章《统计案例》测试(1)第3章《统计案例》测试(2)第3章《统计案例》测试(3)1. 1分类加法计数原理与分步乘法计数原理测试题⼀、选择题1.⼀件⼯作可以⽤2种⽅法完成,有3⼈会⽤第1种⽅法完成,另外5⼈会⽤第2种⽅法完成,从中选出1⼈来完成这件⼯作,不同选法的种数是()A.8 B.15C.16 D.30答案:A2.从甲地去⼄地有3班⽕车,从⼄地去丙地有2班轮船,则从甲地去丙地可选择的旅⾏⽅式有()A.5种B.6种C.7种D.8种答案:B3.如图所⽰为⼀电路图,从A 到B 共有()条不同的线路可通电()A.1 B.2 C.3 D.4答案:D4.由数字0,1,2,3,4可组成⽆重复数字的两位数的个数是()A.25 B.20 C.16 D.12答案:C5.李芳有4件不同颜⾊的衬⾐,3件不同花样的裙⼦,另有两套不同样式的连⾐裙.“五⼀”节需选择⼀套服装参加歌舞演出,则李芳有()种不同的选择⽅式()A.24 B.14 C.10 D.9答案:B 6.设A ,B 是两个⾮空集合,定义{}()A B a b a A b B *=∈∈,,|,若{}{}0121234P Q ==,,,,,,,则P *Q 中元素的个数是()A.4 B.7 C.12 D.16答案:C⼆、填空题7.商店⾥有15种上⾐,18种裤⼦,某⼈要买⼀件上⾐或⼀条裤⼦,共有种不同的选法;要买上⾐,裤⼦各⼀件,共有种不同的选法.答案:33,2708.⼗字路⼝来往的车辆,如果不允许回头,共有种⾏车路线.答案:129.已知{}{}0341278a b ∈∈,,,,,,,则⽅程22()()25x a y b -+-=表⽰不同的圆的个数是.答案:1210.多项式123124534()()()()a a a b b a a b b ++++++··展开后共有项.答案:1011.如图,从A →C ,有种不同⾛法.答案:612.将三封信投⼊4个邮箱,不同的投法有种.答案:34三、解答题 13.⼀个⼝袋内装有5个⼩球,另⼀个⼝袋内装有4个⼩球,所有这些⼩球的颜⾊互不相同.(1)从两个⼝袋内任取⼀个⼩球,有多少种不同的取法?(2)从两个⼝袋内各取⼀个⼩球,有多少种不同的取法?解:(1)549N =+=种;(2)5420N =?=种.14.某校学⽣会由⾼⼀年级5⼈,⾼⼆年级6⼈,⾼三年级4⼈组成.(1)选其中1⼈为学⽣会主席,有多少种不同的选法?(2)若每年级选1⼈为校学⽣会常委,有多少种不同的选法?(3)若要选出不同年级的两⼈参加市⾥组织的活动,有多少种不同的选法?解:(1)56415N =++=种;(2)564120N =??=种;(3)56644574N =?+?+?=种15.已知集合{}321012()M P a b =---,,,,,,,是平⾯上的点,a b M ∈,.(1)()P a b ,可表⽰平⾯上多少个不同的点?(2)()P a b ,可表⽰多少个坐标轴上的点?解:(1)完成这件事分为两个步骤:a 的取法有6种,b 的取法也有6种,∴P 点个数为N =6×6=36(个);(2)根据分类加法计数原理,分为三类:①x 轴上(不含原点)有5个点;②y 轴上(不含原点)有5个点;③既在x 轴,⼜在y 轴上的点,即原点也适合,∴共有N =5+5+1=11(个).1. 1分类加法计数原理与分步乘法计数原理测试题⼀、选择题 1.从集合{ 0,1,2,3,4,5,6}中任取两个互不相等的数a ,b 组成复数a bi +,其中虚数有() A .30个 B .42个 C .36个 D .35个答案:C2.把10个苹果分成三堆,要求每堆⾄少1个,⾄多5个,则不同的分法共有() A .4种 B .5种 C .6种 D .7种答案:A3.如图,⽤4种不同的颜⾊涂⼊图中的矩形A ,B ,C ,D 中,要求相邻的矩形涂⾊不同,则不同的涂法有() A .72种 B .48种 C .24种 D .12种答案:A4.教学⼤楼共有五层,每层均有两个楼梯,由⼀层到五层的⾛法有() A .10种 B .52种C.25种D.42种答案:D5.已知集合{}{}023A B x x ab a b A ===∈,,,,,|,则B 的⼦集的个数是()A.4 B.8 C.16 D.15答案:C6.三边长均为正整数,且最⼤边长为11的三⾓形的个数为()A.25 B.26 C.36 D.37答案:C⼆、填空题7.平⾯内有7个点,其中有5个点在⼀条直线上,此外⽆三点共线,经过这7个点可连成不同直线的条数是.答案:128.圆周上有2n 个等分点(1n >),以其中三个点为顶点的直⾓三⾓形的个数为.答案:2(1)n n -9.电⼦计算机的输⼊纸带每排有8个穿孔位置,每个穿孔位置可穿孔或不穿孔,则每排可产⽣种不同的信息.答案:25610.椭圆221x y m n+=的焦点在y 轴上,且{}{}123451234567m n ∈∈,,,,,,,,,,,,则这样的椭圆的个数为.答案:20 11.已知集合{}123A ,,ü,且A 中⾄少有⼀个奇数,则满⾜条件的集合A 分别是.答案:{}{}{}{}{}13122313,,,,,,,12.整数630的正约数(包括1和630)共有个.答案:24三、解答题 13.⽤0,1,2,3,4,5六个数字组成⽆重复数字的四位数,⽐3410⼤的四位数有多少个?解:本题可以从⾼位到低位进⾏分类.(1)千位数字⽐3⼤.(2)千位数字为3:①百位数字⽐4⼤;②百位数字为4: 1°⼗位数字⽐1⼤;2°⼗位数字为1→个位数字⽐0⼤.所以⽐3410⼤的四位数共有2×5×4×3+4×3+2×3+2=140(个).14.有红、黄、蓝三种颜⾊旗⼦各(3)n n >⾯,任取其中三⾯,升上旗杆组成纵列信号,可以有多少种不同的信号?若所升旗⼦中不允许有三⾯相同颜⾊的旗⼦,可以有多少种不同的信号?若所升旗⼦颜⾊各不相同,有多少种不同的信号?解: 1N =3×3×3=27种; 227324N =-=种; 33216N =??= 种.15.某出版社的7名⼯⼈中,有3⼈只会排版,2⼈只会印刷,还有2⼈既会排版⼜会印刷,现从7⼈中安排2⼈排版,2⼈印刷,有⼏种不同的安排⽅法.解:⾸先分类的标准要正确,可以选择“只会排版”、“只会印刷”、“既会排版⼜会印刷”中的⼀个作为分类的标准.下⾯选择“既会排版⼜会印刷”作为分类的标准,按照被选出的⼈数,可将问题分为三类:第⼀类:2⼈全不被选出,即从只会排版的3⼈中选2⼈,有3种选法;只会印刷的2⼈全被选出,有1种选法,由分步计数原理知共有3×1=3种选法.第⼆类:2⼈中被选出⼀⼈,有2种选法.若此⼈去排版,则再从会排版的3⼈中选1⼈,有3种选法,只会印刷的2⼈全被选出,有1种选法,由分步计数原理知共有2×3×1=6种选法;若此⼈去印刷,则再从会印刷的2⼈中选1⼈,有2种选法,从会排版的3⼈中选2⼈,有3种选法,由分步计数原理知共有2×3×2=12种选法;再由分类计数原理知共有6+12=18种选法.第三类:2⼈全被选出,同理共有16种选法.所以共有3+18+16=37种选法.1. 1 分类加法计数原理与分步乘法计数原理综合卷⼀.选择题:1.⼀个三层书架,分别放置语⽂书12本,数学书14本,英语书11本,从中取出⼀本,则不同的取法共有()(A ) 37种(B ) 1848种(C ) 3种(D ) 6种2.⼀个三层书架,分别放置语⽂书12本,数学书14本,英语书11本,从中取出语⽂、数学、英语各⼀本,则不同的取法共有()(A ) 37种(B ) 1848种(C ) 3种(D ) 6种3.某商业⼤厦有东南西3个⼤门,楼内东西两侧各有2个楼梯,从楼外到⼆楼的不同⾛法种数是()(A ) 5 (B )7 (C )10 (D )124.⽤1、2、3、4四个数字可以排成不含重复数字的四位数有()(A )265个(B )232个(C )128个(D )24个5.⽤1、2、3、4四个数字可排成必须含有重复数字的四位数有()(A )265个(B )232个(C )128个(D )24个6.3科⽼师都布置了作业,在同⼀时刻4名学⽣都做作业的可能情况有()(A )43种(B )34种(C )4×3×2种(D ) 1×2×3种7.把4张同样的参观券分给5个代表,每⼈最多分⼀张,参观券全部分完,则不同的分法共有()(A )120种(B )1024种(C )625种(D )5种8.已知集合M={l ,-2,3},N={-4,5,6,7},从两个集合中各取⼀个元素作为点的坐标,则这样的坐标在直⾓坐标系中可表⽰第⼀、⼆象限内不同的点的个数是()(A )18 (B )17 (C )16 (D )109.三边长均为整数,且最⼤边为11的三⾓形的个数为()(A )25 (B )36 (C )26 (D )3710.如图,某城市中,M 、N 两地有整齐的道路⽹,若规定只能向东或向北两个⽅向沿途中路线前进,则从M 到N 不同的⾛法共有()(A )25 (B )15 (C)13 (D )10 ⼆.填空题:11.某书店有不同年级的语⽂、数学、英语练习册各10本,买其中⼀种有种⽅法;买其中两种有种⽅法.12.⼤⼩不等的两个正⽅形玩具,分别在各⾯上标有数字1,2,3,4,5,6,则向上的⾯标着的两个数字之积不少于20的情形有种.13.从1,2,3,4,7,9中任取不相同的两个数,分别作为对数的底数和真数,可得到个不同的对数值.14.在连结正⼋边形的三个顶点组成的三⾓形中,与正⼋边形有公共边的有个.15.某班宣传⼩组要出⼀期向英雄学习的专刊,现有红、黄、⽩、绿、蓝五种颜⾊的粉笔供选⽤,要求在⿊板中A 、B 、C 、D 每⼀部分只写⼀种颜⾊,如图所⽰,相邻两块颜⾊不同,则不同颜⾊的书写⽅法共有种.三.解答题:16.现由某校⾼⼀年级四个班学⽣34⼈,其中⼀、⼆、三、四班分别为7⼈、8⼈、9⼈、10⼈,他们⾃愿组成数学课外⼩组.(1)选其中⼀⼈为负责⼈,有多少种不同的选法?(2)每班选⼀名组长,有多少种不同的选法?(3)推选⼆⼈做中⼼发⾔,这⼆⼈需来⾃不同的班级,有多少种不同的选法?17.4名同学分别报名参加⾜球队,蓝球队、乒乓球队,每⼈限报其中⼀个运动队,不同的报名⽅法有⼏种?[探究与提⾼]1.甲、⼄两个正整数的最⼤公约数为60,求甲、⼄两数的公约数共有多个?2.从{-3,-2,-1,0,l,2,3}中,任取3个不同的数作为抛物线⽅程y=ax2+bx+c(a≠0)的系数,如果抛物线过原点,且顶点在第⼀象限,这样的抛物线共有多少条?3.电视台在“欢乐今宵”节⽬中拿出两个信箱,其中存放着先后两次竞猜中成绩优秀的群众来信,甲信箱中有30封,⼄信箱中有20封.现由主持⼈抽奖确定幸运观众,若先确定⼀名幸运之星,再从两信箱中各确定⼀名幸运伙伴,有多少种不同的结果?综合卷1.A 2.B 3.D 4.D 5.B 6.B 7.D 8.B 9.B 10.B11.30;300 12.513.17 14.40 15.1801. 2排列与组合1、排列综合卷1.90×9l ×92×……×100=()(A )10100A (B )11100A (C )12100A (D )11101A 2.下列各式中与排列数mn A 相等的是()(A )!(1)!-+n n m (B )n(n -1)(n -2)……(n -m) (C )11m n nA n m --+ (D )111m n n A A --3.若 n ∈N 且 n<20,则(27-n )(28-n)……(34-n)等于()(A )827n A - (B )2734nn A -- (C )734n A - (D )834n A -4.若S=123100123100A A A A ++++,则S 的个位数字是()(A )0 (B )3 (C )5 (D )85.⽤1,2,3,4,5这五个数字组成没有重复数字的三位数,其中偶数共有()(A )24个(B )30个(C )40个(D )60个6.从0,l ,3,5,7,9中任取两个数做除法,可得到不同的商共有()(A )20个(B )19个(C )25个(D )30个7.甲、⼄、丙、丁四种不同的种⼦,在三块不同⼟地上试种,其中种⼦甲必须试种,那么不同的试种⽅法共有()(A )12种(B )18种(C )24种(D )96种8.某天上午要排语⽂、数学、体育、计算机四节课,其中体育不排在第⼀节,那么这天上午课程表的不同排法共有()(A )6种(B )9种(C )18种(D )24种9.有四位司机、四个售票员组成四个⼩组,每组有⼀位司机和⼀位售票员,则不同的分组⽅案共有()(A )88A 种(B )48A 种(C )44A ·44A 种(D )44A 种10.有4位学⽣和3位⽼师站在⼀排拍照,任何两位⽼师不站在⼀起的不同排法共有()(A )(4!)2种(B )4!·3!种(C )34A ·4!种(D )3 5A ·4!种11.把5件不同的商品在货架上排成⼀排,其中a ,b 两种必须排在⼀起,⽽c ,d 两种不能排在⼀起,则不同排法共有()(A )12种(B )20种(C )24种(D )48种⼆.填空题::12.6个⼈站⼀排,甲不在排头,共有种不同排法.13.6个⼈站⼀排,甲不在排头,⼄不在排尾,共有种不同排法.14.五男⼆⼥排成⼀排,若男⽣甲必须排在排头或排尾,⼆⼥必须排在⼀起,不同的排法共有种.15.将红、黄、蓝、⽩、⿊5种颜⾊的⼩球,分别放⼊红、黄、蓝、⽩、⿊5种颜⾊的⼝袋中,但红⼝袋不能装⼊红球,则有种不同的放法.16.(1)有5本不同的书,从中选3本送给3名同学,每⼈各⼀本,共有种不同的送法;(2)有5种不同的书,要买3本送给3名同学,每⼈各⼀本,共有种不同的送法.三、解答题:17.⼀场晚会有5个唱歌节⽬和3个舞蹈节⽬,要求排出⼀个节⽬单(1)前4个节⽬中要有舞蹈,有多少种排法?(2)3个舞蹈节⽬要排在⼀起,有多少种排法?(3)3个舞蹈节⽬彼此要隔开,有多少种排法?18.三个⼥⽣和五个男⽣排成⼀排.(1)如果⼥⽣必须全排在⼀起,有多少种不同的排法?(2)如果⼥⽣必须全分开,有多少种不同的排法?(3)如果两端都不能排⼥⽣,有多少种不同的排法?(4)如果两端不能都排⼥⽣,有多少种不同的排法?(5)如果三个⼥⽣站在前排,五个男⽣站在后排,有多少种不同的排法?综合卷1.B 2.D 3.D 4.C 5.A 6.B 7.B 8.C 9.D 10.D 11.C12.600 13.504 14.480 15.9616.(1) 60;(2) 12517.(1) 37440;(2) 4320;(3) 1440018.(1) 4320;(2) 14400;(3) 14400;(4) 36000;(5) 7202、组合综合卷⼀、选择题:1.下列等式不正确的是()(A )!!()!mn n C m n m =- (B )11mm n n m C C n m++=- (C )1111m m n n m C C n +++=+ (D )11m m n n C C ++= 2.下列等式不正确的是()(A )m n m n n C C -= (B )11m m mm m m C C C -++=(C )123455555552C C C C C ++++= (D )11 111m m m m n n n n C C C C --+--=++3.⽅程2551616x x x C C --=的解共有()(A )1个(B )2个(C )3个(D )4个4.若372345n n n C A ---=,则n 的值是()(A )11 (B )12 (C )13 (D )145.已知7781n n n C C C +-=,那么n 的值是()(A )12 (B )13 (C )14 (D )15 6.从5名男⽣中挑选3⼈,4名⼥⽣中挑选2⼈,组成⼀个⼩组,不同的挑选⽅法共有()(A )3254C C 种(B ) 3254C C 55A 种(C ) 3254A A 种(D ) 3254A A 55A 种7.从4个男⽣,3个⼥⽣中挑选4⼈参加智⼒竞赛,要求⾄少有⼀个⼥⽣参加的选法共有()(A )12种(B )34种(C )35种(D )340种8.平⾯上有7个点,除某三点在⼀直线上外,再⽆其它三点共线,若过其中两点作⼀直线,则可作成不同的直线()(A )18条(B )19条(C )20条(D )21条9.在9件产品中,有⼀级品4件,⼆级品3件,三级品2件,现抽取4个检查,⾄少有两件⼀级品的抽法共有()(A )60种(B )81种(C )100种(D )126种10.某电⼦元件电路有⼀个由三节电阻串联组成的回路,共有6个焊点,若其中某⼀焊点脱落,电路就不通.现今回路不通,焊点脱落情况的可能有()(A )5种(B )6种(C )63种(D )64种⼆.填空题:11.若11m m n n C xC --=,则x= .12.三名教师教六个班的课,每⼈教两个班,分配⽅案共有种。
数学教案 人教a版选修2_3 同步练习-第3章统计案例跟踪训练含解析

回归分析的基本思想及其初步应用[A 组 学业达标]1.下列两个变量之间的关系不是函数关系的是( ) A .角度和它的余弦值 B .正方形的边长和面积 C .正n 边形的边数和内角度数和 D .人的年龄和身高解析:函数关系就是一种变量之间的确定性的关系.A ,B ,C 三项中的两个变量之间都是函数关系,可以写出相应的函数表达式,分别为f(θ)=cos θ,g(a)=a 2,h(n)=nπ-2π.D 选项中的两个变量之间不是函数关系,对于年龄确定的人群,仍可以有不同的身高.故选D.答案:D2.设一个线性回归方程为y ^=2-1.5x ,则变量x 增加一个单位时( ) A.y ^平均增加1.5个单位 B.y ^平均增加2个单位 C.y ^平均减少1.5个单位 D.y ^平均减少2个单位解析:由线性回归方程y ^=2-1.5x 中x 的系数为-1.5,知C 项正确. 答案:C 3.有下列数据:x 1 2 3 y35.9912.01A .y =3×2x -1B .y =log 2xC .y =3xD .y =x 2解析:当x =1,2,3时,分别代入求y 值,离y 最近的值模拟效果最好,可知A 模拟效果最好. 答案:A4.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=-2.756x +7.325.②y 与x 负相关且y ^=3.476x +5.648 ③y 与x 正相关且y ^=-1.226x -6.578 ④y 与x 正相关且y ^=8.967x +8.163 其中一定不正确的结论的序号是( ) A .①② B .②③ C .③④D .①④解析:根据题意,依次分析4个结论:对于①,y 与x 负相关且y ^=-2.756x +7.325,此结论正确,线性回归方程符合负相关的特征; 对于②,y 与x 负相关且y ^=3.476x +5.648,此结论错误,由线性回归方程知,此两变量的关系是正相关;对于③,y 与x 正相关且y ^=-1.226x -6.578,此结论错误,由线性回归方程知,此两变量的关系是负相关;对于④,y 与x 正相关且y ^=8.967x +8.163,此结论正确,线性回归方程符合正相关的特征;故②③一定错误.答案:B5.对具有线性相关关系的变量x ,y ,测得一组数据如下表:x 2 4 5 6 8 y2040607080根据上表,利用最小二乘法得它们的回归直线方程为y ^=10.5x +a ^,据此模型来预测当x =20时,y 的估计值为________.解析:由已知得x -=5,y -=54,则(5,54)满足回归直线方程y ^=10.5x +a ^,解得a ^=1.5,因此y ^=10.5x +1.5,当x =20时y ^=10.5×20+1.5=211.5.答案:211.56.如图是x 和y 的一组样本数据的散点图,去掉一组数据________后,剩下的4组数据的相关指数最大.解析:去掉D(3,10)这一组数据后,其他4组数据对应的点都集中在某一条直线附近,即两变量的线性相关性最强,此时相关指数最大.答案:D(3,10)7.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线y =ebx +a的周围,令z =ln y ,求得回归直线方程为z ^=0.25x -2.58,则该模型的回归方程为____________________.解析:由z =ln y ,z ^=0.25x -2.58, 得ln y ^=0.25x -2.58,∴y ^=e 0.25x -2.58. 故该模型的回归方程为y ^=e 0.25x -2.58. 答案:y ^=e 0.25x -2.588.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程y =b x +a ,其中b =0.76,a =y -b x .据此估计,求社区一户年收入为15万元的家庭的年支出.解析:由题意可得x -=15×(8.2+8.6+10.0+11.3+11.9)=10,y -=15×(6.2+7.5+8.0+8.5+9.8)=8,可得a ^=8-0.76×10=0.4. ∴回归直线方程为y ^=0.76x +0.4.把x =15代入可得y ^=0.76×15+0.4=11.8.故社区一户年收入为15万元的家庭的年支出为11.8万元.9.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求线性回归方程y =b x +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解析:(1)x -=8+8.2+8.4+8.6+8.8+96=8.5,y -=16(90+84+83+80+75+68)=80,∵b ^=-20,a ^=y --b ^ x -, ∴a ^=80+20×8.5=250, ∴线性回归方程y ^=-20x +250;(2)设工厂获得的利润为L 元,则L =x(-20x +250)-4(-20x +250)=-20⎝⎛⎭⎪⎫x -3342+361.25,∴该产品的单价应定为8.25元,工厂获得的利润最大.[B 组 能力提升]10.对于给定的样本点所建立的模型A 和模型B ,它们的残差平方和分别是a 1,a 2,R 2的值分别为b 1,b 2,下列说法正确的是( )A .若a 1<a 2,则b 1<b 2,A 的拟合效果更好B .若a 1<a 2,则b 1<b 2,B 的拟合效果更好C .若a 1<a 2,则b 1>b 2,A 的拟合效果更好D .若a 1<a 2,则b 1>b 2,B 的拟合效果更好解析:由残差平方和以及R 2的定义式可得若a 1<a 2,则b 1>b 2,A 的拟合效果更好. 答案:C11.近10年来,某市社会商品零售总额与职工工资总额(单位:亿元)数据如下:A.y ^=2.799 1x -27.248 552 B.y ^=2.799 1x -23.548 452 C.y ^=2.699 2x -23.749 352 D.y ^=2.899 2x -23.749 452解析:x -=41.72,y -=93.23,代入验证可知B 选项正确. 答案:B12.已知方程y ^=0.85x -82.71是根据女大学生的身高预报她的体重的回归方程,其中x 的单位是cm ,y ^的单位是kg ,那么针对某个体(160,53)的残差是________.解析:将x =160代入y ^=0.85x -82.71,得y ^=0.85×160-82.71=53.29, 所以残差e ^=y -y ^=53-53.29=-0.29.答案:-0.2913.已知一个线性回归方程为y ^=1.5x +45,x ∈{1,5,7,13,19},则y -=________. 解析:∵x -=1+5+7+13+195=9,且y ^=1.5x +45, ∴y -=1.5×9+45=58.5. 答案:58.514.假设关于某种设备的使用年限x(年)与所支出的维修费用y(万元)有如表统计资料:x 2 3 4 5 6 y2.23.85.56.57.0已知∑i =15x 2i=90,∑i =15x i y i =112.3.b ^=∑i =1nx i -x-y i -y-∑i =1nx i -x-2=∑i =1nx i y i -n x - y-∑i =1nx 2i -n x -2,a =y --b ^ x -. (1)求x -,y -.(2)x 与y 具有线性相关关系,求出线性回归方程. (3)估计使用年限为10年时,维修费用约是多少? 解析:(1)x -=4,y -=5.(2)b ^=∑i =15x i y i -5x - y-∑i =15x 2i -5x -2=1.23,a ^=y --b ^ x -=5-1.23×4=0.08.所以线性回归方程为y ^=1.23x +0.08.(3)当x =10时,y ^=1.23×10+0.08=12.38(万元), 即估计使用年限为10年时,维修费用约为12.38万元.15.菜农定期使用低害杀虫农药对蔬菜进行喷洒,以防止害虫的危害,但采集上市时蔬菜仍存有少量的残留农药,食用时需要用清水清洗干净,下表是用清水x(单位:千克)清洗该蔬菜1千克后,蔬菜上残留的农药y(单位:微克)的统计表:x1 2 3 4 5y 58 54 39 29 10(1)令w =x 2,利用给出的参考数据求出y 关于w 的回归方程y ^=b ^w +a ^.(a ^,b ^精确到0.1)参考数据:∑i =15w i =55,∑i =15(w i -w -)(y i -y -)=-751,∑i =15(w i -w -)2=374,其中w i =x 2i ,w -=15∑i =15w i .(2)对于某种残留在蔬菜上的农药,当它的残留量不高于20微克时对人体无害,为了放心食用该蔬菜,请估计至少需要用多少千克的清水清洗1千克蔬菜?(精确到0.1,参考数据5≈2.24)附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v ^=α^+β^u 的斜率和截距的最小二乘估计分别为β^=∑i =1nu i -u-v i -v-∑i =1nu i -u-2,α^=v --β^ u -.解析:(1)由题意得,w -=11,y -=38.b ^=∑i =15w i -w-y i -y-∑i =15w i -w-2=-751374≈-2.0,a ^=y --b ^w =60.0,所以y ^=-2.0w +60.0. (2)由(1)得,y ^=-2.0w +60.0, 所以y ^=-2.0x 2+60.0,当y ^≤20时,即-2.0x 2+60.0≤20,解得x≥25≈4.5,所以为了放心食用该蔬菜,估计需要用4.5千克的清水清洗1千克蔬菜.独立性检验的基本思想及其初步应用[A组学业达标]1.在某次飞行航程中遭遇恶劣气候,55名男乘客中有24名晕机,34名女乘客中有8名晕机,在检验这些乘客晕机是否与性别有关时,采用的数据分析方法应是( )A.频率分布直方图B.回归分析C.独立性检验D.用样本估计总体解析:根据题意,结合题目中的数据,列出2×2列联表,求出K2观测值,对照数表可得出概率结论,这种分析数据的方法是独立性检验.答案:C2.观察下列各图,其中两个分类变量x,y之间关系最强的是( )解析:观察等高条形图发现x1x1+y1和x2x2+y2相差越大,就判断两个分类变量之间关系越强.答案:D3.如表是一个2×2列联表:则表中a,b的值分别为( )y1y2总计x1 a 21 73x222 25 47总计 b 46 120A.94,72C.52,74 D.74,52解析:a=73-21=52,b=a+22=74,故选C.答案:C4.利用独立性检验来考虑两个分类变量X与Y是否有关系时,通过查阅下表来确定“X和Y有关系”的可信度.如果K2的观测值k>5.024,那么在犯错误的概率不超过________的前提下认为“X与Y有关系”()P(K2≥k 0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001k 0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.87910.828A.0.25 B .0.05 C .0.1D .0.025解析:因为K 2的观测值k >5.024,而在临界值表中对应于5.024的是0.025,所以可以在犯错误的概率不超过0.025的前提下认为“X 和Y 有关系”.答案:D5.分类变量X 和Y 的列表如下,则下列说法判断正确的是( )y 1 y 2 总计 x 1 a b a +b x 2 c d c +d 总计a +cb +da +b +c +dA.ad -bc 越小,说明X 与Y 的关系越弱 B .ad -bc 越大,说明X 与Y 的关系越强 C .(ad -bc)2越大,说明X 与Y 的关系越强 D .(ad -bc)2越接近于0,说明X 与Y 的关系越强解析:列联表可以较为准确地判断两个变量之间的相关关系程度, 由K 2=a +b +c +dad -bc2a +b a +cb +dc +d,当(ad -bc)2越大,K 2越大,表明X 与Y 的关系越强.(ad -bc)2越接近0,说明两个分类变量X 和Y 无关的可能性越大. 即所给说法判断正确的是C. 答案:C6.某部门通过随机调查89名工作人员的休闲方式,了解读书和健身的人数,得到的数据如表:读书 健身 总计 女 24 31 55 男 8 26 34 总计325789在犯错误的概率不超过________的前提下认为性别与休闲方式有关系. 解析:由列联表中的数据,得K 2的观测值为k =89×24×26-31×8255×34×32×57≈3.689>2.706,因此,在犯错误的概率不超过0.10的前提下认为性别与休闲方式有关系.答案:0.107.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠.在照射后14天的结果如下表所示:死亡 存活 总计 第一种剂量 14 11 25 第二种剂量 6 19 25 总计203050进行统计分析的统计假设是________,K 2=________,说明两种电离辐射剂量对小白鼠的致死作用________.(填“相同”或“不相同”)参考公式:K 2=n ad -bc2a +bc +d a +cb +d解析:统计假设是“小白鼠的死亡与使用的电离辐射剂量无关”,由列联表中数据得K 2=5.33>3.841,所以在犯错误的概率不超过0.05的前提下认为小白鼠的死亡与使用的电离辐射剂量有关.所以两种电离辐射剂量对小白鼠的致死作用不相同.答案:小白鼠的死亡与使用的电离辐射剂量无关 5.33 不相同 8.下表是关于男婴与女婴出生时间调查的列联表:晚上 白天 总计 男婴 45 A B 女婴 E 35 C 总计98D180那么,A =________,B =E =________. 解析:由列联表知识得⎩⎪⎨⎪⎧ 45+E =98,98+D =180,A +35=D ,E +35=C ,B +C =180,解得⎩⎪⎨⎪⎧A =47,B =92,C =88,D =82,E =53.答案:47 92 88 82 539.网络对现代人的生活影响较大,尤其是对青少年,为了解网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随机抽取了1 000人调查,发现其中经常上网的有200人,这200人中有80人期末考试不及格,而另外800人中有120人不及格.利用图形判断学生经常上网与学习成绩有关吗?解析:根据题目所给的数据得到如下2×2列联表:经常上网 不经常上网总计 不及格80120200及格 120 680 800 总计2008001 000得出等高条形图如图所示:比较图中阴影部分的高可以发现经常上网不及格的频率明显高于经常上网及格的频率,因此可以认为经常上网与学习成绩有关.10.随着生活水平的提高,人们的休闲方式也发生了变化.某机构随机调查了n 个人,其中男性占调查人数的25.已知男性中有一半的人的休闲方式是运动,而女性中只有13的人的休闲方式是运动.(1)完成下列2×2列联表:运动 非运动总计 男性 女性 总计n(2)数至少有多少?(3)根据(2)的结论,本次被调查的人中,至少有多少人的休闲方式是运动? 解析:(1)补全2×2列联表如下:运动 非运动 总计 男性 15n 15n 25n 女性 15n 25n 35n 总计25n 35n n(2)则P(K 2≥k 0)=3.841. 由于K 2的观测值k =n ⎝ ⎛⎭⎪⎫n 5·2n 5-n 5·n 522n 5·3n 5·2n 5·3n 5=n 36,故n36≥3.841,即n≥138.276. 又由15n ∈Z ,故n≥140.故若在犯错误的概率不超过0.05的前提下,可认为“性别与休闲方式有关”,那么本次被调查的至少有140人.(3)根据(2)的结论,本次被调查的人中,至少有25×140=56(人)的休闲方式是运动.[B 组 能力提升]11.某卫生机构对366人进行健康体检,其中某项检测指标阳性家族史者糖尿病发病的有16人,不发病的有93人;阴性家族史者糖尿病发病的有17人,不发病的有240人,故在犯错误的概率不超过________的前提下认为糖尿病患者与遗传有关系.( )A .0.001B .0.005C .0.01D .0.025解析:可以先作出如下列联表(单位:人): 糖尿病患者与遗传列联表糖尿病发病糖尿病不发病总计 阳性家族史 16 93 109 阴性家族史17 240 257 总计33333366根据列联表中的数据,得到K 2的观测值为 k =366×16×240-17×932109×257×33×333≈6.067>5.024.故在犯错误的概率不超过0.025的前提下认为糖尿病患者与遗传有关系. 答案:D12.在研究性别与吃零食这两个分类变量是否有关系时,下列说法中正确的是________(填序号). ①若K 2的观测值k =6.635,则我们在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;②由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,如果某人吃零食,那么此人是女性的可能性为99%;③由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误.解析:K 2的观测值是支持确定有多大把握认为“两个分类变量吃零食与性别有关系”的随机变量值,所以由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误,故填③.答案:③13.根据下表计算:不看电视 看电视 男 37 85 女35143K 2的观测值k≈________(保留3位小数). 解析:k =300×37×143-85×352122×178×72×228≈4.514.答案:4.51414.某学校为了解该校高三年级学生在市一练考试的数学成绩情况,随机从该校高三文科与理科各抽取50名学生的数学成绩,作出频率分布直方图如图,规定考试成绩在[120,150]内为优秀.(1)由以上频率分布直方图填写下列2×2列联表.若按是否优秀来判断,是否有99%的把握认为该校的文理科数学成绩有差异.文科 理科 总计 优秀 非优秀 总计5050100(2)某高校派出2140分以上的学生进行自主招生面试,每位教授至少面试一人,每位学生只能被一位教授面试.若甲教授面试的学生人数为ξ,求ξ的分布列和均值.解析:(1)由频率分布直方图知,该校文科学生中数学成绩优秀的人数为(0.010+0.004+0.002)×10×50=8,故非优秀人数为50-8=42.该校理科学生中数学成绩优秀的人数为(0.020+0.014+0.006)×10×50=20,故非优秀人数为50-20=30.则2×2列联表如下:文科 理科 总计 优秀 8 20 28 非优秀 42 30 72 总计5050100∴K 2的观测值k =100×8×30-42×20250×50×28×72≈7.143>6.635,故有99%的把握认为该校文理科数学成绩有差异.(2)由(1)知,该校随机抽取的学生成绩中一练数学成绩在140分以上的学生为4人,ξ的可能取值为1,2,3.将4人分给两名教授每名教授至少1名学生的不同分法种数为⎝⎛⎭⎪⎫C 34+C 24C 22A 22A 22=14,则P(ξ=1)=C 1414=27,P(ξ=2)=C 2414=37,P(ξ=3)=C 3414=27.∴ξ的分布列为:ξ 1 2 3 P273727∴E(ξ)=1×27+2×37+3×27=2.15.某校为了了解学生对消防知识的了解情况,从高一年级和高二年级各选取100名同学进行消防知识竞赛.图(1)和图(2)分别是对高一年级和高二年级参加竞赛的学生成绩按[40,50),[50,60),[60,70),[70,80]分组,得到的频率分布直方图.(1)请计算高一年级和高二年级成绩小于60分的人数.(2)完成2×2列联表,并回答:在犯错误的概率不超过多少的前提下认为“学生所在的年级与消防常识的了解存在相关性”?成绩小于60分人数成绩不小于60分人数总计高一 高二 总计附:临界值表及参考公式: K 2=n ad -bc 2a +bc +d a +cb +d ,n =a +b +c +d. P(K 2≥k 0)0.15 0.100.05 0.025 0.010 0.005 0.001 k 02.0722.7063.8415.0246.6357.87910.828解析:(1)高一年级成绩低于60分的人数为:(0.03+0.04)×10×100=70; 高二年级成绩低于60分的人数为: (0.035+0.015)×10×100=50. (2)2×2列联表如下:成绩小于60分人数成绩不小于60分人数总计 高一 70 30 100 高二 50 50 100 总计12080200由于K 2的观测值k =200×50×70-50×302100×100×120×80≈8.333>7.879,所以在犯错误的概率不超过0.005的前提下认为“学生所在的年级与消防知识的了解存在相关性”.。
人教版数学高二A版选修2-3单元检测第三章统计案例(附答案)

数学人教版A2-3第三章 统计案例单元检测(时间:45分钟,满分:100分)一、选择题(每小题6分,共48分)1( ).A .一次函数模型B .二次函数模型C .指数函数模型D .对数函数模型2.工人月工资y (元)随劳动生产率x (千元)变化的回归方程为ˆy=50+80x .下列判断错误的是( ).A .劳动生产率为1 000元时,工资约为130元B .劳动生产率提高1 000元时,工资提高130元C .劳动生产率提高1 000元时,工资提高80元D .当月工资约为210元时,劳动生产率为2 000元3.某考察团对全国10大城市进行职工人均工资水平x (千元)与居民人均消费水平y (千元)统计调查,y 与x 具有相关关系,回归方程为ˆy=0.66x +1.562.若某城市居民人均消费水平为7.675(千元),估计该城市人均消费额占人均工资收入的百分比约为( ).A .83%B .72%C .67%D .66%4.若两个变量的残差平方和是325,21()nii x y =-∑=923,则随机误差对预报变量的贡献率约为( ). A .64.8% B .60% C .35.2% D .40% 5.下列说法:①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适; ②用相关指数可以刻画回归的效果,值越小说明模型的拟合效果越好; ③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型拟合效果越好.其中说法正确的是( ). A .①② B .②③ C .①③ D .①②③6.(创新题)独立检验中,假设H 0:变量X 与变量Y 没有关系,则在H 0成立的情况下,P (K 2≥6.635)=0.010表示的意义是( ). A .变量X 与变量Y 有关系的概率为1%B .变量X 与变量Y 没有关系的概率为99.9%C .变量X 与变量Y 没有关系的概率为99%D .变量X 与变量Y 有关系的概率为99%7( ).A.K2=9.564 B.K2=3.564 C.K2<2.706 D.K2>3.841 8.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中由以上数据,计算得到K2的观测值k≈9.643,根据临界值表,以下说法正确的是().A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关二、填空题(每小题6分,共18分)9.(创新题)已知回归直线ˆy=bx+a斜率的估计值是52,且样本点的中心为(4,5).则当x=-2时,ˆy的值为______.10.若一组观测值(x1,y1),(x2,y2),…,(x n,y n)之间满足y i=bx i+a+e i(i=1,2,…,n),若e i恒为0,则R2为________.11.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的试根据上述数据计算K2=______,比较这两种手术对病人又发作心脏病的影响有没有差别______.三、解答题(共34分)12.(10分)某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm,170 cm和182 cm.因儿子的身高与父亲的身高有关,求该老师用线性回归分析的方法预测他孙子的身高为多少.13.(12分)为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.下表1和表2分别是注射药物A和药物B后的试验结果.(疱疹面积单位:mm2)表2:注射药物B后皮肤疱疹面积的频数分布表完成下面2×2列联表,并回答能否有99.9%的把握认为“注射药物A后的疱疹面积与14.(12分)一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了(1)建立零件数为解释变量,加工时间为预报变量的回归模型,并计算残差;(2)你能残差分析这个模型能较好地刻画零件数和加工时间的关系吗?参考答案1答案:A解析:画出散点图可观察得点都在一条直线上,故A正确.2答案:B解析:当x=1(千元)时,ˆy=130元,A正确;当ˆy=210元时,x=2105080-=2千元,D正确;当x增加一个单位时,ˆy增加80,C正确.3答案:A解析:因为当ˆy=7.675时,x=7.675 1.5620.66-≈9.262,所以7.6759.262≈0.829≈83%.4答案:C解析:由题意可知随机误差对预报变量的贡献率约为325923=0.352.5答案:C解析:相关指数R2越大,说明模型拟合效果越好,故②错误.6答案:D解析:由题意知变量X与Y没有关系的概率为0.01,即认为变量X与Y有关系的概率为99%.7答案:D解析:由K2=2()()()()()n ad bca b c d a c b d-++++,得K2的观测值k=285(4012528)68174540⨯⨯⨯⨯⨯⨯-≈4.722>3.841.8答案:D解析:根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.9答案:-10解析:由已知b=52且4b+a=5,∴a=-5,5ˆ2y x=-5.∴x=-2时,y=-10.10答案:1解析:e i恒为0,说明随机误差总为0,于是y i=ˆy,故R2=1.11答案:1.78不能作出这两种手术对病人又发作心脏病的影响有差别的结论解析:提出假设H0:两种手术对病人又发作心脏病的影响没有差别.根据列联表中的数据,可以求得K2的观测值k=2392(3916729157)68324196196⨯⨯⨯⨯⨯⨯-≈1.78.当H 0成立时,K 2≈1.78,而K 2<2.072的概率为0.85.所以,不能否定假设H 0.也就是不能作出这两种手术对病人又发作心脏病的影响有差别的结论.12解:由题意父亲身高x cm 与儿子身高y cm 对应关系如下表:则1731701763x ++==173,1701761823y ++==176, 31()()iii x x y y =--∑=(173-173)×(170-176)+(170-173)×(176-176)+(176-173)×(182-176)=18,321()ii x x =-∑=(173-173)2+(170-173)2+(176-173)2=18.∴18ˆ18b==1. ∴ˆˆay bx =-=176-173=3. ∴线性回归直线方程ˆˆˆybx a =+=x +3. ∴可估计孙子身高为182+3=185(cm).由列联表中的数据,得K 2的观测值为k =2200(70653530)10010010595⨯⨯⨯⨯⨯⨯-≈24.561>10.828.因此,有99.9%的把握认为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有差异”.14解:(1)根据表中数据作出散点图,如图所示.间对零件数的线性回归方程为ˆy=0.668x+54.93.(2)以零件数为横坐标,残差为纵坐标作出残差图如图所示.由图可知,残差点分布较均匀,即用上述回归模型拟合数据效果很好.但需注意,由残差图也可以看出,第4个样本点和第5个样本点的残差比较大,需要确认在采集这两个样本点的过程中是否有人为的错误.。
2020学年数学人教A版选修2-3检测:第三章 统计案例测试卷

第三章 统计案例测试卷(时间:90分钟 满分:150分)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.对于回归直线方程y ^=b ^x +a ^,下列说法不正确的是( )A .直线必经过点(x -,y -)B .x 增加1个单位时,y 平均增加b ^个单位C .样本数据中x =0时,可能有y =a ^D .样本数据中x =0时,一定有y =a ^详细分析:回归直线方程是根据样本数据得到的一个近似曲线,故由它得到的值也是一个近似值.答案:D2.根据如下样本数据:得到的回归直线方程为y =b x +a ,则( ) A.a ^>0,b ^<0 B.a ^>0,b ^>0 C.a ^<0,b ^>0 D.a ^<0,b ^<0详细分析:根据题意,画出散点图.根据散点图,知两个变量为负相关,且回归直线与y轴的交点在y 轴正半轴,所以a ^>0,b ^<0.答案:A 3.独立检验中,假设H 0:变量X 与变量Y 没有关系,则在H 0成立的情况下,P (K 2≥6.635)=0.010表示的意义是( )A .变量X 与变量Y 有关系的概率为1%B .变量X 与变量Y 没有关系的概率为99.9%C .变量X 与变量Y 没有关系的概率为99%D .变量X 与变量Y 有关系的概率为99%详细分析:由题意知变量X 与Y 没有关系的概率为0.01,即认为变量X 与Y 有关系的概率为99%.答案:D4.下面是一个2×2列联表其中a ,b A .52,54 B .54,52 C .94,146 D .146,94详细分析:由a +21=73,得a =52,a +2=b ,得b =54. 答案:A5.在2×2列联表中,下列哪两个比值相差越大,两个分类变量有关系的可能性就越大( )A.a a +b 与c c +dB.a c +d 与c a +bC.a a +d 与c b +cD.a b +d 与c a +c详细分析:当ad 与bc 相差越大,两个分类变量有关系的可能性越大,此时a a +b 与cc +d 相差越大.答案:A 6.某考察团对全国10大城市进行职工人均工资水平x (千元)与居民人均消费水平y (千元)的统计调查,已知y 与x 之间具有线性相关关系,且回归方程为y ^=0.66x +1.562.若某城市的居民人均消费水平为7.675千元,试估计该城市的人均消费额占人均工资收入的百分比约为( )A .83%B .72%C .67%D .66%详细分析:将y ^=7.675代入回归方程,可计算得x ≈9.26,所以该城市的人均消费额占人均工资收入的百分比约为7.675÷9.26≈0.83,即约为83%.答案:A7.根据下面的2×2列联表得到如下4个判断: ①至少有99.9%的把握认为“患肝病与嗜酒有关”;②至少有99%的把握认为“患肝病与嗜酒有关”;③在犯错误的概率不超过0.01的前提下认为“患肝病与嗜酒有关”;④在犯错误的概率不超过0.01的前提下认为“患肝病与嗜酒无关”.A .0B .1C .2D .3详细分析:由2×2列联表中数据可求得K 2的观测值k =992×(700×32-60×200)2760×232×900×92≈7.349>6.635,所以在犯错误的概率不超过0.01的前提下,认为“患肝病与嗜酒有关”,即至少有99%的把握认为“患肝病与嗜酒有关”.因此②③正确,故选C 项.答案:C8.某高校《统计》课程的教师随机给出了选修该课程的一些情况,具体数据如下:因为k >3.841,所以可以判断选修该课程与性别有关.那么这种判断出错的可能性不超过( )A .5%B .95%C .1%D .99%详细分析:若k >3.841,说明在犯错误的概率不超过0.05的前提下认为选修该课程与性别有关,也就是选修该课程与性别有关出错的可能性不超过5%.答案:A9.根据一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的散点图分析存在线性相关关系,求得其回归方程y ^=0.85x -85.7,则在样本点(165,57)处的残差为( )A .54.55B .2.45C .3.45D .111.55详细分析:把x =165代入y ^=0.85x -85.7,得y =0.85×165-85.7=54.55,故残差为57-54.55=2.45.答案:B10.甲、乙两个班级进行一门课程考试,按照学生考试成绩优秀和不优秀统计成绩后,得到如下列联表( ) A .0.3~0.4 B .0.4~0.5 C .0.5~0.6 D .0.6~0.7详细分析:因为K 2=90×(10×38-7×35)245×45×17×73=90×13522 513 025≈0.652 7>0.455,P (K 2≥0.455)=0.5,故选B.答案:B11.某学校开展研究性学习活动,某同学获得一组实验数据如下表所示:)A .y =2x -2B .y =⎝⎛⎭⎫12xC .y =log 2xD .y =12(x 2-1)详细分析:本题若用R 2或残差来分析拟合效果,运算将很繁琐,计算量太大,可以将各组数据代入检验,发现D 项最接近.故选D 项.答案:D12.两个分类变量X 和Y ,值域分别为{x 1,x 2}和{y 1,y 2},其样本频数分别是a =10,b =21,c +d =35.若X 与Y 有关系的可信程度不小于97.5%,则c 等于( )A .3B .4C .5D .6详细分析:列2×2列联表如下:故K 2的观测值k =66×[10(35-c )-21c ]231×35×(10+c )(56-c )≥5.024.把选项A ,B ,C ,D 代入验证可知选A 项. 答案:A二、填空题(本大题共4小题,每小题5分,共20分.把答案填在题中横线上)13.已知高三某学生的高考成绩y (分)与高三期间有效复习时间x (天)正相关,且回归方程是y ^=3x +50,若期望他高考达到500分,则他的有效复习时间应不低于________天.详细分析:本题主要考查运用线性回归方程来预测变量的取值.当y ^=500时,易得x =500-503=150.答案:15014.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量(单位:千箱)与单位成本(单位:元)的资料进行线性回归分析,结果如下:x -=72,y -=71,∑i =16x 2i =79,∑i =16x i y i =1 481.则销量每增加1 000箱,单位成本约下降________元.详细分析:由题意知,b ^=1 481-6×72×7179-6×⎝⎛⎭⎫722≈-1.818 2,a ^=71-(-1.818 2)×72≈77.36,所以y ^=-1.81 82x +77.36,所以销量每增加1 000箱,单位成本约下降1.818 2元. 答案:1.818 215.欲知作者的性别是否与读者的性别有关,某出版公司派工作人员到各书店随机调查了500位买书的顾客,结果如下表所示..(填“有关”或“无关”)详细分析:由公式得k =500×(142×133-122×103)2264×236×245×255≈5.131>5.024,所以在犯错误的概率不超过0.025的前提下作者的性别与读者的性别有关.答案:有关16.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出假设H 0;“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得k ≈3.918,经查对临界值表P (K 2≥3.841)≈0.05.对此,四名同学做出了以下判断:p :在犯错误的概率不超过0.05的前提下认为“能起到预防感冒的作用”; q :若某人未使用该血清,则他在一年中有95%的可能性得感冒; r :这种血清预防感冒的有效率为95%; s :这种血清预防感冒的有效率为5%.则下列结论中,正确结论的序号是________.(把你认为正确的都填上)(1)p ∧(綈q );(2)(綈p )∧q ;(3)[(綈p )∧(綈q )]∧(r ∨s );(4)[p ∨(綈r )]∧[(綈q )∨s ]. 详细分析:查对临界值表知P (K 2≥3.841)=0.05,故有95%的把握认为“这种血清能起到预防感冒的作用”;95%仅是指“血清能起到预防感冒的作用”的可信程度,但也有“在100个使用血清的人中一个患感冒的人也没有”的可能,故p 真,其余都假.结合复合命题的真值可知,选(1)(4).答案:(1)(4)三、解答题(本大题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤) 17.(10分)某运动队研制了一种有助于运动员在大运动量的训练后快速恢复体力的口服制剂,为了实验新药的效果而抽取若干名运动员来实验,所得资料如下:详细分析:对男运动员K 2=270×(60×45-45×120)2105×165×180×90≈7.013>6.635,所以有99%的把握认为药剂对男运动员有效. 对女运动员K 2=540×(45×255-60×180)2105×435×225×315≈0.076≤2.706,所以没有充足的证据显示药剂与女运动员体力恢复有关系.因此该药对男运动员药效较好.18.(12分)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此做了4次试验,得到数据如下:(1)(2)求y 关于x 的线性回归方程y ^=b ^x +a ^;(3)试预测加工10个零件需要的时间. 详细分析:(1)散点图如图所示:(2)由表中数据得x -=3.5,y -=3.5,∑i =14 (x i -x -)(y i -y -)=3.5,∑i =14(x i -x -)2=5, 由公式计算得b ^=0.7,a ^=y --b ^x -=1.05,所以所求线性回归方程为y ^=0.7x +1.05.(3)当x =10时,y ^=0.7×10+1.05=8.05,所以预测加工10个零件需要8.05小时.19.(12分)某班主任对全班50名学生的学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?(2)试运用独立性检验的思想方法分析:学生的学习积极性与对待班级工作的态度是否有关系?并说明理由.详细分析:(1)积极参加班级工作的学生有24人,不太主动参加班级工作且学习积极性一般的学生有19人,总人数为50人,∴抽到积极参加班级工作的学生的概率为2450=1225;抽到不太主动参加班级工作且学习积极性一般的学生的概率为1950.(2)k =50×(18×19-6×7)225×25×24×26=15013≈11.5,∵k >10.828,∴在犯错误的概率不超过0.001的前提下认为学习积极性与对待班级工作的态度有关系.20.(12分)在关于人的脂肪含量(百分比)和年龄的关系的研究中,研究人员获得了一组数据如下表:(2)求相关指数R 2,并说明其含义;(3)给出37岁时人的脂肪含量的预测值.详细分析:(1)散点图如图所示.由散点图可知样本点呈条状分布,脂肪含量与年龄有比较好的线性相关关系,因此可以用线性回归方程来刻画它们之间的关系.设线性回归方程为y ^=b ^x +a ^,则由计算器算得b ^≈0.576,a ^=-0.448,所以线性回归方程为y ^=0.576x -0.448.(2)∑i =114e ^2i =∑i =114 (y i -y ^i )2≈37.78.∑i =114(y i -y -)2≈644.99.R 2=1-37.78644.99≈0.941.R 2≈0.941,表明年龄解释了94.1%的脂肪含量变化.(3)当x =37时,y ^=0.576×37-0.448≈20.9,故37岁时人的脂肪含量约为20.9%.21.(12分)为了了解心肺疾病是否与年龄相关,现随机抽取了40名市民,得到数据如下表:已知在40人中随机抽取1人,抽到不患心肺疾病的市民的概率为25.(1)请将2×2列联表补充完整;(2)已知在大于40岁且患心肺疾病的市民中,有4名重症患者,专家建议重症患者住院治疗,现从这16名患者中选出2人,记需住院治疗的人数为ξ,求ξ的分布列和数学期望;(3)能否在犯错误的概率不超过0.01的前提下认为患心肺疾病与年龄有关?详细分析:(1)将2×2列联表补充完整如下:(2)ξ的可能取值为0,1,2.P (ξ=0)=C 212C 04C 216=1120,P (ξ=1)=C 112C 14C 216=25,P (ξ=2)=C 012C 24C 216=120,所以随机变量ξ的分布列为故ξ的数学期望E (ξ)=0×1120+1×25+2×120=12.(3)K 2=40×(16×12-4×8)224×16×20×20=203>6.635, 所以能在犯错误的概率不超过0.01的前提下认为患心肺疾病与年龄有关.22.(12分)某工厂用甲、乙两种不同工艺生产一大批同一种零件,零件尺寸均在[21.7,22.3](单位:cm)之间,把零件尺寸在[21.9,22.1)的记为一等品,尺寸在[21.8,21.9)∪[22.1,22.2)的记为二等品,尺寸在[21.7,21.8)∪[22.2,22.3]的记为三等品,现从甲、乙工艺生产的零件中各随机抽取100件产品,所得零件尺寸的频率分布直方图如图所示:(1)根据上述数据完成下列2×2列联表,根据此数据你认为选择不同的工艺与生产出一等品是否有关?附:K 2=n (ad -(a +b )(c +d )(a +c )(b +d )(2)以上述各种产品的频率作为各种产品发生的概率,若一等品、二等品、三等品的单件利润分别为30元、20元、15元,你认为以后该工厂应该选择哪种工艺生产该种零件?请说明理由.详细分析:(1)2×2列联表如下:K 2=200×(50×40-60×50)2110×90×100×100≈2.02<2.706,所以没有理由认为选择不同的工艺与生产出一等品有关. (2)由题知运用甲工艺生产单件产品的利润X 的分布列为X 的数学期望为E (X )=30×0.5+20×0.3+15×0.2=24,X 的方差为D (X )=(30-24)2×0.5+(20-24)2×0.3+(15-24)2×0.2=39. 乙工艺生产单件产品的利润Y 的分布列为Y 的数学期望为E (Y )=30×0.6+20×0.1+15×0.3=24.5,Y 的方差为D (Y )=(30-24.5)2×0.6+(20-24.5)2×0.1+(15-24.5)2×0.3=47.25.由上述结果可以看出D (X )<D (Y ),即甲工艺波动小,虽然E (X )<E (Y ),但相差不大,所以以后应选择甲工艺.。
(压轴题)高中数学高中数学选修2-3第三章《统计案例》测试(包含答案解析)(3)

一、选择题1.已知x 与y 之间的几组数据如下表: x 1 2 3 4 y1mn4参考公式:线性回归方程y bx a =+,其中()()()121niii nii x x y y b x x ==--=-∑∑,a y bx =-;相关系数()()()()12211niii nniii i x x y y r x x y y ===--=--∑∑∑.上表数据中y 的平均值为2.5,若某同学对m 赋了三个值分别为1.5,2,2.5得到三条线性回归直线方程分别为11y b x a =+,22y b x a =+,33y b x a =+,对应的相关系数分别为1r ,2r ,3r ,下列结论中错误..的是( ) A .三条回归直线有共同交点 B .相关系数中,2r 最大 C .12b b >D .12a a >2.以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,其变换后得到线性回归方程0.53z x =+,则c =( ) A .3B .3eC .0.5D .0.5e3.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是A .10200ˆyx =-+ B .10200ˆyx =+ C .10200ˆyx =-- D .10200ˆyx =- 4.设导弹发射的事故率为0.01,若发射10次,其出事故的次数为ξ,则下列结论正确的是 ( ) A .0.1E ξ=B .•01D ξ=C .10()0.01?0.99k k P k ξ-==D .1010()0.99?0.01k k kP k C ξ-==5.某研究型学习小组调查研究学生使用智能手机对学习的影响.部分统计数据如下表:附表:经计算2K 的观测值10k =,则下列选项正确的是( ) A .有99.5%的把握认为使用智能手机对学习有影响 B .有99.5%的把握认为使用智能手机对学习无影响 C .有99.9%的把握认为使用智能手机对学习有影响 D .有99.9%的把握认为使用智能手机对学习无影响 6.下列命题中正确命题的个数是(1)对分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握越大;(2)若将一组样本数据中的每个数据都加上同一个常数后,则样本的方差不变; (3)在残差图,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高; (4)设随机变量ξ服从正态分布()0,1N ; 若()1P p ξ>=,则()1102P p ξ-<<=-( ) A .4B .3C .2D .17.在独立性检验中,统计量2χ有三个临界值:2.706、3.841和6.635,在一项打鼾与患心脏病的调查中,共调查了1000人,经计算的2χ=18.87,根据这一数据分析,认为打鼾与患心脏病之间 ( )A .有95%的把握认为两者无关B .约有95%的打鼾者患心脏病C .有99%的把握认为两者有关D .约有99%的打鼾者患心脏病8.对于独立性检验,下列说法正确的是( ) A .K 2>3.841时,有95%的把握说事件A 与B 无关 B .K 2>6.635时,有99%的把握说事件A 与B 有关 C .K 2≤3.841时,有95%的把握说事件A 与B 有关 D .K 2>6.635时,有99%的把握说事件A 与B 无关9.利用独立性检验来考虑两个分类变量X 和Y 是否有关系时,通过查阅临界值表来确定推断“X 与Y 有关系”的可信度,如果k >5.024,那么就推断“X 和Y 有关系”,这种推断犯错误的概率不超过( ) A .0.25 B .0.75 C .0.025 D .0.97510.已知,x y 的取值如下表:( )x0 1, 2 3 4 y11.33.25.68.9若依据表中数据所画的散点图中,所有样本点()(,)1,2,3,4,5i i x y i =都在曲线212y x a =+附近波动,则a =( ) A .1B .12C .13D .12-11.通过随机询问2016名性别不同的大学生是否爱好某项运动,得到2 6.023K =,则根据这一数据查阅表,则有把握认为“爱好该项运动与性别有关”的可信程度是( )A .90%B .95%C .97.5%D .99.5%12.下列说法:①将一组数据中的每个数据都乘以同一个非零常数a 后,标准差也变为原来的a 倍; ②设有一个回归方程35y x =-,变量x 增加1个单位时,y 平均减少5个单位; ③线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;④在某项测量中,测量结果ξ服从正态分布()()21,0N σσ>,若ξ位于区域()0,1的概率为0.4,则ξ位于区域()1,+∞内的概率为0.6⑤利用统计量2χ来判断“两个事件,X Y 的关系”时,算出的2χ值越大,判断“X 与Y 有关”的把握就越大 其中正确的个数是 A .1B .2C .3D .4二、填空题13.在一次独立试验中,有200人按性别和是否色弱分类如下表(单位:人)你能在犯错误的概率不超过_____的前提下认为“是否色弱与性别有关”?14.某中学为了调研学生的数学成绩和物理成绩是否有关系,随机抽取了189名学生进行调查,调查结果如下:在数学成绩较好的94名学生中,有54名学生的物理成绩较好,有40名学生的物理成绩较差;在成绩较差的95名学生中,有32名学生的物理成绩较好,有63名学生的物理成绩较差.根据以上的调查结果,利用独立性检验的方法可知,约有________的把握认为“学生的数学成绩和物理成绩有关系”.15.为了解适龄公务员对放开生育二胎政策的态度,某部门随机调查了200位30~40岁之间的公务员,得到的情况如下表:男公务员 女公务员 生二胎 80 40 不生二胎4040则________(填“有”或“没有”)99%以上的把握认为“生二胎与性别有关”. 附:K 2=. P (K 2≥k 0) 0.10 0.05 0.025 0.010 0.005 0.001 k 02.7063.8415.0246.6357.87910.82816.为了解某班学生喜爱打篮球是否与性别有关,对该班50名 学生进行了问卷调查, 得到了如下22⨯ 列联表喜爱打篮球 不喜爱打篮球 合计男生20 525 女生 10 1525合计30 2050则至少有_____的把握认为喜爱打篮球与性别有关(请用百分数表示). 17.给出下列命题:①线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;②由变量x 和y 的数据得到其回归直线方程:l ˆybx a =+,则l 一定经过点(),x y P ; ③从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;④在回归分析模型中,残差平方和越小,说明模型的拟合效果越好;⑤在回归直线方程0.110ˆyx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 增加0.1个单位,其中真命题的序号是___________.18.某单位为了了解用电量y (度)与气温x (℃)之间的关系,随机统计了某4天的用电量与当天气温(如表),并求得线性回归方程为^=-2x +60.不小心丢失表中数据c ,d ,那么由现有数据知2c+d=______. x c 13 10 -1 y243438d19.下列4个命题:①为了了解800名学生对学校某项教改试验的意见,打算从中抽取一个容量为40的样本,考虑用系统抽样,则分段的间隔为40;②四边形ABCD 为长方形,2AB =,1BC =,O 为AB 中点,在长方形ABCD 内随机取一点P ,取得的P 点到O 的距离大于1的概率为12π-; ③把函数3sin 23y x π⎛⎫=+⎪⎝⎭的图象向右平移6π个单位,可得到3sin 2y x =的图象; ④已知回归直线的斜率的估计值为1.23,样本点的中心为()4,5,则回归直线方程为1.230.08y x =+.其中正确的命题有__________.(填上所有正确命题的编号)20.2018年春季,世界各地相继出现流感疫情,这已经成为全球性的公共卫生问题.为了考察某种流感疫苗的效果,某实验室随机抽取100只健康小鼠进行试验,得到如下列联表:关系.(参考公式:()()()()()22n ad bc K a b c d a c b d -=++++.)三、解答题21.第十八届中国国际农产品交易会于11月27日在重庆国际博览中心开幕,我市全面推广“遂宁红薯”及“遂宁鲜”农产品区域公用品牌,并组织了100家企业、1000个产品进行展示展销,扩大优质特色农产品市场的占有率和影响力,提升遂宁特色农产品的社会认知度和美誉度,让来自世界各地的与会者和消费者更深入了解遂宁,某记者对本次农交会进行了跟踪报道和实际调查,对某特产的最满意度()%x 和对应的销售额y (万元)进行了调查得到以下数据:关系数r 的绝对值在0.95以上(含0.95)是线性相关性较强;否则,线性相关性较弱.请你对线性相关性强弱作出判断,并给出理由;(2)如果没有达到较强线性相关,则采取“末位淘汰”制(即销售额最少的那一天不作为计算数据),并求在剔除“末位淘汰”的那一天后的销量额y 关于最满意度x 的线性回归方程(系数精确到0.1). 参考数据:24x =,81y =,52215146ii x x =-=∑, 52215176i i y y =-=∑,515151i ii x y xy =-=∑13.27≈≈.附:对于一组数据()()()1122,,,,,,n n x y x y x y ⋅⋅⋅.其回归直线方程 ˆˆˆy bx a =+的斜率和截距的最小二乘法估计公式分别为:1221ˆ·ni ii ni i x y nx y bx nx ==-=-∑∑,ˆa y bx=-,线性相关系数·ni ix y nx y r -=∑22.为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:质量监督员甲在生产现场时,990件产品中合格品有982件,次品有8件;甲不在生产现场时,510件产品中合格品有493件,次品有17件,试分别用列联表、独立性检验的方法分析监督员甲是否在生产现场对产品质量好坏有无影响?23.2020年初,新型冠状病毒(2019-nCoV )肆虐,全民开启防疫防控.新型冠状病毒的传染主要是人与人之间进行传播,感染人群年龄大多数是40岁以上人群.该病毒进入人体后有潜伏期,潜伏期是指病原体侵入人体至最早出现临床症状的这段时间.潜伏期越长,感染到他人的可能性越高,现对200个病例的潜伏期(单位:天)进行调查,统计发现潜伏期平均数为7.1,方差为22.25.如果认为超过8天的潜伏期属于“长潜伏期”,按照年龄统计样本,得到下面的列联表:(1)是否有95%的把握认为“长期潜伏”与年龄有关;(2)假设潜伏期X 服从正态分布()2,N μσ,其中μ近似为样本平均数x ,2σ近似为样本方差2s .(ⅰ)现在很多省份对入境旅客一律要求隔离14天,请用概率的知识解释其合理性;(ⅱ)以题目中的样本频率估计概率,设1000个病例中恰有()*k k ∈N 个属于“长期潜伏”的概率是()g k ,当k 为何值时,()g k 取得最大值. 附:()()()()()22n ad bc a b c d a c b d χ-=++++若()2,N ξμσ则()0.6862P μσξμσ-<<+=.()220.9544P μσξμσ-<<+=,()330.9974P μσξμσ-<<+=.24.某地一所妇产科医院为了解婴儿性别与出生时间(白天或晚上)之间的联系,从该医院最近出生的200名婴儿获知如下数据:这200名婴儿中男婴的比例为55%,晚上出生的男婴比白天出生的男婴多75%,晚上出生的女婴人数与白天出生的男婴人数恰好相等. (1)根据题意,完成下列2×2列联表;(2)根据列联表,判断能否有99%的把握认为婴儿的性别与出生时间有关,说明你的理由.附:22()()()()()n ad bcKa b c d a c b d-=++++(n=a+b+c+d),参考数据:221999≈0.0368.25.在第十五次全国国民阅读调查中,某地区调查组获得一个容量为200的样本,其中城镇居民150人,农村居民50人,在这些居民中,经常阅读的城镇居民100人,农村居民24人.(1)完成上面2×2列联表,并判断是否有95%的把握认为经常阅读与居民居住地有关?(2)从该地区居民城镇的居民中,随机抽取5位居民参加一次阅读交流活动,记这5位居民中经常阅读的人数为X,若用样本的频率作为概率,求随机变量X的分布列和期望.附:K2=2()()()()()n ad bca b c d a c b d-++++,其中n=a+b+c+d.26.“微粒贷”是腾讯旗下2015年9月开发上市的微众银行网货产品.腾讯公司为了了解“微粒贷”上市以来在C市的使用情况,统计了C市2015年至2019年使用了“微粒货”贷款的累计人数,统计数据如表所示:(1)已知变量x ,y 具有线性相关关系,求累计人数y (万人)关于年份代号x 的线性回归方程y bx a =+;并预测2020年使用“微粒贷“贷款的累计人数;(2)“微粒贷”用户拥有的贷款额度是根据用户的账户信用资质判定的,额度范围在500元至30万元不等,腾讯公司在统计使用人数的同时,对他们所拥有的贷款额度也作了相应的统计.我们把拥有货款额度在500元至5万元(不包括5万元)的人群称为“低额度贷款人群”,简称“A 类人群”;把拥有贷款额度在5万元及以上的人群称为“高额度贷款人群”,简称“B 类人群”.根据统计结果,随机抽取6人,其中A 类人群4人,B 类人群2人.现从这6人中任取3人,记随机变量ξ为A 类人群的人数,求ξ的分布列及其期望.参考公式:1122211()()()()nni iiii i nniii i x y nx y x x y y b xn x x x ====---==--∑∑∑∑, a y bx =-参考数据:5162i ii x y=≈∑【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】由题意可得5m n +=,分别取m 与n 的值,由公式计算出1122123,,,,,,b a b a r r r 的值,逐一分析四个选项,即可得到答案. 【详解】由题意,1410m n +++=,即5m n +=. 若 1.5m =,则 3.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 1.5 2.53 2.5 3.5 2.54 2.54 2.5 5.5iii x x y y =--=--+--+--+--=∑ ,()()()42222211.50.50.5 1.55i i x x =-=-+-++=∑ ,()()()42222211.511 1.5 6.5i i y y =-=-+-++=∑.则1 5.51.15b ==,1 2.5 1.1 2.50.25a =-⨯=- ,1r =≈; 若2m =,则3n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.52 2.53 2.53 2.54 2.54 2.55iii x x y y =--=--+--+--+--=∑,()4215ii x x =-=∑,()()()42222211.50.50.5 1.55i i y y =-=-+-++=∑.2515b ==,2 2.51 2.50a =-⨯=,21r ==; 若 2.5m =,则 2.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 2.5 2.53 2.5 2.5 2.54 2.54 2.5 4.5iii x x y y =--=--+--+--+--=∑,()4215i i x x =-=∑,()()422211.5 1.5 4.5i i y y =-=-+=∑,3r ==由样本点的中心相同,故A 正确;由以上计算可得,相关系数中,2r 最大,12b b >,12a a <,故B ,C 正确,D 错误. 故选:D . 【点睛】本题考查线性回归方程与相关系数的求法,考查计算能力,是中档题.2.B解析:B 【分析】根据指对数互化求解即可. 【详解】解:因为0.53z x =+,ln z y =,所以0.53ln x y +=,所以0.5330.5x x y e e e +==⨯,故3c e =.故选:B. 【点睛】本题考查非线性回归问题的转化,是基础题.3.A解析:A 【解析】试题分析:因为商品销售量x 与销售价格ˆy负相关,所以排除B ,D 选项, 将0x =代入10200ˆyx =--可得2000ˆy =-<,不符合实际.故A 正确. 考点:线性回归方程.【方法点睛】本题主要考查线性回归方程,属容易题.线性回归方程ˆˆˆy bx a =+当ˆ0b<时ˆ,x y 负相关;当ˆ0b >时ˆ,x y 正相关. 4.A解析:A 【解析】 【分析】由题意知本题是在相同的条件下发生的试验,发射的事故率都为0.01,实验的结果只有发生和不发生两种结果,故本题符合独立重复试验,由独立重复试验的期望公式得到结果. 【详解】由题意知本题是在相同的条件下发生的试验,发射的事故率都为0.01,故本题符合独立重复试验,即ξ~(10,0.01)B . ∴100.010.1E ξ=⨯= 故选A . 【点睛】解决离散型随机变量分布列和期望问题时,主要依据概率的有关概念和运算,同时还要注意题目中离散型随机变量服从什么分布,若服从特殊的分布则运算要简单的多.5.A解析:A 【解析】 【分析】由题意结合2K 的观测值k 由独立性检验的数学思想给出正确的结论即可. 【详解】由于2K 的观测值10k =7.879>,其对应的值0.0050.5%=,据此结合独立性检验的思想可知:有99.5%的把握认为使用智能手机对学习有影响. 本题选择A 选项. 【点睛】独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.6.B解析:B 【解析】 【分析】根据独立性检验的定义可判断(1);根据方差的性质可判断(2);根据残差的性质可判断(3);根据正态分布的对称性可判断(4).【详解】(1)对分类变量X 与Y 的随机变量2K 的观测值K 来说,K 越大,判断“X 与Y 有关系”的把握越大,故(1)错误;(2)若将一组样本数据中的每个数据都加上同一个常数后,数据的离散程度不变,则样本的方差不变,故(2)正确;(3)根据残差的定义可知,在残差图,残差点分布的带状区域的宽度越狭窄,预测值与实际值越接近,其模型拟合的精度越高,(3)正确;(4)设随机变量ξ服从正态分布()0,1N ,若()1P p ζ>=,则()1P p ζ<-=,则()1112P p ζ-<<=-,则()1102P p ζ-<<=-,故(4)正确, 故正确的命题的个数为3个,故选B. 【点睛】本题主要通过对多个命题真假的判断,主要综合考查独立性检验的定义、方差的性质、残差的性质以及正态分布的对称性,属于中档题. 这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.7.C解析:C 【解析】因为统计量2χ有三个临界值:2.706、3.841和6.635,而2χ=18.87>6.635,所以有99%的把握认为两者有关,选C.8.B解析:B【解析】由独立性检验的知识知:K 2>3.841时,有95%的把握认为“变量X 与Y 有关系”;K 2>6.635时,有99%的把握认为“变量X 与Y 有关系”.故选项B 正确.9.C解析:C【解析】∵P (k >5.024)=0.025,故在犯错误的概率不超过0.025的条件下,认为“X 和Y 有关系”. 考点:独立性检验.10.A解析:A 【解析】 设2t x = ,则11(014916)6,(1 1.3 3.2 5.68.9)455t y =++++==++++=,所以点(6,4)在直线12y t a =+上,求出1a =,选A.点睛:本题主要考查了散点图,属于基础题.样本点的中心(),x y 一定在直线回归直线上,本题关键是将原曲线变形为12y t a =+,将点(6,4)代入,求出值. 11.C解析:C 【解析】因为2 6.023K =,且5.024 6.023 6.635≤≤,所以有把握认为“爱好该项运动与性别有关”的可信度P 满足10.02510.010P -≤≤-,即0.9750.99P ≤≤,应选答案C 。
高中数学选修2-3 第三章 统计案例 章末检测题

高中数学选修2-3第三章 统计案例 章末检测题(满分150分,时间120分钟)一、选择题(本大题共12小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.分析人的身高与体重的关系,可以用( ) A .残差分析 B .回归分析 C .等高条形图D .独立性检验【解析】因为身高与体重是两个具有相关关系的变量,所以要用回归分析来解决. 【答案】B2.为了评价某个电视栏目的改革效果,在改革前后分别从居民点抽取了100位居民进行调查,经过计算K 2≈0.99,根据这一数据分析,下列说法正确的是( )A .有99%的人认为栏目优秀B .有99%的人认为栏目是否优秀与改革有关系C .有99%的把握认为电视栏目是否优秀与改革有关系D .没有理由认为电视栏目是否优秀与改革有关系【解析】由于K 2=0.99<3.841,所以没有理由认为电视栏目是否优秀与改革有关系,故选D.【答案】D3.已知一个线性回归方程为y ∧=1.5x +45,其中x 的取值依次为1,7,5,13,19,则y =( ) A .58.5 B .46.5 C .60 D .75【解析】x =1+7+5+13+195=9,因为回归直线方程过点(x ,y ),所以y =1.5×x +45=1.5×9+45=58.5【答案】A4.设有一个回归方程为y ∧=3-5x ,当变量x 增加一个单位时( ) A .y 平均增加3个单位 B .y 平均减少5个单位 C .y 平均增加5个单位D .y 平均减少3个单位【解析】-5是斜率的估计值,说明x 每增加一个单位,y 平均减少5个单位. 【答案】B5.若由一个2×2列联表中的数据计算得K 2=6.630,则判断“这两个分类变量有关系”时,犯错误的最大概率是( )A .0.025B .0.01C .0.005D .0.001【解析】∵P (K 2>5.024)=0.025.又K 2=6.630>5.024,∴犯错误的最大概率为0.025. 【答案】A6.如图5个(x ,y )数据,去掉D (3,10)后,下列说法错误的是( )A .相关系数r 变大B .残差平方和变小C .相关指数R 2变大D .解释变量x 与预报变量y 的相关性变强【解析】由散点图知,去掉D 后,x 与y 的相关性变强,且为正相关,所以r 变大,R 2变大,残差平方和变小.【答案】B7.假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其2×2列联表为:以下数据中,对于同一样本能说明X 与Y 有关的可能性最大的一组为( ) A .A =5,b =4,c =3,d =2 B .A =5,b =3,c =4,d =2 C .A =2,b =3,c =4,d =5 D .A =2,b =3,c =5,d =4【解析】可计算|ad -bc|的值,值越大说明X 与Y 有关的可能性越大. 【答案】D8.变量x 、y 具有线性相关关系,当x 取值为16,14,12,8时,通过观测得到y 的值分别为11,9,8,5.若在实际问题中,y 最大取值是10,则x 的最大取值不能超过( )A .14B .15C .16D .17【解析】根据题意y 与x 呈正相关关系,由最小二乘法或计算器求得回归系数a ∧≈-0.857,b ∧≈0.729,所以线性回归方程为y ∧=0.729x -0.857.当y ∧=10时,得x ≈15.【答案】B9.硕士学位与博士学位的一个随机样本给出了关于所获取学位类别与学生性别的分类数据如表所示:根据以上数据,则( )A .性别与获取学位类别有关B .性别与获取学位类别无关C .性别决定获取学位的类别D .以上都是错误的【解析】由列联表可得:博士:男性占2735≈77%,女性占835≈23%,相差很大,所以性别与获取学位的类别有关,故选A.【答案】A10.在两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的R 2如下,其中拟合效果最好的模型是( )A .模型1的R 2为0.30B .模型2的R 2为0.50C .模型3的R 2为0.75D .模型4的R 2为0.98 【解析】R 2越大,拟合效果越好. 【答案】D11.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y 对x A .y =x -1 B .y =x +1 C .y =88+12x D .y =176【解析】将表中的五组数据分别代入选项验证,可知y =88+12x 最适合.【答案】C12.若对于变量y 与x 的10组统计数据的回归模型中,相关指数R 2=0.95,又知残差平方和为120.53,那么()1021i i y y=-∑的值为( )A .241.06B .2 410.6C .253.08D .2 530.8【解析】R 2=1-∑i =110(y i -y ∧i )2∑i =110(y i -y )2,得0.95=1-120.53∑i =110 (y i -y )2,得()1021i i y y=-∑=120.531-0.95=2 410.6.【答案】B二、填空题(本大题共4小题,每小题4分,共16分.请把正确的答案填在题中的横线上)13.在两个变量的回归分析中,R 2=________,R 2的值越________________________________________________________________________,说明残差平方和越________,也就是说模型的拟合效果越________.【答案】1-∑i =1n(y i -y ∧i )2∑i =1n(y i -y )2大 小 好14.已知样本数为11,计算得∑i =111x i =510,∑i =111y i =214,回归方程为y ∧=0.3x +a ∧,则x ≈________,a ∧≈________.(精确到0.01)【解析】由题意,x =111∑i =111x i =51011≈46.36,y =111∑i =111y i =21411,因为y =0.3x +a ∧,所以21411=0.3×51011+a ∧,可求得a ∧≈5.55. 【答案】46.36 5.5515.某单位为了了解用电量y (度)与气温x (°C )之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表,由表中数据得线性回归方程y ∧=b ∧x +a ∧,其中b ∧=-2.现预测当气温为-4°C 时,用电量的度数约为________.【解析】x =14(18+13+10-1)=10,y =14(24+34+38+64)=40,b ∧=-2.又回归方程y ∧=-2x +a ∧过点(10,40),故a ∧=60,所以当x =-4时,y ∧=-2×(-4)+60=68. 【答案】6816.若两个分类变量X 与Y 的列联表为:则“X 与Y 【解析】由列联表数据,可求得随机变量K 2的观测值k =81×(10×16-40×15)225×56×50×31≈7.227>6.635.因为P(K 2≥6.635)≈0.01.所以“x 与y 之间有关系”出错的概率仅为0.01.【答案】0.01三、解答题(本大题共6个小题,共74分.解答时应写出必要的文字说明、证明过程或演算步骤)17.(本小题满分12分)某研究者欲考察某一高考试题的得分情况是否与性别有关系,统计结果如下:及格的人中男生有290人,女生有100人;不及格的人中男生有160人,女生有350人.试根据这些数据判断这一高考试题的得分情况与性别是否有关系.【解析】根据题中数据得如下列联表:由列联表中的数据得k =900×(290×350-100×160)2450×450×390×510≈163.348>10.828,所以在犯错误的概率不超过0.001的前提下认为“这一高考试题的得分情况与性别有关系.”18.(本小题满分12分)有一台机床可以按各种不同的速度运转,其加工的零件有一些是二级品,每小时生产的二级品零件的数量随机床运转的速度而变化.下面是试验的结果:(1)(2)求出机床运转的速度x 与每小时生产二级品数量y 的回归直线方程;(3)若实际生产中所允许的二级品不超过10个,那么机床的运转速度不得超过多少转/秒?【解析】(1)散点图如下图所示:(2)易求得x =12.5,y =8.25,∴b ∧=∑i =14x i y i -4x y∑i =14x 2i -4x2≈0.728 6,a ∧=y -b ∧x =-0.857 5, 即所求回归直线的方程为:y ∧=0.728 6x -0.857 5.(3)根据公式,要使y ∧≤10, 只要0.728 6x -0.857 5≤10, 解得x ≤14.901 9,即机床的运转速度不能超过14.901 9转/秒.19.(本小题满分12分)有两个分类变量X 与Y ,其一组观测值如下面的2×2列联表所示:其中,a ,15-a 均为大于50.10的前提下认为“X 与Y 之间有关系”?【解析】要使在犯错误的概率不超过0.10的前提下认为“X 与Y 之间有关系”,需要随机变量K 2的观测值大于2.706.∵a +(20-a )=20, (15-a )+(30+a )=45,a +(15-a )=15,(20-a )+(30+a )=50, a +(20-a )+(15-a )+(30+a )=65,则 K 2=65×[a (30+a )-(20-a )(15-a )]220×45×15×50=13(13a -60)25 400>2.706,解之可得,a >7.19或a <2.04,而由原题知a >5且15-a >5,a ∈Z ,即a =6,7,8,9.故当a =8或9时,可在犯错误的概率不超过0.10的前提下认为X 和Y 之间有关系. 20.(本小题满分12分)下表提供了某厂生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据.(1)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ∧=b ∧x +a ∧; (2)请求出R 2,并说明残差变量对预报变量的影响约占百分之几.(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)【解析】(1)∑i =14x i y i =66.5,∑i =14x 2i =32+42+52+62=86,x =4.5,y =3.5b ∧=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7a ∧=y -b ∧x =3.5-0.7×4.5=0.35所求的线性回归方程为y ∧=0.7x +0.35 (2)计算得残差及偏差的数据如下表:从而得∑i =14(y i -y ∧i )2=0.05,∑i =14(y i -y )2=2.5所以R 2=1-∑i =14(y i -y ∧i )2∑i =14(y i -y )2=1-0.052.5=0.98.所以残差变量对预报变量的贡献率约为2%.21.(本小题满分13分)针对时下的“韩剧热”,某校团委对“学生性别和是否喜欢韩剧是否有关”做了一次调查,其中女生人数是男生人数的12,男生喜欢韩剧的人数占男生人数的16,女生喜欢韩剧的人数占女生人数的23.(1)若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有多少人?(2)若没有充分的证据显示是否喜欢韩剧和性别有关,则男生至多有多少人? 【解析】设男生人数为x ,依题意可得列联表如下:(1)则K 2>3.841, 由K 2=3x 2⎝⎛⎭⎫x 6×x 6-5x 6×x 32x ·x 2·x 2·x =38x >3.841,解得x >10.24, ∵x 2,x6为整数, ∴若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有12人;(2)若没有充分的证据显示是否喜欢韩剧和性别有关, 则K 2≤2.706,由K 2=3x 2⎝⎛⎭⎫x 6×x 6-5x 6×x 32x ·x2·x 2·x =38x ≤2.706,解得x ≤7.216, ∵x 2,x6为整数, ∴若没有充分的证据显示是否喜欢韩剧和性别有关,则男生至多有6人.22.(本小题满分13分)某种生物的产卵数与温度有一定的关系,现在收集了7组数据,如下表:【解析】将上表中的数据作成散点图(如图1),可以发现这些点并不是分布在一条直线的附近,而是近似地分布在一个二次函数的图象的附近,因此可用非线性回归模型进行分析,令t =x 2,得到下表:再做出y 和t 的散点图(如图2),发现这些点分布在一条直线的附近,所以y 与t 线性相关,由公式可计算求得:b ∧=∑t i y i -7t y ∑t 2i -7t2≈0.37,a ∧=y -b ∧t =-204.90,于是y ∧=0.37t -204.90,故y 与x 之间的回归方程是y ∧=0.37x 2-204.90,当x =50时,代入可得y ∧=720.1,故由此可以估计温度在50°C 时的产卵数量大约为720个.。
2020版人教A版数学选修2-3同步配套练习:第三章 统计案例 检测(B) Word版含解析

姓名,年级:时间:第三章检测(A)(时间:90分钟满分:120分)附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)一、选择题(本大题共10小题,每小题5分,共50分。
在每小题给出的四个选项中,只有一项是符合题目要求的)1在建立两个变量y与x的回归模型时,分别选择了4个不同的模型,它们的R2如下,其中拟合得最好的模型为 ()A。
模型1的R2为0。
75 B.模型2的R2为0.90C。
模型3的R2为0。
25 D。
模型4的R2为0。
552的值越大,意味着残差平方和越小,也就是说拟合效果越好。
答案:B2随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.由K2=n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)得K2的观测值k=100×(45×22-20×13)2≈9.616.65×35×58×42则正确的结论是()A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关"B.在犯错误的概率不超过0。
1%的前提下,认为“生育意愿与城市级别无关”C.在犯错误的概率不超过0。
005的前提下,认为“生育意愿与城市级别有关”D。
在犯错误的概率不超过0。
005的前提下,认为“生育意愿与城市级别无关”3工人月工资y (单位:元)与劳动生产率x (单位:千元)变化的线性回归方程为y ^=90x +60,下列说法中正确的是( )A 。
劳动生产率每提高1 000元,月工资提高150元左右 B.劳动生产率每提高1 000元,月工资提高90元左右 C.劳动生产率为1 000元时,月工资提高90元 D 。
以上说法都不正确,而是预报变量可能取值的平均值,因此当劳动生产率每提高1 000元,月工资提高90元左右。
故选B 。
答案:B4根据如下样本数据:得到的回归方程为y ^=b x +a ^,则( ) A .a ^>0,b ^>0B.a ^>0,b ^<0 C .a ^<0,b ^>0D.a ^<0,b ^<0y 值总体上是随x 值的增大而减少的,故b ^<0.又回归直线过第一象限,故纵截距a ^>0.故选B.答案:B5已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( )A .y ^=0.4x +2.3B.y ^=2x −2.4C .y ^=−2x +9.5D.y ^=−0.3x +4.4x与y正相关,可知x的系数为正,排除C,D.而所有的回归直线必经过点(x,y),由此排除B,故选A。
【数学】2020高中数学人教A版选修23第三章统计案例综合检测

【关键字】数学【课堂新坐标】(教师用书)2013-2014学年高中数学第三章统计案例综合检测新人教A版选修2-3(时间:90分钟,满分:120分)一、选择题(本大题共10小题,每小题5分共50分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.下列说法中错误的是( )A.如果变量x与y之间存在着线性相关关系,则我们根据试验数据得到的点(xi,yi)(i =1,2,…,n)将散布在某一条直线的附近B.如果两个变量x与y之间不存在着线性关系,那么根据它们的一组数据(xi,yi)(i =1,2,…,n)不能写出一个线性方程C.设x,y是具有相关关系的两个变量,且y关于x的线性返回方程为=x+,叫做返回系数D.为使求出的线性返回方程有意义,可用统计检验的方法来判断变量y与x之间是否存在线性相关关系【解析】任何一组(xi,yi)(i=1,2,…,n)都能写出一个线性方程,只是有的无意义.【答案】 B图12.如图1所示,图中有5组数据,去掉________组数据后(填字母代号),剩下的4组数据的线性相关性最大.( )A.E B.CC.D D.A【解析】由图易知A、B、C、D四点大致在一条直线上,而E点偏离最远,故去掉E 点后数据的相关性最大.【答案】 A3.每一吨铸铁成本yc(元)与铸件废品率x%建立的返回方程=56+8x,下列说法正确的是( )A.废品率每增加1%,成本每吨增加64元B.废品率每增加1%,成本每吨增加8%C.废品率每增加1%,成本每吨增加8元D.如果废品率增加1%,则每吨成本为56元【解析】根据返回方程知y是关于x的单调增函数,并且由系数知x每增加一个单位,y平均增加8个单位.【答案】 C4.用等高条形图粗估计两个分类变量是否相关.观察下列各图,其中两个分类变量关系最强的是( )【解析】根据上述等高条形图可知,D中差距较大,所以分类变量关系最强.【答案】 D5.(2012·沈阳高二检测)经过对K2的统计量的研究,得到了若干个临界值,当K2≤2.706时,我们认为事件A与B( )A.在犯错误的概率不超过0.05的前提下有关系B.在犯错误的概率不超过0.01的前提下有关系C.没有充分理由认为A与B有关系D.不能确定【解析】因为K2≤2.706,而犯错误的概率约为15%,所以没有充分理由认为A与B 有关系.【答案】 C6.若两个变量的残差平方和是325, (yi-)2=923,则随机误差对预报变量的贡献率约为( )A.64.8% B.60%C.35.2% D.40%【解析】由题意可知随机误差对预报变量的贡献率约为≈0.352.【答案】 C7.独立检验中,假设H0:变量X与变量Y没有关系,则在H0成立的情况下,P(K2≥6.635)=0.010表示的意义是( )A.变量X与变量Y有关系的概率为1%B.变量X与变量Y没有关系的概率为99.9%C.变量X与变量Y没有关系的概率为99%D.变量X与变量Y有关系的概率为99%【解析】由题意知变量X与Y没有关系的概率为0.01,即认为变量X与Y有关系的概率为99%.【答案】 D8.(2012·郑州高二检测)收集一只棉铃虫的产卵数y与温度x的几组数据后发现两个变量有相关关系,并按不同的曲线来拟合y与x之间的返回方程,并算出了对应相关指数R2如下表:y ∧=x -0.782-1A.=19.8x -463.7B.=e0.27x -3.84C.=0.367x2-202D.=【解析】 用相关指数R 2来刻画回归效果,R 2的值越大,说明模型的拟合效果越好. 【答案】 B9.某地财政收入x 与支出y 满足线性回归方程y ∧=bx +a +e (单位:亿元),其中b =0.8,a =2,|e |<0.5,如果今年该地区财政收入10亿元,年支出预计不会超过( )A .10亿B .9亿C .10.5亿D .9.5亿【解析】 代入数据得y =10+e ,∵|e |<0.5, ∴|y |<10.5,故不会超过10.5亿. 【答案】 C10.某化工厂为预测某产品的回收率y ,需要研究它和原料的有效成分含量x 之间的相关关系.现取了8对观测值,经计算得:∑i =18x i =52,∑i =18y i =228,∑i =18x 2i =478,∑i =18x i y i =1 849,则y 与x 的回归方程为( )A.y ∧=2.62x +11.47 B.y ∧=2.62x -11.47 C.y ∧=11.47x +2.62 D.y ∧=-2.62x +11.47 【解析】 x =18×52=6.5,y =28.5,∵回归直线过(x ,y ),经验证可知答案应为A.【答案】 A二、填空题(本大题共4小题,每小题5分,共20分,将答案填在题中的横线上) 11.已知回归直线斜率的估计值是 1.23,样本点的中心为(4,5),则回归直线方程为________.【解析】 设回归直线方程为y ∧=1.23x +a ∧,又方程过样本中心,∴5=1.23×4+a ∧,∴a ∧=0.08.【答案】 y ∧=1.23x +0.0812.若一组观测值(x 1,y 1),(x 2,y 2)…(x n ,y n )之间满足y i =bx i +a +e i (i =1,2,…,n ),若e i 恒为0,则R 2为________.【解析】 e i 恒为0,说明随机误差总为0,于是y i =y ∧,故R 2=1. 【答案】 113.下列是关于出生男婴与女婴调查的列联表晚上 白天 总计男婴 45AB 女婴 E35C总计98D180那么A =________,B =________,C ________,D =________,E =________. 【解析】 ∵45+E =98,∴E =53, ∵E +35=C ,∴C =88, ∵98+D =180,∴D =82, ∵A +35=D ,∴A =47, ∵45+A =B ,∴B =92. 【答案】 47 92 88 82 5314.根据下表,计算K 2的观测值k ≈________.(保留两位小数)又发病 未发病 作移植手术 39 157 未作移植手术29167【解析】 k =392×39×167-157×292196×196×68×324≈1.78.【答案】 1.78三、解答题(本大题共4小题,共50分.解答应写出文字说明,证明过程或演算步骤) 15.(本小题满分12分)某单位为了了解用电量y (度)与气温x (℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表,由表中数据得线性回归方程y ∧ =b ∧ x +a ∧ ,其中b ∧=-2.现预测当气温为-4℃时,用电量的度数约为多少?用电量y (度) 24 34 38 64 气温x (℃)181310-1【解】 由题意可知x =14(18+13+10-1)=10, y =14(24+34+38+64)=40,b ∧=-2. 又回归方程y ∧ =-2x +a ∧过点(10,40),故a ∧=60. 所以当x =-4时,y ∧=-2×(-4)+60=68.故当气温为-4 ℃时,用电量的度数约为68度.16.(本小题满分12分)已知10只狗的血球体积x (单位:mm 3)及红血球数y (单位:百万)的测量值如下:x 45 42 46 48 42 35 58 40 39 50 y6.536.309.257.506.995.909.496.206.557.72(1)画出散点图;(2)求出y 对x 的回归线性方程;(3)若血球体积为49 mm 3,预测红血球数大约是多少? 【解】 (1)散点图如图(2)设线性回归方程为y ∧ =b ∧ x +a ∧,由表中数据代入公式,得b ∧=∑i =110x i y i -10x y∑i =110x 2i -10x2≈0.16,a ∧ =y -b ∧x ≈0.12.所以所求线性回归方程为y ∧=0.16x +0.12.(3)把x =49代入线性回归方程得:y ∧=0.16×49+0.12≈7.96(百万),计算结果表明,当血球体积为49 mm 3时,红血球数大约为7.96百万.17.(本小题满分12分)对某校小学生进行心理障碍测试得如下列联表:(其中焦虑、说谎、懒惰都是心理障碍)焦虑 说谎 懒惰 总计 女生 5 10 15 30 男生 20 10 50 80 总计252065110试说明在这三种心理障碍中哪一种与性别关系最大?【解】 利用已知条件来判断两个分类变量是否具有关系,可以先假设两个变量之间有关系,再计算K 2的值,如果K 2的值越大说明两个变量之间有关系的可能性也就越大,再参考临界值,从而判断两个变量有关系的可信程度.对于上述三种心理障碍分别构造三个随机变量K 21,K 22,K 23,由表中数据可得 K 21=110×5×60-25×20230×80×25×85≈0.863,K 22=110×10×70-20×10230×80×20×90≈6.366,K 23=110×15×30-15×50230×80×65×45≈1.410.因为K 22的值最大,所以说谎与性别关系最大.18.(本小题满分14分)(2013·福建高考)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60)、[60,70)、[70,80)、[80,90)、[90,100]分别加以统计,得到如图2所示的频率分布直方图.25周岁以上组25周岁以下组图2(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?附:χ2=n n 11n 22-n 12n 212n 1+n 2+n +1n +2P (χ2≥k )0.100 0.050 0.010 0.001 k2.7063.8416.63510.828(注:此公式也可以写成K 2=n ad -bc 2a +bc +d a +cb +d)【解】 (1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名,所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),记为A 1,A 2,A 3;25周岁以下组工人有40×0.05=2(人),记为B 1,B 2. 从中随机抽取2名工人,所有的可能结果共有10种,它们是:(A 1,A 2),(A 1,A 3),(A 2,A 3),(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(A 3,B 1),(A 3,B 2),(B 1,B 2).其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是:(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(A 3,B 1),(A 3,B 2),(B 1,B 2).故所求的概率P =710.(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手60×0.25=15(人),“25周岁以下组”中的生产能手40×0.375=15(人),据此可得2×2列联表如下:生产能手 非生产能手合计 25 周岁以上组 15 45 60 25周岁以下组15 25 40 合计3070100所以得K2=n ad-bc2a+b c+d a+c b+d=100×15×25-15×45260×40×30×70=2514≈1.79.因为1.79<2.706,所以没有90%的把握认为“生产能手与工人所在的年龄组有关”.此文档是由网络收集并进行重新排版整理.word可编辑版本!。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章检测(A)(时间:90分钟满分:120分)附:K2-一、选择题(本大题共10小题,每小题5分,共50分.在每小题给出的四个选项中,只有一项是符合题目要求的)1在建立两个变量y与x的回归模型时,分别选择了4个不同的模型,它们的R2如下,其中拟合得最好的模型为 ()A.模型1的R2为0.75B.模型2的R2为0.90C.模型3的R2为0.25D.模型4的R2为0.552的值越大,意味着残差平方和越小,也就是说拟合效果越好.2随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.由K2-得K2的观测值k-9.616.则正确的结论是()A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”C.在犯错误的概率不超过0.005的前提下,认为“生育意愿与城市级别有关”D.在犯错误的概率不超过0.005的前提下,认为“生育意愿与城市级别无关”3工人月工资y(单位:元)与劳动生产率x(单位:千元)变化的线性回归方程为下列说法中正确的是A.劳动生产率每提高1 000元,月工资提高150元左右B.劳动生产率每提高1 000元,月工资提高90元左右C.劳动生产率为1 000元时,月工资提高90元D.以上说法都不正确,而是预报变量可能取值的平均值,因此当劳动生产率每提高1 000元,月工资提高90元左右.故选B.4根据如下样本数据:x345678得到的回归方程为则ACy值总体上是随x值的增大而减少的,故又回归直线过第一象限故纵截距故选5已知变量x与y正相关,且由观测数据算得样本平均数则由该观测数据算得的线性回归方程可能是ACx与y正相关,可知x的系数为正,排除C,D.而所有的回归直线必经过点由此排除B,故选A.6为考察A,B两种药物预防某疾病的效果,进行动物试验,分别得到如下等高条形图:药物A试验结果药物B试验结果根据图中信息,在下列各项中,说法最佳的一项是()A.药物A,B对该疾病均没有预防效果B.药物A,B对该疾病均有显著的预防效果C.药物A的预防效果优于药物B的预防效果D.药物B的预防效果优于药物A的预防效果,药物A试验显示不服药与服药时患病的差异较药物B试验显示明显大,所以药物A的预防效果优于药物B的预防效果.故选C.7下列说法:①若r>0,则x增大时,y也相应增大;②若r<0,则x增大时,y也相应增大;③若r=1或r=-1,则x与y的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上.正确的有() A.①② B.②③C.①③D.①②③①③正确.8为了考察某种病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表,可得出()A.在犯错误的概率不超过0.05的前提下,认为“小动物是否被感染与有没有服用疫苗有关”B.在犯错误的概率不超过0.05的前提下,认为“小动物是否被感染与有没有服用疫苗无关”C.在犯错误的概率不超过0.005的前提下,认为“小动物是否被感染与有没有服用疫苗有关”D.在犯错误的概率不超过0.005的前提下,认为“小动物是否被感染与有没有服用疫苗无关”2的观测值k-4.762>3.841,所以在犯错误的概率不超过0.05的前提下,认为“小动物是否被感染与有没有服用疫苗有关”.故选A.9已知x与y之间的几组数据如下表:假设根据上表数据所得线性回归直线方程为根据表中的两组数据和求得的直线方程为则以下结论正确的是AC,n=6故-故可得-把代入可得比较可得故选而由直线方程的求解可得b'--10在利用最小二乘法求回归方程时用到了下表中的组数据则表格中的值为A.68B.70C.75D.72得因为回归直线过样本点的中心点所以解得故选二、填空题(本大题共5小题,每小题5分,共25分.把答案填在题中的横线上)11为了判断高三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如图所示2×2列联表:已知P(K≥3.841)≈0.05,P(K≥5.024)≈0.025.根据表中数据,得到K的观测值k-4.844,则在犯错误的概率不超过的前提下认为选修文科与性别有关.-4.844,因为5.024>4.844>3.841,所以在犯错误的概率不超过由题意知,K20.05的前提下,认为选修文科与性别有关..0512假设关于某设备的使用年限x(单位:年)和所支出的维修费用y(单位:万元)有如下的统计资料:若由资料可知y对x呈线性相关关系,且线性回归方程为其中已知请估计使用年限为年时维修费用约为,∵回归直线一定经过样本点的中心∴5∴线性回归方程为故估计使用年限为20年时,维修费用约为y=1.23×20+0.08=24.68(万元)..68万元13某社会实践调查小组,在对高中学生“能否良好使用手机”的调查中,随机发放了120份问卷.对收回的100份有效问卷进行统计,得到如下2×2列联表:如果认为“能否良好使用手机与性别有关”犯错误的概率不超过p,那么根据临界值表,最精确的p的值应为.,k≈3.03,因为2.706<3.03<3.841,所以能够在犯错误的概率不超过0.10的前提下认为“能否良好使用手机与性别有关”,即最精确的p的值为0.1..114为了了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的2×2列联表:则在犯错误的概率不超过的前提下认为喜爱打篮球与性别有关.(请用百分数表示)K2的观测值k-8.33>7.879,则在犯错误的概率不超过0.005的前提下认为“喜爱打篮球与性别有关”..5%15对有关数据的分析可知,每立方米混凝土的水泥用量x(单位:kg)与28天后混凝土的抗压度y(单位:kg/cm2)之间具有线性相关关系,其线性回归方程为根据建设项目的需要天后混凝土的抗压度不得低于则每立方米混凝土的水泥用量最少应为精确到,得0.30x+9.99≥89.7,解得x≥265.7..7 kg三、解答题(本大题共5小题,共45分.解答时应写出文字说明、证明过程或演算步骤)16(8分)某班主任对全班50名学生的学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?(2)试运用独立性检验的思想方法分析:能否在犯错误的概率不超过0.001的前提下认为学生的学习积极性与对待班级工作的态度有关系?并说明理由.运用古典概型概率公式求值.(2)求出随机变量,说明关系.积极参加班级工作的学生有24人,不太主动参加班级工作且学习积极性一般的学生有19人,总人数为50人,∴抽到积极参加班级工作的学生的概率为抽到不太主动参加班级工作且学习积极性一般的学生的概率为(2)k-11.5.∵k>10.828,∴在犯错误的概率不超过0.001的前提下认为学生的学习积极性与对待班级工作的态度有关系.17(8分)某个服装店经营某种服装,在某周内获纯利y(单位:元)与该周每天销售这种服装数x(单位:件)之间的一组数据关系见下表:已知(1)求(2)判断纯利y(单位:元)与每天销售件数x之间是否线性相关,如果线性相关,求出回归方程.(2)画出散点图如图,可知y与x有线性相关关系,设回归直线方程为-51.36.-故回归方程为18(9分)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:(1)估计该地区老年人中需要志愿者提供帮助的老年人的比例;(2)能否在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中需要志愿者提供帮助的老年人的比例?说明理由.调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要志愿者提供帮助的老年人的比例的估计值为(2)k-9.967.因为9.967>6.635,所以在犯错误的概率不超过0.01的前提下,认为该地区的老年人是否需要帮助与性别有关.(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法,比采用简单随机抽样方法更好.19(10分)在关于人的脂肪含量(单位:百分比)和年龄x(单位:岁)的关系的研究中,研究人员获得了一组数据如下表:(1)作出散点图,并判断y与x是否线性相关,若线性相关,求线性回归方程;(2)求R2,并说明其含义;(3)给出37岁时人的脂肪含量的预测值.,进而求出回归模型,并依据公式求出R2,进而说明拟合效果.散点图如图.由散点图可知样本点呈条状分布,脂肪含量与年龄有比较好的线性相关关系,因此可以用线性回归方程来刻画它们之间的关系.设线性回归方程为则由计算器算得0.576所以线性回归方程为(237.78.644.99.R2=10.941.R2≈0.941,表明年龄解释了94.1%的脂肪含量变化.(3)当x=37时20.9,故37岁时人的脂肪含量约为20.9%.20(10分)一只红铃虫的产卵数y和温度x有关,现收集了 7 组观测数据列于表中,现有模型①y=c x+c与模型②y两种模型作为产卵数和温度的回归方程来建立两个变量之间的关系已知--21.38--0.323.57.(1)根据表中数据,分别建立两个模型下y关于x的回归方程;(2)假设根据模型①,②计算得出数据--的值分别为与试计算模型的相关指数并根据相关指数选择出拟合效果较好的模型(3)能否用第(2)问选择的模型来预测在100 ℃时一只红铃虫的产卵数,只给出判断,不用说明理由.对于模型①:C1--21.38,由y=C1x+C2,可得C280-21.38×26=-475.88.∴模型①的回归方程为对于模型②:C3--0.32,由y可得3.57-0.32×26=-4.75.∴模型②的回归方程为(2)在模型①中--在模型中--因为所以模型②拟合效果较好.(3)不能.(因为样本的取值范围会影响回归方程的使用范围)。