高中数学 回归分析及独立性检验限时作业练习 苏教版必修1
苏教版高中数学选修1-2 独立性检验 课时作业
2019-2020学年苏教版选修1-2 独立性检验 课时作业
1.某高校《统计初步》课程的教师随机调查了选该课程的一些学生的情况,具体数据如下表:
为了检验主修统计专业是否与性别有关系,根据表中的数据得到随机变量K 2
的观测值为k=
≈2.842.因为k>1.841,所以确认“主修统计专业与性别有关系”,这种判
断出现错误的可能性为 .
【解析】因为随机变量K 2
的观测值k>1.841,所以在犯错误的概率不超过0.05的前提下认为“主修统计专业与性别有关系”.故这种判断出现错误的可能性为5%. 答案: 5%
2.为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.
试分析学生选报文、理科与对外语的兴趣是否有关? 【解析】列出2×2列联表
代入公式得K 2
的观测值 k=
≈1.871×10-2.
因为1.871×10-4<2.706,
所以可以认为学生选报文、理科与对外语的兴趣无关.。
高考数学(理)二轮复习练习:专题限时集训7 回归分析、独立性检验 Word版含答案
专题限时集训(七) 回归分析、独立性检验(对应学生用书第91页)(限时:40分钟)1.(2017·石家庄一模)下列说法错误的是( )【导学号:07804050】A .回归直线过样本点的中心(x ,y )B .两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1C .对分类变量X 与Y ,随机变量K 2的观测值k 越大,则判断“X 与Y 有关系”的把握程度越小D .在回归直线方程y ^=0.2x +0.8中,当解释变量x 每增加1个单位时,预报变量y ^就增加0.2个单位C [根据相关定义知选项A ,B ,D 均正确;选项C 中,对分类变量X 与Y ,随机变量K 2的观测值k 越大,对判断“X 与Y 有关系”的把握程度越大,故C 错误.选C.]2.(2017·湖南名校联考)利用独立性检验来考虑两个分类变量X 和Y 是否有关系时,通过查阅下表来确定“X 和Y 有关系”的可信度.如果k >3.841,那么有把握认为“X 和Y 有关系”的百分比为C .99.5%D .95%D [由图表中数据可得,当k >3.841时,有0.05的几率说明这两个变量之间的关系是不可信的,即有1-0.05=0.95的几率,也就是有95%的把握认为变量之间有关系,故选D.] 3.(2017·湖北七市联考)广告投入对商品的销售额有较大影响.某电商对连续5个年度的广告费x 和销售额y 进行统计,得到统计数据如下表(单位:万元):由上表可得回归方程为y ^=10.2x +a ^,据此模型,预测广告费为10万元时销售额约为( )【导学号:07804051】A .101.2万元B .108.8万元C .111.2万元D .118.2万元C [根据统计数据表,可得x =15×(2+3+4+5+6)=4,y =15×(29+41+50+59+71)=50,而回归直线y ^=10.2x +a ^经过样本点的中心(4,50),∴50=10.2×4+a ^,解得a ^=9.2,∴回归方程为y ^=10.2x +9.2,∴当x =10时,y ^=10.2×10+9.2=111.2,故选C.] 4.(2017·佛山二模)现行普通高中学生在高一升高二时面临着选文理科的问题,学校抽取了部分男、女学生意愿的一份样本,制作出如图77所示的两个等高堆积条形图.图77根据这两幅图中的信息,下列哪个统计结论是不正确的( ) A .样本中的女生数量多于男生数量B .样本中有理科意愿的学生数量多于有文科意愿的学生数量C .样本中的男生偏爱理科D .样本中的女生偏爱文科D [由图2知,样本中的女生数量多于男生数量,样本中的男生、女生均偏爱理科;由图1知,样本中有理科意愿的学生数量多于有文科意愿的学生数量,故选D.]5.(2016·汕头模拟)对四组不同数据进行统计,分别获得以下散点图,如果对它们的相关系数进行比较,下列结论中正确的是( )图78(1)图78(2)图78(3)图78(4)A .r 2<r 4<0<r 3<r 1B .r 4<r 2<0<r 1<r 3C .r 4<r 2<0<r 3<r 1D .r 2<r 4<0<r 1<r 3A [由给出的四组数据的散点图可以看出,图(1)和图(3)是正相关,相关系数大于0,图(2)和图(4)是负相关,相关系数小于0,图(1)和图(2)的点相对更加集中,所以相关性要强,所有r 1接近于1,r 2接近于-1,由此可得r 2<r 4<r 3<r 1.故选A.]6.(2017·南昌一模)设某中学的高中女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据样本数据(x i ,y i )(i =1,2,3,…,n ),用最小二乘法近似得到回归直线方程为y ^=0.85x -85.71,则下列结论中不正确的是( ) A .y 与x 具有正线性相关关系 B .回归直线过样本点的中心(x ,y )C .若该中学某高中女生身高增加1 cm ,则其体重约增加0.85 kgD .若该中学某高中女生身高为160 cm ,则可断定其体重必为50.29 kgD [因为回归直线方程y ^=0.85x -85.71中x 的系数为0.85>0,因此y 与x 具有正线性相关关系,所以选项A 正确;由最小二乘法及回归直线方程的求解可知回归直线过样本点的中心(x ,y ),所以选项B 正确;由于用最小二乘法得到的回归直线方程是估计值,而不是具体值,若该中学某高中女生身高增加1 cm ,则其体重约增加0.85 kg ,所以选项C 正确,选项D 不正确.]7.在用线性回归方程研究四组数据的拟合效果中,分别作出下列四个关于四组数据的残差图,则用线性回归模式拟合效果最佳的是( )ABCDC[当残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明拟合精度越好,拟合效果越好,对比4个残差图,易知选项C的图对应的带状区域的宽度越窄.故选C.]8.(2017·江西南城一中、高安中学第九校3月联考)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.由K 2=a +bc +d a +cb +d,得K 2=65×35×58×42≈9.616.参照下表,A .在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”B .在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”C .有99%以上的把握认为“生育意愿与城市级别有关”D .有99%以上的把握认为“生育意愿与城市级别无关” C [K 2≈9.616>6.635,∴有99%以上的把握认为“生育意愿与城市级别有关”,故选C.] 二、填空题9.(2017·汉中二模)为了研究某种细菌在特定环境下随时间变化的繁殖规律,得到了下表中的实验数据,计算得回归直线方程为y ^=0.85x -0.25.由以上信息,可得表中c 的值为________.【导学号:07804052】6 [x =5=5,y =5=5,代入回归直线方程,得14+c5=0.85×5-0.25,解得c =6.] 10.(2017·安徽百校联盟二模)已知x 、y 的取值为:从散点图可知y 与x 呈线性相关关系,且回归直线方程为y ^=1.2x +a ^,则当x =20时,y 的取值为________.27.6 [由表格可知x =3,y =7.2,所以这组数据的样本点的中心是(3,7.2),根据样本点的中心在回归直线上,得7.2=a ^+1.2×3,得a ^=3.6,所以这组数据对应的回归直线方程是y ^=1.2x +3.6,将x =20代入,得y =1.2×20+3.6=27.6.]11.(2017·山西太原五中一模)某小卖部销售某品牌的饮料的零售价与销量间的关系统计如下:已知x ,y 的关系符合回归方程y =b x +a ,其中b =-20.若该品牌的饮料的进价为2元,为使利润最大,零售价应定为________元. 3.75 [x =3.5,y =40,∴a ^=40-(-20)×3.5=110, ∴回归直线方程为:y ^=-20x +110,利润L =(x -2)(-20x +110)=-20x 2+150x -220, ∴x =15040=3.75元时,利润最大,故答案为3.75.]12.(2017·哈尔滨三中二模)以模型y =c e kx(e 为自然对数的底)去拟合一组数据时,为了求出回归直线方程,设z =ln y ,其变换后得到线性回归方程为z =0.4x +2,则c =________. e 2[∵y =c e kx,∴两边取对数,可得ln y =ln(c e kx )=ln c +ln e kx=ln c +kx , 令z =ln y ,可得z =ln c +kx , ∵z =0.4x +2, ∴ln c =2, ∴c =e 2.] 三、解答题13.(2017·石家庄一模)为了调查某地区成年人血液的一项指标,现随机抽取了成年男性、女性各20人组成一个样本,对他们的这项血液指标进行了检测,得到了如图79所示的茎叶图.根据医学知识,我们认为此项指标大于40为偏高,反之即为正常.图79(1)依据上述样本数据研究此项血液指标与性别的关系,列出2×2列联表,并判断能否在犯错误的概率不超过0.01的前提下认为此项血液指标与性别有关系?(2)以样本估计总体,视样本频率为概率,现从本地区随机抽取成年男性、女性各2人,求此项血液指标为正常的人数X 的分布列及数学期望. 附:K 2=n ad -bc 2a +b c +d a +cb +d,其中n =a +b +c +d .K 2=a +bc +d a +cb +d=20×20×28×12≈1.905<6.635,所以不能在犯错误的概率不超过0.01的前提下认为此项血液指标与性别有关系. (2)由样本数据可知,男性正常的概率为45,女性正常的概率为35.此项血液指标为正常的人数X 的可能取值为0,1,2,3,4,P (X =0)=⎝ ⎛⎭⎪⎫1-452⎝ ⎛⎭⎪⎫1-352=4625,P (X =1)=C 1245⎝⎛⎭⎪⎫1-45⎝⎛⎭⎪⎫1-352+⎝ ⎛⎭⎪⎫1-452C 1235·⎝ ⎛⎭⎪⎫1-35=44625, P (X =2)=⎝ ⎛⎭⎪⎫452⎝ ⎛⎭⎪⎫1-352+C 1245⎝ ⎛⎭⎪⎫1-45·C 1235·⎝ ⎛⎭⎪⎫1-35+⎝ ⎛⎭⎪⎫1-452⎝ ⎛⎭⎪⎫352=169625, P (X =3)=C 1245⎝ ⎛⎭⎪⎫1-45⎝ ⎛⎭⎪⎫352+⎝ ⎛⎭⎪⎫452C 1235·⎝⎛⎭⎪⎫1-35=264625,P (X =4)=⎝ ⎛⎭⎪⎫452⎝ ⎛⎭⎪⎫352=144625,所以X 的分布列为所以E (X )=0×625+1×625+2×625+3×625+4×625=2.8.14.(2017·湖南三湘名校联盟三模)为了研究一种昆虫的产卵数y 和温度x 是否有关,现收集了7组观测数据列于下表中,并作出了散点图,发现样本点并没有分布在某个带状区域内,两个变量并不呈线性相关关系,现分别用模型①:y =C 1x 2+C 2与模型②:y =e C 3x +C 4作为产卵数y 和温度x 的回归方程来建立两个变量之间的关系.∑n i =1x i -xy i -y∑ni =1x i -x 2∑n i =1t i -ty i -y∑ni =1t i -t 2∑n i =1z i -zx i -x∑ni =1x i -x 2∑ni =1z i -zt i -t∑ni =1t i -t2其中t i =x 2i ,t =∑i =1t i ,z i =ln y i ,z =∑i =1z i ,附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v ^=β^u +α^的斜率和截距的最小二乘估计分别为:β^=∑ni =1u i -uv i -v∑ni =1u i -u2,α^=v -β^u .图710(1)在答题卡中分别画出y 关于t 的散点图、z 关于x 的散点图,根据散点图判断哪一个模型更适宜作为回归方程类型?(给出判断即可,不必说明理由).图711(2)根据表中数据,分别建立两个模型下y 关于x 的回归方程;并在两个模型下分别估计温度为30℃时的产卵数.(C 1,C 2,C 3,C 4与估计值均精确到小数点后两位)(参考数据:e 4.65≈104.58,e4.85≈127.74,e5.05≈156.02)(3)若模型①、②的相关指数计算得分分别为R 21=0.82,R 22=0.96,请根据相关指数判断哪个模型的拟合效果更好.【导学号:07804053】[解] (1)画出y 关于t 的散点图,如图1;z 关于x 的散点图,如图2.图1 图2根据散点图可判断模型②更适宜作为回归方程类型. (2)对于模型①:设t =x 2,则y =C 1x 2+C 2=C 1t +C 2,其中C ^1=∑7i =1t i -ty i -y∑7i =1t i -t2=0.43,C ^2=y -C ^1t =80-0.43×692=-217.56,所以y =0.43x 2-217.56,当x =30时,估计温度为y 1=0.43×302-217.56=169.44. 对于模型②:y =e C 3x +C 4⇒z =ln y =C 3x +C 4,其中C ^3=∑7i =1z i -zx i -x∑7i =1x i -x2=0.32,C ^4=z -C ^3x =3.57-0.32×26=-4.75.所以y =e0.32x -4.75,当x =30时,估计温度为y 2=e0.32×30-4.75=e4.85≈127.74.(3)因为R 21<R 22,所以模型②的拟合效果更好.。
1.1 独立性检验作业 高中数学选修1-2 苏教版
学业分层测评(一) 第1章 1.1 独立性检验(建议用时:45分钟)学业达标]一、填空题1.为了检验两个事件A 与B 是否相关,经计算得χ2=3.850,我们有________的把握认为事件A 与B 相关.【答案】 95%2.(2016·连云港月考)为了考查高中生的性别与是否喜欢数学课程之间的关系,某市在该辖区内的高生中随机地抽取300名学生进行调查,得到表中数据:【解析】 由χ2=300×(47×123-35×95)2142×158×82×218≈4.512.【答案】 4.5123.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由χ2=n (ad -bc )(a +b )(c +d )(a +c )(b +d )算得,χ2=110×(40×30-20×20)260×50×60×50≈7.822.附表:①有99%以上的把握认为“爱好该项运动与性别有关”②有99%以上的把握认为“爱好该项运动与性别无关”③在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”④在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”【解析】由附表可得知当χ2≥6.635时,有P=1-P=0.99,当χ2≥10.828时,有P=1-P=0.999,而此时的χ2≈7.822显然有0.99<P<0.999,故可以得到有99%以上的把握认为“爱好该项运动与性别有关”.【答案】①4.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:“是”或“否”).【解析】因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即ba+b=1858,dc+d=2742,两者相差较大,所以经直观分析,收看新闻节目的观众与年龄是有关的.【答案】是5.为了评价某个电视栏目的改革效果,在改革前后分别从某居民点抽取了1 000位居民进行调查,经过计算得χ2≈4.358,根据这一数据分析,下列说法正确的是________.①有95%的人认为该栏目优秀②有95%的人认为该栏目是否优秀与改革有关系③在犯错误的概率不超过0.05的前提下认为该电视栏目是否优秀与改革有关系④没有理由认为该电视栏目是否优秀与改革有关系参考数据如表:下认为该电视栏目是否优秀与改革有关系.【答案】③6.在一项打鼾与患心脏病的调查中,共调查了10 671人,经过计算χ2=27.63.根据这一数据分析,我们有理由认为打鼾与患心脏病是________的(填“有关”或“无关”).【解析】∵χ2=27.63>10.828,∴有99.9%的把握认为“打鼾与患心脏病是有关的.【答案】有关7.为研究某新药的疗效,给50名患者服用此药,跟踪调查后得下表中的数据.设0论:服用此药的效果与患者的性别有关,这种判断出错的可能性为________.【解析】由公式计算得χ2≈4.882>3.841,所以有95%的把握认为服用此药的效果与患者的性别有关,从而有5%的可能性出错.【答案】 4.8825%8.为大力提倡“厉行节约,反对浪费”,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:附:χ2=n (ad -bc )(a +b )(c +d )(a +c )(b +d )参照附表,得到的正确结论的序号是__________.①在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”;②在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”;③有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”; ④有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”. 【解析】 根据列联表中的数据得到χ2=100×(45×15-30×10)255×45×75×25≈3.03>2.706.所以有90%以上的把握认为“该市民能否做到‘光盘’与性别有关”故选③.【答案】 ③ 二、解答题9.某高二班主任对本班50名学生学习积极性和对待班级工作的态度进行长期的调查,得到的统计数据如下表所示:系.【解】 根据列联表中的数据得到χ2=50×(18×19-6×7)225×25×24×26≈11.538>10.828,即有99.9%的把握认为学习的积极性与对待班级工作态度有关.10.为研究学生对国家大事的关心与否与性别是否有关,在学生中随机抽样调查,结果如下:(1)(2)扩大样本容量,将表中每个数据扩大为原来的10倍,然后作出判断分析; (3)从某随机抽取450名学生,其中男,女生数量之比为5∶4,通过问卷调查发现男生关心国家大事的百分率为94%,而女生关心国家大事的百分率为85%,请根据这些数据,判断该的学生是否关心国家大事与性别的关系.【解】 (1)提出假设H 0:学生对国家大事的关心与否与性别无关.由公式可得χ2=400×(182×24-18×176)2200×200×358×42≈0.958.因为χ2≈0.958<2.706,所以我们没有理由认为学生是否关心国家大事与性别有关(当然也不能肯定无关).(2)χ2=4 000×(1 820×240-180×1 760)22 000×2 000×3 580×420≈9.577>6.635,所以我们有99%的把握认为是否关心国家大事与性别有关.(3)依题意得,男、女生人数分别是250人和200人,男生中关心国家大事的人数为235人,女生中关心国家大事的人数为170人;列出2×2列联表如下:由表中数据,得χ2=250×200×405×45=10>6.635,所以我们有99%的把握认为该的学生是否关心国家大事与性别有关.能力提升]1.(2014·苏州月考)2014年10月8日为我国第十七个高血压日,主题是“在家测量您的血压”.某社区医疗服务部门为了考察该社区患高血压病是否与食盐摄入量有关,对该社区的1 633人进行了跟踪调查,得出以下数据:计算χ2盐的摄入量有关系.【解析】 χ2=1 633×(34×1 353-220×26)2254×1 379×1 573×60≈80.155>10.828.故有99.9%的把握认为患高血压病与食盐的摄入量有关系. 【答案】 80.155 99.9%2.某高校“统计初步”课程的教师随机调查了一些学生,具体数据如下表所示,为了判断选修统计专业是否与性别有关系,根据表中数据,得χ2=50×(13×20-10×7)223×27×20×30≈4.844,因为4.844>3.841.所以选修统计专业与性别有关,那么这种判断出错的可能性为__________.5%. 【答案】 5%3.下列关于χ2的说法中,正确的有________(填序号).①χ2的值越大,两个分类变量的相关性越大;②χ2的计算公式是χ2=n(ad-bc)(a+b)(c+d)(a+c)(b+d);③若求出χ2=4>3.841,则有95%的把握认为两个分类变量有关系,即有5%的可能性使得“两个分类变量有关系”的推断出现错误;④独立性检验就是选取一个假设H0条件下的小概率事件,若在一次试验中该事件发生了,这是与实际推断相抵触的“不合理”现象,则作出拒绝H0的推断.【解析】对于①,χ2的值越大,只能说明我们有更大的把握认为二者有关系,却不能判断相关性大小,故①错;对于②,(ad-bc)应为(ad-bc)2,故②错;③④对.【答案】③④4.有两个分类变量X与Y,其一组观测值如下2×2列联表所示:其中X与Y 之间有关系.【解】查表可知:要使有90%的把握认为X与Y之间有关系,则χ2≥2.706,而χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=65×[a·(30+a)-(15-a)·(20-a)]2 45×20×15×50=13×(65a-300)2 50×45×60=13×(13a-60)290×60.∵χ2≥2.706,∴13×(13a -60)290×60≥2.706.即(13a -60)2≥1 124.∴13a -60≥33.5或13a -60≤-33.5. ∴a ≥7.2或a ≤2. 又∵⎩⎨⎧a >5,15-a >5,∴5<a <10且a ∈Z . ∴a =8或9.∴当a =8或9时,有90%的把握认为X 与Y 之间有关系.。
2019-2020学年度最新高中数学苏教版课本回归:1 必修1课本题精选(教师版)
2019-2020学年度最新高中数学苏教版课本回归:1 必修1课本题精选(教师版)一、填空题1.(必修1 P10习题1. 2(7))设U =R ,{}|1A x x =<,{}|B x x m =>若U A B ⊆ð,则实数m 的范围是 .解析 [1,)U A =+∞ð,由U A B ⊆ð,得1m <. 2.(必修1 P13练习5)设{}{}(,)|46,(,)|53A x y y x B x y y x ==-+==-,则A B = .解析 461532y x x y x y=-+=⎧⎧⇒⎨⎨=-=⎩⎩,故{}AB =(1,2)3.(必修1 P27 练习7(1))函数2(),{1,2,3}f x x x x =+∈的值域是 .解析 由函数值域的定义可知该函数的值域是{}2,6,12. 4.(必修1 P31习题2.1(8))已知函数()f x ,()g x 分别由下表给出:那么[(1)]f f = .[(2)]f g = .[(3)]g f = . 解析 [(1)](2)3f f f ==;[(2)](1)2f g f ==;[(3)](4)3g f g ==.5. (必修1 P111.复习题(17))已知定义在实数集R 上的偶函数()f x 在区间+∞[0,)上是单调增函数,若(1)(lg )f f x <,则x 的取值范围为_________.解析 因为()f x 为偶函数,所以(1)(|l g f f x <,又()f x 在区间+∞[0,)上是单调增函数,故1|l g |x <,解得x 的取值范围为110∞(0,)(10,+). 6.(必修1 P52复习题11(2))已知2(2)31f x x =+,则函数()f x 的解析式为 . 解析 令2x t =,则2t x =,有223()3()1124t f t t =+=+,即23()14f x x =+. 7.(必修1 P 29习题2.1(5))已知函数))((b x a x f y ≤≤=,集合A ={))((|),(b x a x f y y x ≤≤=}, B ={}0|),(=x y x ,则AB 的元素个数为_______个.解析 根据函数定义,可知直线x =0和函数图象有一个交点或无交点,则集合的元素的个数为0或1个.8.(必修1 P45习题2.2(11))已知函数()y f x =是R 上的奇函数,且当0x >时,()1f x =,则函数1()2y f x x m =-+有两个零点的充要条件是 . 解析 当0x <时,()()1f x f x =--=-; 当0x =时,(0)0f =.故1,0()0,01,0x f x x x >⎧⎪==⎨⎪-<⎩. 函数1()2y f x x m =-+有两个零点等价于方程1()2f x x m =-有两个不同的实数根,即函数()y f x =的图象与直线12y x m =-有两个不同的交点,易知11m -<-<且0m -≠,即(1,0)(0,1)m ∈-,所以函数1()2y f x x m =-+有两个零点的充要条件是(1,0)(0,1)m ∈-. 二、解答题9.(必修1 P 71习题3.1(2)13)已知函数1()41x f x a =++是奇函数. (1)求实数a 的值;(2)求函数()f x 在[1,1]-上的值域; (3)设函数1()11()2g x f x =-+,对于任意的12,x x ∈R ,试比较12()()2g x g x +与12()2x x g +的大小. 解析 (1)1()41x f x a =++是奇函数且定义域为R,则(0)0f =,得12a =-,经检验,函数()f x 为奇函数.(2)由(1)知11()241x f x =-++,在R 上任取12x x <,则1111()241x f x =-++,2211()241x f x =-++ 有211212121144()()04141(41)(41)x x x x x x f x f x --=-=>++++的 所以函数()f x 在R 上为减函数.故()f x 在[1,1]-上的取值范围是[(1),(1)]f f -,即函数的值域是33[,]1010-(3) ()4xg x =,有1212()()4422x x g x g x ++=,12122()42x x x x g ++= 则121212121222212122()()4422222(22)()4022222x x x x x x x x x x g x g x x x g +++++-⨯⨯--=-==≥故有12()()2g x g x +≥12()2x xg +10.(必修1 P 100练习3)经市场调查,某商品在过去100天内的销售量(单位:件)和价格(单位:元) 均为时间t (单位:天)的函数,且销售量近似地满足1109()(1100,)33g t t t t =-+≤≤∈N .前40天价格为1()22(140,)4f t t t t =+≤≤∈N ,后60天价格为1()52(41100,)2f t t t t =-+≤≤∈N ,(1)试写出该种商品的日销售额S 与时间t 的函数关系; (2)求出日销售量的最大值。
独立性检验 课时作业 高中数学选修1-2 苏教版
第1章 统计案例1.1 独立性检验双基达标 (限时15分钟)1.下面是一个2×2的列联表则表中a ,b 解析 由a +21=73,得a =52, 由a +5=b ,得b =57. 答案 52,572.为了检验两个事件A 与B 是否相关,经计算得χ2=3.850,我们有________ 的把握认为事件A 与B 相关. 答案 95%3.为了考查高中生的性别与是否喜欢数学课程之间的关系,某市在该辖区内 的高中学生中随机地抽取300名学生进行调查,得到表中数据:解析 由χ2=300(47×123-35×95)2142×158×82×218≈4.512.答案 4.5124.下列关于独立性检验的4个叙述,说法正确的是________.①χ2的值越大,说明两事件相关程度越大; ②χ2的值越小,说明两事件相关程度越小; ③χ2≤3.841时,有95%的把握说事件A 与B 无关; ④χ2>6.635时,有99%的把握说事件A 与B 有关.解析 在独立性检验中,随机变量χ2的取值大小只能说明“两分类变量有关”,这一结论的可靠程度,即可信度,而不表示两事件相关的程度,故①②不正确.χ2>6.635说明有99%的把握认为二者有关系,χ2≤3.841时,若x 2>2.706则有90%的把握认为事件A 与B 有关系.因此可知③中说法是不正确的. 答案 ④5.想要检验是否喜欢参加体育活动是不是与性别有关,应该假 设________________.解析 独立性检验假设有反证法的意味,应假设两类变量(而非变量的属性)无关,这时的χ2应该很小,如果χ2很大,则可以否定假设;如果χ2很小,则不能够肯定或者否定假设.答案 H 0:喜欢参加体育活动与性别无关6.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行 了3年的跟踪研究,调查他们是否发作过心脏病,调查结果如下表所示:解 提出假设H 0:两种手术对病人又发作心脏病没有影响.由列联表,得 χ2=392×(39×167-157×29)2196×196×68×324≈1.780<2.706.因为当H 0成立时,χ2≥1.780的概率大于10%,这个概率比较大,所以根据目前的调查数据,不能否定假设H 0,故我们没有理由说这两种手术与“又发作过心脏病”有关,故可以认为病人是否发作心脏病跟他做过何种手术无关.综合提高 (限时30分钟)7. 2008年10月8日为我国第十一个高血压日,主题是“在家测量您的血压”.某社区医疗服务部门为了考察该社区患高血压病是否与食盐摄入 量有关,对该社区的1 633人进行了跟踪调查,得出以下数据:计算χ盐的摄入量有关系. 答案 80.155 99.9%8.为了评价某个电视栏目的改革效果,在改革前后分别从居民中抽取了100位 居民进行调查,经过计算χ2=99.9,根据这一数据分析,下列说法正确的是 ________(只填序号).①有99.9%的人认为该栏目优秀;②有99.9%的人认为栏目是否优秀与改革有关系; ③有99.9%的把握认为电视栏目是否优秀与改革有关系; ④以上说法都不对. 答案 ③9.为研究某新药的疗效,给50名患者服用此药,跟踪调查后得下表中的数据。
1.2 回归分析作业 高中数学选修1-2 苏教版
学业分层测评(二)第1章 1.2 回归分析(建议用时:45分钟)学业达标]一、填空题1.如图1-2-1所示,对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图(1);对变量u,v有观测数据(u i,v i)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断________.图1-2-1①变量x与y正相关,u与v正相关②变量x与y正相关,u与v负相关③变量x与y负相关,u与v正相关④变量x与y负相关,u与v负相关【解析】由图(1)知,x与y是负相关,由图(2)知,u与v是正相关,故③正确.【答案】③2.设(x1,y1),(x2,y2),…,(x n,y n)是变量x和y的n个样本点,直线l是由这些样本点通过计算得到的线性回归直线(如图1-2-2),以下结论正确的是________.(填序号)图1-2-2①x 和y 的相关系数为直线l 的斜率 ②x 和y 的相关系数在0到1之间③当n 为偶数时,分布在l 两侧的样本点的个数一定相同 ④直线l 过点(x -,y -) 【答案】 ④3.某产品的广告费用x 与销售额y 的统计数据如下表:根据上表可得回归方程y =b x +a 中的b 为9.4,据此模型,预报广告费用为6万元时销售额为________万元.【解析】样本中心点是(3.5,42),则a ^=y --b ^x -=42-9.4×3.5=9.1,所以回归直线方程是y ^=9.4x +9.1,把x =6代入得y ^=65.5.【答案】 65.54.对两个具有线性相关关系的变量进行回归分析时,得到一个回归方程y ^=1.5x +45,x ∈{1,5,7,13,14},则y -=________.【解析】由x -=8,得y -=1.5×8+45=57. 【答案】 575.已知x ,y 的取值如下表:画出散点图,从所得的散点图分析,y 与x 线性相关,且y =0.95x +a ^,则a ^=________.【解析】因为回归方程必过样本点的中心(x -,y -),解得x -=2,y -=4.5,将(2,4.5)代入y ^=0.95x +a ^可得a ^=2.6.【答案】 2.66.一轮又一轮的寒潮席卷全国.某商场为了了解某品牌羽绒服的月销售量y (件)与月平均气温x (℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,数据如下表:由表中数据算出线性回归方程y =b x +a 中的b ≈-2.气象部门预测下个月的平均气温约为6 ℃,据此估计,该商场下个月羽绒服的销售量的件数约为________.【解析】 ∵样本点的中心为(10,38), ∴38=-2×10+a ^. ∴a ^=58,即y ^=-2x +58. ∴当x =6时,y =46. 【答案】 467.对具有线性相关关系的变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),它们之间的线性回归方程是y =3x +20,若∑i =110x i =18,则∑i =110y i =________.【解析】 由于∑i =110x i =18,则x -=1.8,∵(x -,y -)在回归方程上, ∴y -=3×1.8+20=25.4, ∴∑i =110y i =10y -=254.【答案】 2548.已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线方程是________.【解析】 由斜率的估计值为1.23,且回归直线一定经过样本点的中心(4,5),可得y ^-5=1.23(x -4),即y ^=1.23x +0.08.【答案】 y ^=1.23x +0.08 二、解答题 9.对于数据组:(1)(2)求线性回归方程.【解】 (1)作图略.x ,y 具有很好的线性相关性. (2)设y ^=a ^+b ^x ,因为x -=2.5,y -=5,∑4i =1x i y i =60,∑4i =1x 2i =30,故b ^=60-4×2.5×530-4×2.52=2,a ^=y --b ^x -=5-2×2.5=0, 故所求的回归直线方程为y ^=2x .10.下表为某地近几年机动车辆数与交通事故的统计资料,求出y 关于x 的线性回归方程.【解】∑i =1x i =1 031,∑i =1y i =71.6,∑i =1x 2i =137 835,∑i =1x i y i =9 611.7,x =128.875,y -=8.95,将它们代入⎩⎪⎨⎪⎧b ^=∑ni =1x i y i -n x - y-∑n i =1x 2i-n (x -)2a ^=y --b ^x-计算得b ^≈0.077 4.a ^=-1.025,所以,所求线性回归方程为y ^=0.077 4x -1.025.能力提升]1.已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归直线方程为y =b x +a .若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则b ^__________b ′,a ^______a ′(填><=).【解析】 x =1+2+3+4+5+66=72,y =0+2+1+3+3+46=136,b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x 2=57,a ^=y -b ^x =-13,b ′=2-02-1=2>b ^,a ′=-2<a ^. 【答案】 < >2.(2016·徐州月考)已知对一组观测值(x i ,y i )(i =1,2,…,n )作出散点图后,确定具有线性相关关系,若对于y ^=a ^+b ^x ,求得b ^=0.51,x -=61.75,y -=38.14,则线性回归方程为________.【解析】 ∵a ^=y --b ^x -=38.14-0.51×61.75 =6.647 5≈6.65.∴y ^=0.51x +6.65. 【答案】 y =0.51x +6.653.(2016·南京检测)若线性回归方程中的回归系数b ^=0,则相关系数r =________.【解析】 b ^=∑i =1n(x i -x -)(y i -y -)∑i =1n(x i -x -)2,r =∑i =1n(x i -x -)(y i -y -)∑i =1n(x i -x -)2∑i =1n (y i -y -)2由计算公式知,若b =0,则r =0. 【答案】 04.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100棵种子中的发芽数,得到如下资料:程,剩下的2组数据用于回归方程检验.(1)若选取的是12月1日与12月5日的2组数据,请根据12月2日至12月4日的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?(3)请预测温差为14 ℃的发芽数.【解】 (1)由数据求得,x =12,y =27, 由公式求得,b ^=52,a ^=y -b ^x =-3. 所以y 关于x 的线性回归方程为y ^=52x -3. (2)当x =10时,y ^=52×10-3=22,|22-23|<2; 当x =8时,y ^=52×8-3=17,|17-16|<2. 所以该研究所得到的线性回归方程是可靠的. (3)当x =14时,有y ^=52×14-3=35-3=32, 所以当温差为14 ℃时的发芽数约为32颗.。
苏教版数学高二数学 1.2《回归分析》基础训练(苏教版选修1-2)
1.下列变量之间是线性相关关系的是________. ①人的身高与视力;②角的大小与所对的圆弧长; ③收入水平与纳税水平;④某地人的出生率与树林覆盖率.解析:②为确定性关系,①④不具有线性相关关系. 答案:③2.散点图在回归分析过程中的作用是________. ①查找个体个数;②比较个体数据大小关系; ③探究个体分类;④粗略判断变量是否线性相关.解析:散点图在回归分析中,能粗略判断变量间的相关关系. 答案:④3.已知x ,y 之间的一组数据:x 1.081.121.191.28y2.25 2.37 2.40 2.55 y 与x 之间的线性回归方程y =a +b x 必过定点________.解析:由已知可知线性回归方程一定过定点(x ,y ),因此求出x =1.1675,y =2.3925,故填(1.1675,2.3925).答案:(1.1675,2.3925)4.设有一个回归方程为y ^=2-2.5x ,则变量x 增加一个单位时,y 平均________个单位.解析:线性回归方程y ^=a ^+b ^x 中a ^,b ^的意义是:以a ^为基数,x 每增加1个单位,y 相应地平均增加b ^个单位.答案:减少2.5一、填空题1.下列说法:①回归方程适用于一切样本和总体;②样本取值的范围会影响回归方程的适用范围;③回归方程得到的预报值,是预报变量的精确值.其中正确的是________.解析:回归方程反映的是两个线性相关变量间的相关关系,它能预测变量的值,但不是精确值.答案:②2.关于相关系数r 的临界值r 0.05的说法:①临界值r 0.05是一个定值;②若|r |≤r 0.05,则否定假设H 0,表明有95%的把握认为x ,y 具有较强的线性相关关系;③若|r |>r 0.05,则没有理由拒绝假设H 0,即没有充分的理由认为y 与x 之间有线性相关关系;④临界值r 0.05不是一个定值,它的值可由检验水平0.05及n -2在附表中查到.其中正确的序号为________.解析:②中应改为“|r |>r 0.05”;③中应改为“|r |≤r 0.05”才正确;①、④矛盾,其中④中的表述正确.答案:④3.如图所示,有5组(x ,y )数据,去掉一组数据后,要使剩下的4组数据的相关系数最大,应去掉________点.解析:由散点图可知,D 点偏离最远,所以去掉D 点后,剩下4组数据的相关系数最大.答案:D4.若某地财政收入x 与支出y 满足线性回归方程y =bx +a +e (单位:亿元),其中b =0.8,a =2,|e |≤0.5,如果今年该地区财政收入10亿元,年支出预计不会超过________亿.解析:代入数据得y =10+e ,因为|e |≤0.5,所以|y |≤10.5,故不会超过10.5亿. 答案:10.55.(2011年高考广东卷)为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x (单位:小时)与当天投篮命中率y 之间的关系:时间x 12345命中率0.4 0.5 0.6 0.6 0.4小李这5天的平均投篮命中率为________;用线性回归分析的方法,预测小李每月6号打篮球6小时的投篮命中率为________.解析:小李这5天的平均投篮命中率 y =0.4+0.5+0.6+0.6+0.45=0.5.可求得小李这5天的平均打篮球时间x =3.根据表中数据可求得b ^=0.01,a ^=0.47,故回归直线方程为y ^=0.47+0.01x ,将x =6代入得6号打6小时篮球的命中率约为0.53. 答案:0.5 0.536.已知回归直线的斜率的估计值为 1.23.样本点的中心为(4,5),则回归直线方程是________.解析:由斜率的估计值为 1.23,且回归直线一定经过样本点的中心(4,5),可得y ^-5=1.23(x -4),即y ^=1.23x +0.08.答案:y ^=1.23x +0.087.(2011年高考山东卷改编)某产品的广告费用x 与销售额y 的统计数据如下表广告费用x (万元)4235销售额y (万元) 49 26 39 54 根据上表可得回归方程y =b x +a 中的b 为9.4,据此模型预报广告费用为6万元时销售额为________.解析:∵x =4+2+3+44=72,y =49+26+39+544=42,又y ^=b ^x +a ^必过(x ,y ),∴42=72×9.4+a ^,∴a ^=9.1.∴线性回归方程为y ^=9.4x +9.1.∴当x =6时,y ^=9.4×6+9.1=65.5(万元). 答案:65.5万元8.观测两相关变量得如下数据:x-1-2-3-4-553421 y -9 -7 -5 -3 -1 1 5 3 79根据表中数据可得y 与x 之间的线性回归方程是________.(填序号)①y ^=12x -1;②y ^=x ;③y ^=2x +13;④y ^=x +1.解析:由表中数据可求得x =0,y =0,所以填②. 答案:②9.(2011年高考陕西卷改编)设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是________.①x 和y 的相关系数为直线l 的斜率; ②x 和y 的相关系数在0到1之间;③当n 为偶数时,分布在l 两侧的样本点的个数一定相同;④直线l 过点(x ,y ).解析:因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的绝对值越接近于1,两个变量的线性相关程度越强,所以①②错误.当n 为偶数时,分布在l 两侧的样本点的个数不一定相同,所以③错误.因为回归直线一定过样本点的中心,所以④正确.答案:④ 二、解答题10.某矿山采煤的单位成本y 与采煤量x 有关,其数据如下: 采煤量/千克 289298316322327329 329 331 350 单位成本/元43.5 42.9 42.1 39.6 39.138.5383837(1)作出散点图;(2)求出y 对x 的回归直线方程(结果保留3位小数). 解:(1)作出散点图,如图所示.(2)由图表可得x ≈321.222,y ≈39.856,∑i =19x 2i =931337,∑i =19x i y i =114892.7.所以b ^=∑i =19x i y i -9x y∑i =19x 2i -9(x )2≈-0.123,a ^=y -b ^x ≈79.366.故y 对x 的回归直线方程为y ^=-0.123x +79.366.11.一台机器使用的时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器运转速度的变化而变化,下表为抽转速x (转/秒)1614128每小时生产有缺点的零件数y (件)11 9 8 5(1)利用散点图或相关系数r 的大小判断变量y 对x 是否线性相关?为什么? (2)如果y 对x 有线性相关关系,求线性回归方程;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么机器的运转速度应控制在什么范围内?(最后结果精确到0.001,参考数据:656.25≈25.617,16×11+14×9+12×8+8×5=438,162+142+122+82=660,112+92+82+52=291)解:(1)x =12.5,y =8.25,∑4i =1(x i -x )(y i -y )=25.5, ∑4i =1(x i -x)2∑4i =1(y i -y )2=656.25≈25.617,∴r 0.05≈0.995,由检验水平0.05及n -2=2,在附录1中查得r 0.05=0.950, 因为0.995>0.950,∴y 与x 具有线性相关关系.(2)∑4i =1(x i -x )2=35, ∴b ^≈0.729,a ^=y -b ^x ≈-0.863. ∴线性回归方程为y ^=0.729x -0.863. (3)0.729x -0.863≤10,解得x ≤14.901, 故机器运转速度应在每秒14转之内.12.下表为某百货公司1~6月份销售量与利润之间的数量关系:月份1月2月3月4月5月6月现从具有线性相关关系这六组数据中选取4组数据求线性回归方程,再用剩下的2组数据进行检验.(1)根据2至5月份的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^;(2)若由线性回归方程得到的估计数据与剩下的检验数据的误差均不超过2万元,则认为得到的线性回归方程是理想的,试问所得线性回归方程是否理想?解:(1)由表中数据求得x =11,y =24,∑5i =2x i y i =11×25+13×29+12×26+8×16=1092,∑5i =2x 2i =112+132+122+82=498,∴b ^=∑5i =2x i y i -4x -y -∑5i =2x 2i -4x 2=1092-4×11×24498-4×112=3614=187, a ^=y -b ^x =24-187×11=-307.所以y 关于x 的线性回归方程为y ^=187x -307.(2)当x =10时,y =187×10-307=1507,此时|1507-22|<2;当x =6时,y =187×6-307=787,此时|787-12|<2.所以所得的线性回归方程是理想的.。
苏教版高中数学_ _选修1-2_ 1.1_ _独立性检验_ _作业
1.1独立性检验一、单选题1.通过随机询问100名性别不同的高二学生是否爱吃零食,得到如下的列联表:其中则下列结论正确的是()A.在犯错误的概率不超过0.05的前提下,认为“是否爱吃零食与性别有关”B.在犯错误的概率不超过0.05的前提下,认为“是否爱吃零食与性别无关”C.在犯错误的概率不超过0.025的前提下,认为“是否爱吃零食与性别有关”D.在犯错误的概率不超过0.025的前提下,认为“是否爱吃零食与性别无关”【答案】A【解析】由题意得,,又因为,所以犯错误的概率不超过5%的前提下,认为“是否爱吃零食与性别有关”,故选A. 2.下列事件A,B是独立事件的是()A.一枚硬币掷两次,A=“第一次为正面向上”,B=“第二次为反面向上”B.袋中有两个白球和两个黑球,不放回地摸两球,A=“第一次摸到白球”,B=“第二次摸到白球”C.掷一枚骰子,A=“出现点数为奇数”,B=“出现点数为偶数”D.A=“人能活到20岁”,B=“人能活到50岁”【答案】A【解析】【分析】利用相互独立事件的概念,对四个选项逐一分析排除,从而得出正确选项.【详解】对于A选项,两个事件发生,没有关系,故是相互独立事件.对于B选项,事件发生时,影响到事件,故不是相互独立事件.对于C选项,由于投的是一个骰子,是对立事件,所以不是相互独立事件.对于D选项,能活到岁的,可能也能活到岁,故不是相互独立事件.综上所述,本小题选A.【点睛】本小题主要考查相互独立事件的概念以及相互独立事件的识别,属于基础题.3.利用独立性检验来考查两个分类变量和是否有关系时,通过查阅下表来确定断言“和有关系”的可信度.如果,那么就有把握认为“和有关系”的百分比为( )A.B.C.D.【答案】D【解析】【分析】根据所给的观测值,与所给的临界值表中的数据进行比较,而在观测值表中对应于5.024的是0.025,有1﹣0.025的把握认为“X和Y有关系”,得到结果.【详解】∵k>5.024,而在观测值表中对应于5.024的是0.025,∴有1﹣0.025=97.5%的把握认为“X和Y有关系”,故选:D.【点睛】本题考查独立性检验的应用,属于基础题,4.以下四个命题,其中正确的是( )A.由独立性检验可知,有99%的把握认为物理成绩与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀;B.两个随机变量相关系越强,则相关系数的绝对值越接近于0;C.在线性回归方程中,当变量每增加一单位时,变量平均增加0.2个单位;D.线性回归方程对应的直线至少经过其样本数据点中的一个点.【答案】C【解析】由独立性检验可知,有99%的把握认为物理成绩与数学成绩有关,某人数学成绩优秀,则他的物理不一定优秀,故A错误;两个随机变量相关系越强,则相关系数的绝对值越接近于1,故B错误;线性回归方程对应的直线可能不经过其样本数据点中的任何点,故D错误;在线性回归方程中,当变量每增加一个单位时,变量平均增加0.2个单位,故C正确.故选C.5.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由算得,附表:参照附表,得到的正确结论是()A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C.有99%以上的把握认为“爱好该项运动与性别有关”D.有99%以上的把握认为“爱好该项运动与性别无关”【答案】C【解析】试题分析:因为,但,故有以上的把握认为“爱好该项运动与性别有关”在,故选C.考点:独立性检验.【名师点睛】(1)独立性检验的一般步骤:①根据样本数据制成2×2列联表. ②根据公式计算K 2的值.③查表比较K 2与临界值的大小关系,作统计判断.(2)在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误. 6.假设有两个分类变量X 和Y 的22⨯列联表:注: 对同一样本,以下数据能说明X 和Y 有关系的可能性最大的一组为( ) A .45,15a c == B .40,20a c == C .35,25a c == D .30,30a c == 【答案】A【解析】根据独立性检验的方法和22⨯列联表可得,当分类变量X 和Y 有关系的可能性越大,即,a c 相差越大,大.由各选项可得A 满足条件,选A .7.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( ) A .列联表中 的值为30, 的值为35 B .列联表中 的值为15, 的值为50C .根据列联表中的数据,若按 的可靠性要求,能认为“成绩与班级有关系”D.根据列联表中的数据,若按的可靠性要求,不能认为“成绩与班级有关系”【答案】C【解析】【分析】根据成绩优秀的概率求出成绩优秀的学生数,从而求得和的值,再根据公式求得的值,与临界值比较大小,可判断“成绩与班级有关系”的可靠性程度.【详解】成绩优秀的概率为成绩优秀的学生数是,成绩非优秀的学生数是,选项错误,根据列联表中数据,得到,因此有的把握认为“成绩与班级有关系”,故选C.【点睛】本题主要考查了检验性思想方法,考查了计算能力、阅读能力、建模能力,以及利用所学知识解决实际问题的能力,熟练掌握列联表各数据之间的关系及的计算公式是解题的关键.二、填空题8.为了判断高中三年级学生选修文理科是否与性别有关,现随机抽取50名学生,得到2×2列联表:已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.根据表中数据,得到K2≈4.844,则认为选修文理科与性别有关系出错的可能性约为________.【答案】5%【解析】∵4.844>3.841,且P(K2≥3.841)≈0.05.∴可认为选修文科与性别有关系出错的可能性为5%.答案:5%9.为考察棉花种子经过处理跟生病之间的关系得到下表数据:根据以上数据,则种子经过处理与是否生病________(填“有”或“无”)关.【答案】无【解析】【分析】计算的值与两个临界值比较,即可得出结论.【详解】由公式≈0.1641<3.841.所以种子经过处理与是否生病无关.故答案为:无.【点睛】本题主要考查独立性检验的应用,一般步骤:(1)根据样本数据制成列联表;(2)根据公式计算的值;(3)查表比较与临界值的大小关系,作统计判断.10.为了判断高中学生的文理科选修是否与性别有关系,随机调查了50名学生,得到 的列联表:如下22附:根据表中数据,得到()22501320107 4.84423272030K ⨯⨯-⨯=≈⨯⨯⨯,则认为选修文理科与性别有关系的可能性不低于_____________. 【答案】95%【解析】由于计算得2 4.844 3.841K ≈>故选修文理科与性别有关系的可能性不低于95%.11.某高校《统计初步》课程的教师随机调查了选该课的一些学生的情况,具体数据如下表:为了检验主修统计专业是否与性别有关系,根据表中的数据得到随机变量K 2的观测值为.因为k >3.841,所以确认“主修统计专业与性别有关系”,这种判断出现错误的可能性为________. 【答案】5%【解析】因为随机变量K 2的观测值k >3.841,所以在犯错误的概率不超过0.05的前提下认为“主修统计专业与性别有关系”.故这种判断出现错误的可能性为5%. 考点:独立性检验思想.三、解答题12.某市一中毕业生有3000名,二中毕业生有2000名.为了研究语文高考成绩是否与学校有关,现采用分层抽样的方法,从中抽取100名学生,先统计了他们的成绩(折合成百分制),然后按“一中”、“二中”分为两组,再将成绩分为5组,,,,,分别加以统计,得到如图频率分布直方图:(1)从成绩在90分(含90分)以上的学生中随机抽取2人,问至少抽到一名学生是“一中”的概率;(2)规定成绩在70分一下为“成绩不理想”,请根据已知条件构造列联表,并判断是否有的把握认为“成绩不理想与所在学校有关”.附:【答案】(1);(2)见解析.【解析】分析:由分层抽样可得,成绩在分以上的人中,一中有人;二中有人,由古典概型概率公式、对立事件概率公式结合组合知识可得,至少抽到一名学生是“一中”的概率为;(2)由公式可得,所以没有的把握认为“成绩不理想与所在学校有关.详解:(1)由分层抽样抽取的100名学生中,一中有60名,二中有40名,所以成绩在90分以上的人中,一中有人;二中有人,至少抽到一名学生是“一中”的概率.(2)列联表如下:将列联表中的数据代入公式,可得:(所以没有的把握认为“成绩不理想与所在学校有关”.点睛:本题主要考查频率分布直方图、古典概型概率公式以及独立性检验,属于难题.独立性检验的一般步骤:(1)根据样本数据制成列联表;(2)根据公式计算的值;(3) 查表比较与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)13.近年来我国电子商务行业迎来蓬勃发展的新机遇相关管理部门推出了针对电商的商品和服务的评价体系.现从评价系统中选出200次成功交易,并对其评价进行统计爱,⨯列联表如下表:商品和服务评价的22(1)是否可以在犯错误概率不超过0.1%的前提下,认为商品好评与服务好评有关?(2)若将频率视为概率,某人在该购物平台上进行的3次购物中,设对商品和服务全好评的次数为随机变量X,求X的数学期望.参考数据:=+++),其中n a b c d【答案】(1)可以(2)见解析【解析】试题分析:(1)由已知列出关于商品和服务评价的2×2列联表,代入公式求得k2的值,对应数表得答案;(2)每次购物时,对商品和服务全好评的概率为0.4,且X的取值可以是0,1,2,3,X~B(3,0.4).求出相应的概率,可得对商品和服务全好评的次数X的分布列(概率用组合数算式表示);利用二项分布的数学期望和方差求X的数学期望.试题解析:解:(1不超过0.1%的前提下,认为商品好评与服务好评有关.(2)由题意X的取值可以是0,1,2,3.每次购物时,对商品和服务都好评的概率为所以;;X的分布列为:14.为考察某种药物预防疾病的效果,进行动物试验,调查了 105 个样本,统计结果为:服药的共有 55 个样本,服药但患病的仍有 10 个样本,没有服药且未患病的有 30个样本.(1)根据所给样本数据完成列联表中的数据;(2)请问能有多大把握认为药物有效?(参考公式:独立性检验临界值表【答案】(1)(2)97.5%.【解析】分析:(1)由所给数据可得服药但没有病的人,没有服药且患病的,从而可得到联表;(2)利用公式求得,与邻界值比较,即可得到结论.详解:(1)解依据题意得,服药但没有病的45人,没有服药且患病的20可列下列联表(2)假设服药和患病没有关系,则的观测值应该很小,而由独立性检验临界值表可以得出,由97.5%的把握药物有效;点睛:独立性检验的一般步骤:(1)根据样本数据制成列联表;(2)根据公式计算的值;(3) 查表比较与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)。
高中数学第1章统计案例1-1独立性检验自主练习苏教版选修1
高中数学第1章统计案例1-1独立性检验自主练习苏教版选修1自主广场我夯基 我达标1.下列关于χ2的说法中正确的是( )A.χ2在任何相互独立问题中都可以用来检验有关还是无关.B.χ2的值越大,两个事件的相关性就越大.C.χ2是用来判断两个分类变量是否有关系的随机变量,只对于两个分类变量更适合.D.χ2观测值的计算公式为χ2=))()()(()(2d b c a d c b a bc ad n ++++-解:因为χ2是用来判断两个分类变量是否有关系的随机变量,只对于两个分类变量更适合,所以C 正确,对于D 应为:χ2=.))()()(()(2d b c a d c b a bc ad n ++++-答案:C2.在吸烟与患心脏病这两个分类变量的计算中,下列说法正确的是( )A.若χ2的观测值为6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患肺病.B.从独立性检验可知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能性患有肺病.C.若从统计量中求出有99%的把握认为吸烟与患肺病有关系,是指有1%的可能性使得推断出现错误.D.以上三种说法均不正确.解:若χ2的观测值为6.635,我们不能认为在100个吸烟的人中有99人患有肺病,也不能认为对于吸烟的人有99%的可能性患有肺病,只能理解为有99%的把握认为吸烟与肺病有关系,有1%的可能性使得推断出现错误. 答案:C3.某调查机构调查教师工作压力大小的情况,部分数据如下表:则认为工作压力大与喜欢教师职业是否有关系的把握约为( )A.99%B.95%C.90%D.无充分证据思路解析:利用χ2=))()()(()(2d b c a d c b a bc ad n ++++-计算出χ2的观测值. 答案:B.4.假设有两个分类变量X 和Y ,它们的值域分别为{x1,x2}和{y1,y2},其2×2列联表为。
高中数学苏教版 9.2 独立性检验 课后练习、课时练习
一、单选题1. 根据分类变量与的成对样本数据,计算得到,依据的独立性检验,结论为()A.变量与不独立B.变量与不独立,这个结论犯错误的概率超过0.01C.变量与独立D.变量与独立,这个结论犯错误的概率不超过0.012. 假设有两个分类变量和的列联表如下:注:的观测值.对于同一样本,以下数据能说明和有关系的可能性最大的一组是()A.B.C.D.3. 下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程,变量增加一个单位时,平均增加5个单位;③线性回归直线必过;④曲线上的点与该点的坐标之间具有相关关系;⑤在一个2×2列联表中,由计算得,则其两个变量间有关系的可能性是.其中错误的个数是()A.1 B.2C.3 D.44. 为考察一种新药预防疾病的效果,某科研小组进行动物实验,收集整理数据后将所得结果填入相应的列联表中.由列联表中的数据计算得.参照附表,下列结论正确的是()0.025 0.010 0.005 0.0015.026.6357.879 10.828A.在犯错误的概率不超过0.1%的前提下,认为“药物有效”B.在犯错误的概率不超过0.1%的前提下,认为“药物无效”C.有99.99%以上的把握认为“药物有效”D.有99.99%以上的把握认为“药物无效”5. 东江湖位于湖南省郴州市东北部的资兴市境内,被誉为“人间天上一湖水,万千景象在其中” .每年都吸引无数游客来此游玩,某调查机构在景区随机调查了10名青少年人和8名中老年人,并请他们谈谈是否有“二次游玩”的愿望,统计结果如下,则()“二次游玩”愿望情况有“二次游玩”的愿望无“二次游玩”的愿望总计年龄段青少年8 2 10 中老年 2 6 8总计10 8 18A.有95%的把握判断有“二次游玩”的愿望与年龄有关B.有95%的把握判断有“二次游玩”的愿望与年龄无关C.有99%的把握判断有“二次游玩”的愿望与年龄有关D.有99%的把握判断有“二次游玩”的愿望与年龄无关6. 在下列关于吸烟与患肺癌的列联表中,的值为( )不患肺癌患肺癌总计不吸烟7775 42 7817吸烟d总计9874 9965A.48 B.49 C.50 D.51二、多选题7. 下列命题正确的是()A.若甲、乙两组数据的相关系数分别为0.66和,则乙组数据的线性相关性更强;B.回归分析中常用残差平方和来刻画拟合效果好坏,残差平方和越小,拟合效果越好;C.对变量x与y的统计量来说,值越小,判断“x与y有关系”的把握性越大;D.对具有线性相关关系的变量x、y,有一组观测数据,其线性回归方程是,且,则实数的值是.8. 在检验X与Y是否有关的过程中,表示的意义是()A.有99%的把握认为X与Y没有关系B.有1%的把握认为X与Y有关系C.有99%的把握认为X与Y有关系D.在犯错误的概率不超过1%的前提下,可以认为X与Y有关系三、填空题9. 某单位为了调查性别与对工作的满意程度是否具有相关性,随机抽取了若干名员工,所得数据统计如下表所示,其中,且,若有90%的把握可以认为性别与对工作的满意程度具有相关性,则的值是________.对工作满意对工作不满意男女附:,其中.10. 某驾驶员培训学校为对比了解“科目二”的培训过程采用大密度集中培训与周末分散培训两种方式的效果,调查了105名学员,统计结果为:接受大密度集中培训的55名学员中有45名学员一次考试通过,接受周末分散培训的学员一次考试通过的有30名.根据统计结果,认为“能否一次考试通过与是否集中培训有关”的把握为______.11. 有甲、乙两个班级共计112人进行数学考试,按照大于等于120分为优秀,120分以下为非优秀统计成绩,得到如下所示的列联表:优秀非优秀总计甲班12乙班36已知在全部112人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是______.①列联表中的值为30,的值为20;②列联表中的值为20,的值为44;③根据列联表中的数据,若根据小概率值的独立性检验,能认为“成绩与班级有关系”;④根据列联表中的数据,若根据小概率值的独立性检验,不能认为“成绩与班级有关系”.12. 为了调查学生对网络课程是否喜爱,研究人员随机调查了相同人数的男、女学生,发现男生中有80%喜欢网络课程,女生中有40%不喜欢网络课程,且有95%的把握认为喜欢网络课程与性别有关,但没有99%的把握认为喜欢网络课程与性别有关.已知被调查的男、女学生的总人数为,则________.四、解答题13. 2023年春节期间,科幻电影《流浪地球2》上映,获得较好的评价,也取得了很好的票房成绩.某平台为了解观众对该影片的评价情况(评价结果仅有“好评”“差评”),从平台所有参与评价的观众中随机抽取400人进行调查,数据如下表所示(单位:人):好评差评合计男性80 200女性90合计400(1)把列联表补充完整,试根据小概率值的独立性检验分析对该部影片的评价是否与性别有关;(2)若将频率视为概率,从抽取的400人中所有给出“好评”的观众中随机抽取3人,用随机变量X表示被抽到的女性观众的人数,求X的分布列和数学期望.参考公式:,其中.参考数据:0.10 0.05 0.025 0.010 0.005 0.0012.7063.841 5.024 6.635 7.879 10.82814. 对某市工薪阶层关于“楼市限购政策”的态度进行调查,随机抽取了50人,他们月收入(单位:百元)的频数分布及对“楼市限购政策”赞成的人数如下表.月收入频数 5 10 15 10 5 5赞成人数 5 10 12 7 2 1(1)若以月收入45百元为分界点,由以上统计数据完成下面2×2列联表,并判断是否有的把握认为赞成“楼市限购政策”与月收入有关;月收入低于45百元的人数月收入不低于45百元的人数合计赞成不赞成合计(2)若从月收入在和内的被调查人群中按照分层随机抽样的方法选取6人进行追踪调查,并从中选取3人作问卷调查,求3人中至少有1人月收入在内的概率.15. 第届冬季奥运会将于年月日在北京开幕,本次冬季奥运会共设个大项,个分项,个小项.为调查学生对冬季奥运会项目的了解情况,某大学进行了一次抽样调查,若被调查的男女生人数均为,统计得到以下列联表,经过计算可得.男生女生合计了解不了解合计(1)求的值,并判断有多大的把握认为该校学生对冬季奥运会项目的了解情况与性别有关;(2)为弄清学生不了解冬季奥运会项目的原因,采用分层抽样的方法从抽取的不了解冬季奥运会项目的学生中随机抽取人,再从这人中抽取人进行面对面交流,“至少抽到一名女生”的概率;附表:附:.16. 宁德是福建省重点城市,它不仅有着深厚的历史积淀与丰富的民俗文化,更有着众多旅游景点,每年来宁德参观旅游的人数不胜数,其中三都澳斗姆岛与上金贝被称为两张名片.现对已游览景点的50名男游客和50名女游客进行景点比较调查,给出更喜欢三都澳斗姆岛或上金贝景点的评价,得到如下列联表:三都澳斗姆岛上金贝男游客40 10女游客30 20(1)分别估计男、女游客对两个景点喜好的概率;(2)能否有95%的把握认为男、女游客对两景点的喜好有差异?附表及公式:0.050 0.010 0.0013.841 6.635 10.828其中,.。
苏教版高中数学选修独立性检验同步练习(1)
独立性检验同步练习1. (本小题25分) 为了研究吸烟是否与患肺癌有关,对63位肺癌患者及43位非肺癌患者.调查了其中吸烟的人数,得下列2×2列联表,试问:吸烟与患肺癌是2. (本小题25分) 通过试验得到在不同灌溉方式下水稻叶子的衰老情况如下表,3. (本小题25分) 有甲、乙两个工厂生产同一种产品,产品分为一等品和二等品为考察各工厂产品质量水平是否一致,从这两个工厂中分别随机地抽出产品109件和191件,鉴定每件质量等级的结果如下表,试分析甲、乙两厂的产品质量有无显著差别(可靠性不低于95%)4 (本小题25分) 在某报纸上有一篇文章.内容是关于调适压力是否能减少心脏病猝发的研究.全部107位受测者流向心脏的血流量均低于常人,所以都有心脏病猝发的风险他们被随机指派到3个组.在接下来的3年内,压力调适组的33人中只有3个人曾经历心脏病猝.发同一时间段内,运动组与一般照顾组的74人中有19人经历了心脏病猝发(1)利用该篇文章中的信息,制作一个描述研究结果的列联表;出卡方统计量.参考答案1. 【解】提出统计假设H:吸烟与患肺癌无关.由公式可得2χ≈9.663 6,又P(2χ≥6.635)≈0.01.所以推断吸烟与患肺癌有关.2. 【解】提出统计假设H:灌溉水平对叶子衰老没有影响.由公式可得2χ≈2.3435,又P(2χ≥3.841)≈0.05,所以不能推断出灌溉水平对叶子衰老有影响的结论(可靠性不低于95%)3. 【解】提出统计假设H:甲、乙两厂的产品质量无显著差别由公式可得2χ≈7.7814,又P(2χ≥3.841)≈0.05,所以甲、乙两厂的产品质量有显著差别(可靠性不低于95%).4. 【解】 (1)列联表如下:(2)卡方检验的统计假设为H:调适匪力不能减少心脏病摔发各估计值见下表,卡方统计量为3.843。
线性回归方程复习练习苏教版必修
线性回归方程复习练习苏教版必修YUKI was compiled on the morning of December 16, 2020第12课时复习课2分层训练1.三点(3,10),(7,20),(11,24)的线性回归方程是 ( )A . 5.75 1.75y x ∧=-B . 1.75 5.75y x ∧=+ C . 1.75 5.75y x ∧=- D . 5.75 1.75y x ∧=+2.在一次歌手大奖赛上,七位评委为歌手打出的分数如下: ,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为 ( )A .,B .,0.016C .,D .,3.根据1994~2004年统计数据,全国营业税税收总额y (亿元)与全国社会消费品零售总额x (亿元)之间有如下线性回归方程0.07658705.1y x ∧=-,则全国社会消费品零售总额每增加1亿元时,全国营业税税收总额( )A .平均增加百万元B .平均减少亿元C .增加百万元D .减少亿元4.回归直线方程y bx a ∧=+中的y ∧是预测值,与实际中的y 关系为 ( )A .y y ∧-越小,说明回归偏差越小B .y y ∧-越大,说明回归偏差越小C .y y ∧-越小,说明回归偏差越小D .y y ∧-越小,说明回归偏差越小5.两个样本,甲:5,4,3,2,1;乙:4,0,2,1,-2. 那么样本甲和样本乙的波动大小情况是 ( )A .甲、乙波动大小一样 B. 甲的波动比乙的波动大C. 乙的波动比甲的波动大 C. 甲、乙的波动大小无法比较思考•运用6.某化肥厂有甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其重量,分别记录抽查数据如下:甲:102,101,99,98,103,98,99;乙:110,115,90,85,75,115,110.(1)这种抽样方法是哪一种方法(2)试计算甲、乙两个车间产品重量的平均数与方差,并说明哪个车间产品较稳定?解:7.某工厂有经理1人,另有6名管理人员,5名高级技工,10名工人和1名学徒.现在需要增加一名新工人,小张前来应聘,经理说:“我公司报酬不错,平均工资每周300元.”小张几天后找到经理说:“你欺骗了我,我问过其他工人,没有一个工人的周工资超过200元.平均工资怎么可能是300元呢”经理拿出如下的工资表说:“你看,平均工资就是300元.”小张通过计算发现本题中总体平均数恰为(2200×1+250×6+220×5+200×10+100×1)÷23=300,并没有错.这个问题中,总体平均数能客观反映工人的工资水平吗为什么解:8.养鱼场对放养一年的某种鱼的生长状况进行调查,并随机捞取该类鱼的40尾称量出它们的体重作为样本,获得的数据如下(单位:g )6(102101999810398991007x =++++++=甲();11101159085751151101007x =++++++=乙();214114941 3.428577S =++++++=甲();2110022510022562522517S =++++++乙(;∴ 22S S <乙甲 故甲车间产品比较稳定.况下,对整体平均水平产生较大影响.本题中,可去掉2200这个数据后再求平均数,就能较好地反映工人的工资水平了. 工资水平约为每周(250×6+220×5+200×10+100×1)÷22≈214元.8.由于我们无法直接获得总体的平均数,所以只有求得样本的平均数来推断总体。
苏教版数学高一课时作业 1.2回归分析
1.2 回归分析一、填空题1.根据如下样本数据:x 3 4 5 6 7 8 y4.02.5-0.50.5-2.0-3.0得到的回归方程为y ^=b ^x +a ^,则a ^,b ^与0的大小关系是________. 考点 线性回归分析 题点 线性回归方程的应用 答案 a ^>0,b ^<0 解析 作出散点图如下:观察图象可知,回归直线y ^=b ^x +a ^的斜率b ^<0, 当x =0时,y ^=a ^>0.故a ^>0,b ^<0.2.某同学在研究性学习中,收集到某制药厂今年前5个月甲胶囊生产产量(单位:万盒)的数据如下表所示:x (月份) 1 2 3 4 5 y (万盒)55668若x ,y 线性相关,线性回归方程为y ^=0.7x +a ^,估计该制药厂6月份生产甲胶囊产量约为________万盒. 考点 线性回归方程 题点 样本点中心的应用解析 回归直线一定过样本点中心.由已知数据,可得x =3,y =6,代入回归方程,可得a ^=y -0.7x =3.9,即回归方程为y ^=0.7x +3.9.把x =6代入,可得y ^=8.1,所以6月份的产量约为8.1万盒.3.某化工厂为预测某产品的回收率y ,而要研究它和原料有效成分含量之间的相关关系,现取了8对观测值,计算得∑i =18x i =52,∑i =18y i =228,∑i =18x 2i =478,∑i =18x i y i =1 849,则y 与x 的线性回归方程是________________. 考点 线性回归方程 题点 求线性回归方程 答案 y ^=2.62x +11.47解析 由题中数据得x =6.5,y =28.5,∴b ^=∑i =18x i y i -8x ·y∑i =18x 2i -8(x )2=1 849-8×6.5×28.5478-8×6.52=367140≈2.62, a ^=y -b ^x ≈28.5-2.62×6.5=11.47, ∴y 与x 的线性回归方程是y ^=2.62x +11.47. 4.已知x ,y 的取值如下表:从所得的散点图分析,y 与x 线性相关,且y ^=0.95x +a ^,则a ^=________. 考点 题点 答案 2.6解析 ∵x =2,y =4.5.又回归直线恒过定点(x ,y ),代入得a ^=2.6.5.从某大学随机选取8名女大学生,其身高x (cm)和体重y (kg)的线性回归方程为y ^=0.849x -85.712,则身高172 cm 的女大学生,由线性回归方程可以估计其体重为________ kg.题点 答案 60.316解析 y ^=0.849×172-85.712=60.316. 6.有下列关系:①曲线上的点与该点的坐标之间的关系; ②苹果的产量与气候之间的关系;③森林中的同一种树木,其断面直径与高度之间的关系; ④学生与其学号之间的关系.其中有相关关系的是________.(填序号) 考点 题点 答案 ②③解析 由相关关系定义分析.7.某产品的广告费用x 与销售额y 的统计数据如下表:根据上表可得线性回归方程y ^=b ^x +a ^中的b ^为9.4,据此模型估计广告费用为6万元时的销售额为____________万元. 考点 题点 答案 65.5解析 样本点中心是(3.5,42), 则a ^=y -b ^x =42-9.4×3.5=9.1, 所以线性回归方程是y ^=9.4x +9.1, 把x =6代入,得y ^=65.5.8.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为________. 考点 线性相关系数题点 线性相关系数的概念及计算 答案 1解析 根据样本相关系数的定义可知,当所有样本点都在一条直线上且直线斜率大于零时,相关系数为1.9.对于回归分析,有下列叙述:①在回归分析中,变量间的关系若是非确定性关系,则因变量不能由自变量唯一确定; ②线性相关系数可以是正的或是负的;③回归分析中,如果r 2=1或r =±1,说明x 与y 之间完全线性相关; ④样本相关系数r ∈(-∞,+∞). 其说法正确的序号是________. 考点 题点 答案 ①②③解析 由回归模型及其性质易知①②③是正确的.相关系数的取值范围应为|r |≤1,所以④是错误的.10.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线y =e bx+a的周围.令z =ln y ,求得线性回归方程为z ^=0.25x -2.58,则该模型的回归方程为________. 考点 非线性回归分析 题点 非线性回归分析 答案 y =e 0.25x-2.58解析 因为z ^=0.25x -2.58,z =ln y , 所以y ^=e 0.25x-2.58.11.在对两个变量进行回归分析时,甲、乙分别给出两个不同的回归方程,并对回归方程进行检验.对这两个回归方程进行检验时,与实际数据(个数)的对比结果如下:则从表中数据分析,________回归方程更好.(即与实际数据更贴近) 考点 两个模型拟合效果的比较 题点 两个模型拟合效果的比较答案甲解析可以根据表中数据分析,两个回归方程对数据预测的正确率进行判断,甲回归方程的数据准确率为3240=45,而乙回归方程的数据准确率为4060=23.显然甲的准确率高些,因此甲回归方程好些.二、解答题12.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:零件的个数x(个)2345加工的时间y(小时) 2.534 4.5(1)在给定的坐标系中画出表中数据的散点图;(2)求出y关于x的线性回归方程y^=b^x+a^,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少时间?(注:b^=∑i=1nx i y i-n x y∑i=1nx2i-n(x)2,a^=y-b^x)考点线性回归方程题点求线性回归方程解(1)散点图如图.(2)由表中数据得∑i=14x i y i =52.5,x =3.5,y =3.5,∑i =14x 2i =54,所以b ^=∑i =14x i y i -4x y∑i =14x 2i -4(x )2=0.7,所以a ^=y -b ^x =1.05. 所以y ^=0.7x +1.05.回归直线如第(1)问图所示. (3)将x =10代入线性回归方程, 得y ^=0.7×10+1.05=8.05,所以预测加工10个零件需要8.05小时.13.为了研究某种细菌随时间x 的变化繁殖个数y 的变化情况,收集数据如下:时间x (天) 1 2 3 4 5 6 繁殖个数y612254995190(1)(2)求y 与x 之间的回归方程. 考点 非线性回归分析 题点 非线性回归分析 解 (1)散点图如图所示:(2)由散点图看出样本点分布在一条指数曲线y =c 1e c 2x 的周围,于是令z =ln y ,则x 1 2 3 4 5 6 z1.792.483.223.894.555.25所以z^=0.69x+1.115,则有y^=e0.69x+1.115.三、探究与拓展14.已知x,y的取值如下表:x2356y 2.7 4.3 6.1 6.9从散点图分析y与x具有线性相关关系,且回归方程为y^=1.02x+a^,则a^=________.考点题点答案0.92解析由题意得x=4,y=5,又(x,y)在直线y^=1.02x+a^上,所以a^=5-4×1.02=0.92. 15.在一段时间内,分5次测得某种商品的价格x(万元)和需求量y(t)之间的一组数据为12345价格x 1.4 1.6 1.82 2.2需求量y1210753已知∑i=15x i y i=62,∑i=15x2i=16.6.(1)画出散点图;(2)求出y对x的线性回归方程;(3)如果价格定为1.9万元,预测需求量大约是多少?(精确到0.01 t)考点题点解(1)散点图如图所示:(2)因为x=15×9=1.8,y=15×37=7.4,∑i=15x i y i=62,∑i=15x2i=16.6,所以b ^=∑i =15x i y i -5x y∑i =15x 2i -5(x )2=62-5×1.8×7.416.6-5×1.82=-11.5,a ^=y -b ^x =7.4+11.5×1.8=28.1, 故y 对x 的线性回归方程为y ^=-11.5x +28.1. (3)y ^=28.1-11.5×1.9=6.25(t).故价格定为1.9万元,预测需求量大约为6.25 t.。
苏教版高中数学选修线性回归分析同步测试
苏教选修(1-2)数学:1.3《线性回归分析》一、选择题1.对两对变量y 和x 进行线性相关性检验,已知n 是观测值组数,r 是相关系数,且已知①7n =,0.953r =;②15n =,0.3012r =;③17n =,0.7991r =;④3n =,0.4950r =,则y 和x 有较强线性相关关系的是( )A .①②B .①③C .②④D .③④ 答案:B2.变量x y ,的散点图如右图所示,那么x y ,之间的样本相关系数r 最接近的值为( ) A .1 B .0.5- C .0D .0.5答案:C3.在回归分析中,以下说法正确的是( ) A .自变量和因变量都是随机变量B .自变量是随机变量,因变量是确定性变量C .自变量是确定性变量,因变量是随机变量D .自变量和因变量都是确定性变量 答案:C4.若某地财政收入x 与支出Y 满足回归方程i y bx a δ=++(单位:亿元)(12i =,,…),其中0.8b =,2a =,0.5i δ<.如果今年该地区财政收入10亿元,年支出预计不会超过( ) A .10亿 B .9亿C .10.5亿D .9.5亿答案:C5.设有一个回归方程为$32y x =-,变量x 增加一个单位时( ) A .y 平均增加2个单位 B .y 平均减少3个单位 C .y 平均减少2个单位 D .y 平均增加3个单位 答案:C6.相关系数r 是衡量两变量之间的线笥相关程度的,对此有下列说法:①r 越接近于1,相关程度越大;②r 越接近于0,相关程度越小;③r 越接近于1,相关程度越小;④r 越接近于0,相关程度越大.其中正确的是( ) A .①② B .②④ C .②③ D .①④ 答案:A 二、填空题7.线性回归方程$$y abx =+$恒过定点 . 答案:()x y ,8.在比较两个模型的拟合效果时,甲、乙两个模型的相关系数分别约为0.96和0.85,则拟合效果好的模型为 . 答案:甲9.许多因素都会影响贫富,教育也许是其中之一,在研究这两个因素的关系时,收集了美国50个州的成年人受过9年或更少教育的百分比(x )和收入低于官方规定的贫困线的人数占本州人数的百分比(y )的数据,建立线性回归方程为0.8 4.6y x =+;成年人受到9年或更少教育的百分比(x )和收入低于官方贫困线的人数占本州人数的面分比(y )之间的相关系数 (填“大于零”或“小于零”). 答案:大于零10.在查相关性检验的临界值表时,若在2n -列对应的值为20,则观测值有 组. 答案:22 三、解答题 11.某小卖部为了了解热茶销售量与气温之间的关系,随机统机并制作了某6天卖出的热茶气温(℃) 26 18 13 1041-杯数20 24 34 38 5064画出散点图并判断热茶销售量与气温之间是否具有线性相关关系. 解:(1)以x 表示气温,y 表示热茶杯数,画出散点图如图所示.(2)1(2618131041)11.76x =⨯++++-≈. 1(202434385064)38.36y =⨯+++++≈.622222221261813104(1)1286ii x==+++++-=∑.6126201824133410384501641910i ii x y==⨯+⨯+⨯+⨯+⨯-⨯=∑.62222222120243438506410172ii y==+++++=∑.所以0.97r =-.由于0.970.811r =>,所以x 与y 具有很强的线性相关关系.12.对于x 与y 有如下观测数据:(1)对x 与y (2)求出x 与y 的回归方程. 解:(1)作相关性检验.37x =,7y =,7y =,82111920i i x ==∑,821428ii y==∑,812257i i i x y ==∑,80.991i ix y nx yr -∴=≈∑.由于0.9910.707r =>,因此认为两个变量有很强的相关关系.(2)由公式得0.191b=$,$a y bx =-$70.91370.067=-⨯=-. $0.1910.067y x =-.13.用镁合金X 光探伤时,要考虑透视电压V 与透视厚度L 的关系,做了5次实验,结果如下:(1)进行相关性检验;(2)求V 关于L 的回归方程,并预测当透视厚度为40mm 时,透视电压V 是多少kv ? 解:(1)0.050.9850.878r r =>=,则有95%的把握认为V 与L 之间具有线性相关关系;(2)µ0.5442.4VL =+,当透视厚度40mm 时,可预测透视电压的值为64kv .。
年高中数学苏教版选修1-2同步训练:1.2 回归分析
1.2 回归分析1、若线性回归方程中的回归系数0b =,则相关系数( ) A.1r =B.1r =-C.0r =D.无法确定2、下列四个命题中正确的是( )①在线性回归模型中,e 是bx a +预报真实值y 的随机误差,它是一个可观测的量;②残差平方和越小的模型,拟合的效果越好;③用2R 来刻画回归效果,2R 越小,拟合的效果越好;④在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高. A.①③B.②④C.①④D.②③3、已知x 与y 之间的几组数据如下表:则y 与x 的线性回归方程y bx a =+必过( ) A.(1,3)B.(2,5)C.(1,5,4)D.(3,7)4、已知两个变量,x y 与其线性相关系数r ,下列说法正确的是( )①若0r >,则x 增大时,y 也相应增大;②若0r <,则x 增大时,y 也相应增大;③若1r =或1r =-,则x 与y 的关系完全相关(有函数关系),在散点图上各个散点均在一条直线上. A.①②B.②③C.①③D.①②③5、工人工资随劳动生产率变化的线性回归方程为5080y x =+,下列判断正确的是( ) A.当劳动生产率为1时,工资为80 B.当劳动生产率提高1时,工资提高80 C.当劳动生产率提高1时,工资提高130 D.当工资为250时,劳动生产率为26、某化工厂产生的废气经过过滤后排放,以模型0e kx y p -=去拟合过滤过程中废气的污染物数量mg/L y 与时间h x 之间的一组数据时,为了求出回归方程,设ln z y =,其变换后得到线性回归方程0.52ln300z x =-++S=-0?+2+In300,则经过6h 后,预报废气的污染物数量为( ) A.2300e mg/LB.300emg/LC.2300mg/L e D.300mg/L e7、由变量x 与y 相对应的一组数据1(3,)y ,2(5,)y ,3(7,)y ,4(12,)y ,5(13,)y 得到的线性回归方程为1202y x =+,则51i i y ==∑( )A.25B.125C.120D.248、某公司过去五个月的广告费支出x 与销售额y 之间有下列对应数据(单位:万元)工作人员不慎将表格中y 的第一个数据丢失.已知y 对x 呈线性相关关系,且回归方程为6.517.5y x =+,则下列说法:①销售额y 与广告费支出尤正相关; ②丟失的数据(表中▲处)为30;③该公司广告费支出每增加1万元,销售额一定增加6.5万元; ④若该公司下月广告费投入8万元,则销售额为70万元. 其中,正确说法有( ) A.1个B.2个C.3个D.4个9、变量,x y 之间的一组相关数据如表所示,且由表中数据得变量,x y 之间的回归方程为0.710.3y x =-+,则下列说法错误的是( )A.变量,x y 之间呈负相关关系B.由表格数据知,该回归直线必过点(9,4)C.可以预测,当12x =时,y 约为2.6D.4m =10、变量X 与Y 相对应的一组数据为()()()()()10,1,11.3,2,11.8,3,12.5,4,13,5,变量U 与V 相对应的一组数据为()()()()()10,5,11.3,4,11.8,3,12.5,2,13,1.1r 表示变量X 与Y 之间的线性相关系数,2r 表示变量V 与U 之间的线性相关系数,则( ) A.210r r <<B.210r r <<C.210r r <<D.21r r =11、已知回归方程21y x =+,试验得到一组数据是(2,4. 9),(3,7.1),(4,9.1),则残差平方和是______________.12、下列关于回归直线y bx a =+的说法中正确的有___________. ① 它必经过样本数据点1122(,),(,),...(,)n n x y x y x y 中的一个点; ② 它必过样本中心点(,)x y ; ③ 它表示了变量与之间的函数关系; ④ 随着变量的增大,函数值随之增大.13、若一组观测值()11,x y ,()22,x y ,…, (),n n x y 之间满足i i i y bx a e =++ (1,2,,i n =⋯),若i e 恒为0,则2R 为__________. 14、已知样本容量为11,计算得111510ii x==∑,111214i i y ==∑,112136750ii x ==∑,11215422ii y ==∑,11113910i i i x y ==∑,则y 对x 的回归方程为__________.15、如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注:参考数据:77119.32,40.17i i i i i y t y ====∑∑721()7 2.646.ii yy =-≈∑参考公式:相关系数()()nii tt y y r --=∑y a bt =+中斜率和截距的最小二乘估计公式分别为:121()(),()nii i nii tt y y b a y bt tt ==--==--∑∑.答案以及解析1答案及解析: 答案:C解析:由线性相关系数的计算公式可知,当0b =时,0r =.2答案及解析: 答案:B解析:e 是一个不可观测的量,故①不正确;2R 越小,残差平方和越大,即模型的拟合效果越差,故③不正确;②④是正确的.3答案及解析: 答案:C解析:由于回归直线y bx a =+一定过样本点的中心(,)x y .而 1.5,4x y ==,故线性回归方程y bx a =+必过(1.5,4).4答案及解析: 答案:C解析:若两个变量正相关,则因变量随着自变量的增大(减小)而增大(减小),此时相关系数0r >;若两个变量负相关,则因变量随自变量的增大(减小)而减小(增大),此时相关系数0r <;若1r =,则两个变量完全相关.5答案及解析: 答案:B解析:回归直线斜率为80,所以x 每增加1,y 增加80,即当劳动生产率提高1时,工资提高80,故选B.6答案及解析: 答案:D解析:当6x =时,3001ln300ln e z =-+=,∴300e ez y ==.7答案及解析: 答案:C 解析:由题得35121385x ++++==,∵回归直线必过样本点的中心(,)x y ,∴1202y x =+,24y =, ∴511245i i y y ===∑,∴51120i i y ==∑,故选C.8答案及解析: 答案:B解析:由回归直线方程为 6.517.5y x =+,可知 6.5b =,则销售额y 与广告费支出x 正相关,所以①是正确的;设丢失的数据为a ,由表中的数据可得5x =,2205a y +=,把点220(5,)5a+代入回归方程,可得220 6.5517.55a+=⨯+,解得30a =,所以②是正确的;该公司广告费支出每增加1万元,销售额应平均增加6.5万元,所以③不正确;若该公司下月广告费投入8万元,则估计销售额为 6.5817.569.5y =⨯+=万元,所以④不正确,故选B.9答案及解析: 答案:D解析:由0.710.3y x =-+得0.7b =-,故,x y 呈负相关关系,故A 正确;68101294x +++==,所以0.7910.34y =-⨯+=,故63244m +++=,解得5m =,故B 正确,D 错误;当11x =时,y 的预测知为2.6,故C 正确.故选D.10答案及解析: 答案:C解析:由变量X 与Y 相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),可得变量Y 与X 之间正相关,因此10r >.而由变量U 与V 相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),可知变量V 与U 之间负相关,∴20r <.因此1r 与2r 的大小关系是210r r <<.11答案及解析: 答案:0.03解析:当2x =时,5y =;当3x =时,7y =;当4x =时,9y =,故322221(4.95)(7.17)(9.19)0.03i i e ==-+-+-=∑.12答案及解析: 答案: 1.客观填空 ②解析:根据回归直线的性质,可知它必过样本中心点.13答案及解析: 答案:1 解析:14答案及解析:答案: 5.5503ˆ.yx =+解析:15答案及解析:答案:(1)由折线图中数据和附注中参考数据得7214,()0.55i i t t t ==-==∑,777111()()40.1749.32 2.89ii i i i i i i tt y y t y t y ===--=-=-⨯=∑∑∑,2.890.990.552 2.646r ≈≈⨯⨯.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系. (2)由9.321.3317y =≈及(1)得 71721()()2.890.10328()ii i ii tt y y b tt ==--==≈-∑∑, 1.3310.10340.92a y bt =-≈-⨯≈.所以y 关于t 的回归方程为0.920.10y t =+. 将2016年对应的9t =代入回归方程 得0.920.109 1.82y =+⨯=.所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨. 解析:由Ruize收集整理。
苏教版数学高一苏教版选修1-2课后导练1.2回归分析
课后导练 基础达标1.若回归直线方程中的回归系数b =0,则相关系数() A.r=1 B.r=-1 C.r=0D.无法确定解析:b=∑∑==---ni ini i ix xy y x x121)())((,r=∑∑∑===-⋅---ni ni i ini i iy y x xy y x x11221)()())((,若b=0,则r=0.答案:C 2.若某地财政收入x 与支出y 满足线性回归方程y =bx +a +e(单位:亿元),其中b =0.8,a =2,|e|<0.5,如果今年该地区财政收入10亿元,年支出预计不会超过()A.10亿B.9亿C.10.5亿D.9.5亿解析:代入数据y =10+e,因为|e|<0.5,所以|y |≤10.5,故不会超过10.5亿. 答案:C3.两相关变量满足如下关系: x 10152025 30 y1003 1005 1010 1011 1014两变量回归直线方程为()A. yˆ=0.56x ˆ+997.4 B. yˆ=0.63x ˆ-231.2 C. yˆ=50.2x ˆ+501.4D. yˆy =60.4x +400 解析:直接使用回归直线方程的系数公式即可. 答案:A4.对相关系数r ,下列说法正确的是() A. |r|越大,相关程度越大 B. |r|越小,相关程度越大C. |r|越大,相关程度越小,|r|越小,相关程度越大D. |r|≤1且|r|越接近1,相关程度越大,|r|越接近0,相关程度越小解析:由两个变量的相关系数公式可知相关程度的强弱与|r|与1的接近程度有关,|r|越接近1,相关程度越大,|r|越接近0,相关程度越小.答案:D5.2003年春季,我国部分地区SARS 流行,党和政府采取果断措施,防治结合,很快使病情得到控制,下表是某同学记载的5月1日至5月12日每天北京市SARS 病患者治愈日期 5.1 5.2 5.3 5.4 5.5 5.6 人数 100 109 115 118 121 134 日期5.75.85.95.105.115.12人数141 152 168 175 186 203下列说法:①根据此散点图,可以判断日期与人数具有线性相关关系;②若日期与人数具有线性相关关系,则相关系数r与临界值r0.05应满足|r|>r0.05;③根据此散点图,可能判断日期与人数具有一次函数关系,其中正确的个数为()A.0B.1C.2D.3答案:C6.用身高(c m)预报体重(kg)满足y=0.849x-85.712,若要找到41.638 kg的人,_________是150 c m.解析:体重不只受身高的影响,还可能受其他因素的影响.答案:不一定7.一家工厂对职工进行技能检查,收集数据如下:零件数x(个) 10 20 30 40 50 60 70 80加工时间y(分钟)12 25 35 48 55 61 64 70两变量的回归直线方程为__________.答案:yˆ=0.817x+9.58.在一段时间内,某种商品价格x(万元)和需求量Y(t)之间的一组数据为价格x:1.4 1.6 1.82 2.2需求量Y:121075 3(1)画出散点图;(2)求出Y对x的回归直线方程,并在(1)的散点图中画出它的图象;(3)如价格定为1.9万元,预测需求量大约是多少(精确到0.01 t)?解:(1)序号x y x2xy1 1.4 12 1.96 16.82 1.6 10 2.56 163 1.8 7 3.24 12.64 25 4 10 5 2.2 3 4.84 6.6 ∑93716.662951⨯=x =1.8 3751⨯=y =7.4, 28.156.164.78.1562ˆ⨯-⨯⨯-=b≈-11.5; a ˆ=7.4+11.5×1.8=28.1. Y 对x 的回归直线方程为x b a yˆˆˆ+==28.1-11.5x . (3)当x =1.9时,Y=28.1-11.5×1.9=6.25, 所以价格定为1.9万元,需求量大约是6.25 t . 9.1950~1958年我国的人口数据资料: 年份x 1950 1951 1952 1953 1954 人数y /万人 55 196 56 300 57 482 58 796 60 266 年份x 1955 1956 1957 1958 人数y /万人61 56062 82864 56365 994求y 关于x 的非线性回归方程. 解:根据收集数据,作散点图.根据已有函数知识,发现样本点分布在某一条指数函数周围,y =c 1e c2x (其中c 1,c 2是待定参数),令z =ln y ,则有y =e z ,∴e z =e lnc1+c 2x ,z =c 2x +lnc 1=b x +a, x195019511952195319541955195619571958z ≈ln y 10.92 10.94 10.96 10.98 11.01 11.03 11.05 11.08 11.09由散点图可知,x 与z 线性相关,故采用一元线性回归模型,由表中数算得:x =1 954,L xz =∑=--91))((i i i z z x x =1.23,z z =11.01,L xx =∑=-912)(i i x x =60.∴b=xxxzL L ≈0.021.a=z-b x=-30.02.∴z=a+b x=0.021x-30.02,即ln y=0.021x-30.02.∴y=e0.021x-30.02.因此,所求非线性回归方程为y=e0.021x-30.02.综合运用10.下表是1957年美国旧轿车价格的调查资料.今以x表示轿车的使用年数,y表示相应的年均价格,求y关于x的回归方程.使用年数x 1 2 3 4 5平均价格(美元)y 2 651 1 943 1 494 1 087 765使用年数x 6 7 8 9 10平均价格(美元)y538 484 290 226 204解:由散点图看出y与x呈指数关系.于是令z=ln y.x 1 2 3 4 5 6 7 8 9 10z 7.883 7.573 7.309 6.991 6.640 6.288 6.182 5.670 5.420 5.318由上图可知,各点基本上处于一直线,由表中数据可得线性回归方程zˆ=8.165-0.297x.因此旧车的平均价格对使用年数的非线性回归方程为yˆ=e8.165-0.297x.11.一般说,一个人的身高越高,他的手就越大,为调查这一问题,对10名高三男生的身高与右手一揸长测量得如下数据:(单位:cm)身高168170171172174176178178180181一揸长19.020.021.021.521.02 2.02 4.02 3.02 2.523.0试建立一揸长y与身高x之间方程.解:作出散点图(见下图)可见,身高与右手一揸长之间的总体趋势成一条直线,即它们线性相关.设线性回归方程yˆ=a+b x , 由上述数据可得x =174.8,y =21.7.∑=1012i ix=305 730,∑=101i ii yx =37 986.∴210121011010ˆxxy x yx bi ii ii --=∑∑===28.174103057307.218.1741037986⨯-⨯⨯-≈0.303.x b y aˆ,ˆˆ==-31.246 ∴方程为yˆ=0.303x -31.246. 拓展探究12.若样本点(x 1,y 1)、(x 2,y 2)…(x n ,y n ),∑∑===n 1i n1i i i ,y n 1y ,x n 1-x 试证明点(y ,x )在直线x b ˆa ˆyˆ+=. 证明:我们知道,回归截距a ˆ和回归斜率b ˆ分别是使Q (a,b )=∑=--ni ii a bx y 12)( 取最小值时a 、b 的值.由于 Q(a,b)=∑=--+---ni i ia xb y x b y bx y12])()([={}}∑=--+-----+---ni i iiia xb y a x b y x b y bx yx b y bx y 122])[(]))][(([2)]([=∑∑==--+--⋅---+---ni ni i i i ia xb y n a x b y x b y bx y x b y bx y1122)()()]([2)]([注意到∑=-----ni i ia xb y x b y bx y1))](([=∑=-----ni i ix b y bx ya xb y 1)]([)(=])()[(11∑∑==-----ni ni i ix b y n x b ya xb y=0)]()[(=-----x b y n x nb ny a x b y 所以Q(a,b)=∑=--+---ni i ia xb y n x b y bx y122)()]([=∑∑∑===--+-+----ni ni ni i i i ia xb y n y y y y x x b x xb1112222)()())((2)(=∑=-+--ni ix xa xb y n 122)()(∑∑∑===-+----ni i ni ini i iy y x xy y x xb 12121)(])())(([∑∑∑===-+----ni i ni in i i i y y x xy y x x 121221)()(]))(([在上式中,后两项和a 、b 无关,前两项为非负数,因此要使Q 取最小值,当且仅当前两项的值均为0,则有a=x b y -.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
限时作业 回归分析及独立性检验
一、选择题
则下列选项中最佳的回归方程为( )
A.12
1
+=
x y B.y =x C.3
1
2+=x y D.y =2x+1
解析:对表格中的数据进行适当的近似处理,分别代入选项中进行检验,每组数据都相差不多的直线模型为最佳回归方程.仔细观察可以发现,表格的每组数据的x 和y 都近似相等,所以回归方程为y =x. 答案:B
2.下列两个变量之间是相关关系的是( )
A.圆的面积与半径
B.球的体积与半径
C.角度与它的正弦值
D.一个考生的数学成绩与物理成绩 解析:相关关系不是确定的函数关系,这里A 、B 、C 都是确定的函数关系. 答案:D
3.想要检验是否喜欢参加体育活动是不是与性别有关,应该检验( ) A.H 0:男性喜欢参加体育活动 B.H 0:女性不喜欢参加体育活动 C.H 0:喜欢参加体育活动与性别有关 D.H 0:喜欢参加体育活动与性别无关
解析:独立性检验假设有反证法的意味,应假设两类变量(而非变量的属性)无关,这时的K 2应该很小,如果K 2很大,则可以否定假设,如果K 2很小,则不能够肯定或者否定假设. 答案:D
4.已知一组观测值具有线性相关关系,若对于y
ˆ=a x b ˆˆ+,求得b ˆ=0.51,x =61.75,y =38.14,则线性回归方程为( )
A.y
ˆ=0.51x+6.65 B.y ˆ=6.65x+0.51 C.y
ˆ=0.51x+42.30 D.y ˆ=42.30x+0.51 解析:x b
y a ˆ-==38.14-0.51×61.75=42.30. 答案:C
5.下面关于卡方说法正确的是( )
A.K 2在任何相互独立的问题中都可以用于检验有关还是无关
B.K 2的值越大,两个事件的相关性就越大
C.K 2是用来判断两个分类变量是否相关的随机变量,当K 2的值很小时可以推定两类变量不相关
D.K 2的观测值的计算公式是)
)()()(()
(2
d b c a d c b a bc ad n K ++++-=
解析:K 2只适用于2×2型列联表问题,且K 2只能推定两个分类变量相关,但不能推定两个变量不相关.选项D 中K 2公式错误,分子上少了平方. 答案:B 二、填空题
6.根据下表,K 2≈_____________.(保留两位小数)
解析:把列联表的行和列的合计补充完整,可利用公式)
)()()(()(2
2
d b c a d c b a bc ad n K ++++-=直
接计算. 答案:1.39 7.下列命题:
①用相关系数r 来刻画回归的效果时,r 的值越大,说明模型拟合的效果越好;
②对分类变量X 与Y 的随机变量的K 2观测值来说,K 2越小,“X 与Y 有关系”可信程度越大;
③两个随机变量相关性越强,则相关系数的绝对值越接近1;
其中正确命题的序号是______________.(写出所有正确命题的序号)
解析:正确的是③,①是由于r 可能是负值,②中K 2越大,“X 与Y 有关系”可信程度越大. 答案:③ 三、解答题
8.在7块并排、形状大小相同的试验田上进行施化肥量对水稻产量影响的试验,得到如下表所示的一组数据(单位:kg).
(2)求y 关于x 的线性回归方程;
(3)若施化肥量为38 kg ,其他情况不变,请预测水稻的产量. 解:(1)根据题表中数据可得散点图如下:
(2)根据回归直线方程系数的公式计算可得回归直线方程是
y
ˆ=4.75x+257. (3)把x =38代入回归直线方程得y =438,所以,可以预测,施化肥量为38 kg ,其他情况不变时,
水稻的产量是438 kg.
9.某班主任对全班50名学生学习积极性和对待班级工作的态度进行了调查,统计数据如下表
不太主动参加班级工作且学习积极性一般的学生的概率是多少?
(2)试运用独立性检验的思想方法点拨:学生的学习积极性与对待班级工作的态度是否有关系?并说明理由.(参考下表)
解:(1)积极参加班级工作的学生有24人,总人数为50人,概率为
2550=; 不太主动参加班级工作且学习积极性一般的学生有19人,概率为50
19
.
(2)5.1113
150
26242524)761918(5022
≈=⨯⨯⨯⨯-⨯⨯=
K , ∵K 2>6.635,
∴有99%的把握说学习积极性与对待班级工作的态度有关系.
10.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y =a x b
ˆˆ+; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,
预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:3×2.5+4×3+5×4+6×4.5=66.5) 解:(1)由题设所给数据,可得散点图如图.
(2)由对照数据,计算得
864
1
2=∑=i i
x
,
5.44
6
543=+++=
x ,
5.34
5.4435.2=+++=y ,
已知
∑==4
1
5.66i i
i y
x ,
所以,由最小二乘法确定的回归方程的系数为
7.05
.44865.35.445.6644ˆ2
41
2
2
4
1
=⨯-⨯⨯-=
-∙-=∑∑==i i i i i x
x y
x y
x b
,x b y a ˆˆ-==3.5-0.7×4.5=0.35, 因此,所求的回归方程为y =0.7x+0.35.
(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为90-(0.7×100+0.35)=19.65(吨标准煤).
试说明在这三种心理障碍中哪一种与性别关系最大? 解:由题设表格可得三个新的表格如下: 关于是否得到焦虑的结论:
对于三种心理障碍分别构造三个随机变量K 1、K 2、K 3,由表中数据可得
63.885258030)2025605(11022
1
≈⨯⨯⨯⨯-⨯=K ,
366.690208030)10207010(11022
2
≈⨯⨯⨯⨯-⨯=K ,
410.145
658030)50153015(11022
3
≈⨯⨯⨯⨯-⨯=K .
所以有99.5%的把握认为焦虑与性别有关,有99%的把握认为说谎与性别有关,没有充分的证据表明懒惰与性别有关.这说明在这三种心理障碍中焦虑与性别关系最大.。