高中数学选修本(文科)线性回归 同步练习
高中线性回归习题含答案
高二选修1—2线性回归习题1. 独立性检验,适用于检查______变量之间的关系 ( )A.线性B.非线性C.解释与预报D.分类2. 样本点),(,),,(),,(2211n n y x y x y x 的样本中心与回归直线a x b yˆˆˆ+=的关系( ) A.在直线上 B.在直线左上方 C. 在直线右下方 D.在直线外3 已知数列 ,11,22,5,2,则52是这个数列的 ( )A.第6项B.第7项C.第19项D.第11项4 用数学归纳法证明)5,(22≥∈>*n N n n n 成立时,第二步归纳假设正确写法是( )A.假设k n =时命题成立B.假设)(*∈=N k k n 时命题成立C.假设)5(≥=n k n 时命题成立D.假设)5(>=n k n 时命题成立5 .确定结论“X 与Y 有关系”的可信度为5.99℅时,则随即变量2k 的观测值k 必须( )A.大于828.10B.小于829.7C.小于635.6D.大于706.26.有下列关系:①人的年龄与他(她)拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其横断面直径与高度之间的关系,其中有相关关系的是 ( )A .①②③B .①②C .②③D .①③④ 7.在线性回归模型y bx a e =++中,下列说法正确的是A .y bx a e =++是一次函数B .因变量y 是由自变量x 唯一确定的C .因变量y 除了受自变量x 的影响外,可能还受到其它因素的影响,这些因素会导致随机误差e 的产生D .随机误差e 是由于计算不准确造成的,可以通过精确计算避免随机误差e 的产生8.对相关系数r ,下列说法正确的是 ( )A .||r 越大,线性相关程度越大B .||r 越小,线性相关程度越大C .||r 越大,线性相关程度越小,||r 越接近0,线性相关程度越大D .||1r ≤且||r 越接近1,线性相关程度越大,||r 越接近0,线性相关程度越小9.在独立性检验中,统计量2K 有两个临界值:3.841和6.635;当2K >3.841时,有95%的把握说明两个事件有关,当2K >6.635时,有99%的把握说明两个事件有关,当2K ≤3.841时,认N M PCBA 为两个事件无关.在一项打鼾与患心脏病的调查中,共调查了2000人,经计算的2K =20.87,根据这一数据分析,认为打鼾与患心脏病之间 ( )A .有95%的把握认为两者有关B .约有95%的打鼾者患心脏病C .有99%的把握认为两者有关D .约有99%的打鼾者患心脏病10必过点 .11.已知,x y R +∈,且2x y +>, 求证:1x y +与1y x +中至少有一个小于212. 如图P 是ABC ∆所在平面外一点,,PA PB CB =⊥平面PAB ,M 是PC 的中点,N 是AB 上的点,3AN NB =。
高中数学选修1-2回归分析 同步练习1
回归分析同步练习1(2)对两个变量进行相关性检验(α=0.05).2. 下表给出了12个人的月存款额y与月收人x的有关数据,试根据这些数据,求出y关于x的回归方程:3. 为了研究大豆脂肪含量(x)和蛋白质含量(y)的关系,测定了9种大豆品种籽粒内的脂肪含最和蛋白质含量,得到如下表的数据,试求出y与x之间的线性回归方程.x的数据:(2)求线性回归方程,并在散点图中加上回归直线;(3)据(2)的结果估计当房屋面积为150m2时的销售价格.5.为研究合金的强度y(×107pa)与合金中碳的含量x(%)的关系,搜集了下面的7对数据x y, (i=l,2,3,…,7):(0.10,43),(0.12,44 5),(0.14,4 5),(0.15,47).(0.16,(,)i i48.5),(0.18,49),(0.2l,55)(1)画出散点图;(2)求出y关于x的线性回归方程;(3)当z=0.17 时,试估计y的值.6. 测量不同浓度(x%)的葡萄糖液在光电比色计上的消光度,得试验数据如下表,试根据试验数据预测葡萄糖液浓度x=12时的消光度.7. 某公司购进一新型设备,为了分配合适的工人操纵设备,进行该设备的工人劳动生产力与工龄之间的相关分析,下表是12个5一10年工龄的工人操纵新设备的劳动生产率的试验记录:参考答案1. (1) 经计算得:567.31,40==y x ,,600092912=-∑=x x i i 2995991=⋅-∑=y x y x i i i ,,38.153392912=-∑=y y i i 从而,4992.060002995==b 60.11=-=x b y a ,回归直线方程是x y 4992.060.11^+=; (2)相关系数9874.038.153360002995=⨯=r ,查表得,与显著性水平0.05和自由度相应的相关系数临界值666.005.0=r ,因05.0r r >,这说明溶解度y 与温度x 之间存在着线性相关关系. 2. 0.3120.3809y x ∧=-+ 3. 54.40.903y x ∧=-4. (1)图略; (2)23,109==y x ,,157092512=-∑=x x i i308551=⋅-∑=y x yx i ii ,从而,1962.01570308==b 8166.1=-=x b y a ,所求回归直线方程是x y 1962.08166.1^+=,(3)据(2),当x=150m 2时,2466.31^=y 万元 5.(1)图略.(2)31.59104.59y x ∧=+(3)当x=0.17时,y 的估计值约为49.37 .6. 0. 27517. 从生产效率来分析:26.13,25.34,7.20,5.8,25.7=====yy xx xy L L L y x ,从而相关系数r=0.91733334.结果说明工龄与劳动者生产率之间存在着高度相关关系;从每件所花费的时间来分析:相关系数r ’= -0.9628,结果说明工龄长短与劳动生产率的逆指标具有高度的负相关关系,工龄越长,每件产品耗时越少,说明经验与知识对于提高劳动生产率有着非常重要的意义.。
苏教版高中数学选修线性回归分析同步测试
苏教选修(1-2)数学:1.3《线性回归分析》一、选择题1.对两对变量y 和x 进行线性相关性检验,已知n 是观测值组数,r 是相关系数,且已知①7n =,0.953r =;②15n =,0.3012r =;③17n =,0.7991r =;④3n =,0.4950r =,则y 和x 有较强线性相关关系的是( )A .①②B .①③C .②④D .③④ 答案:B2.变量x y ,的散点图如右图所示,那么x y ,之间的样本相关系数r 最接近的值为( ) A .1 B .0.5- C .0D .0.5答案:C3.在回归分析中,以下说法正确的是( ) A .自变量和因变量都是随机变量B .自变量是随机变量,因变量是确定性变量C .自变量是确定性变量,因变量是随机变量D .自变量和因变量都是确定性变量 答案:C4.若某地财政收入x 与支出Y 满足回归方程i y bx a δ=++(单位:亿元)(12i =,,…),其中0.8b =,2a =,0.5i δ<.如果今年该地区财政收入10亿元,年支出预计不会超过( ) A .10亿 B .9亿C .10.5亿D .9.5亿答案:C5.设有一个回归方程为$32y x =-,变量x 增加一个单位时( ) A .y 平均增加2个单位 B .y 平均减少3个单位 C .y 平均减少2个单位 D .y 平均增加3个单位 答案:C6.相关系数r 是衡量两变量之间的线笥相关程度的,对此有下列说法:①r 越接近于1,相关程度越大;②r 越接近于0,相关程度越小;③r 越接近于1,相关程度越小;④r 越接近于0,相关程度越大.其中正确的是( ) A .①② B .②④ C .②③ D .①④ 答案:A 二、填空题7.线性回归方程$$y abx =+$恒过定点 . 答案:()x y ,8.在比较两个模型的拟合效果时,甲、乙两个模型的相关系数分别约为0.96和0.85,则拟合效果好的模型为 . 答案:甲9.许多因素都会影响贫富,教育也许是其中之一,在研究这两个因素的关系时,收集了美国50个州的成年人受过9年或更少教育的百分比(x )和收入低于官方规定的贫困线的人数占本州人数的百分比(y )的数据,建立线性回归方程为0.8 4.6y x =+;成年人受到9年或更少教育的百分比(x )和收入低于官方贫困线的人数占本州人数的面分比(y )之间的相关系数 (填“大于零”或“小于零”). 答案:大于零10.在查相关性检验的临界值表时,若在2n -列对应的值为20,则观测值有 组. 答案:22 三、解答题 11.某小卖部为了了解热茶销售量与气温之间的关系,随机统机并制作了某6天卖出的热茶气温(℃) 26 18 13 1041-杯数20 24 34 38 5064画出散点图并判断热茶销售量与气温之间是否具有线性相关关系. 解:(1)以x 表示气温,y 表示热茶杯数,画出散点图如图所示.(2)1(2618131041)11.76x =⨯++++-≈. 1(202434385064)38.36y =⨯+++++≈.622222221261813104(1)1286ii x==+++++-=∑.6126201824133410384501641910i ii x y==⨯+⨯+⨯+⨯+⨯-⨯=∑.62222222120243438506410172ii y==+++++=∑.所以0.97r =-.由于0.970.811r =>,所以x 与y 具有很强的线性相关关系.12.对于x 与y 有如下观测数据:(1)对x 与y (2)求出x 与y 的回归方程. 解:(1)作相关性检验.37x =,7y =,7y =,82111920i i x ==∑,821428ii y==∑,812257i i i x y ==∑,80.991i ix y nx yr -∴=≈∑.由于0.9910.707r =>,因此认为两个变量有很强的相关关系.(2)由公式得0.191b=$,$a y bx =-$70.91370.067=-⨯=-. $0.1910.067y x =-.13.用镁合金X 光探伤时,要考虑透视电压V 与透视厚度L 的关系,做了5次实验,结果如下:(1)进行相关性检验;(2)求V 关于L 的回归方程,并预测当透视厚度为40mm 时,透视电压V 是多少kv ? 解:(1)0.050.9850.878r r =>=,则有95%的把握认为V 与L 之间具有线性相关关系;(2)µ0.5442.4VL =+,当透视厚度40mm 时,可预测透视电压的值为64kv .。
《9.1 线性回归分析》(同步训练)高中数学选择性必修第二册_苏教版_2024-2025学年
《9.1 线性回归分析》同步训练(答案在后面)一、单选题(本大题有8小题,每小题5分,共40分)1、某地区近五年内每年的GDP(单位:亿元)如下表所示:年份 | GDP–|—– 2016 | 300 2017 | 320 2018 | 350 2019 | 370 2020 | 400若要用线性回归分析预测该地区2021年的GDP,以下哪项说法是正确的?A、根据2016年到2020年的数据,拟合直线y=10x+290,则预测2021年GDP为410亿元B、根据2016年到2020年的数据,拟合直线y=10x+280,则预测2021年GDP为420亿元C、根据2016年到2020年的数据,拟合直线y=10x+280,则预测2021年GDP为400亿元D、根据2016年到2020年的数据,拟合直线y=10x+290,则预测2021年GDP为400亿元2、已知一组数据的线性回归方程为(y=1.5x+20),若将(x)的值增加 2,则(y)的值将()。
A、减少 3B、减少 2C、增加 3D、增加 23、(单选题)若线性回归方程为y = 3x + 1,当x增加1个单位时,y大约增加多少个单位?A. 1个单位B. 3个单位C. 4个单位D. 2个单位4、给定一组数据点((x1,y1),(x2,y2),...,(x n,y n)),假设我们已经计算出了线性回归方程(y=ax+b)中的斜率(a)和截距(b)。
如果增加一个新数据点((x n+1,y n+1))到这组数据中,那么新的线性回归方程中的斜率(a′)相对于原来的斜率(a):A. 一定会变大B. 一定会变小C. 可能会变大,可能会变小,也可能会不变D. 一定不会改变5、某校为研究学生身高与体重之间的关系,随机抽取了10名学生的身高和体重数据,并建立了线性回归方程y=50x+35(其中x为身高,y为体重),若某学生的身高为1.75米,则该学生的预测体重约为:A. 70千克B. 75千克C. 80千克D. 85千克6、某研究机构对两种不同品牌的学习卡片销售情况进行了统计,得到了两组数据,为了找到哪种学习卡片的销售趋势更好的线性回归方程,第一组(品牌A)的广告费用与销售额数据如下:广告费用x(元)分别为100、200、300、400、500,对应的销售额y(万元)分别为15、25、35、45、55。
完整word版高中数学专题训练教师版线性回归
高中数学专题训练(教师版)—线性回归一、选择题1.实验测得四组(x,y)的值为(1,2),(2,3),(3,4),(4,5),则y与x之间的回归直线方程为()^^2 +B.y=x A.y=x+1^^1 x-y2x+1 D.=C.y=A答案^1.+解析画出散点图,四点都在直线y=x) 2.下列有关样本相关系数的说法不正确的是(之间的线性相关程度A.相关系数用来衡量变量x与y,相关程度越大,且|r|越接近于1r B.||≤1 ,相关程度越小,且|r|越接近0C.|r|≤1 |r|越接近1,相关程度越小≥D.|r|1,且D答案^,bx=a+…,,y),(x,y)得到的回归直线方程y(3.由一组样本x,y),(x n1n221下面有四种关于回归直线方程的论述:^至少经过点(x,y),(x,y),…,((1)直线y=a+bx x,y)中的一个点;n2112nn yx-n x∑y ii^1i=(2)直线y=a +bx的斜率是;n22xx∑n-i1i=^y)点;x,直线y=a+bx必过((3)^n a-(yx,y)的偏差∑((+bx和各点x,y),(x,y),…,(4)直线y=a i2121nn1i=2 )是该坐标平面上所有的直线与这些点的偏差中最小的直线.-bx i) (其中正确的论述有.1个.0个BA 3个.2个DC.D答案中的任何一)y,(x,)y,(x,y),…解析线性回归直线不一定过点(x,n1212nn yx-∑xyn ii1=i就是线性回归直线的斜率,也就是回归系数;线性回b =点;n22x-n∑x i1i=n归直线过点(x,y);线性回归直线是平面上所有直线中偏差∑2)-bxa (y-ii1=i取得最小的那一条.故有三种论述是正确的,选D.4.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x 的回归直线的斜率是b,纵截距是a,那么必有()A.b与r的符号相同B.a与r的符号相同C.b与r的符号相反D.a与r的符号相反A答案.2的值分别.在比较两个模型的拟合效果时,甲、乙两个模型的相关指数R5约为0.96和0.85,则拟合效果好的模型是()A.甲B.乙C.甲、乙相同D.不确定答案A6.某化工厂为预测产品的回收率y,需要研究它和原料有效成分含量x之8882=xy=228,∑间的相关关系,现取8对观测值,计算,得∑x=52,∑iii11iii1 )===8=1849,则其线性回归方程为(478,∑xy ii1i=^^+2.62x11.47+2.62x B.y=-11.47A.y=^^ 2.62x D.y=11.47-x C.y=2.62+11.47A答案^. x+2.622.62,故y=11.47解析利用回归系数公式计算可得a=11.47,b=二、填空题)的一组数据:月份用水量~4(单位:百吨7.下表是某厂14 312月份x2.543用水量y 4.5其线性回归x用水量y与月份之间有较好的线性相关关系,由散点图可知,^.等于______直线方程是y=-0.7x+a,则a x =2.5,y=3.5,∵回归直线方程过定点(x,y),∴解析3.5=-0.7×2.5.+a5.25.∴a=之间的关)x与月平均气温(℃8.某服装商场为了了解毛衣的月销售量y(件)系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:2月平均气温x(℃)1713855 334024)件月销售量y(^,气象部门预测下个月b≈-2+由表中数据算出线性回归方程y=bxa中的件.6的平均气温约为℃,据此估计,该商场下个月毛衣的销售量约为________n?y n xxy-ii1i=(参考公式:b=,a =y-b x)n22?x xn-i1i=答案46解析由所提供数据可计算得出x=10,y=38,又b≈-2代入公式a=y^y58,即线性回归方程x可得a=-b6代入可得.xx2+58,将==-个接受血管清障手术的病人进个接受心脏搭桥手术的病人和196196.对9 3行了年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:又发作过未发作过合计心脏病心脏病196 39157心脏搭桥手术19629167血管清障手术39268324合计2________.试根据上述数据计算K=________.比较这两种手术对病人又发作心脏病的影响有没有差别.2?×157167?39×-29392×1.78≈答案196××19668×324不能作出这两种手术对病人又发作心脏病的影响有差别的结论解析提出假设H:两种手术对病人又发作心脏病的影响没有差别.02?15729×?39×167-392×根据列联表中的数据,可以求得K=2≈1.78.68×324×196×196当H<2.072的概率为0.85.所以,不能否定假设H22.≈1.78,成立时K而K00也就是不能作出这两种手术对病人又发作心脏病的影响有差别的结论.三、解答题10.某农科所对冬季昼夜温差大小与某反季大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了2010年12月1日至12月5日的每天昼夜温差与实该农科所确定的研究方案是:先从这五组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验.(1)求选取的2组数据恰好是不相邻的2天数据的概率;(2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12^a;y =bx+月4日的数据,求出y关于x的线性回归方程若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过(3)中所得到的线性回归方程是试问(2)2颗,则认为得到的线性回归方程是可靠的,否可靠?组数2因为从5组数据中选取A解析(1)设抽到不相邻的两组数据为事件,,(3,5)(3,4),,(2,4),(2,5),(1,5)10据共有种情况:(1,2),(1,3),(1,4),,(2,3) 月份的日期数.其中数据为12(4,5) 6种:每种情况都是可能出现的,事件A包括的基本事件有363=)=P(A所以. 天数据的概率是2组数据恰好是不相邻2.所以选取的510527.y=,(2)由数据,求得x=1253.x=-y,由公式,求得b=a=-b25^yx关于的线性回归方程为y所以3.-=x2.5^当(3)x=10,y=;×-1023|-3<=222|22,25^ 2;-16|<-3=17,|17y同样,当x=8时,=×82所以,该研究所得到的回归方程是可靠的.11.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:234 5 零件的个数x(个)加工的时间y(小时) 2.534 4.5(1)在给定的坐标系中画出表中数据的散点图;^,并在坐标系中画出回归直线;+ax的线性回归方程y=bx(2)求出y关于个零件需要多少小时?试预测加工10(3)n yx y-n∑x ii1i=,(注:b=a=y-b x) n22xx∑-n i1i=解析(1)散点图如图.4 52.5,x由表中数据得:∑y=(2)ii1=i42=54,∑=3.5,y=3.5,xx i1i=1.05,,=0.7∴a=∴b^y∴1.05.x+=0.7 回归直线如图所示.^ ).8.05(1.05100.7y10x(3)将=代入回归直线方程,得=×+=小时小时.8.05个零件需要10∴预测加工.两种药物后产生的皮肤疱疹的面积,B)为了比较注射A,辽宁卷12.(2010·其中一组只,200只家兔随机地分成两组,每组100选200只家兔做试验,将这. 注射药物A,另一组注射药物B2) 疱疹面积单位:(mm下表1和表2分别是注射药物A和B后的试验结果.1A:注射药物表后皮肤疱疹面积的频数分布表[75,80) [70,75)[65,70)疱疹面积[60,65)10 2040频数30 B后皮肤疱疹面积的频数分布表表2:注射药物[80,85) [70,75)[75,80)[65,70)[60,65)疱疹面积15 20 301025频数ⅰ)(完成下面频率分布直方图,并比较注射两种药物后疱疹面积的中位数大小;(ⅱ)完成下面2×2列联表,并回答能否有99.9% 的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.表3:疱疹面积小合计n=2n?ad-bc?2=K附:?a+b??c+d??a+c??b+d?解析(ⅰ)可以看出注射药物A后的疱疹面积的中位数在65至70之间,而注射药物B后的疱疹面积的中位数在70至75之间,,所以注射药物A后疱疹面积的中位数小于注射药物B后疱疹面积的中位数.(ⅱ)表3:疱疹面积小2疱疹面积不小于70 mm2合计于70 mm100 3070= b= a注射药物A10065=d 35=cB 注射药物.合计10595n=200 2?3035×?70×65-×200=2≈24.56.K100×100×105×95由于K>10.828,所以有99.9%的把握认为“注射药物A后的疱疹面积与注射药2”.后的疱疹面积有差异B物.。
高二第二学期第一章线性回归方程同步练习题(文科)(2)(教师版)
高二第二学期第一章线性回归方程同步练习题(文科)(2)一.选择题1. 下列语句表示的事件中的因素不具有相关关系的是( D )A .瑞雪兆丰年B .名师出高徒C .吸烟有害健康D .喜鹊叫喜,乌鸦叫丧2. 某化工厂为预测某产品的回收率y ,需要研究它和原料有效成份含量之间的相关关系,现取了8对观测值,计算得:∑8i =1x i =52,∑8i =1y i =228,∑8i =1x 2i =478,∑8i =1x i y i =1 849,则y 与x 的线性回归方程是( A ) A .y =11.47+2.62x B .y =-11.47+2.62x C .y =2.62x +11.47x D .y =11.47-2.62x 3.下列属于相关现象的是( B )A.利息与利率 B.居民收入与储蓄存款 C.电视机产量与苹果产量D.某种商品的销售额与销售价格 4. 一工人月工资y (元)关于劳动生产率x (千元)的回归方程为y =650+0.008x ,下列说法中正确的个数是( C )①劳动生产率为1 000元时,工资为730元;②劳动生产率提高1 000元,则工资提高80元; ③劳动生产率提高1 000元,则工资提高730元;④当月工资为810元时,劳动生产率约为2 000元. A .1 B .2 C .3 D .45. 在对两个变量x ,y 进行线性回归分析时有下列步骤:①对所求出的回归方程作出解释; ②收集数据(x i ,y i ),i =1,2,…,n ; ③求线性回归方程; ④求相关系数; ⑤根据所收集的数据绘制散点图.若根据可靠性要求能够作出变量x ,y 具有线性相关结论,则在下列操作顺序中,正确的是( D ) A. ①②⑤③④ B. ③②④⑤① C. ②④③①⑤ D. ②⑤④③① 6. 给定y 与x 的一组样本数据,求得相关系数r=-0.690,则( D ) A.y 与x 的线性相关性很强 B. y 与x 的相关性很强 C. y 与x 正线性相关 D. y 与x 负线性相关7.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归方程为y =7.19x +73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是( A ).A .身高在145.83 cm 左右B .身高在145.83 cm 以上C .身高在145.83 cm 以下D .身高一定是145.83 cm8.已知线性回归方程y =1+bx ,若x =2,y =9,则b 等于( A ). A .4B .-4C .18D .09.已知x 、y 之间的数据如下表所示,则y 与x 之间的线性回归方程过点( D )A .()0,0B .(),0xC .()0,yD .(),x y10.由一组数据1122()()()n n x y x y x y ,,,,,,得到的回归直线方程 y bx a =+,那么下面说法不正确的是( B)A.直线 y bx a =+必经过点()x y , B.直线 y bx a =+至少经过点1122()()()n n x y x y x y ,,,,,,中的一个点 C.直线 y bx a =+a 的斜率为1221ni ii nii x ynx y xnx==--∑∑ D.直线 y bx a =+和各点1122()()()n n x y x y x y ,,,,,,的总离差平方和21[()]ni i i y bx a =-+∑是该坐标平面上所有直线与这些点的离差平方和中最小的直线二、填空题11. 给出下列说法:①线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示; ③通过回归方程y =bx +a 及其回归系数b 可估计和观测变量的取值和变化趋势; ④因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验. 其中正确的是_①②③___.(把正确的序号填上)12.有下列关系:(1)人的年龄与他(她)拥有的财富之间的关系(2)曲线上的点与该点的坐标之间的关系(3)苹果的产量与气候之间的关系(4)森林中的同一种树木,其断面直径与高度之间的关系(5)学生与他(她)的学号之间的关系 其中,具有相关关系的是 .答案:(1)(3)(4)13.下列说法:①线性回归方程适用于一切样本和总体;②线性回归方程一般都有局限性;③样本取值的范围会影响线性回归方程的适用范围;④线性回归方程得到的预测值是预测变量的精确值. 正确的是________(将你认为正确的序号都填上).答案:②③14.下面四个散点图中点的分布状态,直观上判断两个变量之间具有线性相关关系的是_③__.15.(2011·高考山东卷改编)某产品的广告费用x 与销售额y 的统计数据如下表:根据上表可得回归方程y ^=bx +a 中的b 为9.4,据此模型预报广告费用为6万元销售额为________万元. 解析:由题意可知x -=3.5,y -=42,又y ^=bx +a ,必过(x ,y ),则42=9.4×3.5+a ,解得a =9.1,则线性回归方程为y ^=9.4x +9.1,所以广告费用为6万元时,y ^=9.4×6+9.1=65.5(万元).答案:65.5 16.在对两个变量x ,y 进行线性回归分析时,有下列步骤:①对所求出的回归直线方程作出解释;②收集数据(x i ,y i ),i =1,2,…,n ; ③求线性回归方程;④求相关系数;⑤根据所搜集的数据绘制散点图.如果根据可行性要求能够得出变量x ,y 具有线性相关的结论,则正确的操作顺序是________.答案:②⑤④③①17.(2010·广东深圳模拟)已知关于某设备的使用年限x 与所支出的维修费用y (万元),有如下统计资料:若y 对x 呈线性相关关系,则回归直线方程y^=bx +a 表示的直线一定过定点________.答案:(4,5) 18. 正常情况下,年龄在18岁到38岁的人们,体重y (kg )依身高x (cm )的回归方程为y=0.72x-58.5.张红红同学不胖不瘦,身高1米78,他的体重应在 69.66 kg 左右.19.保险公司收集了10周中工作的加班时间y 与签订新保单数目x ,用最小二乘法求出线性回归方程为y=0.12+0.0036x 若公司预签订新保单1000张,估计需加班 _3.72 ___小时. 三、解答题20.某公司利润y (单位:千万元)与销售总额x (单位:千万元)之间有如下对应数据:(1)画出散点图;(2) 解析:(1)画散点图如图所示.(2)从散点图可看出各样本点都在一直线附近摆动,所以x ,y 之间存在线性相关关系.由表格数据可得:∑i =17x i 2=3 447,∑i =17x i y i =346.3,x =21,y =2.1,进而可求得b =∑i =17x i y i -7x y∑i =17x i 2-7x2=346.3-7×21×2.13 447-7×212≈0.104, a =y -b x =2.1-0.104×21=-0.084.∴x ,y 之间的线性回归方程为y =-0.084+0.104x .21.某班5名学生的数学和物理成绩如表:(1)解析(1)散点图:(2)x =15×(88+76+73+66+63)=73.2,y =15×(78+65+71+64+61)=67.8,∑5i =1x i y i =88×78+76×65+73×71+66×64+63×61=25054,∑ni =1x 2i =882+762+732+662+632=27174, (2)回归系数b =∑5i =1x i y i -5x y∑5i =1x 2i -5x2=25054-5×73.2×67.827174-5×73.22≈0.625,a =y -b x =67.8-0.625×73.2=22.05, ∴ y 对x 的线性回归方程是y =0.625x +22.05.22.某医院用光电比色计检验尿汞时,得尿汞含量(毫克/升)与消光系数如下表: 尿汞含量x :2 4 6 8 10 消光系数:y 64134 205 285 360(1)画出散点图;(2)如果y 与x 之间具有线性相关关系,求回归直线方程; (3)估计尿汞含量为9毫克/升时的消光系数. 解:(1)(2)由散点图可知y 与x 线性相关,设回归直线方程为 y bx a =+.列表:2777456209.637.1522056b-⨯⨯==-⨯∴,209.637.15613.3a =-⨯=-∴.∴回归直线方程为 37.1513.3y x =-. (3)当9x =时, 37.15913.3321.05y =⨯-=.23. 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨)标准煤的几组对照数据.(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y^=bx +a ;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)解:(1)由题设所给数据,可得散点图如上图:(2)由对照数据,计算得: =86,x==4.5,y ==3.5,已知 =66.5,所以,由最小二乘法确定的回归方程的系数为:b===0.7,a=y-b x=3.5-0.7×4.5=0.35.因此,所求的线性回归方程为y^=0.7x+0.35.(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为:90-(0.7×100+0.35)=19.65(吨)标准煤.24.假设某设备的使用年限x(年)和所支出的维修费用y(万元)有如下统计资料:若由资料知y对x,b;(2)估计使用年限为10年时,维修费用是多少?解 (1)制表:于是有b=90-5×42=10=1.23,a=y-b x=5-1.23×4=0.08.(2)线性回归方程是y=0.08+1.23x.当x=10(年)时,y=0.08+1.23×10=12.38,即估计使用10年时,维修费用是12.38万元.25. 以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:(1)(3)根据(2)的结果估计当房屋面积为150 m2时的销售价格.解析:(1)散点图如图所示:(第8题)(2)x =15∑i =15x i =109,∑i =15(x i -x )2=1 570,y =23.2,∑i =15(x i -x )(y i -y )=308.设所求回归直线方程为y =bx +a ,则b =3081 570≈0.196 2,a =y -b x =23.2-109×3081 570≈1.816 6.故所求回归直线方程为y =0.196 2x +1.816 6. (3)据(2),当x =150 m 2时,销售价格的估计值为y =0.196 2×150+1.816 6=31.246 6(万元).26.在一段时间内,某种商品的价格x (元)和需求量y (件)之间的一组数据为:已知x 与y 解析: x =15×(14+16+18+20+22)=18,y =15×(12+10+7+5+3)=7.4,∑5i =1x 2i =142+162+182+202+222=1 660, ∑5i =1y 2i =122+102+72+52+32=327, ∑5i =1x i y i =14×12+16×10+18×7+20×5+22×3=620,所以b =∑5i =1x i y i -5x y∑5i =1x 2i -5x 2=620-5×18×7.41 660-5×182=-2320=-1.15, 所以a =y -b x =7.4+1.15×18=28.1,所以线性回归方程为y =-1.15x +28.1.。
高学期线性回归方程同步练习题(文科)(教师版)
1 / 10高二第二学期第一章线性回归方程同步练习题(文科)(1)一、选择题1 . 下列两个变量之间的关系哪个不是函数关系( D)A .角度和它的余弦值B.正方形边长和面积C .正n边形的边数和它的内角和D.人的年龄和身高2.某市纺织工人的月工资(元)依劳动生产率(千元)变化的回归方程为y=50+80x ,则下列说法中正确的是( C )A .劳动生产率为1000元时,月工资为130元 B .劳动生产率提高1000元时,月工资提高约为130元C .劳动生产率提高1000元时,月工资提高约为80元 D .月工资为210元时,劳动生产率为2000元3.设有一个回归方程为y=2-1.5x ,则变量x 每增加一个单位时,y 平均( C )A .增加 1.5单位 B.增加2单位 C.减少 1.5单位 D .减少2单位4.实验测得四组(x ,y )的值为(1,2),(2,3),(3,4),(4,5),则y 与x 之间的回归直线方程为(A ) A.y ^=x +1B.y ^=x +2 C.y ^=2x +1 D.y ^=x -15.由一组样本(x 1,y 1),(x 2,y 2),…,(x n ,y n )得到的回归直线方程y ^=a +bx ,下面有四种关于回归直线方程的论述:(1)直线y ^=a +bx 至少经过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点;(2)直线y ^=a +bx 的斜率是∑ni =1x i y i -nxy∑ni =1x 2i-n x2;(3)直线y ^=a +bx 必过(x ,y )点;(4)直线y ^=a +bx 和各点(x 1,y 1),(x 2,y 2),…,(x n,y n)的偏差∑n i =1(y i-a -bx i)2是该坐标平面上所有的直线与这些点的偏差中最小的直线.其中正确的论述有( D )A .0个 B .1个C .2个 D .3个解析线性回归直线不一定过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的任何一点;b =∑ni =1x i y i -n xy∑ni =1x 2i-nx2就是线性回归直线的斜率,也就是回归系数;线性回归直线过点(x ,y );线性回归直线是平面上所有直线中偏差∑ni =1(y i -a -bx i )2取得最小的那一条.故有三种论述是正确的,选 D.6.某化工厂为预测产品的回收率y ,需要研究它和原料有效成分含量x 之间的相关关系,现取8对观测值,计算,得∑8i =1x i=52,∑8i =1y i=228,∑8i =1x 2i=478,∑8i =1x i y i =1849,则其线性回归方程为(A )A.y ^=11.47+2.62x B.y ^=-11.47+2.62x C.y ^=2.62+11.47x D.y ^=11.47-2.62x 解析利用回归系数公式计算可得a =11.47,b =2.62,故y ^=11.47+2.62x .7. 下列变量之间的关系是函数关系的是( A )A .已知二次函数c bx axy 2,其中a ,b 是已知常数,取b 为自变量,因变量是这个函数的判别式acbΔ42B .光照时间和果树的亩产量C .降雪量和交通事故发生率D .每亩用肥料量和粮食亩产量8. 列有关线性回归的说法,不正确是(D )A.变量取值一定时,因变量的取值带有一定的随机性的两个变量之间的关系叫做相关关系B.在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量的一组数据的图形叫做散点图C.线性回归直线方程最能代表观测值x ,y 之间的关系。
高中数学线性回归方程讲解练习题
教学步骤及教学内容线性回归方程(参考公式:b=∑i=1nx i y i-n x y∑i=1nx2i-n x2,a=y-b x)1.实验测得四组(x,y)的值为(1,2),(2,3),(3,4),(4,5),则y与x之间的回归直线方程为()A.y^=x+1 B.y^=x+2 C.y^=2x+1 D.y^=x-12.在比较两个模型的拟合效果时,甲、乙两个模型的相关指数R2的值分别约为0.96和0.85,则拟合效果好的模型是()A.甲B.乙C.甲、乙相同D.不确定3.某化工厂为预测产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取8对观测值,计算,得∑8i=1x i=52,∑8i=1y i=228,∑8i=1x2i=478,∑8i=1x i y i=1849,则其线性回归方程为()A.y^=11.47+2.62x B.y^=-11.47+2.62xC.y^=2.62+11.47x D.y^=11.47-2.62x4.下表是某厂1~4月份用水量(单位:百吨)的一组数据:月份x 123 4用水量y 4.543 2.5由散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归直线方程是y^=-0.7x+a,则a等于______.5.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:零件的个数x(个)234 5加工的时间y(小时) 2.534 4.5(1)在给定的坐标系中画出表中数据的散点图;(2)求出y关于x的线性回归方程y^=bx+a,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少小时?作业布置家长意见家长签名:2013 年_月_日(第_次)审阅人:1。
高二数学课后练习题:线性回归方程检测试题-word文档资料
高二数学课后练习题:线性回归方程检测试题【】鉴于大家对查字典数学网十分关注,小编在此为大家整理了此文高二数学课后练习题:线性回归方程检测试题,供大家参考!本文题目:高二数学课后练习题:线性回归方程检测试题高中苏教数学③2. 4线性回归方程测试题一、选择题1.下列关系属于线性负相关的是( )A.父母的身高与子女身高的关系B.身高与手长C.吸烟与健康的关系D.数学成绩与物理成绩的关系答案:C2.由一组数据得到的回归直线方程,那么下面说法不正确的是( )A.直线必经过点B.直线至少经过点中的一个点C.直线 a的斜率为D.直线和各点的总离差平方和是该坐标平面上所有直线与这些点的离差平方和中最小的直线答案:B3.实验测得四组的值为,则y与x之间的回归直线方程为( )A. B.C. D.答案:A4.为了考查两个变量x和y之间的线性关系,甲、乙两位同学各自独立作了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1,l2,已知两人所得的试验数据中,变量x和y的数据的平均值都相等,且分别是,那么下列说法正确的是( )A.直线和一定有公共点B.直线和相交,但交点不一定是C.必有直线D. 和必定重合答案:A二、填空题5.有下列关系:(1)人的年龄与他(她)拥有的财富之间的关系(2)曲线上的点与该点的坐标之间的关系(3)苹果的产量与气候之间的关系(4)森林中的同一种树木,其断面直径与高度之间的关系(5)学生与他(她)的学号之间的关系其中,具有相关关系的是.答案:(1)(3)(4)6.对具有相关关系的两个变量进行的方法叫做回归分析.用直角坐标系中的坐标分别表示具有的两个变量,将数据表中的各对数据在直角坐标系中描点得到的表示具有相关关系的两个变量的一组数据的图形,叫做 .答案:统计分析;相关关系;散点图7.将一组数据同时减去3.1,得到一组新数据,若原数据的平均数、方差分别为,则新数据的平均数是,方差是,标准差是 .答案: ; ;8.已知回归直线方程为,则可估计x与y增长速度之比约为 .答案:三、解答题9.某商店统计了近6个月某商品的进价x与售价y(单位:元)的对应数据如下:3 5 2 8 9 124 6 3 9 12 14求y对x的回归直线方程.解:,,回归直线方程为 .10.已知10只狗的血球体积及红血球的测量值如下:45 42 46 48 426.53 6.30 9.257.580 6.9935 58 40 39 505.90 9.496.20 6.557.72x(血球体积,ml),y(红血球数,百万)(1)画出上表的散点图;(2)求出y对x的回归直线方程并且画出图形 .解:(1)见下图(2) ,设回归直线方程为,则, .图形如下:11.某医院用光电比色计检验尿汞时,得尿汞含量(毫克/升)与消光系数如下表:尿汞含量:2 4 6 8 10消光系数 64 134 205 285 360(1)画出散点图;(2)如果y与x之间具有线性相关关系,求回归直线方程;(3)估计尿汞含量为9毫克/升时的消光系数.解:(1)(2)由散点图可知与线性相关,设回归直线方程为 .列表:1 2 3 4 52 4 6 8 1064 134 205 285 360128 536 1230 2280 3600回归直线方程为 .(3)当时, .【总结】2019年查字典数学网为小编在此为您收集了此文章高二数学课后练习题:线性回归方程检测试题,今后还会发布更多更好的文章希望对大家有所帮助,祝您在查字典数学网学习愉快!。
人教B版高中数学选修回归分析同步练习—(1)
1.2 回归分析例题:1. 在画两个变量的散点图时,下面哪个叙述是正确的( ) (A)预报变量在x 轴上,解释变量在y 轴上 (B)解释变量在x 轴上,预报变量在y 轴上 (C)可以选择两个变量中任意一个变量在x 轴上 (D)可以选择两个变量中任意一个变量在y 轴上解析:通常把自变量x 称为解析变量,因变量y 称为预报变量.选B2. 若一组观测值(x 1,y 1)(x 2,y 2)…(x n ,y n )之间满足y i =bx i +a+e i (i=1、2. …n)若e i 恒为0,则R 2为 解析: e i 恒为0,说明随机误差对y i 贡献为0. 答案:1.3.(1)线性回归方程;(2)估计使用年限为10年时,维修费用是多少? 解:(1)列表如下:于是23.145905453.112552251251=⨯-⨯⨯-=--=∑∑==xx yx yx b i i i ii , 08.0423.15=⨯-=-=bx y a∴线性回归方程为:08.023.1^+=+=x a bx y (2)当x=10时,38.1208.01023.1^=+⨯=y (万元) 即估计使用10年时维修费用是1238万元 课后练习:1. 一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为y=7.19x+73.93 用这个模型预测这个孩子10岁时的身高,则正确的叙述是( ) A.身高一定是145.83cm; B.身高在145.83cm 以上;C.身高在145.83cm 以下;D.身高在145.83cm 左右.2. 两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数2R 如下 ,其中拟合效果最好的模型是( )A.模型1的相关指数2R 为0.98B.模型2的相关指数2R 为0.80C.模型3的相关指数2R 为0.50D.模型4的相关指数2R 为0.253.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是( ) A.总偏差平方和 B.残差平方和C.回归平方和D.相关指数R 24.工人月工资(元)依劳动生产率(千元)变化的回归直线方程为ˆ6090y x =+,下列判断正确的是()A.劳动生产率为1000元时,工资为50元B.劳动生产率提高1000元时,工资提高150元C.劳动生产率提高1000元时,工资提高90元D.劳动生产率为1000元时,工资为90元5.线性回归模型y=bx+a+e 中,b=_______,a=_________e 称为_________6. 若有一组数据的总偏差平方和为100,相关指数为0.5,则期残差平方和为_______ 回归平方和为____________7. 一台机器使用的时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,(1)变量y 对x 进行相关性检验; (2)如果y 对x 有线性相关关系,求回归直线方程; (3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么机器的运转速度应控制在什么范围内?第一章:统计案例答案1.2 回归分析 1. D2.A3.B4.C5.a=ˆy bx-,e 称为随机误差6. 50,507. (1)r=0.995,所以y 与x 有线性性相关关系 (2)y=0.7286x-0.8571 (3)x 小于等于14.9013∑∑==---=ni i ni i ix x y y x xb 121)())((。
人教B版高中数学选修回归分析同步练习(1)
3.2 回归分析测试题一、选择题1.下列结论正确的是()①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.A.①②B.①②③C.①②④D.①②③④答案:C2.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是()A.总偏差平方和B.残差平方和D.回归平方和D.相关指数答案:B3.已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线方程为()A.$1.234=+B.$1.235y x=+y xC.$1.230.08=+y xy x=+D.$0.08 1.23答案:C4.高二第二学期期中考试,按照甲、乙两个班级学生数学考试成绩优秀和不优秀统计后,得到如下列联表:班级与成绩列联表则随机变量2K的观测值约为()A.0.60 B.0.828 C.2.712 D.6.004答案:A5.利用独立性检验来考察两个分类变量X和Y是否有关系时,通过查阅下表来确定断言“X 与Y有关系”的可信程度.如果k>5.024,那么就有把握认为“X与Y有关系”的百分比为()25%75% 2.5%97.5%答案:D二、填空题6.线性回归模型y bx a e=++(a和b为模型的未知参数)中,e称为.答案:随机误差7.在线性回归模型中,总偏差平方和、回归平方和、残差平方和的关系等式是.答案:回归平方和=总偏差平方和-残差平方和8.在残差分析中,残差图的纵坐标为.答案:残差9.在分析两个分类变量之间是否有关系时,常用到的图表有.答案:列联表、三维柱形图、二维条形图10.在比较两个模型的拟合效果时,甲、乙两个模型的相关指数2R的值分别约为0.96和0.85,则拟合效果好的模型是.答案:甲三、解答题11.在回归分析中,通过模型由解释变量计算预报变量的值时,应注意什么问题?解:应注意下列问题:(1)回归方程只适用于我们所研究的样本的总体;(2)我们所建立的回归方程一般都有时间性;(3)样本取值的范围会影响回归方程的适用范围;(4)不能期望回归方程得到的预报值就是预报变量的精确值.12.某企业为考察生产同一种产品的甲、乙两条生产线的产品合格率,同时各抽取100件产品,检验后得到如下列联表:生产线与产品合格数列联表解:2K的观测值2200(975953)0.521 2.706(973)(955)(9795)(35)k ⨯⨯-⨯=≈+⨯+⨯+⨯+≤,因此没有充分的证据显示甲、乙两线生产的产品合格率有关系.。
人教B版高中数学选修回归分析同步练习
《回归分析》复习问答一、【问】回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.相关关系又分线性相关关系和非线性相关关系,如何利用回归分析的方法对两个具有线性相关关系的变量进行研究呢?【答】利用回归分析的方法对两个具有线性相关关系的变量进行研究的步骤为:①画出两个变量的散点图;②求回归直线方程;③用回归直线方程进行预报.其中求回归直线方程是关键.而对于线性回归模型y bx a =+来说,估计模型中的未知参数a 和b 的最好方法就是用最小二乘估计和,其计算公式为1122211()()()nnii i ii i nniii i xx y y x yxyb xx xnxη====---==--∑∑∑∑,a y bx =-. 例1 某地10户家庭的年收入和年饮食支出的统计资料如下表:(1)根据表中数据,确定家庭的年收入和年饮食支出的相关关系; (2)如果某家庭年收入为9万元,预测其年饮食支出. 解析:(1)由题意知,年收入x 为解释变量,年饮食支出y 为预报变量,作散点图(如图所示).从图中可以看出,样本点呈条状分布,年收入和年饮食支出有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系. 61.83x y ==,∵,1021406i i x ==∑,102135.13ii y==∑,101117.7i i i x y ==∑,0.17b =∴.1.830.17260.798a yb x =-=-⨯=. 从而得到回归直线方程为0.1720.798y x =+. (2)0.1720.798 2.346y =⨯=万元.点评:①0.172b =是斜率的估计值,说明年收入x 每增加一万元,年饮食支出y 就增加0.172万元,这表明了年饮食支出与年收入具有正的线性相关关系.②对于该家庭年收入为9万元,由回归方程得到的年饮食支出的预报值2.346万元,并不能说该家庭的年饮食支出一定是2.346万元.一般说来,不能期望回归方程得到的预报值就是预报变量的精确值.事实上,它是预报变量的可能取值的平均值. 二、【问】上面说到,判断解释变量x 与预报变量y 是否具有线性相关关系,先作出散点图,从点的分布特征来判定是否线性相关.那么,如果作图不准,出现误差怎么办?怎样更好地判定两个变量相关关系的强弱?【答】作相关性检验,通过作散点图,并观察所给的数据列成的点是否在一条直线的附近来判定,这样做既直观又方便,因而对解决相关性检验问题比较常用,但在作图中,由于存在误差,有时很难说这些点是不是分布在一条直线的附近,这时就很难判断两个变量之间是否具有相关关系.因此,给定样本数据()(12)i i x y i n =,,,,,单纯由散点图判定其是否大致在一条直线附近主观性太强,回归分析时还通常用相关系数r 来检验两个变量之间线性相关关系的强弱.样本相关系数的具体计算公式为:()()nii xx y y r r --∑的绝对值越接近1,表明两个变量的线性相关性越强;r 的绝对值接近于0时,表明两个变量之间几乎不存在线性相关关系.通常当r 大于0.75时,认为两个变量有很强的线性相关关系. 例2 为了了解某地母亲身高x 与女儿身高y 的相关关系,现随机测得10对母女的身高,所得数据如下表所示:试对与进行回归分析,并预报当母亲身高为161cm 时,女儿的身高为多少? 解析:作线性相关性检验,158.8159.1x y ==,, 22222210(159160157)10158.847.6ixx -=+++-⨯=∑,1037.2i i x y x y -=∑,221056.9i y y -=∑.因此0.71r ≈.表明x 与y 有线性相关关系,因而求回归直线方程有必要. 又0.78b ≈,159.10.78158.835.2a =-⨯≈.由此可得回归直线方程为0.7835.2y x =+.斜率的估计值0.78b =反映出当母亲身高每增加1cm 时,女儿身高平均增加0.78cm ,35.2a =可以理解为女儿身高中不受母亲身高影响的部分.当母亲身高为161x =cm 时,预报女儿身高为0.7816135.2160.78161y =⨯+=≈cm ,这就是说当母亲身高为161cm 时,女儿身高大致也为161cm .点评:本题是一个回归分析类问题 .解决这一问题,首先应对问题进行必要的相关性检验,如果x 与y 之间具有线性相关关系,再求出对应的回归直线的方程,最后利用回归直线方程由解释变量x 的值得到预报变量y 的值.注意:如果不先作相关性检验,我们虽然也可以求出x 与y 的回归直线方程,但这时的回归直线方程也许没有任何实际价值,它也就不能反映变量x 与y 之间的变化规律,只有在x 与y 之间具有相关关系时,求回归直线方程才具有实际意义. 三、【问】如何比较两个不同回归模型的拟合效果?【答】首先建立回归模型,其基本步骤是:①确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;②画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性相关关系等);③由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程y bx a =+);④按一定规则估计回归方程中的参数(如最小二乘法);⑤得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差呈现不随机的规律性等),若存在异常,则检查数据是否有误,或模型是否合适等. 建立起回归模型后,利用残差分析的方法来比较两个不同回归模型的拟合效果.其方法是:对于由给定的样本点1122()()()n n x y x y x y ,,,,,,而得到的两个回归方程(1)()yf x a =,和(2)()yf x b =,,分别计算两个回归方程的残差平方和(1)(1)21()ni i i Q y y ==-∑与(2)(2)21()ni i i Qy y ==-∑;若(1)(2)Q Q<,则(1)()yf x a =,的效果比(2)()yf x b =,的好;反之,(1)()yf x a =,的效果不如(2)()yf x b =,的好.四、【问】上面主要研究了线性回归问题,那么如何用回归分析的方法对非线性回归问题进行统计分析呢?【答】对于非线性回归问题进行回归分析的方法是:(1)若问题中已给出经验公式,这时可以将解释变量进行交换(换元),将变量的非线性关系转化为线性关系,将问题化为线性回归分析问题来解决.(2)若问题中没有给出经验公式,需要我们画出已知数据的散点图,通过与各种函数(如指数函数、对数函数、幂函数等)的图象作比较,选择一种与这些散点拟合得最好的函数,然后采用适当的变量变换,将问题化为线性回归分析问题来解决.例3 某种图书每册的成本费y (元)与印刷册数x (千册)有关,经统计得到数据如下:检验每册书的成本费y 与印刷册数的倒数1x之间是否有线性相关关系,如果有,求出y 对x 的回归方程.解析:首先作变量变换,令1u x=,则题目所给数据变成如下表所示的数据:并且8.973b =, 1.125a y bu =-=,最后回代1u x =可得8.973 1.125y x=+. 因此y 与x 的回归方程为8.9731.125y x=+. 点评:本题中y 与x 之间不具有线性回归关系,因而是非线性回归分析问题,通过变量变换,即令1u x=,并通过对u 与y 作相关性检验,判定出y 与u 之间具有较强的线性相关关系后,求出y 对u 的回归直线方程,最后再回代1u x=,得到y 对x 的回归方程. 五、【问】如何进行独立性检验? 【答】若要推断的论述为1H :“X 与Y 有关系”,判断结论1H 成立的可能性的方法是: (1)三维柱形图与二维条形图可用于粗略地判断两个分类变量是否有关系.①在三维柱形图中,主对角线上两个柱形高的乘积ad 与副对角线上两个柱形高的乘积bc 相差越大,两个分类变量X与Y有关系的可能性就越大.②在二维条形图中,可以估计图形满足1X x =的个体中具有1Y y =的个体所占的比例a ab +,也可以估计满足条件2X x =的个体中具有1Y y =的个体所占的比例cc d +,两个比例相差越大,X与Y有关系的可能性就越大.但是三维柱形图和二维条形图无法精确地给出所得结论的可靠程度,因而只做粗略估计,而不做具体运算.(2)可以利用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度.具体做法是:根据观测数据计算检验随机变量2K 的值k ,其值越大,说明“X 与Y 有关系”成立的可能性越大.独立性检验的一般步骤是:①假设两个分类变量X与Y无关系;②计算出2K 的观测值2()()()()()n ad bc k a b c d a c b d -=++++;③把k 的值与临界值比较确定X与Y有关系的程度或无关系.。
高中数学选修12回归分析 同步练习2
高中数学选修12回归分析同步练习21. 对以下几对变量,它们具有明显的负相关、明显的正相关,还是相关系数接近0?(1)二手车的车龄与车价; (2)新车的重量和汽车百千米油耗;(3)成年男性的身高和体重; (4)成年男性的身高和IQ2. 以下每一条叙述中都有一个错误,说明错存哪里:(1)美国就业者的性别与收入之间有很高的相关系数;(2)我们发现在学生对教授的评价和其他同行对教授的评价之间,存在很高的线性相关系数(r=1.09);(3)年龄与收入之间的相关系数是r=0.533岁3. 某动物的5个化石标本中,股骨与脏骨的长度如下表所示,试计算这两个变量的相关系数,并求出线性回归方程.股骨74 64 59 56 38肫骨84 72 70 63 414. 汽车每加仑汽油行驶的英里数在速度增加时先上升再下降假设这种相关关系相当规则,速度(每小时英里数)和汽车里程(每加仑英里数)如下所示:速度20 30 40 50 60汽车里24 28 30 28 24程画个汽油里程对应速度的散点图,用计算器(机)算算,速度和汽油单程之间的相关系数其实是0,解释一下为什么虽然速度和汽油里程之间有很强的相关性,但相关系数却是05. 随机选取15家销售公司,由营业报告中查出其上年度的广告费x(占总费用的百分比)及广告费x 1.5 0.8 2.6 1.0 0.6 2.8 1.2 0.9 0.4 1.3 1.2 2.0 1.6 1.8 2.2 盈利额y 3.1 1.9 4.2 2.3 1.6 4.9 2.8 2.1 1.4 2.4 2.4 3.8 3.0 3.4 4.0(3)在显著水平0.01的条件下,对变量x与y进行相关性检验;(4)如果变量x与y之间具有线性相关关系,求出回归直线方程;(5)已知某销售公司的广告费占其总费用的1.7%,试估计其盈利净额占销售总额的百分比.含碳量x% 0.10 0.30 0.40 0.55 0.70 0.80 0.9515 18 19 21 22.6 23.8 26电阻y(200C,Ωμ)(2)求出y与x的相关系数;(3)求出电阻y关于含碳量x之间的回归直线方程.广告费x 40 18 33 36 25 43 38 30 50 20 42 46消费额y 400 395 420 475 385 525 480 400 560 365 510 540(2)求销售额y对广告费x的一元线性回归方程;(3)求出两个变量的相关系数.8. 在有关增重、节食的研究中,10位女性和6位男性的瘦肉体重(kg)及静止新陈代谢率(卡路里)如下表所示:(1)针对女性参与者的数据画个散点图,变量之间的相关性是正还是负?(2)现在把男性的数据也加进散点图,用不一样的颜色或者符号,你觉得男性的相关系数和女性的相关系数会差不多,还是颇有差距?(3)计算女性的相关系数和男性的相关系数参考答案1. (1)负的 (2)正的 (3)正的 (4)接近0.2. (1)性别不是数量变量.(2)r 不能超过1(3)r 没有单位.3. 相关系数为0.9941,回归方程为y ∧=-3.659 6+ 1.1969x .4. 散点图略,这里的相关不是线性的.5. (1)图略; (2)相关系数r=0.98831; (3)相关系数临界值641.001.0=r ,因01.0r r >,这说 明两变量之间存在着线性相关关系; (4)^y =1.41468x+0.82123; (5)当x=1.7 时,y=3.23,其盈利净额占销售总额的百分比为3.23%.6. (1)图略; (2)y 与x 的相关系数r=0.998714; (3)回归方程^y =12.5504x+13.95839.7. (1)图略;(2)回归方程^y =7.28601x+200.39416;(3)相关系数r=0.98353.8. (1)散点图略,变量之间的相关性是正的. (2)图略,差不多 (3)女性的相关系数为0.836 2,男性的相关系数为0.821 7.。
高中数学3.3线性回归分析专项测试同步训练
高中数学3.3线性回归分析专项测试同步训练2020.031,在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是( )A.总偏差平方和 B.残差平方和C.回归平方和 D.相关指数R22,工人月工资(元)依劳动生产率(千元)变化的回归直线方程为ˆ6090=+,下列判断正确的是()y xA.劳动生产率为1000元时,工资为50元B.劳动生产率提高1000元时,工资提高150元C.劳动生产率提高1000元时,工资提高90元D.劳动生产率为1000元时,工资为90元3,一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为y=7.19x+73.93用这个模型预测这个孩子10岁时的身高,则正确的叙述是()A.身高一定是145.83cm; B.身高在145.83cm以上;C.身高在145.83cm以下; D.身高在145.83cm左右.4,在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:人体的脂肪含量百分比和年龄通过计算得到回归方程为0.5770.448y x =-,利用这个方程,我们得到年龄37岁时体内脂肪含量为20.90%,那么数据20.90%的意义是: ( )A .某人年龄37岁,他体内脂肪含量为20.90%;B .某人年龄37岁,他体内脂肪含量为20.90%的概率最大;C .某人年龄37岁,他体内脂肪含量的期望值为20.90%;D .20.90%是对年龄为37岁的人群中的大部分人的体内脂肪含量所作出的估计;5,两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数2R 如下 ,其中拟合效果最好的模型是( ) A .模型1的相关指数2R 为0.98 B .模型2的相关指数2R 为0.80 C .模型3的相关指数2R 为0.50 D .模型4的相关指数2R 为0.256,规定A m x=x(x-1)…(x-m+1),其中x ∈R ,m 为正整数,且A 0x=1,这是排列数A m n(n ,m 是正整数,且m ≤n)的一种推广. (1)求A 315-的值;(2)排列数的两个性质:①A m n=nA11--m n ,②A m n +mA1-m n=Am n 1+(其中m ,n 是正整数).是否都能推广到A m x(x ∈R ,m 是正整数)的情形?若能推广,写出推广的形式并给予证明;若不能,则说明理由;(3)确定函数A3x的单调区间.7,平面上有两个质点A(0,0), B(2,2),在某一时刻开始每隔1秒向上下左右任一方向移动一个单位。
高中数学新课标选修回归分析同步练习
3。
1.1回归分析同步练习【选择题】1、下列两个变量之间的关系哪个不是函数关系?()A、角度和它的余弦值B、正方形边长和面积C、正n边形的边数和顶点角度之和D、人的年龄和身高2、变量y与x之间的回归直线方程( )A.表示y与x之间的函数关系B.表示y和x之间的不确定关系C.反映y和x之间真实关系的形式D.反映y与x之间的真实关系达到最大限度的吻合3、若用水量x(吨)与某种产品的产量y的回归直线方程是ˆy=2x+1250,若用水量为50kg时,预计的某种产品的产量是( )A.1350 kg B.大于1350 kg C.小于1350kg D.以上都不对[来源: ]【填空题】4、对具有______________的两个变量进行统计分析的方法叫回归分析。
5、现有一个由身高预测体重的回归方程:体重预测值=4(磅/英寸)×身高-130磅.其中体重与身高分别以磅和英寸为单位.如果换算_____________________6、回归直线方式:a bx y+=ˆ中b =_____________________,a =____________________(其中:∑==ni ix n x 11)【解答题】7、为考虑广告费用x 与销售额y 之间的关系,抽取了5家餐厅,得到如下数据: [来源:](1)在同一张图上画散点图,直线ˆy (1)=24+2.5x ,曲线ˆy (2)=602xx +;[来源: ](2)比较所画直线与曲线,哪一条更能表现这组数据之间的关系?(3)分别计算用直线方程与曲线方程得到在5个x 点处的销售额预测值与实际值之间的误差,最后比较两个误差绝对值之和的大小。
8、下面是两个变量的一组数据: x 1 2 3 4 5 6 7 8 y1491625364964请用最小二乘法求出这两个变量之间的线性回归方程。
参考答案1、D2、D3、A4、相关关系5、体重预测值=0.72(kg/cm )×身高-58.5kg6、其中b = , a =x b y -7、解:(1)所求图形如右图.∑∑==--ni ini ii x n x yx n y x 1221(2)从图形上看,曲线ˆy(2)=602xx+比直线ˆy(1)=24+2.5x更能表现出这组数据之间的关系.(3)列表略:用直线ˆy(1)=24+2.5x近似数据时,误差绝对值的和为27。
高中数学选修1-2可线性化的回归分析同步练习
高中数学学习材料 (灿若寒星 精心整理制作)可线性化的回归分析 同步练习【选择题】1、给定y 与x 的一组样本数据,求得相关系数r=-0.690,则( ) A.y 与x 的线性相关性很强 B. y 与x 的相关性很强 C. y 与x 正线性相关 D. y 与x 负线性相关2、若回归直线方程中的回归系数b=0时,则相关系数 ( ) A 、r =1 B 、r = -1 C 、r =0 D 、无法确定 【填空题】3、为考虑广告费用x 与销售额y 之间的关系,随机地抽取5家超市,得到如下表所示的数据;广告费用x(千克) 1.0 4.0 6.0 10.0 14.0 销售额y (千元) 19.0 42.0 46.0 52.0 53.0 现要使销售额达到10万元,则广告费用约为______________千克.4、对于一组数据的两个函数模型,其残差平方和分别为180.2和290.7,若从中选取一个拟合程度较好的函数模型,应选____________________. 【解答题】5、在彩色显影中,由经验可知,形成染料光学密度y 与析出银的光学密度x 由公式)0(<=b Ae y xb 表示,现测得试验数据如下:i x0.05 0.06 0.25 0.31 0.07 0.10i y 0.10 0.14 1.00 1.12 0.23 0.37 i x0.38 0.43 0.14 0.20 0.47 i y1.191.250.590.791.29试求y 对x 的回归方程.6、某种书每册的成本费Y 元与印刷册数x (千册)有关,经统计得到数据如下: x 1 2 3 5 10 20 30 50 100 200 Y 10.15 5.52 4.08 2.85 2.11 1.62 1.41 1.30 1.21 1.15检验每册书的成本费Y 与印刷册数的倒数x1之间是否具有线性相关关系,如有,求出Y 对x 的回归方程.参考答案1、D2、C3、31.856 44、第一种5、解:由题意知,对于给定的公式)0(<=b Ae y xb 两边取自然对数,得.ln ln xbA y +=与线性回归方程相对照可以看出,只要取,ln ,ln ,1A a y v xu ===就有v =a +bu . 这是V 对u 的线性回归直线方程,对此我们再套用相关性检验,求回归系数b 和a ,题目中所给的数据由变量置换,ln ,1y v xu ==变为如下所示的数据.i u20.00 16.667 4.000 3.226 14.286 10.000i v -2.303 -1.966 0 0.113 -1.470 -0.994 i u 2.632 2.326 7.143 5.000 2.128 i v0.1740.223-0.528-0.2360.255可以求得:r =0.998,由于,75.0998.0||>=r 可知,v u 与具有很强的线性相关关系. 再求出b =-0.14,a =0.548,u v146.0548.0ˆ-=∴ 把v u 与置换回来可得.146.0548.0ˆln xy -=∴xxxeee e y146.0146.0548.0146.0548.073.1ˆ---=⋅==∴所以回归曲线方程为xe y146.073.1ˆ-=∴6、Y 对x 的回归方程为.120.1976.8ˆ+=xy。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
线性回归同步练习
一、选择题(本大题共6小题,每小题3分,共18分)
1.下列说法正确的是
A.任何两个变量都具有相关关系
B.球的体积与该球的半径具有相关关系
C.农作物的产量与施化肥量之间是一种确定性的关系
D.某商品的生产量与该商品的销售价格之间是一种非确定性的关系
2.变量y与x之间的回归方程表示
A.表示y与x之间的函数关系
B.表示y和x之间的不确定关系
C.反映y和x之间真实关系的形式
D.反映y与x之间的真实关系达到最大限度的吻合
3.设有一个回归方程为^
y=2+3x,则变量x增加一个单位时,则
A.y平均增加2个单位
B.y平均减少3个单位
C.y平均减少2个单位
D.y平均增加3个单位
4.线性回归方程^
y=bx+a必过
A.(0,0)点
B.(x,0)点
C.(0,y)点
D.(x,y)点
5.为了考察两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,那么下列说法正确的是
A.l1和l2有交点(s,t)
B.l1与l2相交,但交点不一定是(s,t)
C.l1与l2必定平行
D.l1与l2必定重合
6.“回归”一词是在研究子女的身高与父母的身高之间的遗传关系时,由高尔顿提出的,他的研究结果是子代的平均身高向中心回归,根据他的结论,在儿子的身高y与父亲的身高
x的回归方程^y=a+bx中,b的取值
A.在(-1,0)内
B.等于0
C.在(0,1)内
D.在[1,+∞)内
二、填空题(本大题共5小题,每小题3分,共15分) 7.有下列关系:(1)人的年龄与他(她)拥有的财富之间的关系;(2)曲线上的点与该点的坐标之间的关系;(3)苹果的产量与气候之间的关系;(4)森林中的同一种树木,其断面直径与高度之间的关系;(5)学生与他(她)的学号之间的关系.其中有相关关系的是 .
8.若施化肥量x 与水稻产量y 的回归直线方程为^
y =5x +250,当施化肥量为80 kg 时,预计的水稻产量为 .
9.散点图中n 个点的重心是 .
10.有一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )记
x =
n
1∑=n
i xi
1
,y
=n
1,)(,1
2
1
∑∑==-=n
i i xx
n
i x x l
yi ,)()(1
y y x x l i n
i i xy --=∑= ,则线性回归方程则^
y =a +bx 中的
b = ,a = .
11.由一组观测数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )得
x =1.542,y
=2.8475,∑=n
i i x 1
2
=29.898,08∑=n
i i y 1
2
=99.208,∑=n
i i i y x 1
=54.243,则回归直线方程是 .
三、解答题(本大题共3小题,每小题9分,共27分)
(1)依据这些数据画出散点图并作直线^
y =78+4.2x ,计算∑=10
1
i (y i -^
y i )2;
(2)依据这些数据由最小二乘法求线性回归方程,并据此计算∑=-10
1
2^
)(i i i y y ;
(3)比较(1)和(2)中的残差平方和∑=-10
1
2^
)(i i i y y 的大小.
13.有一台机床可以按各种不同的速度运转,其加工的零件有一些是二级品,每小时生产的二级品零件的数量随机床运转的速度而变化.下面是实验的步骤:
(2)求出机床运转的速度x与每小时生产二级品数量y的回归直线方程;
(3)若实际生产中所允许的二级品不超过10个,那么机床的运转速度不得超过多少转/秒?
14.为了研究三月下旬的平均气温(x)与四月二十号前棉花害虫化蛹高峰日(y)的关系,
高峰日为哪天;
(2)对变量x,y进行相关性检验.
参考答案
一、1.D 2.D 3.D 4.D 5.A 6.C
二、7.(1)(3)(4) 8.650 kg 9.(y x ,) 10.
xx
xy l l x b y - 11.^
y =1.215x +0.974
三、12.解:(1)散点图与直线^
y =78+4.2x 的图形如下图,对x =1,3,…,13,有
^
y i =82.2,90.6,94.8,94.8,103.2,111.6,120,120,124.2,132.6,
∑
=10
1
i (y i -^
y i )2=179.28.
(2)x =
10
1∑
=10
1
i x i =7,
l xx =∑=5
1
i (x i -x )2=142,y =108,
l xy = ∑=10
1
i (x i -x )(y i -y )=568,
∴^
β1=
142
568
=xx
xy l l =4, ^β0= y -^
βx 1=108-7×4 =80,故^
y =80+4x .
^
y i =84,92,96,96,104,112,120,120,124,132,∑=10
1
i (y i -^
y i )2=170.
(3)比较可知,用最小二乘法求出的∑=10
1
i (y i -^
y i )2较小
.
13.解:(1)散点图见图
.
(2)易求得x =12.5,y =8.25
∴回归直线的斜率b =
2
1
2)(x n x
y
x n y
x n
i i
n
n
i i
i
--∑∑===0.7286
截距a =x b y -=-0.8571.
∴所求回归直线的方程为^
y =0.7286x -0.8571.
(3)根据经验公式,要使^
y ≤10,只要0.7286x -0.8571≤10,解得x ≤14.9013,即机床的运转速度不能超过14.9013转/秒.
14.解:(1)运用科学计算器,得:
x =6
1∑=6
1
i i
x =29.13,y =61
∑=6
1
i i
y
=7.5,
∑=6
1
i i
x
2
=5130.92, ∑=6
1
i i x y i =1222.6.
∴b =
∑∑==--6
1
2
26
1)(66i i
i i
i
x x
y
x y
x =-2.2,
a =x
b y - =7.5-(-2.2)×29.13=71.6. ∴回归直线方程为^
y =-2.2x +71.6. 当x =27时,^
y =-2.2×27+71.6=12.2.
据此,可估计该地区2002年4月12日或13日为化蛹高峰日.
(2)r =
)
6)(6(62
6
1
2
2
6
1
2
6
1
y y x x y
x y
x i i i i i i
i ---∑∑∑====0.9342.
查表知r 0.05=0.811,由|r |>r 0.05可知,变量y 与x 存在线性相关关系.。