【创新设计】-高中数学 3.1.2 相关系数同步练习 北师大版选修2-3
高中数学北师大版选修2-3学案:3.1.1 回归分析 1.2 相关系数 1.3 可线性化的回归分析 Word版含解析
§1回归分析1.1回归分析1.2相关系数1.3可线性化的回归分析1.了解回归分析的思想和方法.(重点)2.掌握相关系数的计算和判断线性相关的方法.(重点)3.了解常见的非线性回归模型转化为线性回归模型的方法.(难点)[基础·初探]教材整理1回归分析阅读教材P73~P75,完成下列问题.设变量y对x的线性回归方程为y=a+bx,由最小二乘法知系数的计算公式为:b=l xyl xx=∑i=1n(x i-x)(y i-y)∑i=1n(x i-x)2=∑i=1nx i y i-n x y∑i=1nx2i-n x2,a=y-b x.教材整理2 相关系数阅读教材P 76~P 78,完成下列问题. 1.相关系数r 的计算假设两个随机变量的数据分别为(x 1,y 1),(x 2,y 2),…,(x n ,y n ),则变量间线性相关系数r =l xyl xx l yy=∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2∑i =1n(y i -y )2=∑i =1nx i y i -n x y∑i =1nx 2i -nx2∑i =1ny 2i -n y 2.2.相关系数r 与线性相关程度的关系(1)r 的取值范围为[-1,1];(2)|r |值越大,误差Q 越小,变量之间的线性相关程度越高; (3)|r |值越接近0,误差Q 越大,变量之间的线性相关程度越低. 3.相关性的分类(1)当r >0时,两个变量正相关; (2)当r <0时,两个变量负相关; (3)当r =0时,两个变量线性不相关.判断(正确的打“√”,错误的打“×”)(1)两个变量的相关系数r >0,则两个变量正相关.( ) (2)两个变量的相关系数越大,它们的相关程度越强.( ) (3)若两个变量负相关,那么其回归直线的斜率为负.( ) 【答案】 (1)√ (2)× (3)√ 教材整理3 可线性化的回归分析 阅读教材P 79~P 82,完成下列问题.1.非线性回归分析对不具有线性相关关系的两个变量做统计分析,通过变量代换,转化为线性回归模型.2.非线性回归方程下列数据x,y符合哪一种函数模型()A.y=2+13x B.y=2exC.y=2e 1x D.y=2+ln x【解析】分别将x的值代入解析式判断知满足y=2+ln x. 【答案】 D[质疑·手记]预习完成后,请将你的疑问记录,并与“小伙伴们”探讨交流:疑问1:解惑:疑问2:解惑:[小组合作型]3-1-1i i①,对变量u,v有观测数据(u i,v i)(i=1,2,…,10),得散点图②.由这两个散点图可以判断()图3-1-1A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关(2)(2016·上饶高二检测)两个变量x,y与其线性相关系数r有下列说法:①若r>0,则x增大时,y也随之相应增大;②若r<0,则x增大时,y也相应增大;③若r=1或r=-1,则x与y的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上,其中正确的有()A.①②B.②③C.①③D.①②③(3)有五组变量:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;②平均日学习时间和平均学习成绩;③某人每日吸烟量和其身体健康情况;④正方形的边长和面积;⑤汽车的重量和百公里耗油量.其中两个变量成正相关的是() A.①③B.②④C.②⑤D.④⑤【精彩点拨】可借助于线性相关概念及性质作出判断.【自主解答】(1)由这两个散点图可以判断,变量x与y负相关,u与v正相关,故选C.(2)根据两个变量的相关性与其相关系数r之间的关系知,①③正确,②错误,故选C.(3)其中①③成负相关关系,②⑤成正相关关系,④成函数关系,故选C.【答案】(1)C(2)C(3)C1.线性相关系数是从数值上来判断变量间的线性相关程度,是定量的方法.与散点图相比较,线性相关系数要精细得多,需要注意的是线性相关系数r 的绝对值小,只是说明线性相关程度低,但不一定不相关,可能是非线性相关.2.利用相关系数r来检验线性相关显著性水平时,通常与0.75作比较,若r>0.75,则线性相关较为显著,否则为不显著.[再练一题]1.下列两变量中具有相关关系的是()【导学号:62690052】A.正方体的体积与边长B.人的身高与体重C.匀速行驶车辆的行驶距离与时间D.球的半径与体积【解析】选项A中正方体的体积为边长的立方,有固定的函数关系;选项C中匀速行驶车辆的行驶距离与时间成正比,也是函数关系;选项D中球的体积是43π与半径的立方相乘,有固定函数关系.只有选项B 中人的身高与体重具有相关关系.【答案】 By (件)与月平均气温x (℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:(1)(2)气象部门预测下个月的平均气温约为6 ℃,据此估计该商场下个月毛衣的销售量.【精彩点拨】 (1)可利用公式求解; (2)把月平均气温代入回归方程求解.【自主解答】 (1)由散点图易判断y 与x 具有线性相关关系. x =(17+13+8+2)÷4=10, y =(24+33+40+55)÷4=38,∑4i =1x i y i =17×24+13×33+8×40+2×55=1 267,∑4i =1x 2i =526,b=∑4i=1x i y i-4x y ∑4i=1x2i-4x2=1 267-4×10×38526-4×102≈-2.01,a=y-b x≈38-(-2.01)×10=58.1,所以线性回归方程为y=-2.0x+58.1.(2)气象部门预测下个月的平均气温约为6 ℃,据此估计,该商场下个月毛衣的销售量为y=-2.0 x+58.1=-2.0×6+58.1≈46(件).1.回归分析是定义在具有相关关系的两个变量基础上的,因此,在作回归分析时,要先判断这两个变量是否相关,利用散点图可直观地判断两个变量是否相关.2.利用回归直线,我们可以进行预测.若回归直线方程y=a+bx,则x=x0处的估计值为y0=a+bx0.3.线性回归方程中的截距a和斜率b都是通过样本估计而得到的,存在着误差,这种误差可能导致预报结果的偏差,所以由线性回归方程给出的是一个预报值而非精确值.4.回归直线必过样本点的中心点.[再练一题]2.某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:(1)(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y =bx +a ;(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力. 【解】 (1)如图:(2) ∑ 4i =1x i y i =6×2+8×3+10×5+12×6=158,x =6+8+10+124=9,y =2+3+5+64=4, ∑ 4i =1x 2i =62+82+102+122=344,b =158-4×9×4344-4×92=1420=0.7,a =y -b x =4-0.7×9=-2.3, 故线性回归方程为y =0.7x -2.3.(3)由(2)中线性回归方程得当x =9时,y =0.7×9-2.3=4,预测记忆力为9的同学的判断力约为4.[探究共研型]探究1 【提示】 非线性回归问题有时并不给出经验公式.这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量变换,把问题化为线性回归分析问题,使之得到解决.其一般步骤为:探究2已知x和y之间的一组数据,则下列四个函数中,模拟效果最好的为哪一个?①y=32③y=4x; ④y=x2.【提示】观察散点图中样本点的分布规律可判断样本点分布在曲线y=3×2x-1附近.所以模拟效果最好的为①.某地区不同身高的未成年男性的体重平均值如下表:(2)如果一名在校男生身高为168 cm,预测他的体重约为多少?【精彩点拨】先由散点图确定相应的拟合模型,再通过对数变换将非线性相关转化为线性相关的两个变量来求解.【自主解答】(1)根据表中的数据画出散点图,如下:由图看出,这些点分布在某条指数型函数曲线y=c1e c2x的周围,于是令z=ln y,列表如下:^=0.693+0.020x,则有y 由表中数据可求得z与x之间的回归直线方程为z=e0.693+0.020x.(2)由(1)知,当x=168时,y=e0.693+0.020×168≈57.57,所以在校男生身高为168 cm,预测他的体重约为57.57 kg.两个变量不具有线性关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型,如y=c1e c2x,我们可以通过对数变换把指数关系变为线性关系,令z=ln y,则变换后样本点应该分布在直线z=bx+a(a=ln c1,b=c2)的周围.[再练一题]3.在一次抽样调查中测得样本的5个样本点,数据如下表:【解】作出变量y与x之间的散点图如图所示.由图可知变量y 与x 近似地呈反比例函数关系.设y =k x ,令t =1x ,则y =kt .由y 与x 的数据表可得y 与t 的数据表:作出y由图可知y 与t 呈近似的线性相关关系.又t =1.55,y =7.2,∑i =15t i y i =94.25,∑i =15t 2i =21.312 5,b =∑i =15t i y i -5t y ∑i =15t 2i -5t 2=94.25-5×1.55×7.221.312 5-5×1.552≈4.134 4,a =y -b t =7.2-4.134 4×1.55≈0.8, ∴y =4.134 4t +0.8.所以y 与x 的回归方程是y =4.134 4x +0.8. [构建·体系]1.下列结论正确的是()①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.A.①②B.①②③C.①②④D.①②③④【解析】函数关系和相关关系的区别是前者是确定性关系,后者是非确定性关系,故①②正确;回归分析是对具有相关关系的两个变量进行统计分析的一种方法,故③错误,④正确.【答案】 C2.下表是x和y之间的一组数据,则y关于x的线性回归方程必过点()C.(2.5,4) D.(2.5,5)【解析】线性回归方程必过样本点的中心(x,y),即(2.5,4),故选C.【答案】 C3.对具有线性相关关系的变量x和y,由测得的一组数据求得回归直线的斜率为6.5,且恒过(2,3)点,则这条回归直线的方程为________.【导学号:62690053】【解析】由题意知x=2,y=3,b=6.5,所以a=y-b x=3-6.5×2=-10,即回归直线的方程为y=-10+6.5x.【答案】y=-10+6.5x4.部门所属的10个工业企业生产性固定资产价值与工业增加值资料如下表(单位:百万元):【解析】 x =3+3+5+6+6+7+8+9+9+1010=6.6.y =15+17+25+28+30+36+37+42+40+4510=31.5.∴r =∑ 10i =1 (x i -x )(y i -y )∑ 10i =1(x i -x )2∑ 10i =1(y i -y )2=0.991 8.【答案】 0.991 85.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程y =bx +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)【解】 (1)x =16(8+8.2+8.4+8.6+8.8+9)=8.5,y =16(90+84+83+80+75+68)=80, ∵b =-20,a =y -b x , ∴a =80+20×8.5=250, ∴回归直线方程为y =-20x +250.(2)设工厂获得的利润为L 元,则L =x (-20x +250)-4(-20x +250)=-20⎝ ⎛⎭⎪⎫x -3342+361.25, ∴该产品的单价应定为334元时,工厂获得的利润最大.我还有这些不足:(1) (2)我的课下提升方案: (1) (2)学业分层测评(建议用时:45分钟)[学业达标]一、选择题1.为了考查两个变量x 和y 之间的线性相关性,甲、乙两名同学各自独立地做了10次试验和15次试验,并且利用线性回归方法,求得回归直线分别为l 1和l 2.已知两个人在试验中发现对变量x 的观测数据的平均数都为s ,对变量y 的观测数据的平均数都为t ,那么下列说法中正确的是( )A .直线l 1和l 2都过点(s ,t )B .直线l 1和l 2相交,但交点不一定是(s ,t )C .直线l 1和l 2必平行D .直线l 1和l 2必重合【解析】 线性回归方程y =bx +a 恒过点(x ,y ),故直线l 1和l 2都过点(s ,t ).【答案】 A2.已知人的年龄x 与人体脂肪含量的百分数y 的回归方程为y =0.577x -0.448,如果某人36岁,那么这个人的脂肪含量( )A .一定是20.3%B .在20.3%附近的可能性比较大C .无任何参考数据D .以上解释都无道理【解析】 将x =36代入回归方程得y =0.577×36-0.448≈20.3.由回归分析的意义知,这个人的脂肪含量在20.3%附近的可能性较大,故选B.【答案】 B3.关于回归分析,下列说法错误的是( ) A .回归分析是研究两个具有相关关系的变量的方法 B .线性相关系数可以是正的或负的 C .回归模型中一定存在随机误差 D .散点图表明确反映变量间的关系【解析】 用散点图反映两个变量间的关系时,存在误差,故D 错误. 【答案】 D4.某学校开展研究性学习活动,某同学获得一组实验数据如下表:( ) A .y =2x -2 B .y =⎝ ⎛⎭⎪⎫12xC .y =log 2xD .y =12(x 2-1)【解析】 代入检验,当x 取相应的值时,所得y 值与已知数据差的平方和最小的便是拟合程度最高的.【答案】 D5.某产品的广告费用x 与销售额y 的统计数据如下表:6万元时销售额为()A.63.6万元B.65.5万元C.67.7万元D.72.0万元【解析】样本点的中心是(3.5,42),则a=y-b x=42-9.4×3.5=9.1,所以回归直线方程是y=9.4x+9.1,把x=6代入得y=65.5.【答案】 B二、填空题6.回归分析是处理变量之间________关系的一种数量统计方法.【导学号:62690054】【解析】回归分析是处理变量之间相关关系的一种数量统计方法.【答案】相关7.已知某个样本点中的变量x,y线性相关,相关系数r<0,则在以(x,y)为坐标原点的坐标系下的散点图中,大多数的点都落在第________象限.【解析】∵r<0时b<0,∴大多数点落在第二、四象限.【答案】二、四8.某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm,170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________cm.【解析】儿子和父亲的身高可列表如下:设线性回归方程y=a+bx,由表中的三组数据可求得b=1,故a=y-b x =176-173=3,故线性回归方程为y=3+x,将x=182代入得孙子的身高为185 cm.【答案】185三、解答题9.(2016·包头高二检测)关于某设备的使用年限x 和所支出的维修费用y (万元),有如下的统计资料:如由资料可知y (1)线性回归方程:⎝ ⎛⎭⎪⎪⎫a =y -b x -,b =∑i =1nx i y i -n x -y -∑i =1nx 2i-n (x )2(2)估计使用年限为10年时,维修费用是多少? 【解】 (1)x =2+3+4+5+65=4,y =2.2+3.8+5.5+6.5+7.05=5,∑i =15x 2i =90,∑i =15x i y i =112.3, b =∑i =15x i y i -5x -y -∑i =15x 2i -5x 2=112.3-5×4×590-5×42=1.23.于是a =y -bx =5-1.23×4=0.08. 所以线性回归方程为y =1.23x +0.08.(2)当x =10时,y =1.23×10+0.08=12.38(万元), 即估计使用10年时维修费用是12.38万元.10.某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对比表.【解】 画出散点图如图所示.x =16(26+18+13+10+4-1)≈11.7, y =16(20+24+34+38+50+64)≈38.3,∑i =16xx i y i =26×20+18×24+13×34+10×38+4×50-1×64=1 910,∑i =16xx 2i =262+182+132+102+42+(-1)2=1 286,∑i =16xy 2i =202+242+342+382+502+642=10 172,由r =∑ hi =1x i y i-n x y ∑ ni =1x 2i -n x2∑ ni =1y 2i-n y 2,可得r ≈0.97.由于r 的值较大,所以x 与y 具有很强的线性相关关系.[能力提升]1.经统计,用于数学学习的时间(单位:小时)与成绩(单位:分)近似于线性相关关系.对某小组学生每周用于数学的学习时间x 与数学成绩y 进行数据收集如表:与直线x +18y =100的位置关系是( )A .a +18b <100B .a +18b >100C .a +18b =100D .a +18b 与100的大小无法确定【解析】 x =15(15+16+18+19+22)=18, y =15(102+98+115+115+120)=110, 所以样本数据的中心点为(18,110), 所以110=18b +a ,即点(a ,b )满足a +18b =110>100. 【答案】 B2.已知x 与y 之间的几组数据如下表:a .若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A .b >b ′,a >a ′B .b >b ′,a <a ′C .b <b ′,a >a ′D .b <b ′,a <a ′【解析】 由(1,0),(2,2)求b ′,a ′. b ′=2-02-1=2, a ′=0-2×1=-2. 求b ,a 时,∑i =16x i y i =0+4+3+12+15+24=58,x =3.5,y =136,∑i =16x 2i =1+4+9+16+25+36=91,∴b=58-6×3.5×13691-6×3.52=57,a=136-57×3.5=136-52=-13,∴b<b′,a>a′.【答案】 C3.(2016·江西吉安高二检测)已知x,y的取值如下表所示,由散点图分析可知y与x线性相关,且线性回归方程为y=0.95x+2.6,那么表格中的数据m的值为________.【解析】x=0+4=2,y=+m4=11.3+m4,把(x-,y-)代入回归方程得11.3+m4=0.95×2+2.6,解得m=6.7.【答案】 6.74.某商店各个时期的商品流通率y(%)和商品零售额x(万元)资料如下:散点图显示出证明,流通率y决定于商品的零售额x,体现着经营规模效益,假定它们之间存在关系式:y=a+bx.试根据上表数据,求出a与b的估计值,并估计商品零售额为30万元时的商品流通率.【解】设u=1x,则y≈a+bu,得下表数据:进而可得n =10,u ≈0.060 4,y =3.21,∑i =110uu 2i -10u 2≈0.004 557 3,∑i =110u i y i -10u y ≈0.256 35,b ≈0.256 350.004 557 3≈56.25,a =y -b ·u ≈-0.187 5,所求的回归方程为y =-0.187 5+56.25x .当x =30时,y =1.687 5,即商品零售额为30万元时,商品流通率为1.687 5%.。
2018-2019学年北师大版高中数学选修2-3同步配套(课件+练习):3.1.2
≈0.94.
4 144-7×242× 5 892.013 6-7×28.992
反思当相关系数|r|越接近1时,两个变量的线性相关程度越高,当相 关系数|r|越接近0时,两个变量的线性相关程度越低.
题型一
题型二
目标导航
知识梳理
典例透析
随堂演练
【变式训练1】 下表为某地近几年机动车辆数与交通事故数的 统计资料,请判断交通事故数与机动车辆数是否有线性相关关系.
7
∴r=
������=∑1������������������������-7������ ������
=
18 542-7×27.4×81.3
������=∑71���������2��� -7������2 ������=∑71���������2��� -7������2 5 414-7×27.42 124 393-7×81.32
������=1
i=1
������=1
5
5
∑ xiyi=8 285, ∑ ���������2��� =59 051,������=15,������=108.6.
������=1
������=1
5
r=
������=∑1������������������������-5������ ������
=
机动车辆数 x/千台 交通事故数 y/千件
95 110 112 120 129 135 150 180 6.2 7.5 7.7 8.5 8.7 9.8 10.2 13.0
目标导航
知识梳理
典例透析
随堂演练
题型一
题型二
解:列表如下:
i xi
yi
1 95
2017-2018学年北师大版高中数学选修2-3第三章统计案例1-2相关系数导学案 含答案 精品
1.2相关系数自主整理判断两个变量之间的线性相关关系的方法有:(1)_______________________________________________________________. (2)_______________________________________________________________. 高手笔记1.假设两个随机变量的数据分别为(x 1,y 1),(x 2,y 2),…,(x n ,y n ),则变量间线性相关系数r 的计算公式为r=2.(1)r∈[-1,1],|r|值越大,误差Q 越小,变量之间的线性相关程度越高. (2)|r|值越接近0,Q 越大,变量之间的线性相关程度越低. (3)当r >0时,l xy >0,b=xxxy l l >0,两个变量正相关.当r <0时,l xy <0,b=xxxy l l <0,两个变量负相关.当r=0时,两个变量线性不相关. 名师解惑如何用变量间线性系数r 来恒量两变量间的线性相关程度的大小? 剖析:误差Q(a ,b )=∑=ni 1[y i -(a+bx i )]2=l yy +n [y -(a+b x )]2+l xx (b-xxxy l l )2-xxxyl l 2.当b=xxxy l l ,a=y -b x 时,Q (a ,b )最小=l yy -xxxyl l 2=l yy (1-yyxx xyl l l 2)=l yy ·(1-r 2).∵Q (a,b)≥0,∴1-r 2≥0,即r∈[-1,1].(1)|r|值越大,1-r 2越接近于0,误差Q (a ,b )越小,两变量之间的线性相关程度越高. (2)|r|值越接近于0,1-r 2越大,误差Q (a ,b )越大,两变量之间的线性相关程度越低. (3)当r=0时,两变量线性不相关.讲练互动【例1】维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y 来衡量,这个指标越高,耐水性能也越好,而甲醛浓度是影响缩醛化度的重要因素,在生产中常用甲醛浓度x (克/升)去控制这一指标,为此必须找出它们之间的关系,现安排一批实验,获得如下数据.求相关系数r. 解:列表如下x =7=24,y =7, r=2712712271777yy xx yx yx l l l i i i i i ii yyxx xy ---=∑∑∑====22)794.202(758922474144794.20224716.4900⨯-⨯-⨯⨯-=0.96. 由此可知,甲醛浓度与缩醛化度之间有很强的线性相关关系.绿色通道:当相关系数|r|越接近1时,两个变量的相关关系越强,当相关系数|r|越接近0时,两个变量的相关关系越弱. 变式训练1.以下是收集到的新房屋的销售价格y 和房屋的大小x 的数据.(1)画出数据的散点图;(2)用最小二乘估计求线性回归方程; (3)求相关系数r,并作出评价. 解:(1)略. (2)x =5=109,y =5=23.2, b=15703081095609752.2310951295252251251=⨯-⨯⨯-=--∑∑==xx yx yx i i i ii =0.196, a=y -b x =23.2-0.196×109=1.836. ∴回归方程为y=1.836+0.196x ,(3)r==---∑∑∑===5122251251555i i i i i iiy y xx yx yx6.6515703082.2358.27561095609752.2310951295222⨯=⨯-∙⨯-⨯⨯-=0.96,拟合程度较高.【例题2】为了了解某地母亲身高x 与女儿身高y 的相关关系,现随机测得10对母女的身高,所得数据如下表所示.(1)试对x 与y 进行线性回归分析,并预测当母亲身高为161 cm 时,女儿的身高为多少? (2)求相关系数r. 解:(1)x =10=158.8,y =159.1, b=6.472.378.158102522221.1598.158102526881010221012101=⨯-⨯⨯-=--∑∑==x xyx yx i ii ii ≈0.78, a=y -b x =159.1-0.78×158.8=35. ∴回归直线方程为y=35+0.78x.当x=161时,y=160.58 cm,即女儿身高为160.58 cm.(2)r=2101221012101101010yy x x yx yx i i i i i ii-∙--∑∑∑=====⨯-⨯-⨯⨯-221.159102531858.15810222.2521.1598.158********9.566.472.37⨯≈0.715.绿色通道:解相关性检验的必要性,如果不作相关性检验,我们仍然可以求出x 与y 的回归直线方程,但这时的回归直线方程已经没有任何实际价值了,它也就不能反映变量x 与y 之间的变化规律.只有在x 与y 之间具有相关关系时,求回归直线方程才有实际意义,也才可以用于预测取值的情况. 变式训练2.设变量x,y 存在相关关系,今测得下列10组数据.(1)写出y 关于x 的线性回归方程; (2)预测x=25时y 的取值; (3)求线性相关系数r. 解:x =8,y =49.7,b=21013228108507.4981052981010210122101=⨯-⨯⨯-=--∑∑==i i i iixx yx yx ≈6.3,a=y -b x =49.7-6.3×8=-0.7, ∴线性回归方程为y=-0.7+6.3x. 当x=25时,y=156.8,r=2101210122101101010yy xx yx yx i i i i i ii---∑∑∑====227.4910331498108507.498105298⨯-⨯-⨯⨯-=0.992 5.x 与y 之间有很强的线性相关性.。
高中数学北师大版选修2-3 3.1.2相关系数 课件
选修2-3
【思路探究】
先根据表中的数据作相关检验,然后判
断是否具有相关关系, 再根据所给的数据解出线性回归方程, 最后进行预测.
【自主解答】
(1)根据数据我们对区内大学生人数 x 与
1 店铺季度销售额 y 作相关检验.根据数据可知: x = (0.2+ 10
i=1 n n
∑ xi- x
i=1
2
i=1
yi- y 2
n
∑xiyi-n x y =
i=1 n 2 ∑x2 i -n x i=1 2 ∑y2 i -n y i=1 n
n
BS ·数学
选修2-3
相关系数及其应用
维尼纶纤维的耐热水性能的好坏可以用指标 “缩醛化度”y 来衡量,这个指标越高,耐热水性能就越好, 而甲醛浓度是影响“缩醛化度”的重要因素,在生产中常用 甲醛浓度 x(克/升)去控制这一指标, 为此必须找出它们之间的 关系,现安排一批试验,获得如下表数据. 甲醛浓度 18 20 22 24 26 28 30 (克/升) 缩醛化度 26. 28. 28. 28. 29. 30. 30. (克分子%) 86 35 75 87 75 00 36 求相关系数 r. 【思路探究】 可直接利用相关系数 r 的公式直接计算.
BS ·数学
选修2-3
【解】 i 1 2 3 4 5 6 7 xi 15 20 25 30 35 40 45 yi 320 330 360 410 460 470 480 xi2 225 400 625 900 1 225 1 600 2 025 yi2 102 400 108 900 129 600 168 100 211 600 220 900 230 400 xiyi 4 800 6 600 9 000 12 300 16 100 18 800 21 600
(新)高中数学第三章统计案例1_2相关系数同步测控北师大版选修2-3
高中数学 第三章 统计案例 1.2 相关系数同步测控 北师大版选修2-3我夯基,我达标1.下列结论正确的是( ) ①函数关系是一种确定性关系 ②相关关系是一种非确定性关系③回归分析是具有函数关系的两个变量进行统计分析的一种方法④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法A.①②B.①②③C.①②④D.①②③④ 答案:C2.已知回归直线的斜率的估计值是 1.23,样本的平均值为x =4,y =5,则回归直线的方程是( )A.y=1.23x+4B.y=1.23x+5C.y=1.23x+0.08D.y=0.08x+1.23 解析:回归直线都过点(y ,x ),即(4,5)点,斜率为1.23.答案:B3.回归分析中,相关系数|r|值越大,则误差Q (a ,b )应( ) A.越小 B.越大C.可能大也可能小D.以上都不对解析:Q=l yy (1-r 2)>0,∴|r|越大,Q (a ,b )越小. 答案:A4.对于相关系数r ,下列说法正确的是( ) A.|r|越大,相关程度越小 B.|r|越小,相关程度越大C.|r|越大,相关程度越小,|r|越小,相关程度越大D.|r|≤1且|r|越接近于1,相关程度越大,|r|越接近于0,相关程度越小 答案:DA.很强B.很弱C.无相关D.不确定 解析:∑∑∑=====5125151,543,75i i i i i i x y x =1 375,∑=51i i x y i=8 285,∑=512i iy=59 051,x =15,y =108.6.r=∑∑∑===---512251225155i i i i i iiyy xx yx yx =226.10855905115513756.1081558285⨯-•⨯-⨯⨯-=0.982 6.相关程度很强. 答案:A我综合,我发展(2)指出产量每增加1 000件时,单位成本下降多少;(3)假定产量为6 000件时,单位成本是多少?单位成本为70元时,产量应为多少? 解:∑=61i ix=21,∑=61i iy=426,∑=61i ix2=79,∑=61i iy2=30 268,∑=61i ixy i =1 481,x =3.5,y =71,b=5.5105.3679715.361481662261261-=⨯-⨯⨯-=--∑∑==xx yx yx i i i ii=-1.818, a=y -6x =71+1.818×3.5=77.363, ∴回归方程为y=77.363-1.818x.r==---∑∑∑===2612261261666i ii i i iiyyxx yx yx1110225.510716302685.3679715.36148122-=⨯-=⨯-⨯-⨯⨯-=-0.91.(2)产量每增加1 000件时单位成本下降1.818元. (3)当x=6时,y=66.455元; 当y=70时,x=4.05(千件)=4 050件.若由资料知y 对x 呈线性相关关系,试求: (1)线性回归方程y=bx+a 的回归系数a 、b ; (2)估计使用年限为10年时,维修费用是多少? (3)求线性相关系数r.∴x =4,y =5, b=103.1245905453.1122=⨯-⨯⨯-=1.23, a=y -b x =5-1.23×4=0.08.(2)回归直线方程为y=1.23x+0.08.当x=10时,y=1.23×10+0.08=12.38(万元).估计使用10年时维修费用是12.38万元. (3)r=78.15103.125578.14045905453.11222⨯=⨯-⨯-⨯⨯-=0.979.x 、y 有很强的线性相关性.我创新,我超越8.为了研究三月下旬的平均气温x (单位:℃)与四月二十号前棉花害虫化蛹高峰日y 的关日为哪一天;(2)对变量x 、y 进行相关性检验. 解:(1)x =61(24.4+29.5+…+28.9)≈29.12, y =61(19+6+…+8)=7.5, ∑=61i ix2=24.42+…+28.92=5 125.01,∑=61i iy2=192+…+82=563,∑=61i ixy i =24.4×19+…+28.9×8=1 222,∴b=212.29601.512512.295.761222⨯-⨯⨯-≈-2.379, a=y -b x =7.5+2.379×29.12=76.77.回归直线方程为y=-2.379x+76.77.当x=27时,y=-2.379×27+76.77=12.537.据此估计该地区2008年4月12日或13日为化蛹高峰日.(2)r=∑∑∑===---6161222261)6)(6(6i i i i i iiy y x x yx yx =-0.966,由于|r|接近于1,∴y 与x 存在很强的线性相关关系.求y 与x 的线性回归方程,并检验回归方程中的显著性. 分析:x 、y 有明显的线性关系,可根据公式求方程. 解:由已知数据得x=71,∑=71i i x ≈0.543,y =71×145.2≈20.74,∑=712i i x =2.595,∑=712i i y =3094.72,i i i y x ∑=71=85.45. ∴b≈2)543.0(7595.274.20543.0745.85⨯-⨯⨯-≈12.45,a=20.74-12.45×0.543≈13.98.回归直线方程为y=13.98+12.45x,利用相关系数检验是否显著,∑=71i ixy i -7x y =85.45-7×0.543×20.74≈6.62,∑=71i ix2-72x =2.595-7×(0.543)2≈0.531,∑=712i i y -72y =3 094.72-7×(20.74)2=83.687.∴r=687.63531.062.6⨯≈0.993.由于r接近于1,故钢铁碳含量对电阻的效应线性相关关系显著.。
【创新设计】-高中数学 3.1.1 回归分析同步练习 北师大版选修2-3
1.1 回归分析双基达标限时20分钟1.关于变量y与x之间的线性回归方程叙述正确的是( ).A.表示y与x之间的一种确定性关系B.表示y与x之间的相关关系C.表示y与x之间的最真实的关系D.表示y与x之间真实关系的一种效果最好的拟合解析线性回归方程能最大可能地反映y与x之间的真实关系.答案 D2.散点图在回归分析过程中的作用是( ).A.查找个体个数B.比较个体数据大小关系C.探究个体分类D.粗略判断变量是否线性相关答案 D3.设有一个回归方程为y=2-2.5x,则变量x增加一个单位时,则( ).A.y平均增加2.5个单位B.y平均增加2个单位C.y平均减少2.5个单位D.y平均减少2个单位解析斜率的估计值为-2.5,即x每增加1个单位时,y平均减少2.5个单位.答案 C4.用身高(cm)预报体重(kg)满足y=-85.712+0.849x,若要找到41.638 kg 的人,身高________是150 cm.(填“一定”、“不一定”)答案不一定5.某五星级饭店的入住率x(%)与每天每间客房的成本y(元)如下表:解析将已知数据代入回归系数方程可得b=-35.03,a=5 317,故y=5 317-35.03x.答案y=5 317-35.03x6.高二(3)班学生每周用于数学学习的时间x(单位:小时)与数学成绩y(单位:分)之间有如下数据:解 由散点图可得学习时间与学习成绩间具有线性相关关系,可以列出下表,并用科学计算器进行计算.b =∑i =110x i y i -10x y∑i =1nx 2i -10x 2=545.4154.4≈3.53, a =y -b x =74.9-3.53×17.4≈13.5.因此可求得线性回归方程为y =13.5+3.53x .当x =18时y =13.5+3.53×18=77. 故该同学预计可得77分.综合提高限时25分钟 7.下列有关线性回归的说法,不正确的是( ).A .变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系 叫做相关关系B .在平面直角坐标系中,用描点的方法得到的,表示具有相关关系的两个量的一组数据的图形叫做散点图C .线性回归方程最能代表观测值x ,y 之间的关系D .任何一组观测值都能得到具有代表意义的线性回归方程解析 只有对两个变量具有线性相关性作出判断时,利用最小二乘法求出线性回归方程才有意义.答案 D8.为了考查两个变量x和y之间的线性相关性,甲、乙两位同学各自独立作了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1、l2,已知两人得的试验数据中,变量x和y的数据的平均值都相等,且分别都是s、t,那么下列说法正确的是( ).A.直线l1和l2一定有公共点(s,t)B.直线l1和l2相交,但交点不一定是(s,t)C.必有l1∥l2D.l1与l2必定重合解析每条回归直线都过点(x,y),故l1与l2都过点(s,t),即l1与l2有公共点(s,t),故选A.答案 A9.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的线性回归方程:y^=0.254x+0.321.由线性回归方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析由题意,知其回归系数为0.254,故家庭年收入每增加1万元,年饮食支出平均增加0.254万元.答案0.25410.某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm、170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________ cm.解析儿子和父亲的身高可列表如下:设线性回归方程y=a+bx,由表中的三组数据可求得b=1,故a=y-b x=176-173=3,故线性回归方程为y=3+x,将x=182代入得孙子的身高为185 cm.答案18511.在研究硝酸钠的可溶性程度时,对于不同的温度观测它在水中的溶解度,得观测结果如下:解 x =30,y =66.7+76.0+85.0+112.3+128.05=93.6.b =∑i =15x i y i -5x y∑i =15x 2i -5x 2≈0.880 9.a =y -b x =93.6-0.880 9×30=67.173.∴回归方程为y =67.173+0.880 9x .12.(2011·安徽)某地最近十年粮食需求量逐年上升,下表是部分bx ;(2)利用(1)中所求出的直线方程预测该地2012年的粮食需求 量.解(1)由所给数据看出,年需求量与年份之间是近似直线上升的,下面求线性回归方程.为此对数据预处理如下:x =0,y =3.2. b =--+--+2×19+4×29-5×0×3.2-2+-2+22+42-5×02=26040=6.5,a =y -b x =3.2.由上述计算结果,知所求线性回归方程为y -257=b (x -2 006)+a =6.5(x -2 006)+3.2,即y =6.5(x -2 006)+260.2. ①。
高中数学 第三章 统计案例 1.2 相关系数同步测控 北师
高中数学 第三章 统计案例 1.2 相关系数同步测控 北师大版选修2-3我夯基,我达标1.下列结论正确的是( ) ①函数关系是一种确定性关系 ②相关关系是一种非确定性关系③回归分析是具有函数关系的两个变量进行统计分析的一种方法④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法A.①②B.①②③C.①②④D.①②③④ 答案:C2.已知回归直线的斜率的估计值是 1.23,样本的平均值为x =4,y =5,则回归直线的方程是( )A.y=1.23x+4B.y=1.23x+5C.y=1.23x+0.08D.y=0.08x+1.23 解析:回归直线都过点(y ,x ),即(4,5)点,斜率为1.23.答案:B3.回归分析中,相关系数|r|值越大,则误差Q (a ,b )应( ) A.越小 B.越大C.可能大也可能小D.以上都不对解析:Q=l yy (1-r 2)>0,∴|r|越大,Q (a ,b )越小. 答案:A4.对于相关系数r ,下列说法正确的是( ) A.|r|越大,相关程度越小 B.|r|越小,相关程度越大C.|r|越大,相关程度越小,|r|越小,相关程度越大D.|r|≤1且|r|越接近于1,相关程度越大,|r|越接近于0,相关程度越小 答案:DA.很强B.很弱C.无相关D.不确定 解析:∑∑∑=====5125151,543,75i i i i i ix y x=1 375,∑=51i i x y i=8 285,∑=512i iy=59 051,x =15,y =108.6.r=∑∑∑===---512251225155i i i i i iiyy xx yx yx =226.10855905115513756.1081558285⨯-∙⨯-⨯⨯-=0.982 6.相关程度很强. 答案:A我综合,我发展(2)指出产量每增加1 000件时,单位成本下降多少;(3)假定产量为6 000件时,单位成本是多少?单位成本为70元时,产量应为多少? 解:∑=61i ix=21,∑=61i iy=426,∑=61i ix2=79,∑=61i iy2=30 268,∑=61i ixy i =1 481,x =3.5,y =71,b=5.5105.3679715.361481662261261-=⨯-⨯⨯-=--∑∑==xx yx yx i i i ii=-1.818, a=y -6x =71+1.818×3.5=77.363, ∴回归方程为y=77.363-1.818x.r==---∑∑∑===2612261261666i ii i i iiyyxx yx yx1110225.510716302685.3679715.36148122-=⨯-=⨯-⨯-⨯⨯-=-0.91.(2)产量每增加1 000件时单位成本下降1.818元. (3)当x=6时,y=66.455元; 当y=70时,x=4.05(千件)=4 050件.若由资料知y 对x 呈线性相关关系,试求: (1)线性回归方程y=bx+a 的回归系数a 、b ; (2)估计使用年限为10年时,维修费用是多少? (3)求线性相关系数r.∴x =4,y =5, b=103.1245905453.1122=⨯-⨯⨯-=1.23, a=y -b x =5-1.23×4=0.08.(2)回归直线方程为y=1.23x+0.08.当x=10时,y =1.23×10+0.08=12.38(万元).估计使用10年时维修费用是12.38万元. (3)r=78.15103.125578.14045905453.11222⨯=⨯-⨯-⨯⨯-=0.979.x 、y 有很强的线性相关性.我创新,我超越8.为了研究三月下旬的平均气温x (单位:℃)与四月二十号前棉花害虫化蛹高峰日y 的关日为哪一天;(2)对变量x 、y 进行相关性检验. 解:(1)x =61(24.4+29.5+…+28.9)≈29.12, y =61(19+6+…+8)=7.5, ∑=61i ix2=24.42+…+28.92=5 125.01,∑=61i iy2=192+…+82=563,∑=61i ixy i =24.4×19+…+28.9×8=1 222,∴b=212.29601.512512.295.761222⨯-⨯⨯-≈-2.379, a=y -b x =7.5+2.379×29.12=76.77.回归直线方程为y=-2.379x+76.77.当x=27时,y=-2.379×27+76.77=12.537.据此估计该地区2008年4月12日或13日为化蛹高峰日.(2)r=∑∑∑===---6161222261)6)(6(6i i i i i iiy y x x yx yx =-0.966,由于|r|接近于1,∴y 与x 存在很强的线性相关关系.求y 与x 的线性回归方程,并检验回归方程中的显著性. 分析:x 、y 有明显的线性关系,可根据公式求方程. 解:由已知数据得x=71,∑=71i i x ≈0.543,y =71×145.2≈20.74,∑=712i i x =2.595,∑=712i i y =3094.72,i i i y x ∑=71=85.45. ∴b≈2)543.0(7595.274.20543.0745.85⨯-⨯⨯-≈12.45,a=20.74-12.45×0.543≈13.98.回归直线方程为y=13.98+12.45x,利用相关系数检验是否显著,∑=71i ixy i -7x y =85.45-7×0.543×20.74≈6.62,∑=71i ix2-72x =2.595-7×(0.543)2≈0.531,∑=712i i y -72y =3 094.72-7×(20.74)2=83.687.∴r=687.63531.062.6⨯≈0.993.由于r接近于1,故钢铁碳含量对电阻的效应线性相关关系显著.。
【创新设计】-高中数学 1.1.2 相关系数同步练习 北师大版选修1-2
§1 回归分析1.2 相关系数双基达标限时20分钟1.下列说法中不正确的是( ).A.回归分析中,变量x和y都是普通变量B.变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定C.线性相关系数可能是正的,也可能是负的D.如果线性相关系数是负的,y随x的增大而减少解析在回归分析中的两个变量是具有相关关系的两个变量.答案 A2.通过相关系数来判断两个变量相关关系的强弱时,相关系数的绝对值越大,用线性回归模型拟合样本数据的效果就越好,如果相关系数r∈[0.75,1]则两个变量( ).A.负相关很强B.相关性一般C.正相关很强D.两变量之间几乎没有关系答案 C3.对四对变量y和x进行线性相关检验,已知n是观测值组数,r是相关系数,且已知:①n=7,r=0.953 3 ②n=15,r=0.301 2 ③n=17,r=0.499 1 ④n=3,r=0.995则变量y和x具有线性相关关系的是( ).A.①和②B.①和④C.②和④ D.③和④解析相关系数r的绝对值越大,变量x,y的线性相关关系越强,故选B.答案 B4.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵轴上的截距是a,则下列说法正确的是________.①b与r的符号相同②a与r的符号相同③b与r的符号相反④a与r的符号相反解析因为b>0时,两变量正相关,此时r>0;b<0时,两变量负相关,此时r<0.答案①5.部门所属的10个工业企业生产性固定资产价值与工业增加值资料如下表(单位:百万元):解析 x =3+3+5+6+6+7+8+9+9+1010=6.6.y =15+17+25+28+30+36+37+42+40+4510=31.5.∴r=∑i =110x i -xy i -y∑i =110x i -x2∑i =110 y i -y2=0.991 8.答案 0.991 86.维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y 来衡量,这个指标越高,耐水性能也越好,而甲醛浓度是影响缩醛化度的重要因素,在生产中常用甲醛浓度x (克/升)去控制这一指标,为此必须找出它们之间的关系,现安排一批实验,获得如下数据.甲醛浓度克/升缩醛化度克分子解 列表如下续表x =1687=24,y =7,r =l xyl xx l yy=∑i =17x i yi -7x y∑i =17x 2i -7x2∑i =17y 2i -7y 2=4 900.16-7×24×202.9474 144-7×2425 892-7×⎝ ⎛⎭⎪⎫202.9472=0.96.由此可知,甲醛浓度与缩醛化度之间有很强的线性相关关系.综合提高限时25分钟7.对变量x 、y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图①:对变量u 、v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图②.由这两个散点图可以判断( ).A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关解析 在图①中,所有点都在一条直线的附近,且直线的斜率为负值,所以变量x 与y 负相关;同理,变量u 与v 正相关,故选C.答案 C8.若已知∑i =1n(x i -x )2是∑i =1n(y i -y )2的两倍,∑i =1n (x i -x )·(y i -y )是∑i =1n(y i -y )2的1.2倍,则相关系数r 的值是 ( ).A.21.2B.1.22C .0.92D .0.65解析 由于相关系数r=∑i=1nx i-x y i-y∑i=1nx i-x2∑i=1ny i-y 2=1.2∑i=1ny i-y22∑i=1ny i-y2·∑i=1ny i-y2=1.22.故选B.答案 B9.关于回归分析,下列说法错误的是________.①在回归分析中,变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定②线性相关系数可以是正的也可以是负的③回归分析中,如果r2=1或r=±1,说明x与y之间完全线性相关④样本相关系数r∈(-1,1)解析样本的相关系数应满足-1≤r≤1,故只有④错.答案④10.去年一轮又一轮的寒潮席卷全国,某商场为了了解某品牌羽绒服的月销售量y(件)与月平均气温x(℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温、数据如下表:气象部门预测下个月的平均气温约为6 ℃,据此估计,该商场下个月羽绒服的销售量的件数约为________.解析x=10,y=38,a=38-(-2)×10=58,∴回归方程为y=-2x+58.当x=6 ℃时,y=46.答案4611.5个学生的数学和物理成绩如表:解 法一 涉及两个变量:数学成绩与物理成绩,可以以数学成绩为自变量,考察因变量物理成绩的变化趋势.以x 轴表示数学成绩,y 轴表示物理成绩,可得相应的散点图.由散点图可见,两者之间具有线性相关关系且是正相关.法二 列表:续表∴r =∑i =15x i y i -5x y⎝ ⎛⎭⎪⎪⎫∑i =15x 2i -5x 2⎝ ⎛⎭⎪⎪⎫∑i =15y 2i -5y2=23 190-23 100250×40=0.9>0.∴两变量具有相关关系且正相关.12.(创新拓展)下列是水稻产量与施化肥量的一组观测数据:(1) (2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?该结论与相关系数r 的计算一致吗?解 (1)散点图如下:列表:∴r =∑i =17x i y i -7x y⎝ ⎛⎭⎪⎪⎫∑i =17x 2i -7x 2⎝ ⎛⎭⎪⎪⎫∑i =17y 2i -7y2=4 300700×27 771.43≈0.975. (2)从图中可以发现施化肥量与水稻产量具有线性相关关系,当施化肥量由小到大变化时,水稻产量也由小变大,图中的数据点大约分布在一条直线的附近,因此施化肥量和水稻产量近似成线性正相关关系.又由于r =0.975>0,故散点图与r 的计算一致.。
《相关系数》(北师大版 选修2-3)
A.变量x与y正相关,u与v正相关 B.变量x与y正相关,u与v负相关 C.变量x与y负相关,u与v正相关 D.变量x与y负相关,u与v负相关
当堂检测
3.在回归分析中,相关系数|r|越大,则误差Q(a,b)应( A ) A.越小 B.越大 C.可能大也可能小 D.以上都不对 4.两个变量满足如下表的关系:
由表可知:
2 2 x 1 00 , y i i 75 , xi yi 0 ,
n
n
n
i 1
i 1
i ቤተ መጻሕፍቲ ባይዱ1
x 0 ,y 2.71,则可得
r 0 7 0 2.71 100 7 0 2 75 7 2.712 0
你发现什么了?? r=0,则变量间并不存在线性相关关系。即此时 建立线性回归方程是没有意义的。
=1 i=1
6
6
6
=1
2 =79,
∑
6
=1
2 =30
268, ∑ x iyi =1
=1
6
∴r=
=1
∑
6
-6
2 2 ∑ 2-6 6
=1 6
∑ 2- 6
6
=
1 481 -6×3.5×71 79-6×3 .52×
30 268 -6×71 2
≈-0. 91,
=1
∴y 与 x 具有较高的相关程度. ∴
b= =1 6
自主学习
活动:请阅读课本P76-P77“思考交流”之前的内容, 思考下列问题: 1、相关系数r的计算公式是什么? 2、说出相关系数r的取值范围。 3、相关系数与线性相关的程度有怎样的关系? 4、根据相关系数r的范围,线性相关可以分为几类?
点拨精讲
高中数学北师大版选修2-3同步训练:(12)回归分析
(12)回归分析1、已知某产品的销售额y 与广告费用x 之间的关系如表所示:若求得其线性回归方程为 6.5y x a =+,则预计广告费用为6万元时,销售额为( ) A.42万元B.45万元C.48万元D.51万元2、若实数,x y 的取值如表,从散点图分析,y 与x 线性相关,且回归方程为 3.5 1.3y x =-,则m =( )A.15B.16C.16.2D.173、已知下表所示数据的回归直线方程为44y x =-,则实数a 的值为( ) x 2 3 4 5 6 y 3711a 21A. 16B. 18C. 20D. 224、若回归直线的方程为 1.52ˆyx =-+,则变量x 增加一个单位时 ( ) A.y 平均增加1.5个单位 B.y 平均增加2个单位 C.y 平均减少1.5个单位D.y 平均减少2个单位5、已知x 与y 之间的一组数据如下表:则y 与x 的线性回归方程为y bx a =+必过点( )A.(2,2)B.(1,2)C.(1.5,0)D.(1.5,4)6、已知回归直线斜率的估计值为2.1,样本点的中心为()3,4,则回归直线方程为( ) A. 2.1 5.4y x =-B. 2.1 2.3y x =-C. 2.1 2.3y x =+D. 2.3 2.1y x =-7、对具有线性相关关系的变量,x y ,测得一组数据如下表: x24568x 0 1 2 3 y1357根据上表,利用最小二乘法得它们的回归方程为10.5y x a =+,据此模型来预测当20x =时,y 的估计值为( ) A.210B.210.5C.211D.211.58、设某大学的女生体重y (单位:kg )与身高x (单位:cm )具有线性相关关系,根据一组样本数据(,)(1,2,,),i i x y i n =⋅⋅⋅,用最小二乘法建立的回归方程为0.8585.71,y x =-,则下列结论中不正确的是( )A.y 与x 具有正的线性相关关系B.回归直线过样本点的中心(,)x yC.若该大学某女生身高增加1cm ,则其体重约增加0.85kgD.若该大学某女生身高为170cm ,则可断定其体重必为58.79kg 9、某产品的广告费用x 与销售额y 的统计数据如下表:根据上表可得回归方程ˆˆˆy bx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为( )A. 63.6万元B. 65.5万元C. 67.7万元D. 72.0万元10、某单位为了了解用电量y (千瓦时)与气温x (℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:4℃时,用电量的千瓦时数约为( )A .72B .70C .68D .6611、某数学老师身高176cm ,他爷爷、父亲和儿子的身高分别是173cm ,170cm 和182cm .因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为__________cm .12、若回归直线方程的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线方程是_____________.x (厘米)和体重y (公斤)数据如下表:8,则表格中空白处的值为__________ 14、某工厂对新研发的一种产品进行试销,得到如下数据表: 已知销量y 与单价x 具有线性相关关系,该工厂每件产品的成本为5.5元,请你利用所求的线性相关关系预测:要使得利润最大,单价应该定为_____________元. 附:线性回归方程ybx a =+中斜率和截距的最小二乘估计计算公式:121()()()niii nii x x yy b x x ==--=-∑∑,a y bx =-15、某城市理论预测2017年到2021年人口总数(单位:十万)与年份的关系如下表所示:(1)请根据上表提供的数据,用最小二乘法求出y 关于x 的回归方程ˆˆˆybx a =+; (2)据此估计2022年该城市人口总数.附: 1221ˆni i i n ii x y nx y bx nx==-=-∑∑, ˆˆay bx =-. 参考数据: 051728311419132⨯+⨯+⨯+⨯+⨯=,222220123430++++=.答案以及解析1答案及解析: 答案:C解析: 由题意得,0123425x ++++==,1015203035225y ++++==,将(),x y 代入线性回归方程 6.5y x a =+中,得9a =,即线性回归方程为 6.59y x =+.当6x =时,48y =.故选C.2答案及解析: 答案:D解析:由表格中的数据可得1234535x ++++==,278122555m m y +++++==, 由于回归直线过点(),x y ,所以,353.53 1.35m +⨯-=,解得17m =,故选:D.3答案及解析: 答案:B 解析:4答案及解析: 答案:C解析:由回归方程2 1.5ˆyx =-知,x 与y 负相关,即x 增加一个单位,y 平均减少1.5个单位.5答案及解析: 答案:D 解析:6答案及解析: 答案:B 解析:7答案及解析: 答案:D 解析:8答案及解析: 答案:D解析:由线性回归方程0.8585.71y x =-知,0.850,k =>所以y 与x 具有正的线性相关关系的,故选项A 正确;由回归直线方程恒过样本点的中心(,)x y 知,选项B 正确;若该大学某女生身高增加1cm ,则由0.8585.71y x =-知其体重约增加0.85kg ,因此C 选项正确;若该大学某女生身高为170cm ,则可预测或估计其体重为58.79kg ,并不一定为58.79kg ,因此选项D 不正确.故答案为D.9答案及解析: 答案:B解析:由表可计算4235742x +++==, 49263954424y +++==,∵点7,422⎛⎫ ⎪⎝⎭在回归直线ˆˆˆy bx a =+上,且ˆb 为9.4, 所以7429.4ˆ2a =⨯+, 解得ˆ9.1a=, 故回归方程为9.4.1ˆ9y x =+, 令6x =,得ˆ65.5y=。
高中数学第三章统计案例3.1.2相关系数教案北师大版选修2_3
1.2 相关系数(一)、问题情境1、情境:下面是一组数据的散点图,若求出相应的线性回归方程,求出的线性回归方程可以用作预测和估计吗?2.问题:思考、讨论:求得的线性回归方程是否有实际意义.(二)、学生活动对任意给定的样本数据,由计算公式都可以求出相应的线性回归方程,但求得的线性回归方程未必有实际意义.左图中的散点明显不在一条直线附近,不能进行线性拟合,求得的线性回归方程是没有实际意义的;右图中的散点基本上在一条直线附近,我们可以粗略地估计两个变量间有线性相关关系,但它们线性相关的程度如何,如何较为精确地刻画线性相关关系呢?这就是上节课提到的问题①,即模型的合理性问题.为了回答这个问题,我们需要对变量x 与y 的线性相关性进行检验(简称相关性检验).(三)、探析新课1、相关系数的计算公式:对于x ,y 随机取到的n 对数据(,)i i x y (1,2,3,,)i n =,样本相关系数r 的计算公式为2、相关系数r 的性质:(1)||1r ≤;(2)||r 越接近与1,x ,y 的线性相关程度越强;(3)||r 越接近与0,x ,y 的线性相关程度越弱.可见,一条回归直线有多大的预测功能,和变量间的相关系数密切相关.3、对相关系数r 进行显著性检验的步骤: 相关系数r 的绝对值与1接近到什么程度才表明利用线性回归模型比较合理呢?这需要对相关系数r 进行显著性检验.对此,在统计上有明确的检验方法,基本步骤是:(1)提出统计假设0H :变量x ,y 不具有线性相关关系;(2)如果以95%的把握作出推断,那么可以根据10.950.05-=与2n -(n 是样本容量)在附录2(教材P111)中查出一个r 的临界值0.05r (其中10.950.05-=称为检验水平);(3)计算样本相关系数r ;(4)作出统计推断:若0.05||r r >,则否定0H ,表明有95%的把握认为变量y 与x 之间具有线性相关关系;若0.05||r r ≤,则没有理由拒绝0H ,即就目前数据而言,没有充分理由认为变量y 与x 之间具有线性相关关系。
高中数学 第三章 统计案例 1.2 相关系数知识导航 北师大版选修2-3(2021年最新整理)
高中数学第三章统计案例1.2 相关系数知识导航北师大版选修2-3 编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(高中数学第三章统计案例1.2 相关系数知识导航北师大版选修2-3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为高中数学第三章统计案例1.2 相关系数知识导航北师大版选修2-3的全部内容。
1。
2相关系数自主整理判断两个变量之间的线性相关关系的方法有:(1)_______________________________________________________________. (2)_______________________________________________________________。
高手笔记1。
假设两个随机变量的数据分别为(x 1,y 1),(x 2,y 2),…,(x n ,y n ),则变量间线性相关系数r 的计算公式为r=∑∑∑∑∑∑======---==---=ni i ni i ni ii ni in i ii ni iyyxx xy yn y xn x yx n yx y yx xy y x xl l l 122122121121)()()()(2。
(1)r∈[—1,1],|r|值越大,误差Q 越小,变量之间的线性相关程度越高. (2)|r |值越接近0,Q 越大,变量之间的线性相关程度越低。
(3)当r >0时,l xy >0,b=xxxy l l >0,两个变量正相关。
当r <0时,l xy <0,b=xxxy l l <0,两个变量负相关。
当r=0时,两个变量线性不相关。
北师大版高中数学选修2-3相关系数同步练习.docx
高中数学学习材料唐玲出品相关系数同步练习【选择题】1、对于回归分析,下列说法错误的是()A、变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定B、线性相关系数可以是正的或负的C、回归分析中,如果2r=1或r=±1,说明x与y之间完全线性相关D、样本相关系数r∈(-1,+1)2、下列说法中正确的是()A、任何两个变量都具有相关关系B、人的知识与其年龄具有相关关系C、散点图中的各点是分散的,没有规律D、根据散点图求得的回归直线方程都是有意义的3、下列两变量具有相关关系的是()A、正方体的体积与边长B、人的身高与体重C、匀速行驶车辆的行驶距离与时间D、球的半径与体积4、对于线性相关系数r,下列说法正确的是()A、)r,||r越大,相关程度越大;反之,相关程度越小∈|+∞|,0(B 、),(+∞-∞∈r ,r 越大,相关程度越大;反之,相关程度越小C 、||r ≤1,且||r 越接近于1,相关程度越大;||r 越接近于0,相关程度越小D 、以上说法都不正确5、线性回归方程ˆy=b x +a 必过( ) A 、(0,0)点 B 、(x ,0)点 C 、(0,y )点 D 、(x ,y )点 【填空题】6、 ________________ 叫做变量y 与x 之间的相关系数。
7、对于回归方程25775.4ˆ+=x y,当x=28时,y 的估计值是________________。
【解答题】8、随机选取15家销售公司,由营业报告中查出其上年度的广告费x(占总费用的百分比)及盈利额y(占销售总额的百分比)列表如下: x 1.5 0.8 2.6 1.0 0.6 2.8 1.2 0.9 y 3.1 1.9 4.2 2.3 1.6 4.9 2.8 2.1 x 0.4 1.3 1.2 2.0 1.6 1.8 2.2 y1.42.42.43.83.03.44.0试根据上述资料: 画出散点图;计算出这两组变量的相关系数;在显著水平0.01的条件下,对变量x 与y 进行相关性检验; 如果变量x 与y 之间具有线性相关关系,求出回归直线方程;已知某销售公司的广告费占其总费用的1.7%,试估计其盈利净额占销售总额的百分比。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.2 相关系数
双基达标限时20分钟
1.下列说法中不正确的是( ).A.回归分析中,变量x和y都是普通变量
B.变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定
C.线性相关系数可能是正的,也可能是负的
D.如果线性相关系数是负的,y随x的增大而减少
解析在回归分析中的两个变量是具有相关关系的两个变量.
答案 A
2.通过相关系数来判断两个变量相关关系的强弱时,相关系数的绝对值越大,用线性回归模型拟合样本数据的效果就越好,如果相关系数r∈[0.75,1]则两个变量( ).
A.负相关很强B.相关性一般
C.正相关很强D.两变量之间几乎没有关系
答案 C
3.对四对变量y和x进行线性相关检验,已知n是观测值组数,r是相关系数,且已知:
①n=7,r=0.953 3 ②n=15,r=0.301 2 ③n=17,r=0.499 1 ④n=3,r=
0.995 0
则变量y和x具有线性相关关系的是( ).
A.①和②B.①和④
C.②和④D.③和④
解析相关系数r的绝对值越大,变量x,y的线性相关关系越强,故选B.
答案 B
4.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵轴上的截距是a,则下列说法正确的是________.
①b与r的符号相同②a与r的符号相同③b与r的符号相反④a与r的符号相
反
解析因为b>0时,两变量正相关,此时r>0;b<0时,两变量负相关,此时r<
0.
答案①
5.部门所属的10个工业企业生产性固定资产价值与工业增加值资料如下
表(单位:百万元):
解析 x =3+3+5+6+6+7+8+9+9+10
10
=6.6.
y =
15+17+25+28+30+36+37+42+40+45
10
=31.5.
∴r =
∑i =1
10
x i -x
y i -y
∑i =1
10
x i -x
2
∑i =1
10 y i -y
2
=0.991 8.
答案 0.991 8
6.维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y 来衡量,这
个指标越高,耐水性能也越好,而甲醛浓度是影响缩醛化度的重要因素,在生产中常用甲醛浓度x (克/升)去控制这一指标,为此必须找出它们之间的关系,现安排一批实验,获得如下数据. 甲醛浓度
克/升
缩醛化度
克分子
解 列表如下
x =
7=24,y =7
,
r =
l xy
l xx l yy
=∑i =1
7
x i yi -7x y
∑i =1
7
x 2
i -7x
2
∑i =1
7
y 2i -7y 2
=
4 900.16-7×24×
202.94
74 144-7×242
5 892-7×⎝ ⎛⎭
⎪
⎫202.9472
=0.96.
由此可知,甲醛浓度与缩醛化度之间有很强的线性相关关系.
综合提高
限时25分钟
7.对变量x 、y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图①:对变量u 、
v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图②.由这两个散点图可以判断
( ).
A .变量x 与y 正相关,u 与v 正相关
B .变量x 与y 正相关,u 与v 负相关
C .变量x 与y 负相关,u 与v 正相关
D .变量x 与y 负相关,u 与v 负相关
解析 在图①中,所有点都在一条直线的附近,且直线的斜率为负值,所以变量x 与
y 负相关;同理,变量u 与v 正相关,故选C.
答案 C
8.变量X 与Y 相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U 与V 相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r 1表示变量Y 与X 之间的线性相关系数,r 2表示变量V 与U 之间的线性相关系数,则
( ).
A .r 2<r 1<0
B .0<r 2<r 1
C .r 2<0<r 1
D .r 2=r 1
解析 由线性相关系数公式知
r
=
∑i =1
n
x i -x
y i -y
∑i =1
n
x i -x
2
∑i =1
n
y i -y
2
.
∵X =U =11.72,Y =V =3,
X i =U i (i =1,2,…,5),Y i =V 6-i (i =1,2,…,5),
∴
∑i =15
X i -X
2
∑i =1
5
Y i -Y
2
=
∑i =1
5
U i -U
2
·
∑i =15
V i -V
2
.
令∑i =1
5
(X i -X )(Y i -Y )=A
=(10-X )(1-Y )+(11.3-X )(2-Y )+(11.8-X )(3-Y )+(12.5-X )(4-Y )+(13-X )(5-Y ),
∑i =1
5
(U i -U (V i -V )=B
=(10-U )(5-V )+(11.3-U )(4-V )+(11.8-U )(3-V )+(12.5-U )(2-V )+(13-U )(1-V ), ∴A >0,B <0,∴r 1>0,r 2<0. 答案 C
9.关于回归分析,下列说法错误的是________.
①在回归分析中,变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定
②线性相关系数可以是正的也可以是负的
③回归分析中,如果r 2
=1或r =±1,说明x 与y 之间完全线性相关 ④样本相关系数r ∈(-1,1)
解析 样本的相关系数应满足-1≤r ≤1,故只有④错. 答案 ④
10.去年一轮又一轮的寒潮席卷全国,某商场为了了解某品牌羽绒服的月
销售量y (件)与月平均气温x (℃)之间的关系,随机统计了某4个月的月销售量与当
月平均气温、数据如下表:
气象部门预测下个月的平均气温约为6 ℃,据此估计,该商场下个月羽绒服的销售量的件数约为________.
解析x=10,y=38,a=38-(-2)×10=58,
∴回归方程为y=-2x+58.
当x=6 ℃时,y=46.
答案46
11.5个学生的数学和物理成绩如表:
解法一涉及两个变量:数学成绩与物理成绩,可以以数学成绩为自变量,考察因变量物理成绩的变化趋势.
以x轴表示数学成绩,y轴表示物理成绩,可得相应的散点图.
由散点图可见,两者之间具有线性相关关系且是正相关.
法二列表:
∴r =
∑i =1
5
x i y i -5x y
⎝ ⎛⎭⎪⎪⎫∑i =15
x 2i -5x 2⎝ ⎛⎭
⎪⎪⎫∑i =15
y 2
i -5y
2
=
23 190-23 100
250×40
=0.9>0.
∴两变量具有相关关系且正相关.
12.(创新拓展)下列是水稻产量与施化肥量的一组观测数据:
(2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?该结论与相关系数
r 的计算一致吗?
解 (1)散点图如下:
列表:
∴r=
∑
i=1
7
x i y i-7x y
⎝
⎛
⎭
⎪
⎪
⎫
∑
i=1
7
x2i-7x2
⎝
⎛
⎭
⎪
⎪
⎫
∑
i=1
7
y2i-7y2
=
4 300
700×27 771.43
≈0.975.
(2)从图中可以发现施化肥量与水稻产量具有线性相关关系,当施化肥量由小到大变化时,水稻产量也由小变大,图中的数据点大约分布在一条直线的附近,因此施化肥量和水稻产量近似成线性正相关关系.又由于r=0.975>0,故散点图与r的计算一致.。