【志鸿优化】2015高考数学(人教,理)一轮精品课件:11.9 变量间的相关关系、统计案例
【志鸿优化】2015届高三数学(理)一轮课时作业:10.11 变量间的相关关系与统计案例]
第11讲变量间的相关关系与统计案例基础巩固1.下列两个变量之间的关系是相关关系的是( )A.正方体的棱长与体积B.单位面积产量为常数时,土地面积与产量C.日照时间与水稻的亩产量D.电压一定时,电流与电阻答案:C解析:A,B,D中两个变量间的关系都是确定的,所以是函数关系,C中的两个变量间是相关关系,对于日照时间一定的水稻,仍可以有不同的亩产量.故选C.2.观察下列散点图,则①正相关;②负相关;③不相关,它们的排列顺序与图形相对应的是( )A.a—①,b—②,c—③B.a—②,b—③,c—①C.a—②,b—①, c—③D.a—①,b—③,c—②答案:D3.一位母亲记录了儿子3~9岁的身高,数据(略),由此建立的身高与年龄的回归模型为=7.19x+73.93,用这个模型预测这个孩子10岁时的身高,正确的叙述是( )A.身高一定是145.83 cmB.身高在145.83 cm以上C.身高在145.83 cm左右D.身高在145.83 cm以下答案:C解析:用回归模型=7.19x+73.93,只能作预测,其结果不一定是个确定值.4.在一组样本数据(x1,y1),(x2,y2),…,(x n,y n)(n≥2,x1,x2,…,x n不全相等)的散点图中,若所有样本点(x i,y i)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为( )A.-1B.0C. D.1答案:D解析:样本相关系数越接近1,相关性越强,现在所有的样本点都在直线y=x+1上,样本的相关系数应为1.5.已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的方程是( )A.=1.23x+4B.=1.23x+5C.=1.23x+0.08D.=0.08x+1.23答案:C解析:D显然错误,把(4,5)代入A,B,C检验,满足的只有C.6.已知x与y之间的几组数据如下表:x 1 2 3 4 5 6y 0 2 1 3 3 4假设根据上表数据所得线性回归直线方程为=x+.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b'x+a',则以下结论正确的是( )A.>b',>a'B.>b',<a'C.<b',>a'D.<b',<a'答案:C解析:∵==,==,∴==,=-=-,b'==2>,a'=-2<.7.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系.根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是( )A.y与x具有正的线性相关关系B.回归直线过样本点的中心(,)C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg答案:D解析:D选项中,若该大学某女生身高为170 cm,则可断定其体重约为0.85×170-85.71=58.79 kg.故D不正确.8.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程=3-5x,变量x增加一个单位时,y平均增加5个单位;③回归直线方程=x+必过点(,).其中错误的个数是( )A.0B.1C.2D.3答案:B解析:一组数据都加上或减去同一个常数,数据的平均数有变化,方差不变(方差是反映数据的波动程度的量),①正确;回归方程中x的系数具备直线斜率的功能,对于回归直线方程=3-5x,当x增加一个单位时,y平均减少5个单位,②错误;由线性回归方程的定义知,线性回归方程=x+必过点(,),③正确.9.已知一个线性回归方程为=1.5x+45(x i∈{1,7,5,13,19}),则=.答案:58.5解析:线性回归方程为=1.5x+45,经过点(,),由=9,知=58.5.10.某单位为了了解用电量y度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:气温(℃) 18 13 10 -1用电量(度) 24 34 38 64由表中数据得线性回归方程=bx+a中b=-2,预测当气温为-4 ℃时,用电量的度数约为.答案:68解析:∵=10,=40,回归方程过点(,),∴40=-2×10+a.∴a=60.∴=-2x+60,令x=-4.∴=(-2)×(-4)+60=68.11.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:小时)与当天投篮命中率y之间的关系:时间x 1 2 3 4 5命中率y 0.4 0.5 0.6 0.6 0.4小李这5天的平均投篮命中率为;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为.答案:0.5 0.53解析:平均命中率=×(0.4+0.5+0.6+0.6+0.4)=0.5;而=3,(x i-)(y i-)=(-2)×(-0.1)+(-1)×0+0×0.1+1×0.1+2×(-0.1)=0.1,(x i-)2=(-2)2+(-1)2+02+12+22=10,于是=0.01,=-=0.47,∴=0.01x+0.47,令x=6,得=0.53.12.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得的数据如下:零件数x(个) 10 20 30 40 50 60 70 80 90 100加工时间y(分) 62 68 75 81 89 95 102 108 115 122(1)y与x是否具有线性相关关系?(2)如果y与x具有线性相关关系,求回归直线方程.(3)根据求出的回归直线方程,预测加工200个零件所用的时间为多少?解:(1)由表中数据,画出散点图如下:由散点图可知,x,y具有很好的线性相关关系.(2)设所求的回归直线方程为=x+,列出下表,i 1 2 3 4 5 6 7 8 9 10x i10 20 30 40 50 60 70 80 90 100y i62 68 75 81 89 95 102 108 115 122x i y i620 1 360 2 250 3 240 4 450 5 700 7 140 8 640 10 350 12 200=55,=91.7,=38 500,x i y i=55 950,则有==≈0.668,=-=91.7-0.668×55=54.96.因此,所求的回归直线方程为=0.668x+54.96.(3)当x=200时,y的估计值为=0.668×200+54.96=188.56≈189,因此,加工200个零件所用的工时约为189分钟.13.某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:日期1月10日2月10日3月10日4月10日5月10日6月10日昼夜温差10 11 13 12 8 6x(℃)就诊人数y 22 25 29 26 16 12该兴趣小组确定的研究方案是:先从这6组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验.(1)求选取的2组数据恰好是相邻两个月的概率;(2)若选取的是1月与6月的两组数据,请根据2至5月份的数据,求出y关于x的线性回归方程=bx+a;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?解:(1)设抽到相邻两个月的数据为事件A.因为从6组数据中选取2组数据共有15种情况,每种情况都是等可能出现的.其中,抽到相邻两个月的数据的情况有5种,所以P(A)==.(2)由数据求得=11,=24,由公式求得=,=-=-,所以y关于x的线性回归方程为=x-.(3)当x=10时,=,<2;同样,当x=6时,=,<2.所以,该小组所得线性回归方程是理想的.拓展延伸14.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.x 3 4 5 6y 2.5 3 4 4.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程= x+;(3)已知该厂技改前生产100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?解:(1)由题设所给数据,可得散点图如图所示.(2)由对照数据,计算得=86,==4.5(吨),==3.5(吨).已知x i y i=66.5,所以,由最小二乘法确定的回归方程的系数为===0.7,=- =3.5-0.7×4.5=0.35.因此,所求的线性回归方程为=0.7x+0.35.(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为90-(0.7×100+0.35)=19.65(吨标准煤).。
2015高考数学(理)一轮复习考点突破课件:11.3变量间的相关关系、统计案例
• •
1.相关关系与函数关系的区别 相关关系与函数关系不同.函数关系中的两个变量间是一种确定 性关系.例如正方形面积S与边长x之间的关系S=x2就是函数关 系.相关关系是一种非确定性关系,即相关关系是非随机变量与 随机变量之间的关系.例如商品的销售额与广告费是相关关 系.两个变量具有相关关系是回归分析的前提.
2.对回归分析的理解 (1)回归分析是处理变量相关关系的一种数学方法, 它主要解决 三个问题: ①确定两个变量之间是否有相关关系, 如果有就找出它们之间 贴近的数学表达式,否则求出的回归方程没有意义; ②根据一组观察值, 预测变量的取值及判断变量取值的变化趋 势; ③求出线性回归方程. ^x+a ^一定过样本点的中心( x , y ). (2)回归直线^ y=b
第3课时
变量间的相关关系、统计案例
• • • • •
(一)考纲点击 1.会作两个有关联变量数据的散点图,会利用散点图认识变量 间的相关关系. 2.了解最小二乘法的思想,能根据给出的线性回归方程系数公 式建立线性回归方程. 3.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简 单应用. 4.了解回归的基本思想、方法及其简单应用.
• 2×2列联表
总计 x1 a+ b x2 c+ d a+ b +c 2 c b+nd 总计 a+ ad-bc 2 +d 构造一个随机变量 K =
n=
y1 a c
y2 b d
,其中 a+bc+da+cb+d
a+b+c+d
为样本容量.
• (3)独立性检验 • 利用随机变量 来判断“两个分类变量 独立性检验. K2
其中一定不正确 的结论的序号是 ... ( A.①② C.③④ B.②③ D.①④ )
• (2)对变量x,y有观测数据(xi,yi)(i=1,2,„,10),得散点图(1); 对变量u、v有观测数据(ui,vi)(i=1,2,„,10),得散点图(2).由 这两个散点图可以判断 •( )
【志鸿优化设计】2015届高考数学(人教版-文科)一轮总复习课时规范练11-函数的图象及其变换]
课时规范练11函数的图象及其变换一、选择题1.已知函数y=f(x)与函数y=lg的图象关于直线y=x对称,则函数y=f(x-2)的解析式为()A.y=10x-2-2B.y=10x-1-2C.y=10x-2D.y=10x-1答案:B解析:∵y=lg,∴=10y.∴x=10y+1-2,∴f(x)=10x+1-2.∴f(x-2)=10x-1-2.2.下列函数图象中不正确的是()答案:D解析:逐一验证知:A,B,C正确,对D,y=-log2|x|是偶函数,图象关于y轴对称,显然不正确.3.已知函数y=f(x)的大致图象如图所示,则函数y=f(x)的解析式应为()A.f(x)=e x ln xB.f(x)=e-x ln(|x|)C.f(x)=e x ln(|x|)D.f(x)=e|x|ln(|x|)答案:C4.如果函数f(x)=a x+b-1(a>0,且a≠1)的图象经过第一、二、四象限,不经过第三象限,那么一定有()A.0<a<1且b>0B.0<a<1且0<b<1C.a>1且b<0D.a>1且b>0答案:B解析:由题意知函数单调递减,所以0<a<1.又f(x)过第一、二、四象限,不经过第三象限,所以-1<b-1<0,所以0<b<1.故选B.5.函数y=2|x|的定义域为[a,b],值域为[1,16],当a变化时,函数b=g(a)的图象可以是()答案:B解析:由图象知故b=g(a),即为b=4(-4≤a≤0),图象为B.6.若函数f(x)=(k-1)a x-a-x(a>0且a≠1)在R上既是奇函数,又是减函数,则g(x)=log a(x+k)的图象是()答案:A解析:由函数f(x)在R上是奇函数,可得f(-x)=-f(x),即(k-1)a-x-a x=(1-k)a x+a-x,∴k=2.∴f(x)=a x-a-x.又f (x)在R上是减函数,∴0<a<1.∴g(x)的图象应是A.二、填空题7.把函数y=log3(x-1)的图象向右平移个单位,再把横坐标缩小为原来的,所得图象的函数解析式是.答案:y=log3解析:y=log3(x-1)的图象向右平移个单位得到y=log3,再把横坐标缩小为原来的,得到y=log3.故应填y=log3.8.已知函数y=,将其图象向左平移a(a>0)个单位,再向下平移b(b>0)个单位后图象过坐标原点,则ab的值为.答案:1解析:图象平移后的函数解析式为y=-b,由题意知-b=0,∴ab=1.9.已知函数y=的图象与函数y=kx的图象恰有两个交点,则实数k的取值范围是.答案:(0,1)∪(1,2)解析:y=函数y=kx过定点(0,0).由数形结合可知:0<k<1或1<k<k OC,故0<k<1或1<k<2.10.函数y=f(x)(x∈R)的图象如图所示,下列说法正确的是.①函数y=f(x)满足f(-x)=-f(x);②函数y=f(x)满足f(x+2)=f(-x);③函数y=f(x)满足f(-x)=f(x);④函数y=f(x)满足f(x+2)=f(x).答案:①②解析:由图象可知,函数f(x)为奇函数且关于直线x=1对称;对于②,因为f(1+x)=f(1-x),所以f[1+(x+1)]=f[1-(x+1)],即f(x+2)=f(-x).故①②正确.11.已知函数f(x)=2-x2,g(x)=x.若f(x) g(x)=min{f(x),g(x)},那么f(x) g(x)的最大值是.(注意:min表示最小值)答案:1解析:画出示意图如图.f(x) g(x)=其最大值为1.三、解答题12.直线y=1与曲线y=x2-|x|+a有2个交点,求a的取值范围.解:y=x2-|x|+a=当其图象如图所示时满足题意.由图知a<1或a-=1,解得a<1或a=.13.作出下列函数的大致图象.(1)y=x2-2|x|;(2)y=lo[3(x+2)].解:(1)y=的图象如图(1).(2)y=lo3+lo(x+2)=-1+lo(x+2)的图象如图(2).14.已知函数y=f(x)同时满足以下五个条件:(1) f(x+1)的定义域是[-3,1];(2)f(x)是奇函数;(3)在[-2,0)上,f'(x)>0;(4)f(-1)=0;(5)f(x)既有最大值又有最小值.请画出函数y=f(x)的一个图象,并写出相应于这个图象的函数解析式.解:由(1)知,-3≤x≤1,-2≤x+1≤2,故f(x)的定义域是[-2,2].由(3)知,f(x)在[-2,0)上是增函数.综合(2)和(4)知,f(x)在(0,2]上也是增函数,且f(-1)=f(1)=0,f(0)=0.故函数y=f(x)的一个图象如下图所示,与之相应的函数解析式是f(x)=15.设函数f(x)=x+的图象为C1,C1关于点A(2,1)对称的图象为C2,C2对应的函数为g(x).(1)求g(x)的解析式;(2)若直线y=m与C2只有一个交点,求m的值和交点坐标.解:(1)设点P(x,y)是C2上的任意一点,则P(x,y)关于点A(2,1)对称的点为P' (4-x,2-y),代入f(x)=x+, 可得2-y=4-x+,即y=x-2+.∴g(x)=x-2+.(2)由消去y得x2-(m+6)x+4m+9=0,Δ=[-(m+6)]2-4(4m+9),∵直线y=m与C2只有一个交点,∴Δ=0,解得m=0或m=4.当m=0时,经检验合理,交点为(3,0);当m=4时,经检验合理,交点为(5,4).四、选做题1.设f(x)是定义在R上的周期为3的周期函数,如图表示该函数在区间(-2,1]上的图象,则f(2013)+f(2 014)=()A.3B.2C.1D.0答案:C解析:f(2 013)=f(3×671)=f(0)=0,f(2 014)=f(3×671+1)=f(1)=1,则f(2 013)+f(2 014)=1.2.已知定义在[0,+∞)上的函数y=f(x)和y=g(x)的图象如图所示,则不等式f(x)·g(x)>0的解集是.答案:解析:由题图可知,当0<x<时,f(x)>0,g(x)>0;当<x<1时,f(x)>0,g(x)<0;当1<x<2时,f(x)<0,g(x)<0;当x>2时,f(x)>0,g(x)>0,因此f(x)·g(x)>0的解集是.3.已知函数f(x)=m的图象与h(x)=+2的图象关于点A(0,1)对称.(1)求m的值;(2)若g(x)=f(x)+在(0,2]上是减函数,求实数a的取值范围.解:(1)设P(x,y)是h(x)图象上一点,点P关于点A(0,1)的对称点为Q(x0,y0),则x0=-x,y0=2-y.∴2-y=m,∴y=m+2,从而m=.(2)g(x)=.设0<x1<x2≤2,则g(x1)-g(x2)==(x1-x2)+(a+1)·=(x1-x2)·>0,并且在x1,x2∈(0,2]上恒成立,∴x1x2-(a+1)<0,∴1+a>x1x2,1+a≥4,∴a≥3.。
2015届高考数学(人教,理科)大一轮配套第十章算法初步、统计、统计案例第4节变量间的相关关系、统计案例
2009~2013年高考真题备选题库 第10章 算法初步、统计、统计案例 第4节 变量间的相关关系、统计案例考点一 变量间的相关性1.(2013福建,5分)已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归直线方程为y =b x +a ,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′ B.b ^>b ′,a ^<a ′ C.b ^<b ′,a ^>a ′D.b ^<b ′,a ^<a ′解析:本题主要考查线性回归直线方程,意在考查考生的数形结合能力、转化和化归能力、运算求解能力.由两组数据(1,0)和(2,2)可求得直线方程为y =2x -2,b ′=2,a ′=-2.而利用线性回归方程的公式与已知表格中的数据,可求得b ^=6i =1x i y i-6x -·y -6i =1x 2i -6x -2=58-6×72×13691-6×⎝⎛⎭⎫722=57,a ^=y --b ^x -=136-57×72=-13,所以b ^<b ′,a ^>a ′. 答案:C2.(2013湖北,5分)四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -6.423; ②y 与x 负相关且y ^=-3.476x +5.648; ③y 与x 正相关且y ^=5.437x +8.493; ④y 与x 正相关且y ^=-4.326x -4.578: 其中一定不正确的结论的序号是( ) A .①② B .②③ C .③④D .①④解析:本题主要考查两个变量的相关性,并能判断正相关和负相关.①中y 与x 负相关而斜率为正,不正确;④中y 与x 正相关而斜率为负,不正确.答案:D3.(2013重庆,13分)从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得10i =1x i =80,10i =1y i =20,10i =1x i y i =184,10i =1x 2i =720.(1)求家庭的月储蓄y 对月收入x 的线性回归方程y =bx +a ; (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程y =bx +a 中,b =n i =1x i y i -n x - y-ni =1x 2i -n x-2,a =y --b x -,其中x -,y -为样本平均值,线性回归方程也可写为y ^=b ^x +a ^.解:本题主要考查两个变量的相关性、线性回归方程的求法及预报作用,考查考生的运算求解能力与逻辑思维能力.(1)由题意知n =10,x =1n n i =1x i =8010=8,y -=1n ni =1y i =2010=2.又ni =1x 2i -n x -2=720-10×82=80,ni =1x i y i -n x - y -=184-10×8×2=24,由此可得b =ni =1x i y i -n x - y -n i =1x 2i -n x -2=2480=0.3,a =y --b x -=2-0.3×8=-0.4,故所求回归方程为y =0.3x -0.4.(2)由于变量y 的值随x 的值增加而增加(b =0.3>0),故x 与y 之间是正相关. (3)将x =7代入回归方程可以预测该家庭的月储蓄为y =0.3×7-0.4=1.7(千元). 4.(2012湖南,5分)设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确的是( )A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg解析:由于回归直线的斜率为正值,故y 与x 具有正的线性相关关系,选项A 中的结论正确;回归直线过样本点的中心,选项B 中的结论正确;根据回归直线斜率的意义易知选项C 中的结论正确;由于回归分析得出的是估计值,故选项D 中的结论不正确.答案:D5.(2011山东,5分)某产品的广告费用x 与销售额y 的统计数据如下表:根据上表可得回归方程y =b x +a 中的b 为9.4,据此模型预报广告费用为6万元时销售额为( )A .63.6万元B .65.5万元C .67.7万元D .72.0万元解析:样本中心点是(3.5,42),则a ^=y --b ^x -=42-9.4×3.5=9.1,所以回归直线方程是y ^=9.4x +9.1,把x =6代入得y ^=65.5.答案:B6.(2011陕西,5分)设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是( )A .x 和y 的相关系数为直线l 的斜率B .x 和y 的相关系数在0到1之间C .当n 为偶数时,分布在l 两侧的样本点的个数一定相同D .直线l 过点(x -,y -)解析:回归直线过样本中心点(x -,y -). 答案:D7.(2011辽宁,5分)调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析:以x +1代x ,得y ^=0.254(x +1)+0.321,与y ^=0.254x +0.321相减可得,年饮食支出平均增加0.254万元.答案:0.254考点二 统计案例1.(2013福建,12分)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?附:χ2=n (n 11n 2212n 21)n 1+n 2+n +1n +2⎝ ⎛⎭⎪⎫注:此公式也可以写成K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )解:本题主要考查古典概型、抽样方法、独立性检验等基础知识,考查运算求解能力、应用意识,考查必然与或然思想、化归与转化思想等.(1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名.所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),记为A 1,A 2,A 3;25周岁以下组工人有40×0.05=2(人),记为B 1,B 2.从中随机抽取2名工人,所有的可能结果共有10种,它们是:(A 1,A 2),(A 1,A 3),(A 2,A 3),(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(A 3,B 1),(A 3,B 2),(B 1,B 2).其中,至少1名“25周岁以下组”工人的可能结果共有7种,它们是(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(A 3,B 1),(A 3,B 2),(B 1,B 2).故所求的概率P =710.(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手有60×0.25=15(人),“25周岁以下组”中的生产能手有40×0.375=15(人),据此可得2×2列联表如下:所以得χ2=n (ad -bc )(a +b )(c +d )(a +c )(b +d )=100×(15×25-15×45)60×40×30×70=2514≈1.79.因为1.79<2.706,所以没有90%的把握认为“生产能手与工人所在的年龄组有关”.2.(2010新课标全国,12分)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关? (3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )解:(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估计值为70500=14%.(2)K 2=500×(40×270-30×160)2200×300×70×430≈9.967.由于9.967>6.635,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关. (3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法,比采用简单随机抽样方法更好.。
人教版高考数学理科一轮总复习配套课件11.9变量间的相关关系、统计案例
-3-
1.相关关系: 当自变量取值一定时, 因变量的取值带有一定随机性的两 个变量之间的关系叫做相关关系.与函数关系不同, 相关关系是一种
非确
定性关系 .
2.散点图: 表示具有相关关系的两个变量的一组数据的图形叫做散点 图, 它可直观地判断两变量的关系是否可以用线性关系表示.若这些散点分 布在从左下角到右上角的区域, 则称两个变量 在从左上角到右下角的区域, 则称两个变量
������
, ������ = ������ − ������ ������ , 它主要用来估
^
计和预测取值, 从而获得对这两个变量之间整体关系的了解.
^ ^
想一想结合直线的点斜式方程, 你能推导出回归方程 ������ =
^
������ x+ ������ 经过的定点吗?
答案: 由������ = ������ − ������ ������ 得������ = ������ x+������ − ������ ������ , 即 ������ − ������ = ������ (x-������ ), 由此可知回
-4-
4.回归方程: ������ = ������ x+������ , 其中 ������ =
^
^ ^
^
������=1 ������
∑ ������������ ������������ -n������ ������ ^
2 ∑ ������2 ������ -n������ ������=1
关闭
^ ^ ^
^
������ =
^
4+2+3+5 4 ^
=3.5,������=
【志鸿优化设计】高考数学一轮复习 第十一章概率与统计11.9回归分析与独立性检验教学案 新人教B版
11.9 回归分析与独立性检验考纲要求1.会作两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系. 2.了解最小二乘法的思想,能根据给出的回归直线方程系数公式建立回归直线方程(线性回归方程系数公式不要求记忆).3.了解独立性检验(只要求2×2列联表)的思想、方法及其简单应用. 4.了解回归分析的基本思想、方法及其简单应用.1.相关关系与函数关系不同,相关关系是一种__________性关系. 2.散点图若点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为________;若点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为________.3.回归直线 从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,就称两个变量之间具有__________关系,这条直线叫做________.4.回归直线方程(1)最小二乘法:求回归直线使得样本数据的点到它的____________的方法叫做最小二乘法.(2)回归直线方程:方程y ^=b ^x +a ^是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的回归方程,其中a ^,b ^是待定参数.⎩⎪⎨⎪⎧b ^= = ,a ^= .5.样本相关系数r =∑ni =1 x i -xy i -y∑n i =1x i -x2∑ni =1y i -y2=∑ni =1x i y i -n x y∑n i =1x 2i -n x2∑ni =1y 2i -n y2.(1)r 具有以下性质:|r |≤1,并且|r |越接近1,线性相关程度越强;|r |越接近0,线性相关程度越弱.(2)检验的步骤如下:①作统计假设:x 与Y 不具有线性相关关系;②根据小概率0.05与n -2在附表中查出r 的一个临界值r 0.05; ③根据样本相关系数的计算公式算出r 的值;④作统计推断.如果|r |>r 0.05,表明有95%的把握认为x 与Y 之间具有线性相关关系. 如果|r |≤r 0.05,没有理由拒绝原来的假设.这时寻找回归直线方程是毫无意义的. 6.独立性检验(1)假设有两个分类变量X 和Y ,它们的值域分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称为2×2列联表)为:y 1 y 2 合计 x 1 n 11 n 12 n 1+ x 2 n 21 n 22 n 2+ 合计 n +1 n +2 n χ2=____________________________(其中n =______________________为样本容量). (2)两个临界值:3.841和6.635.当χ2>________时,有95%的把握说事件A 与B 有关;当χ2>________时,有99%的把握说事件A 与B 有关;当χ2≤________时,认为事件A 与B 是无关的.1.下列两个变量之间是相关关系的是( ). A .圆的面积与半径 B .球的体积与半径 C .角度与它的正弦值D .一个考生的数学成绩与物理成绩2.已知变量x ,y 呈线性相关关系,回归方程y ^=0.5+2x ,则变量x ,y 是( ). A .线性正相关关系B .由回归方程无法判断其正负相关C .线性负相关关系D .不存在线性相关关系3.关于独立性检验的说法中,错误的是( ). A .独立性检验依据小概率原理B .独立性检验原理得到的结论一定正确C .样本不同,独立性检验的结论可能有差异D .独立性检验不是判定两类事物是否相关的唯一方法4.为了考察长头发与女性头晕是否有关系,随机抽查301名女性,得到如下列联表,试根据表格中已有数据填空.经常头晕 很少头晕 合计 长发 35 ① 121 短发 37 143 ② 合计 72 ③ ④ 则空格中的数据应分别为:①__________;②__________;③__________;④__________.一、变量间的相关性【例1】一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得的数据如下: 零件数x /个 10 20 30 40 50 60 70 80 90 100 加工时间y /分 62 68 75 81 89 95 102 108 115 122 (1)y 与x 是否具有线性相关关系?(2)如果y 与x 具有线性相关关系,求回归直线方程.(3)根据求出的回归直线方程,预测加工200个零件所用的时间为多少? 方法提炼1.散点图可以直观地反映两个变量间的相关关系,并且根据散点的分布规律可以判断出这两个变量是正相关还是负相关.2.求线性回归直线方程的步骤(1)作出散点图,判断两个变量是否线性相关;(2)如果是,利用公式求出a ^,b ^的值,写出回归直线方程;(3)利用求出的方程进行估计.由于求回归直线方程时的计算量较大,所以计算时要仔细、谨慎,可分层进行,避免因计算产生失误.特别注意,只有在散点图大体呈线性时,求出的回归直线方程才有意义.请做演练巩固提升4二、回归方程的求法及回归分析【例2】 某地最近十年粮食需求量逐年上升,下表是部分统计数据:年份 2002 2004 2006 2008 2010 需求量/万吨 236 246 257 276 286(1)利用所给数据求年需求量与年份之间的回归直线方程y ^=b ^x +a ^; (2)利用(1)中所求出的直线方程预测该地2012年的粮食需求量. 方法提炼1.最小二乘法估计的一般步骤: (1)作出散点图,判断是否线性相关;(2)如果线性相关,利用公式求a ^,b ^,写出回归直线方程; (3)根据方程进行估计.2.回归直线方程恒过点(x ,y ).请做演练巩固提升2 三、独立性检验【例3】 某单位餐厅的固定餐椅经常有损坏,于是该单位领导决定在餐厅墙壁上张贴文明标语看是否有效果,并对文明标语张贴前后餐椅的损坏情况作了一个统计,具体数据如下:损坏餐椅数 未损坏餐椅数 合计文明标语张贴前 39 157 196 文明标语张贴后 29 167 196合计 68 324 392 请你判断在餐厅墙壁上张贴文明标语对减少餐椅损坏数是否有效果? 方法提炼1.所谓独立性检验,就是根据所采集样本的数据,利用公式计算χ2的值,比较与临界值的大小关系,来判断事件X 与Y 是否有关的问题.2.独立性检验的思想来自于统计上的假设检验思想,它与反证法类似,它们都是先假设结论不成立,然后根据是否能推出“矛盾”来判定结论是否成立.但二者“矛盾”的含义不同,反证法中的“矛盾”是指不符合逻辑的事件发生;而假设检验中的“矛盾”是指不符合逻辑的小概率事件发生,即在结论不成立的假设下推出有利于结论成立的小概率事件的发生.请做演练巩固提升3要重视对线性回归方程意义的理解【典例】 (2012湖南高考)设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系.根据一组样本数据(x i ,y i )( i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确的是( ).A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg 答案:D解析:D 选项中,若该大学某女生身高为170 cm ,则可断定其体重约为:0.85×170-85.71=58.79 kg.故D 不正确.答题指导:1.求回归方程,关键在于正确求出系数a ^,b ^,由于a ^,b ^的计算量大,计算时应仔细谨慎,分层进行,避免因计算而产生错误.(注意线性回归方程中一次项系数为b ^,常数项为a ^,这与一次函数的习惯表示不同.)2.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.3.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.1.(2012课标全国高考)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x+1上,则这组样本数据的样本相关系数为( ).A .-1B .0C .12D .12.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下: 父亲身高x (cm) 174 176 176 176 178 儿子身高y (cm) 175 175 176 177 177 则y 对x 的线性回归方程为( ).A.y ^=x -1B.y ^=x +1C.y ^=88+12x D.y ^=1763.为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例.(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关? (3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.附:χ2=n n 11n 22-n 12n 212n 1+n 2+n +1n +24.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据:x /吨 3 4 5 6 y /吨 2.5 3 4 4.5 (1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的回归直线方程y ^=b ^x +a ^; (3)已知该厂技改前10吨甲产品的生产能耗为9吨标准煤.试根据(2)求出的回归直线方程,预测生产10吨甲产品的生产能耗比技改前降低多少吨标准煤?参考答案基础梳理自测知识梳理1.非确定 2.正相关 负相关 3.线性相关 回归直线 4.(1)离差平方和最小(2)∑n i =1(x i -x )(y i -y )∑ni =1 (x i -x )2 ∑ni =1x i y i -n x y ∑n i =1x i 2-n x 2y -b ^x 6.(1)n (n 11n 22-n 12n 21)2n 1+n 2+n +1n +2n 11+n 21+n 12+n 22(2)3.841 6.635 3.841 基础自测1.D 解析:相关关系不是确定的函数关系,这里A ,B ,C 都是确定的函数关系. 2.A 解析:因为b =2>0,所以x ,y 是正相关关系.3.B 解析:因为利用独立性原理检验时与样本的选取有关,所以得到的结论可能有失误,不是一定正确.4.①86 ②180 ③229 ④301解析:最右侧的合计是对应的行上的两个数据的和,由此可求出①和②;而最下面的合计是相应的列上两个数据的和,由刚才的结果可求得③④.5.58.5 解析:回归直线方程为y ^=1.5x +45,经过点(x ,y ),由x =9,知y =58.5.考点探究突破【例1】解:(1)作出如下散点图:显然,图中的散点大致分布在一条直线附近,因此y 与x 具有线性相关关系. (2)列出下表: i 1 2 3 4 5 6 7 8 9 10 x i 10 20 30 40 50 60 70 80 90 100 y i 62 68 75 81 89 95 102 108 115 122xiy i620 1 360 2 250 3 240 4 450 5 700 7 140 8 640 10 350 12 200x =55,y =91.7,∑i =110x i 2=38 500,∑i =110y i 2=87 777,∑i =110x i y i =55 950,设所求的回归直线方程为y ^=b ^x +a ^,则有b ^=∑i =110x i y i -10x y∑i =110x i 2-10x2=55 950-10×55×91.738 500-10×552≈0.668, a ^=y -b ^x =91.7-0.668×55=54.96.因此,所求的回归直线方程为y ^=0.668x +54.96. (3)当x =200时,y 的估计值为 y ^=0.668×200+54.96=188.56≈189.因此,加工200个零件所用的时间约为189分钟.【例2】 解:(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来配回归直线方程.为此对数据预处理如下:年份-2006 -4 -2 0 2 4 需求量-257 -21 -11 0 19 29 对预处理后的数据,容易算得x =0,y =3.2,b ^=(-4)×(-21)+(-2)×(-11)+2×19+4×2942+22+22+42=26040=6.5, a ^=y -b ^x =3.2.由上述计算结果,知所求回归直线方程为y ^-257=b (x -2 006)+a=6.5(x -2 006)+3.2.即y ^=6.5(x -2 006)+260.2.①(2)利用直线方程①,可预测2012年的粮食需求量为 6.5×(2 012-2 006)+260.2 =6.5×6+260.2=299.2(万吨) ≈300(万吨).【例3】 解:根据题中的数据,由χ2=n (n 11n 22-n 12n 21)2n 1+n 2+n +1n +2,得χ2=392×(39×167-157×29)2196×196×68×324≈1.78.因为1.78<3.841,所以我们没有理由说在餐厅墙壁上张贴文明标语对减少餐椅损坏数有效果,即效果不明显. 演练巩固提升1.D 解析:样本相关系数越接近1,相关性越强,现在所有的样本点都在直线y =12x+1上,样本的相关系数应为1.可得C 为正确答案.法二:将表中的五组数值分别代入选项验证,可知y ^=88+12x 最适合.3.解:(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估计值为70500=14%.(2)由公式得χ2=500×(40×270-30×160)2200×300×70×430≈9.967.由于9.967>6.635,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关. (3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,要先确定该地区老年人中男、女的比例,再把老年人分成男、女两层,并采用分层抽样方法比采用简单随机抽样方法更好.4.解:(1)如下图.(2)∑i =14x i y i =3×2.5+4×3+5×4+6×4.5=66.5,x =3+4+5+64=4.5, y =2.5+3+4+4.54=3.5,∑i =1nx i 2=32+42+52+62=86.b ^=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7, a ^=y -b ^x =3.5-0.7×4.5=0.35.因此所求的回归直线方程为y ^=0.7x +0.35.(3)根据回归直线方程的预测,现在生产10吨产品消耗的标准煤的数量为0.7×10+0.35=7.35,故能耗减少了9-7.35=1.65(吨).。
【志鸿优化设计】2015届高考数学(人教版,理科)一轮总复习精品课件:12.2 基本算法语句
当 j=2 时,余数 a=3;当 j=3 时,余数 a=1; 当 j=4 时,余数 a=0;当 j=5 时,余数 a=0; 当 j=6 时,不满足条件,此时退出循环.
C.2
D.4
关闭
解析
答案
第十二章
12.2
基本算法语句 -261 2 3
2.完成下列程序,输入 x 的值,求函数 y=|8-2x2|的值. INPUT x IF ① ② ELSE y=2��� x^2-8 END IF PRINT y END ① ,② .
基本算法语句 -7-
5.循环语句 (1)UNTIL 语句的一般格式: DO 循环体
LOOP UNTIL
条件
第十二章
12.2
基本算法语句 -8-
(2)WHILE 语句的一般格式: WHILE 循环体 条件
WEND
第十二章
12.2
基本算法语句 -9-
基础自测
1.下列关于“赋值语句”叙述正确的是( A.3.6=x 是赋值语句 B.利用赋值语句可以进行代数式的化简 C.赋值语句中的等号与数学中的等号意义相同 D.赋值语句的作用是先计算出赋值号右边表达式的值,然后把该值赋给赋 )
关闭
D
答案
第十二章
12.2
基本算法语句 -10-
2.下列语句是正确的赋值语句的是( A.5=x C.x=y=-2 B.x+y=3 D.y=y��� y
)
关闭
赋值语句中“=”的左右两边不能互换,不能给常量赋值,左边必须是变量,右 边是数值或表达式,故 A,B 错.C 错,一个赋值语句只能给一个变量赋值.D 正确,关闭 D 该语句的功能是将当前的 y 平方后赋给变量 y.
解析
考点一 考点二 考点三
【志鸿优化设计】2015届高考数学(人教版,理科)一轮总复习精品课件:2.3 函数的奇偶性与周期性
第二章
2.3
函数的奇偶性与周期性 -15-
举一反三 1 下列函数中既不是奇函数,又不是偶函数的是( )
A.y=2|x| C.y=2x+2-x B.y=lg(x+ x 2 + 1) D.y=lg
1 x+1
关闭
对于 D,y=lg
1
������ +1
的定义域为{x|x>-1},不关于原点对称,是非奇非偶函数.
关闭
∵ log210= ,
lg2
1
∴ lg(log210)=lg(lg 2)-1=-lg(lg 2). 令 g(x)=ax3+bsin x,易知 g(x)为奇函数. ∵ f(lg(log210))=f(-lg(lg 2))=g(-lg(lg 2))+4=5, ∴ g(-lg(lg 2))=1. ∴ g(lg(lg 2))=-1. ∴ f(lg(lg 2))=g(lg(lg 2))+4=-1+4=3.故选 C. B
考点一
考点二
考点三
第二章
2.3
函数的奇偶性与周期性 -14-
2.图象法
3.性质法:(1)“奇+奇”是奇,“奇-奇”是奇,“奇·奇”是偶,“奇÷ 奇”是偶; (2)“偶+偶”是偶,“偶-偶”是偶,“偶·偶”是偶,“偶÷ 偶”是偶; (3)“奇·偶”是奇,“奇÷ 偶”是奇. 提醒:(1)分段函数奇偶性的判断,要注意定义域内 x 取值的任意性,应分 段讨论,讨论时可依据 x 的范围取相应地化简解析式,判断 f(x)与 f(-x)的关 系,得出结论,也可以利用图象作判断. (2)“性质法”中的结论是在两个函数的公共定义域内才成立的. (3)性质法在选择题和填空题中可直接运用,但在解答题中应给出性质 推导的过程.
人教版高三数学一轮复习精品课件:§11.3 变量的相关性
B.52,50
C.52,74
D.74,52
∵a+21=73,∴a=52. 又a+22=b,∴b=74.
3.(2016·河南八市质检)为了研究某大型超市当天销售额与开业天数的关系, 随机抽取了5天,其当天销售额与开业天数的数据如下表所示:
开业天数x
10
20
30 40 50
当天销售额y/万元 62
75 81 89
8
(xi-
x
y w i=1
x )2
46.6 563 6.8 289.8
8
(wi-
i=1
w )2
1.6
8
(xi-
i=1
8
(wi- w )·
i=1
x )·(yi- y ) 1 469
(yi- y ) 108.8
表中 wi= xi, w =18i=81wi.
(1)根据散点图判断,y=a+bx 与 y=c+d x哪一个适宜作为年销售量 y 关于年宣传费 x 的回归方程类型?(给出判断即可,不必说明理由) 解答
思维升华
判定两个变量正、负相关性的方法 (1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布 从左上角到右下角,两个变量负相关. (2)相关系数:r>0时,正相关;r<0时,负相关. (3)回归直线方程中:b^ >0 时,正相关;b^ <0 时,负相关.
跟踪训练1 (1)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2, x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,
P(χ2≥k0) k0
0.05 3.841
0.025 5.024
0.010 6.6350.005 7.8790.001 10.828
2015届高考数学第一轮复习精讲(课前准备+课堂活动小结+课后练习)变量间的相关关系导学案(新人教A版)文
学案58 变量间的相关关系导学目标: 1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.自主梳理1.两个变量的线性相关 (1)正相关在散点图中,点散布在从__________到________的区域,对于两个变量的这种相关关系,我们将它称为正相关.(2)负相关在散点图中,点散布在从________到________的区域,两个变量的这种相关关系称为负相关.(3)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.2.回归方程 (1)最小二乘法求回归直线使得样本数据的点到它的________________________的方法叫做最小二乘法.(2)回归方程方程y ^=b ^x +a ^是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的回归方程,其中a ^,b ^是待定参数.自我检测1.下列有关线性回归的说法,不正确的是( ) A .相关关系的两个变量不一定是因果关系 B .散点图能直观地反映数据的相关程度C .回归直线最能代表线性相关的两个变量之间的关系D .任一组数据都有回归直线方程 2.(2009·海南,宁夏)对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图(1);对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图(2).由这两个散点图可以判断( )A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关 3.(2011·银川模拟)下表是某厂1~4月份用水量(单位:百吨)的一组数据:由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其回归直线方程是y ^=-0.7x +a ^,则a ^等于( )A .10.5B .5.15C .5.2D .5.25 4.(2010·广东)某市居民2005~2009年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:, 家庭年平均收入与年平均支出有______线性相关关系. 5.(2011·金陵中学模拟)已知三点(3,10),(7,20),(11,24)的横坐标x 与纵坐标y 具有线性关系,则其回归方程是________________.探究点一 利用散点图判断两个变量的相关性例1 有一位同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出热饮杯数与当天气温的对比表:(1)(2)你能从散点图中发现气温与热饮销售杯数之间关系的一般规律吗?变式迁移1 某班5个学生的数学和物理成绩如表:探究点二 求回归直线方程例2 假设关于某设备的使用年限x 和所支出的维修费用y(万元)有以下统计资料:若由资料知y 对x 呈线性相关关系.试求回归方程y =b x +a .变式迁移2 已知变量x 与变量y 有下列对应数据:且y 对x探究点三 利用回归方程对总体进行估计例3 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.(1)(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的回归方程y ^=b ^x +a ^;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)变式迁移3 (2011·盐城期末)某单位为了了解用电量y 度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:气温(℃) 18 13 10 -1 用电量(度)24 34 38 64 由表中数据得回归方程y ^=b ^x +a ^中b ^=-2,预测当气温为-4℃时,用电量的度数约为________.1.相关关系与函数关系不同.函数关系中的两个变量间是一种确定性关系.而相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系.函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.2.回归直线方程:设x 与y 是具有相关关系的两个变量,且相应于n 个观测值的n 个点大致分布在某一条直线的附近,就可以认为y 对x 的回归函数的类型为直线型:y ^ =b ^ x +a ^.其中我们称这个方程为y 对x 的回归直线方程.其中x =1n ∑ni =1x i ,y =1n ∑ni =1y i,(x ,y )称为样本点的中心.3.求回归直线方程的步骤:(1)计算出x 、y、∑ni =1x 2i 、∑n i =1x i y i 的值;(2)计算回归系数a ^ 、b ^;(3)写出回归直线方程y ^=b ^x +a ^.(满分:75分)一、选择题(每小题5分,共25分) 1.下列命题:①线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法; ②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;③通过回归直线y ^=b ^x +a ^及回归系数b ^,可以估计和预测变量的取值和变化趋势. 其中正确的命题是( ) A .①② B .①③ C .②③ D .①②③2.设有一个回归直线方程为y ^=2-1.5x ,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位 D .y 平均减少2个单位3.(2011·陕西)设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是( )A .x 和y 的相关系数为直线l 的斜率B .x 和y 的相关系数在0到1之间C .当n 为偶数时,分布在l 两侧的样本点的个数一定相同D .直线l 过点(x ,y )4.(2011·山东)某产品的广告费用x 与销售额y 的统计数据如下表:根据上表可得线性回归方程y =b x +a 中的b 为9.4,据此模型预报广告费用为6万元时销售额为( )A .63.6万元B .65.5万元C .67.7万元D .72.0万元 5.(2011·青岛模拟)为了考察两个变量x 和y 之间的线性相关性,甲、乙两位同学各自独立做了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l 1、l 2,已知两人所得的试验数据中,变量x 和y 的数据的平均值都相等,且分别是s 、t ,那么下列说法中正确的是( )A .直线l 1和l 2一定有公共点(s ,t)B .直线l 1和l 2相交,但交点不一定是(s ,t)C .必有l 1∥l 2D .l 1与l 2必定重合二、填空题(每小题4分,共12分)6.下列关系中,是相关关系的为________.(填序号) ①学生的学习态度与学习成绩之间的关系;②教师的执教水平与学生的学习成绩之间的关系; ③学生的身高与学生的学习成绩之间的关系; ④家庭的经济条件与学生的学习成绩之间的关系.7.已知回归直线的斜率的估计值是0.73,样本点的中心为(12.5,8.25),则回归直线的回归方程是______________.8.(2011·茂名月考)在研究硝酸钠的可溶性程度时,观测它在不同温度的水中的溶解度,得观测结果如下表:三、解答题(共38分) 9.(12分)(2011·威海模拟)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下:(1)(2)求出y 关于x 的回归方程y ^=b ^x +a ^,并在坐标系中画出回归直线; (3)试预测加工10个零件需要多少时间?(注:b ^=∑ni =1x i y i -n x y∑ni =1x 2i -n x2,a ^ =y -b ^x )10.(12分)(2010·许昌模拟)某种产品的宣传费支出x 与销售额y(单位:万元)之间有如下对应数据:(1)画出散点图; (2)求回归直线方程;(3)试预测宣传费支出为10万元时,销售额多大?11.(14分)(1)(2)指出产量每增加1 000件时,单位成本平均变动多少? (3)假定产量为6 000件时,单位成本为多少元?学案58 变量间的相关关系自主梳理1.(1)左下角 右上角 (2)左上角 右下角 2.(1)距离的平方和最小(2)∑ni =1(x i -x )(y i -y )∑n i =1(x i -x )2 ∑ni =1x i y i -n x y∑ni =1x 2i -n x 2y -b ^x 自我检测1.D 2.C 3.D4.13 正 5.y ^=74x +234课堂活动区例1 解题导引 判断变量间是否线性相关,一种常用的简便可行的方法就是作散点图. 散点图是由大量数据点分布构成的,是定义在具有相关关系的两个变量基础之上的,对于性质不明确的两组数据可先作散点图,直观地分析它们有无关系及关系的密切程度.解 (1)以x 轴表示温度,以y 轴表示热饮杯数,可作散点图,如图所示.(2)从图中可以看出,各点散布在从左上角到右下角的区域里,因此,气温与热饮销售杯数之间是负相关关系,即气温越高,卖出去的热饮杯数越少.从散点图可以看出,这些点大致分布在一条直线附近.变式迁移1 解 以x 轴表示数学成绩,y 轴表示物理成绩,可得相应的散点图如下图所示:由散点图可见,两者之间具有相关关系.例2 解题导引 根据题目给出的数据,利用公式求回归系数,然后获得回归方程. 解 制表如下:于是有b ^=112.3-5×4×590-5×42=12.310=1.23;a ^=y -b ^x =5-1.23×4=0.08. ∴回归直线方程为y ^=1.23x +0.08.变式迁移2 解 x =1+2+3+44=52,y =12+32+2+34=74,∑ni =1x 2i =12+22+32+42=30,∑ni =1x i y i=1×12+2×32+3×2+4×3=432, ∴b ^ =∑n i =1x i y i -n x y ∑n i =1x 2i -n x 2=432-4×52×7430-4×254=0.8,a ^ =y -b ^x =74-0.8×52=-0.25,∴y ^=0.8x -0.25.例3 解题导引 利用描点法得到散点图,按求回归方程的步骤和公式,写出回归方程,最后对总体进行估计.利用回归方程可以进行预测,回归方程将部分观测值所反映的规律进行延伸,是我们对有线性相关关系的两个变量进行分析和控制,依据自变量的取值估计和预报因变量值的基础和依据,有广泛的应用.解 (1)散点图:(2)x =3+4+5+64=4.5,y =2.5+3+4+4.54=3.5,∑4i =1x i y i =3×2.5+4×3+5×4+6×4.5=66.5.∑4i =1x 2i =32+42+52+62=86, ∴b ^=∑4i =1x i y i -4x y ∑4i =1x 2i -4x2=66.5-4×4.5×3.586-4×4.52=0.7,a ^=y -b ^x =3.5-0.7×4.5=0.35. ∴所求的回归方程为y ^=0.7x +0.35. (3)现在生产100吨甲产品用煤y ^=0.7×100+0.35=70.35,∴降低90-70.35=19.65(吨标准煤). 变式迁移3 68解析 x =10,y =40,回归方程过点(x ,y ),∴40=-2×10+a ^.∴a ^=60. ∴y ^=-2x +60.令x =-4,y ^=(-2)×(-4)+60=68. 课后练习区1.D [根据线性回归的含义、方法、作用分析这三个命题都是正确的.]2.C [设(x 1,y 1),(x 2,y 2)在直线上,若x 2=x 1+1,则y 2-y 1=(2-1.5x 2)-(2-1.5x 1)=1.5(x 1-x 2)=-1.5,y 平均减少1.5个单位.]3.D [因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的绝对值越接近1,两个变量的线性相关程度越强,所以A 、B 错误.C 中n 为偶数时,分布在l 两侧的样本点的个数可以不相同,所以C 错误.根据线性回归方程一定经过样本中心点可知D 正确.所以选D .]4.B [∵x =4+2+3+54=72,y =49+26+39+544=42,又y ^ =b ^ x +a ^ 必过(x ,y ),∴42=72×9.4+a ^ ,∴a ^=9.1.∴线性回归方程为y ^=9.4x +9.1.∴当x =6时,y ^=9.4×6+9.1=65.5(万元).]5.A [回归直线方程为y ^=b ^x +a ^.而a ^=y -b ^x ,即a ^=t -b ^s ,t =b ^s +a ^.∴(s ,t)在回归直线上. ∴直线l 1和l 2一定有公共点(s ,t).] 6.①②解析 ①中学生的学习态度与学习成绩之间不是因果关系,但具有相关性,是相关关系.②教师的执教水平与学生的学习成绩之间的关系是相关关系.③④都不具备相关关系.7.y ^=0.73x -0.875解析 a ^=y -b ^x =8.25-0.73×12.5=-0.875. 8.0.880 9解析 x =30,y =93.6,∑5i =1x 2i =7 900,∑5i =1x i y i =17 035, ∴回归直线的斜率为b ^=∑5i =1x i y i -5x y ∑5i =1x 2i -5x 2=17 035-5×30×93.67 900-4 500≈0.880 9.9.解(1)散点图如图所示.(4分)(2)由表中数据得∑4i =1x i y i =52.5, x =3.5,y =3.5,∑4i =1x 2i =54, ∴b ^ =0.7.∴a ^=y -b ^x =1.05.∴y ^=0.7x +1.05.回归直线如图中所示.(10分) (3)将x =10代入回归直线方程, 得y =0.7×10+1.05=8.05(小时),∴预测加工10个零件需要8.05小时.(12分)10.解 (1)根据表中所列数据可得散点图如图所示:(4分)(2)计算得:x =255=5,y =2505=50, ∑5i =1x 2i =145,∑5i =1x i y i =1 380. 于是可得b ^=∑5i =1x i y i -5x y ∑5i =1x 2i -5x 2=1 380-5×5×50145-5×52=6.5,a ^=y -b ^x =50-6.5×5=17.5,因此,所求回归直线方程是y ^=6.5x +17.5.(10分)(3)由上面求得的回归直线方程可知,当宣传费支出为10万元时,y ^=6.5×10+17.5=82.5(万元),即这种产品的销售大约为82.5万元.(12分)11.解 (1)n =6,∑6i =1x i =21,∑6i =1y i =426,x =3.5,y =71, ∑6i =1x 2i =79,∑6i =1x i y i =1 481, b ^=∑6i =1x i y i -6x y ∑6i =1x 2i -6x 2=1 481-6×3.5×7179-6×3.52≈-1.82. (3分)a ^=y -b ^x =71+1.82×3.5=77.37.(5分) ∴回归方程为y ^=a ^+b ^x =77.37-1.82x.(6分)(2)因为单位成本平均变动b ^=-1.82<0,且产量x 的计量单位是千件,所以根据回归系数b 的意义有:产量每增加一个单位即1 000件时,单位成本平均减少1.82元.(10分) (3)当产量为6 000件时,即x =6,代入回归方程:y ^=77.37-1.82×6=66.45(元).∴当产量为6 000件时,单位成本为66.45元. (14分)。
2015高考数学一轮课件:11.3 变量间的相关关系、统计案例
与角度、体积有关的几何概型
【例 3】 如图所示,在△ABC 中, 思维启迪
解析
探究提高
∠B=60°,∠C=45°,高 AD= 根据“在∠BAC 内作射线 AM”可
3,在∠BAC 内作射线 AM 交 知,本题的测度是角度.
BC 于点 M,求 BM<1 的概率.
基础知识
题型分类
思想方法
练出高分 第二十四页,编辑于星期五:十三点 十一分。
件所占区域和整个 区域 Ω 的几何度量, 然后代入公式即可 求解.
基础知识
题型分类
思想方法
练出高分 第三页,编辑于星期五:三点 十一分。
基础知识·自主学习
要点梳理
3.要切实理解并掌握几何概型试 验的两个基本特点 (1)无限性:在一次试验中,可能 出现的结果有 无限多个 ; (2)等可能性:每个结果的发生具 有 等可能性 .
基础知识
题型分类
思想方法
练出高分 第十二页,编辑于星期五:十三点 十一分。
题型分类·深度剖析
题型一
与长度有关的几何概型
【例 1】 在集合 A={m|关于 x 的 思维启迪 解析 答案 探究提高 方程 x2+mx+34m+1=0 无实 由 Δ=m2-443m+1<0 得-1<m<4. 根}中随机地取一元素 m,恰使 即 A={m|-1<m<4}.
变式训练 1 在半径为 1 的圆内一条直径上任取一点,过这个点作垂直 1
于直径的弦,则弦长超过圆内接等边三角形边长的概率是____2____.
解析 记事件 A 为“弦长超过圆内接等边三角形的边 长”,如图,不妨在过等边三角形 BCD 的顶点 B 的直径 BE 上任取一点 F 作垂直于直径的弦,当弦为 CD 时,就 是等边三角形的边长(此时 F 为 OE 中点),弦长大于 CD 的充要条件 是圆心 O 到弦的距离小于 OF,由几何概型公式得:P(A)=12×2 2=12.
2015年高考数学一轮复习 9-3 变量间的相关关系及统计案例课件 文
(3)(2013·福建卷)已知 x 与 y 之间的几组数据如下表: x123456 y021334
假设根据上表数据所得线性回归直线方程为^y=b^x+a^,若某 同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为 y= b′x+a′,则以下结论正确的是( )
A.b^>b′,a^>a′ B.b^>b′,a^<a′ C.b^<b′,a^>a′ D.b^<b′,a^<a′ 参考公式:回归直线方程是:^y=b^x+a^,a^= y -b^ x
考点
互动探究
核心突破 · 导与练
(对应学生用书 P210)
考点1
相关关系的判断
1.相关关系是非随机变量与随机变量之间的关系.而函数关 系可以看成是两个非随机变量之间的关系.因此,不能把相关关 系等同于函数关系.
2.函数关系是一种因果关系,而相关关系不一定是因果关 系,也可能是伴随关系.
3.散点图是将两个变量的各对数据在直角坐标系中描点得 到的图形,它直观地反映了两个变量之间存在的某种关系和密切 程度,所以它可以判断两个变量间是否是相关关系,是什么样的 相关关系等问题.
像这样的变量称为分类变量.
(2)2×2 列联表:假设有两个分类变量 X 和 Y,它们的值域
分别为{x1,x2}和{y1,y2},其样本频数列联表(称 2×2 列联表) 为:
x1 x2 总计
y1 a c a+c
y2 b d b+d
总计 a+b c+d a+b+c+d
nad-bc2 K2=a+ba+cb+dc+d (其中 n=a+b+c+d 为样本 容量). (3)独立性检验 利用随机变量、 独立性假设 来确定是否一定有把握认为
2015高考数学一轮总复习课件:10.3变量间的相关关系、统计案例
立性检验判断表来判断“x 与 y 的关系”.这种利用随机变量 K2 来确定在多大程度上可以
认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.
第十三页,编辑于星期五:十二点 二十九分。
基础知识梳理
指点迷津
1.一个区别
函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系 是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.
第十四页,编辑于星期五:十二点 二十九分。
聚焦考向透析
考向一 相关关系的判断
例题精编
审题视点 典例精讲 类题通法 变式训练
下面是水稻产量与施化肥量的一组观测数据: 施化肥量:15 20 25 30 35 40 45 水稻产量:320 330 360 410 460 470 480 (1)将上述数据制成散点图; (2)你能从散点图中发现施化肥量与水稻产量近似成 什么关系吗?水稻产量会一直随施化肥量的增加而 增长吗?
基础知识系统化1
◆以上题目主要考查了以下内容: (1)变量间的相关关系 ①常见的两变量之间的关系有两类:一类是函数关系, 另一类是相关关系;与函数关系不同,相关关系是一种 非确定性关系.
②从散点图上看,点分布在从左下角到右上角的区域内,两个
变量的这种相关关系称为正相关,点分布在左上角到右下角 的区域内,两个变量的相关关系为负相关.
单价 x(元) 8 8.2 8.4 8.6 8.8 9 销量 y(件) 90 84 83 80 75 68
(1)求线性回归方程^y=^bx+a^,其中b^=- 20,^a=-y -^b-x ;
(2)预计在今后的销售中,销量与单价仍然 服从(1)中的关系,且该产品的成本是 4 元/件, 为使工厂获得最大利润,该产品的单价应定为 多少元?(利润=销售收入-成本)
【步步高】2015届高考数学总复习 第十一章 11.3变量间的相关关系、统计案例强化训练 理 北师大
§11.3 变量间的相关关系、统计案例1.相关性(1)通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图.(2)从散点图上,如果变量之间存在某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这样的近似过程称为曲线拟合.(3)若两个变量x 和y 的散点图中,所有点看上去都在一条直线附近波动,则称变量间是线性相关,若所有点看上去都在某条曲线(不是一条直线)附近波动,称此相关是非线性相关.如果所有的点在散点图中没有显示任何关系,则称变量间是不相关的. 2.回归方程(1)最小二乘法如果有n 个点(x 1,y 1),(x 2,y 2),…,(x n ,y n ),可以用[y 1-(a +bx 1)]2+[y 2-(a +bx 2)]2+…+[y n -(a +bx n )]2来刻画这些点与直线y =a +bx 的接近程度,使得上式达到最小值的直线y =a +bx 就是所要求的直线,这种方法称为最小二乘法. (2)回归方程方程y =bx +a 是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的回归方程,其中a ,b 是待定参数. ⎩⎪⎨⎪⎧b =∑ni =1(x i-x )(y i-y )∑n i =1(x i-x )2=∑ni =1x i y i-n x y ∑n i =1x 2i-n x 2a =y -b x.3.回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法. (2)样本点的中心对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )中(x ,y )称为样本点的中心. (3)相关系数①r=∑ni=1(x i-x)(y i-y)∑ni=1(x i-x)2∑ni=1(y i-y)2=∑ni=1x i y i-n x y(∑ni=1x2i-n x2)(∑ni=1y2i-n y2);②当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.4.独立性检验设A,B为两个变量,每一个变量都可以取两个值,变量A:A1,A2=A1;变量B:B1,B2=B1;2×2列联表:BAB1B2总计A1 a b a+bA2 c d c+d总计a+c b+d n=a+b+c+d构造一个随机变量χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).利用随机变量χ2来判断“两个分类变量有关系”的方法称为独立性检验.1.判断下面结论是否正确(请在括号中打“√”或“×”)(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.(×)(2)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.(√)(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.(√)(4)某同学研究卖出的热饮杯数y与气温x(℃)之间的关系,得回归方程y=-2.352x+147.767,则气温为2℃时,一定可卖出143杯热饮.(×)(5)事件X,Y关系越密切,则由观测数据计算得到的χ2越大.(√)(6)由独立性检验可知,有99%的把握认为物理成绩优秀与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀.(×)2.下面哪些变量是相关关系( )A .出租车车费与行驶的里程B .房屋面积与房屋价格C .身高与体重D .铁块的大小与质量 答案 C3.为了评价某个电视栏目的改革效果,在改革前后分别从居民点抽取了100位居民进行调查,经过计算χ2≈0.99,根据这一数据分析,下列说法正确的是( ) A .有99%的人认为该电视栏目优秀B .有99%的人认为该电视栏目是否优秀与改革有关系C .有99%的把握认为该电视栏目是否优秀与改革有关系D .没有理由认为该电视栏目是否优秀与改革有关系 答案 D解析 只有χ2≥6.635才能有99%的把握认为该电视栏目是否优秀与改革有关系,而既使χ2≥6.635也只是对“该电视栏目是否优秀与改革有关系”这个论断成立的可能性大小的结论,与是否有99%的人等无关.故只有D 正确.4.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算χ2=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的(填“有关”或“无关”). 答案 有关5.下表是某厂1~4月份用水量(单位:百吨)的一组数据:月份x 1 2 3 4 用水量y4.5432.5由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归方程是y ^= -0.7x +a ,则a 等于( ) A .10.5 B .5.15 C .5.2 D .5.25 答案 D解析x =2.5,y =3.5,∵回归直线过定点(x ,y ), ∴3.5=-0.7×2.5+a .∴a =5.25,故选D.题型一 相关关系的判断例15个学生的数学和物理成绩如下表:学生A B C D E学科数学8075706560物理7066686462画出散点图,并判断它们是否具有相关关系.思维启迪将每个学生的数学成绩和物理成绩分别作为点的横坐标和纵坐标,作散点图,然后根据散点图判断两个变量是否存在相关关系.解以x轴表示数学成绩,y轴表示物理成绩,可得到相应的散点图如图所示.由散点图可知,各组数据对应点大致在一条直线附近,所以两者之间具有相关关系,且为正相关.思维升华判断变量之间有无相关关系,一种简便可行的方法就是绘制散点图,根据散点图很容易看出两个变量之间是否具有相关性,是不是存在线性相关关系,是正相关还是负相关,相关关系是强还是弱.(1)对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图①;对变量u,v有观测数据(u i,v i)(i=1,2,…,10),得散点图②,由这两个散点图可以判断()A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关答案 C(2)(2012·课标全国)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为( ) A .-1 B .0 C.12D .1答案 D解析 样本点都在直线上时,其数据的估计值与真实值是相等的,即y i =y i ^,代入相关系数公式r =1-i =1n (y i -y i ^)2i =1n (y i -y )2=1.题型二 线性回归分析例2 某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下:零件的个数x (个) 2 3 4 5 加工的时间y (小时)2.5344.5(1)在给定的坐标系中画出表中数据的散点图;(2)求出y 关于x 的线性回归方程y =bx +a ,并在坐标系中画出回归直线; (3)试预测加工10个零件需要多少小时?思维启迪 求线性回归方程的系数b ^时,为防止出错,应分别求出公式中的几个量,再代入公式.解 (1)散点图如图.(2)由表中数据得:∑i =14x i y i =52.5,x =3.5,y =3.5, i =14x 2i =54,∴b =0.7,∴a =1.05,∴y =0.7x +1.05,回归直线如图所示.(3)将x =10代入回归直线方程,得y =0.7×10+1.05=8.05, 故预测加工10个零件约需要8.05小时.思维升华 (1)线性回归方程y =bx +a 必过样本点的中心(x ,y ).(2)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x (单位:小时)与当天投篮命中率y 之间的关系:时间x 1 2 3 4 5 命中率y0.40.50.60.60.4小李这5天的平均投篮命中率为________;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为________. 答案 0.5 0.53解析 小李这5天的平均投篮命中率y =0.4+0.5+0.6+0.6+0.45=0.5,可求得小李这5天的平均打篮球时间x =3.根据表中数据可求得b =0.01,a =0.47,故线性回归方程为y =0.47+0.01x ,将x =6代入得6号打6小时篮球的投篮命中率约为0.53. 题型三 独立性检验例3为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:性别男女是否需要志愿者需要 40 30 不需要160270(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例.(2)能否有99.5%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关? (3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.思维启迪 直接计算χ2的值,然后利用表格下结论.解 (1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要志愿者提供帮助的老年人的比例的估计值为70500×100%=14%.(2)χ2=500×(40×270-30×160)2200×300×70×430≈9.967.由于9.967>6.635,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关. (3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法,比采用简单随机抽样方法更好.思维升华 (1)根据样本估计总体是抽样分析的一个重要内容.要使估计的结论更加准确,抽样取得的样本很关键.(2)根据独立性检验知,需要提供服务的老人与性别有关,因此在调查时,采取男、女分层抽样的方法更好,从而看出独立性检验的作用.某中学对“学生性别和是否喜欢看NBA 比赛”作了一次调查,其中男生人数是女生人数的2倍,男生喜欢看NBA 的人数占男生人数的56,女生喜欢看NBA 的人数占女生人数的13.(1)若被调查的男生人数为n ,根据题意建立一个2×2列联表;(2)若有95%的把握认为是否喜欢看NBA 和性别有关,求男生至少有多少人? 解 (1)由已知得:喜欢看NBA不喜欢看NBA总计 男生 5n 6 n 6 n 女生 n 6 n 3 n 2 总计nn 23n 2(2)χ2=3n 2(5n 6·n 3-n 6·n 6)2n ·n 2·n 2·n =38n .若有95%的把握认为是否喜欢看NBA 和性别有关, 则χ2>3.841,即38n >3.841,n >10.24.∵n 2,n6为整数,∴n 最小值为12. 即:男生至少12人.统计中的数形结合思想典例:(12分)某地10户家庭的年收入和年饮食支出的统计资料如表所示: 年收入x (万元) 24466677810年饮食支出y (万元)0.91.41.62.02.11.91.82.12.22.3(1)根据表中数据,确定家庭的年收入和年饮食支出的相关关系; (2)如果某家庭年收入为9万元,预测其年饮食支出.思维启迪 可以画出散点图,根据图中点的分布判断家庭年收入和年饮食支出的线性相关性. 规X 解答解 (1)由题意,知年收入x 为解释变量,年饮食支出y 为预报变量,作散点图如图所示.[3分]从图中可以看出,样本点呈条状分布,年收入和年饮食支出有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系.[4分] 因为x =6,y =1.83,∑i =110x 2i =406,∑i =110y 2i =35.13,∑i =110x i y i =117.7,所以b =∑i =110x i y i -10x y∑i =110x 2i -10x2≈0.172,a =y -b x ≈1.83-0.172×6=0.798.从而得到线性回归方程为y =0.172x +0.798.[8分] (2)y =0.172×9+0.798=2.346(万元).所以家庭年收入为9万元时,可以预测年饮食支出为2.346万元.[12分]温馨提醒 (1)在统计中,用样本的频率分布表、频率分布直方图、统计图表中的茎叶图、折线图、条形图,去估计总体的相关问题,以及用散点图判断相关变量的相关性等都体现了数与形的完美结合.借助于形的直观,去统计数据,分析数据,无不体现了数形结合的思想.(2)本题利用散点图分析两变量间的相关关系,充分体现了数形结合思想的应用. (3)本题易错点为散点图画的不准确,导致判断错误.方法与技巧1.求回归方程,关键在于正确求出系数a ,b ,由于a ,b 的计算量大,计算时应仔细谨慎,分层进行,避免因计算而产生错误.(注意线性回归方程中一次项系数为b ,常数项为a ,这与一次函数的习惯表示不同.)2.回归分析是处理变量相关关系的一种数学方法.主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观察值,预测变量的取值及判断变量取值的变化趋势;(3)求出线性回归方程.3.根据χ2的值可以判断两个分类变量有关的可信程度.失误与防X1.相关关系与函数关系的区别:相关关系与函数关系不同.函数关系中的两个变量间是一种确定性关系.例如正方形面积S与边长x之间的关系S=x2就是函数关系.相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系.例如商品的销售额与广告费是相关关系.两个变量具有相关关系是回归分析的前提.2.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.A组专项基础训练(时间:40分钟)一、选择题1.某地区调查了2~9岁的儿童的身高,由此建立的身高y(cm)与年龄x(岁)的回归模型为y =8.25x+60.13,下列叙述正确的是()A.该地区一个10岁儿童的身高为142.63 cmB.该地区2~9岁的儿童每年身高约增加8.25 cmC.该地区9岁儿童的平均身高是134.38 cmD.利用这个模型可以准确地预算该地区每个2~9岁儿童的身高答案 B2.设(x1,y1),(x2,y2),…,(x n,y n)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是()A.直线l过点(x,y)B.x和y的相关系数为直线l的斜率C.x和y的相关系数在0到1之间D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同 答案 A解析 因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的绝对值越接近1,两个变量的线性相关程度越强,所以B 、C 错误.D 中n 为偶数时,分布在l 两侧的样本点的个数可以不相同,所以D 错误.根据线性回归直线一定经过样本点中心可知A 正确.3.(2012·某某)设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y =0.85x -85.71,则下列结论中不正确...的是( ) A .y 与x 具有正的线性相关关系 B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg 答案 D解析 由于线性回归方程中x 的系数为0.85, 因此y 与x 具有正的线性相关关系,故A 正确.又线性回归方程必过样本点中心(x ,y ),因此B 正确.由线性回归方程中系数的意义知,x 每增加1 cm ,其体重约增加0.85 kg ,故C 正确. 当某女生的身高为170 cm 时,其体重估计值是58.79 kg ,而不是具体值,因此D 不正确. 4.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:χ2=110×(40×30-20×20)60×50×60×50≈7.8.下面结论正确的是( )A .有99%以上的把握认为“爱好该项运动与性别有关”B .有99%以上的把握认为“爱好该项运动与性别无关”C .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”答案 A解析根据独立性检验的定义,由χ2≈7.8>6.635可知我们有99%以上的把握认为“爱好该项运动与性别有关”,故选A.5.某产品的广告费用x与销售额y的统计数据如下表:6万元时销售额为()A.63.6万元B.65.5万元C.67.7万元D.72.0万元答案 B解析∵x=4+2+3+54=72,y=49+26+39+544=42,又y=bx+a必过(x,y),∴42=72×9.4+a,∴a=9.1.∴线性回归方程为y=9.4x+9.1.∴当x=6时,y=9.4×6+9.1=65.5(万元).二、填空题6.以下四个命题,其中正确的序号是________.①从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量相关性越强,则相关系数的绝对值越接近于1 ;③在线性回归方程y=0.2x+12中,当解释变量x每增加一个单位时,预报变量y平均增加0.2个单位;④对分类变量X与Y,它们的随机变量χ2来说,χ2越小,“X与Y有关系”的把握程度越大.答案②③解析①是系统抽样;对于④,随机变量χ2越小,说明两个相关变量有关系的把握程度越小.7.已知回归方程y=4.4x+838.19,则可估计x与y的增长速度之比约为________.答案5∶22解析x每增长1个单位,y增长4.4个单位,故增长的速度之比约为1∶4.4=5∶22.事实上所求的比值为回归直线方程斜率的倒数.8.某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm、170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________ cm.答案185解析儿子和父亲的身高可列表如下:父亲身高173170176儿子身高170176182设线性回归方程为y=a+bx,由表中的三组数据可求得b=1,故a=y-b x=176-173=3,故线性回归方程为y=3+x,将x=182代入得孙子的身高为185 cm.三、解答题9.某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:甲厂:分组[29.86,29.90) [29.90,29.94)[29.94,29.98)[29.98,30.02)[30.02,30.06)[30.06,30.10)[30.10,30.14)频数1263861829261 4 乙厂:分组[29.86,29.90) [29.90,29.94)[29.94,29.98)[29.98,30.02)[30.02,30.06)[30.06,30.10)[30.10,30.14)频数297185159766218(1)试分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填下面2×2列联表,问是否有99%的把握认为“两个分厂生产的零件的质量有差异”?甲厂乙厂合计优质品非优质品合计附χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),解 (1)甲厂抽查的500件产品中有360件优质品,从而估计甲厂生产的零件的优质品率为360500=72%; 乙厂抽查的500件产品中有320件优质品,从而估计乙厂生产的零件的优质品率为320500=64%.(2)完成的2×2列联表如下:由表中数据计算得χ2=1 000×(360×180-320×140)2500×500×680×320≈7.35>6.635,所以有99%的把握认为“两个分厂生产的零件的质量有差异”.10.(2013·某某)从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑i =110x i =80,∑i =110y i =20,∑i =110x i y i =184,∑i =110x 2i =720.(1)求家庭的月储蓄y 对月收入x 的线性回归方程y =bx +a ; (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄. 解 (1)由题意知n =10,x =1n ∑i =1n x i =8010=8,y =1n ∑i =1n y i =2010=2,又l xx =∑i =1nx 2i -n x 2=720-10×82=80,l xy =∑i =1nx i y i -n x y =184-10×8×2=24,由此得b=l xyl xx =2480=0.3,a=y-b x=2-0.3×8=-0.4,故所求线性回归方程为y=0.3x-0.4.(2)由于变量y的值随x值的增加而增加(b=0.3>0),故x与y之间是正相关.(3)将x=7代入回归方程可以预测该家庭的月储蓄为y=0.3×7-0.4=1.7(千元).B组专项能力提升(时间:30分钟)1.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程y=3-5x,变量x增加一个单位时,y平均增加5个单位;③回归方程y=bx+a必过(x,y);④有一个2×2列联表中,由计算得χ2=13.079,则有99%的把握确认这两个变量间有关系.其中错误的个数是()A.0 B.1 C.2 D.3答案 B解析一组数据都加上或减去同一个常数,数据的平均数有变化,方差不变(方差是反映数据的波动程度的量),①正确;回归方程中x的系数具备直线斜率的功能,对于回归方程y=3-5x,当x增加一个单位时,y平均减少5个单位,②错误;由线性回归方程的定义知,线性回归方程y=bx+a必过点(x,y),③正确;因为χ2=13.079>6.635,故有99%的把握确认这两个变量有关系,④正确.故选B.2.(2013·某某)已知x与y之间的几组数据如下表:(1,0)和(2,2)求得的直线方程为y=b′x+a′,则以下结论正确的是()A.b>b′,a>a′B.b>b′,a<a′C.b<b′,a>a′D.b<b′,a<a′答案 C解析b′=2,a′=-2,由公式b =i =16(x i -x )(y i -y )i =16(x i -x )2求得.b =57,a =y -b x =136-57×72=-13, ∴b <b ′,a >a ′.选C.3.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下非优秀统计成绩,得到如下所示的列联表:优秀 非优秀 总计 甲班 10 b 乙班 c 30 合计已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法正确的是( )A .列联表中c 的值为30,b 的值为35B .列联表中c 的值为15,b 的值为50C .根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D .根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系” 答案 C解析 由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75, 所以c =20,b =45,选项A 、B 错误. 根据列联表中的数据,得到χ2=105×(10×30-20×45)255×50×30×75≈6.6>3.841,因此有95%的把握认为“成绩与班级有关系”.4.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程y =0.67x +54.9.零件数x (个) 10 2030 40 50 加工时间y (min)62758189答案 68解析 由已知可计算求出x =30,而必过点(x ,y ), 则y =0.67×30+54.9=75,设模糊数字为a ,则a+62+75+81+895=75,计算得a=68.5.为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的2×2列联表:喜爱打篮球不喜爱打篮球总计男生20525女生101525总计302050则有________的把握认为喜爱打篮球与性别有关(请用百分数表示).答案0.5%解析χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=50×(20×15-5×10)225×25×30×20≈8.333>6.635,所以有99%的把握认为喜爱打篮球与性别有关.6.(2013·某某)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?P(χ2≥k)0.1000.0500.010k 2.706 3.841 6.635解(1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名.所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),记为A1,A2,A3;25周岁以下组工人有40×0.05=2(人),记为B1,B2.从中随机抽取2名工人,所有的可能结果共有10种,它们是(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率P=710.(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手60×0.25=15(人),“25周岁以下组”中的生产能手40×0.375=15(人),据此可得2×2列联表如下:所以得χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=100×(15×25-15×45)260×40×30×70=2514≈1.79.因为1.79<2.706.所以没有90%的把握认为“生产能手与工人所在的年龄组有关”.。