2015届高考数学总复习 基础知识名师讲义 第九章 第五节变量间的相关关系、统计案例 文
2015届高考数学总复习 基础知识名师讲义 第九章 第五节 变量间的相关关系、统计案例 理
第五节 变量间的相关关系、统计案例知识梳理 1.散点图.(1)将变量所对应的点描出来,就组成了变量之间的一个图, 这种图为变量之间的________.(2)从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势可用一条光滑的曲线来近似,这种近似的过程称为曲线拟合.答案:1.(1)散点图2.相关关系.(1)从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为____________;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为____________.(2)线性相关:从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做____________.(3)若两个变量x 和y 的散点图中,所有点看上去都在某条曲线(不是一条直线)附近波动,则称此相关是______________的.如果所有的点在散点图中没有显示任何关系,则称变量间是不相关的.答案:2.(1)正相关 (2)回归直线 (3)非线性相关3.回归直线.(1)最小二乘法:如果有n 个点:(x 1,y 1),(x 2,y 2),…,(x n ,y n )可以用下面的表达式来刻画这些点与回归直线的接近程度: [y 1-(a +bx 1)]2+[y 2-(a +bx 2)]2+…+[y n -(a+bx n )]2,使得上式达到最小值的y ^=b ^x +a ^就是我们要求的直线,这种方法称为最小二乘法.(2)在回归直线方程y ^=b ^x +a ^中,b ^=∑i =1nx i -xy i -y∑i =1nx i -x2=∑i =1nx i y i -n x·y∑i =1nx 2i -n x2,a^1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.3.了解下列两种常用的统计方法,并能应用这些方法解决一些实际问题. (1)独立检验:了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用;(2)回归分析:了解回归分析的基本思想、方法及其简单应用.=________,其中x =x 1+x 2+…+x n n ,y =y 1+y 2+…+y n n.b ^叫做回归直线方程的斜率,a^是直线在y 轴上的截距.答案:3.y -b ^x4.相关系数.r=∑i =1nx i -xy i -y∑i =1nx i -x2y i -y2,用它来衡量两个变量间的线性相关关系.(1)当r >0时,表明两个变量________; (2)当r <0时,表明两个变量________;(3)r 的绝对值越接近1,表明两个变量的线性相关性______;r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r |>0.75时,认为两个变量有很强的线性相关关系.当|r |∈[0.3,0.75)时,相关性一般.当|r |∈[0,0.25]时,相关性较弱.答案:4.(1)正相关 (2)负相关 (3)越强5.残差分析.(1)线性回归模型:y =bx +a +e 中,a ,b 称为模型的未知参数;e 称为随机误差.(2)残差平方和:对于样本点(x i ,y i )(i =1,2,…,n ),Q =∑i =1n(y i -y )称为残差平方和,Q 值越小,说明线性回归模型的拟合效果越好.(3)相关指数:用相关指数R 2来刻画回归的效果,公式是R2= . R 2的值越大,说明残差平方和越小,也就是说模型拟合效果______.答案:5.越好6.独立性检验.(1)若变量的不同“值”表示个体所属的不同类型,则这类变量称为分类变量. (2)列出两个分类变量的频数表,称为列联表.(3)利用随机变量K 2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的________.2×2列联表独立性检验公式K 2=__________________.答案:6.(3)独立性检验n (ad -bc )2(a +b )(c +d )(a +c )(b +d )基础自测1.下列命题:①任何两个变量都具有相关关系;②圆的周长与该圆的半径具有相关关系;③某商品的需求与该商品的价格是一种非确定性关系;④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.其中正确的命题为( )A .①③④B .②④⑤C .③④⑤D .②③⑤答案:C2.(2013·武昌调研)通过随机询问110名性别不同的行人,对过马路是愿意走斑马线由K 2=n (a +b )(c +d )(a +c )(b +d ),算得K 2=260×50×60×50≈7.8.附表:A .有99%以上的把握认为“选择过马路的方式与性别有关”B .有99%以上的把握认为“选择过马路的方式与性别无关”C .在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别有关”D .在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别无关”解析:因为K 2=110×(40×30-20×20)260×50×60×50≈7.8>6.635,所以有99%以上的把握认为“选择过马路的方式与性别有关”.答案:A3.(2012·新课标全国卷)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x+1上,则这组样本数据的样本相关系数为__________________.解析:所有点均在直线上,则样本相关系数最大即为1. 答案:14.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析: 由题意得y ^2-y ^1=[0.254(x +1)+0.321]-[0.254x +0.321]=0.254,即家庭年收入每增加1万元,年饮食支出平均增加0.254万元.答案:0.2541.(2012·湖南卷)设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确的是( )A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg解析:根据回归方程的概念和性质知选项A ,B ,C 三项均正确,选项D 错误,线性回归方程只能预测学生的体重. 选项D 应改为“若该大学某女生身高为170 cm ,则估计其体重大约为58.79 kg”.答案:D2.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名(1)(2)用分层抽样方法在收看新闻节目的观众中随机抽取5名大于40岁的观众应该抽取几名?(3)在上述抽取的5名观众中任取2名,求恰有1名观众年龄为20至40岁的概率.解析:(1)有关.收看新闻节目多为年龄大的.(2)应抽取的人数为:5×2745=3(人).(3)由(2)知,抽取的5名观众中,有2名观众年龄处于20至40岁,3名观众的年龄大于40岁.记大于40岁的人为a 1,a 2,a 3,20至40岁的人为b 1,b 2,则从5人中抽取2人的基本事件有(a 1,a 2),(a 1,a 3),(a 2,a 3),(b 1,b 2),(a 1,b 1),(a 1,b 2),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2),共10个,其中恰有1人为20至40岁的基本事件有(a 1,b 1),(a 1,b 2),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2),共6个,因此所求的概率P =610=35.1.(2013·梅州一模)在2014年1月15日当天,某物价部门对本市的5家商场的某商品的一天销售量价格进行调查,5家商场的售价x 元和销售量y 件之间的一组数据如下表所示:y ^=-3.2x +40,且m +n =20,则其中的n =________.解析:x =15(9+9.5+m +10.5+11)=15(40+m ),y =15(11+n +8+6+5)=15(30+n ).因为其线性回归直线方程是:y ^=-3.2x +40,所以15(30+n )=-3.2×15(40+m )+40,即30+n =-3.2(40+m )+200,又m +n =20, 解得m =n =10. 答案:102.某大学高等数学老师上学期分别采用了A ,B 两种不同的教学方式对甲、乙两个大一新生班进行教改试验(两个班人数均为60人,入学数学平均分数和优秀率都相同;勤奋程度和自觉性都一样).现随机抽取甲、乙两班各20名同学的上学期数学期末考试成绩,得到茎叶图如下:(1)依茎叶图判断哪个班的平均分高?(2)从乙班这20名同学中随机抽取2名高等数学成绩不得低于85分的同学,求成绩为90分的同学被抽中的概率.(3)学校规定:成绩不低于85分的为优秀,请填写下面的2×2列联表,并判断“能否在犯错误的概率不超过K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d(4)从乙班高等数学成绩不低于85分的同学中抽取2人,成绩不低于90分的同学得奖金100元,否则得奖金50元,记ξ为这2人所得的总奖金,求ξ的分布列和数学期望.解析:(1)甲班高等数学成绩集中于60~90分之间,而乙班数学成绩集中于80~100分之间,所以乙班的平均分高.(2)P =C 11C 19C 210=15.(3)K 2=40×(13×27×20×20≈5.584>5.024,因此在犯错误的概率不超过0.025的前提下可以认为成绩优秀与教学方式有关.(4)由题可知ξ的可能取值为100,150,200.P ()ξ=100=C 25C 210=29,P ()ξ=150=C 15C 15C 210=59,P ()ξ=200=C 25C 210=29,所以ξ的分布列为:∴E (ξ)=100×29+150×9+200×9=150.。
变量间的相关关系
2.正相关:在散点图中,点散布在从左下角到右上 角的区域,对于两个变量的这种相关关系,我们将 它称为正相关。
思考6:如图是高原含氧量与海拔高度的相关关系 的散点图,高原含氧量与海拔高度有何相关关系? 点的分布有何特点?
海平面以上,海拔高度 越高,含氧量越少。
点散布在从左上角到右 下角的区域内。
脂肪含量
40 35 30 25 20 15 10 5 0
20 25 30 35 40 45 50 55 60 65 年龄
思考3:上图叫做散点图,你能描述一下散点图的含 义吗?
1.散点图:在平面直角坐标系中,表示具有相关关系 的两个变量的一组数据图形,称为散点图.
脂肪含量
思考4:观察散点图的大致趋势,人的年龄的与人体 脂肪含量具有什么相关关系?
大体上看,随着年龄的增加,人体中脂肪百分比也 在增加。
年龄 23 脂肪 9.5
27 39 17.8 21.2
41 25.9
45
49 50
27.5 26.3 28.2
年龄 53 54 56 57 58 60 61 脂肪 29.6 30.2 31.4 30.8 33.5 35.2 34.6
思考2:为了确定年龄和人体脂肪含量之间的更明 确的关系,我们需要对数据进行分析,通过作图可 以对两个变量之间的关系有一个直观的印象.以x轴 表示年龄,y轴表示脂肪含量,你能在直角坐标系 中描出样本数据对应的图形吗?
销售价格 12.2 15.3 24.8 21.6 18.4 29.2 22
(万元)
画出数据对应的散点图,并指出销售价格与房屋面积 这两个变量是正相关还是负相关.
解: 35
30 25 20 15 10 5 0
高三数学一轮复习 第9章第5节 变量的相关关系、统计案例课件 文 (广东专用)
程可能是( )
∧
∧
A.y=-10x+200 B.y=10x+200
∧
∧
C.y=-10x-200 D.y=10x-200
【解析】 由题意回归方程斜率应为负,故排除B,D,又销售量 应为正值,故C不正确,故选A.
【答案】 A
3.(2011·辽宁高考)调查了某地若干户家庭的年收入 x(单位:万元)和 年饮食支出 y(单位:万元),调查显示年收入 x 与年饮食支出 y 具有线
∧
(2)由于 x 与 y 之间具有线性相关关系,根据回归系数公式得到b= 499974=0.5,a∧=100-0.5×100=50,
∧
∴线性回归方程为y=0.5x+50. 当 y=115 时,x=130. 建议:进一步加强对数学的学习,提高数学成绩的稳定性,将有
助于物理成绩的进一步提高.,
某地区甲校高二年级有1 100人,乙校高二年级有900人,为了 统计两个学校高二年级在学业水平考试中的数学学科成绩,采用分层 抽样的方法在两校共抽取了200名学生的数学成绩,如下表:(已知本 次测试合格线是50分,两校合格率均为100%)
nad-bc2 构造一个随机变量 K2= a+bc+da+cb+d , 其中 n= a+b+c+d 为样本容量
∧
1.线性回归方程y=bx+a 是否一定过样本点的中心( x , y ), 为什么?
【提示】 一定过点( x , y ),∵a= y -b x ,∴ y =b x +a,即
∧
点( x , y )一定在回归直线y=bx+a 上.
(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样 本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有 明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再 把老年人分成男、女两层并采用分层抽样方法,比采用简单随机抽样 方法更好.
2015年高考数学第一轮复习课件:9.3变量间的相关关系、统计案例
递减趋势
递增趋势
解析 由图(1)可知,各点整体呈递减趋势,x 与 y 负相关; 由图(2)可知,各点整体呈递增趋势,u 与 v 正相关.
答案 C
第十一页,编辑于星期五:十一点 五十一分。
考
线性回归方程及其应用
点
【例题 2】(2013·重庆卷)从某居民区随机抽取 10 个家庭,获得第 i 个家庭的月收入 xi(单位:千元)与月储蓄 yi(单位:千元)的数据资料,
得回归直线方程,分别得到以下四个结论:
①y 与 x 负相关且y^ =2.347x-6.423; ②y 与 x 负相关且y^ =-3.476x+5.648;
不是负相关;
④方程中的 x 的系数 为负,不是正相关,
③y 与 x 正相关且y^ =5.437x+8.493;
∴①④一定不正确.
④y 与 x 正相关且y^ =-4.326x-4.578.
i=1
10
i=1
xiyi-10 x y
i=1
由此得b^ =
10
=2840=0.3,
x2i -10 x 2
i=1
^
a
= y -b^
x =2-0.3×8=-0.4,故所求回归方程为y^
=0.3x-0.4.
第十三页,编辑于星期五:十一点 五十一分。
线性回归方程及其应用
(2) 由于变量 y 的值随 x 值的增加而增加(b^ =0.3>0),
xiyi-n x y
i=1
附:线性回归方程y^ =b^ x+a^ 中,b^ =
,a^ = y -b^
n
x2i -n x 2
i=1
x ,其中 x , y 为样本平均值.
第十二页,编辑于星期五:十一点 五十一分。
变量间的相关关系讲义
变量间的相关关系讲义变量间的相关关系讲义一、基础知识梳理知识点1:变量之间的相关关系两个变量之间的关系可能是确定的关系(如:函数关系),或非确定性关系。
当自变量取值一定时,因变量也确定,则为确定关系;当自变量取值一定时,因变量带有随机性,这种变量之间的关系称为相关关系。
相关关系是一种非确定性关系,如长方体的高与体积之间的关系就是确定的函数关系,而人的身高与体重的关系,学生的数学成绩好坏与物理成绩的关系等都是相关关系。
注意:两个变量之间的相关关系又可分为线性相关和非线性相关,如果所有的样本点都落在某一函数曲线的附近,则变量之间具有相关关系(不确定性的关系),如果所有样本点都落在某一直线附近,那么变量之间具有线性相关关系,相关关系只说明两个变量在数量上的关系,不表明他们之间的因果关系,也可能是一种伴随关系。
点睛:两个变量相关关系与函数关系的区别和联系相同点:两者均是两个变量之间的关系,不同点:函数关系是一种确定的关系,如匀速直线运动中时间t与路程s的关系,相关关系是一种非确定的关系,如一块农田的小麦产量与施肥量之间的关系,函数关系是两个随机变量之间的关系,而相关关系是非随机变量与随机变量之间的关系;函数关系式一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系。
知识点2.散点图.1.在考虑两个量的关系时,为了对变量之间的关系有一个大致的了解,人们常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图。
2.从散点图可以看出如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这种近似的过程称为曲线拟合。
3.对于相关关系的两个变量,如果一个变量的值由小变大时,另一个变量的的值也由小变大,这种相关称为正相关,正相关时散点图的点散布在从左下角到由上角的区域内。
如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关,负相关时散点图的点散步在从左上角到右下角的区域。
2015届高考数学(文)基础知识总复习精讲课件:第9章 第5节 变量间的相关关系、统计案例
对低蛋白食物组,设年龄为x,身高为y,同样可得线性回归方程 =51.226+ 8.686x,通过对斜率、截距进行比较,可以看出不同食物对婴儿的身高有显著
xy
1
2
73
4 146
2
3
72
9 216
3
4
71
16 284
4
3
73
9 219
5
4
69
16 276
6
568Leabharlann 25 340合计21
426
79 1 481
根据以上数据求线性回归方程.
解析:设回归直线方程为y^=b^x+^a,
-x =261,-y =4626=71,
6
x2i =79,
6
xiyi=1
481,
年 龄
0.2
0.5
0.8
1
1
1.4 1.8
2
2
2.5 2.5 3 2.7
身 高
54
54.3
63
66 69
73
82
83
80.3
91
93.2 94
94
低蛋白食物组
年 龄 0.4 0.7 1 1 1.5 2
2
2. 4
2. 8
3
1.3 1.8
0.2
3
身 高
52
55
61
63. 4
66
68.5
67.9
7 2
76
变式探究
1.(1)有五组变量: ①汽车的重量和汽车每消耗1升汽油所行驶的平均路程; ②平均日学习时间和平均学习成绩; ③某人每日吸烟量和身体健康情况; ④圆的半径与面积; ⑤汽车的重量和每公里耗油量. 其中两个变量成正相关的是( ) A.①③ B.②④ C.②⑤ D.④⑤ (2)有10名同学高一(x)和高二(y)的数学成绩如下:
2015高考数学(文)一轮总复习课件:9.3 变量间的相关关系、回归分析及独立性检验
迁移发散:(2013·南昌模拟)下表提供了某厂节能降耗 技术改造后在生产 A 产品过程中记录的产量 x(吨)与 相应的生产能耗 y(吨)的几组对应数据:
x y 3 2.5 4 t 5 4 6 4.5
根据上表提供的数据,求出 y 关于 x 的回归直线 方程为 y=0.35+0.7x,那么表中 t 的值为() A. 3 B. 3.15 C. 3.5 D. 4.5
第九章 §9.3 变量间的相关关系、回归分析及独立性检验
最新考纲 基础梳理
第 三 节
自主测评 典例研析
特色栏目
备课优选
最新考纲
1. 会作两个有关联变量的数据的散点图,会利用散点图认识变 量间的相关关系. 2. 了解最小二乘法的思想,能根据给出的线性回归方程系数公 式求回归直线方程. 3. 了解独立性检验(只要求 2×2 列联表)的基本思想,方法及其 简单应用. 4. 了解回归分析的基本思想,方法及其简单应用.
点评:本题考查相关关系的判断,判断两变量之间是 否具备相关关系,可以利用散点图,也可以可利用样 本相关系数.
规律总结:在散点图中,如果所有的样本点都落在某 一函数的曲线上,就用该函数来描述变量之间的关系 即变量之间具有函数关系.如果所有的样本点都落在 某一函数的曲线附近,变量之间就有相关关系.如果 所有的样本点都落在某一直线附近,变量之间就有线 性相关关系.画散点图时,两组数据中可以任选一组 作为横坐标取值,另一组作为纵坐标取值且平面直角 坐标系中两坐标轴的长度单位可以不同.
7.675-1.562 ^ 解析:∵当 y =7.675 时,x= ≈9.262, 0.66 7.675 则 ≈0.829≈83%. 9.262
5、已知 x,y 之间的数据如下表所示,则回归直线过 点 (3,2.5).
高考数学 第九章 第五节变量间的相关关系课件 理
中最小的.
()
(2)已知回归方程 yˆ=4.4x+838.19,则可估计x与y的增长速 度之比约为______.
【解析】(1)任何一组观测值都能利用公式得到直线方程,但
这个方程可能无意义,①不正确;回归直线方程 yˆ=bˆ x+aˆ 经 过样本点的中心( x, y ),可能不经过(x1,y1),(x2,y2), …,(xn,yn)中的任何一点,这些点分布在这条直线附近, ②不正确;③正确;④正确.
【例1】下表是某小卖部6天卖出的热茶的杯数与当天气温的对 比表.
气温 (℃)
26
18
13
10
4
-1
杯数y 20
24
34
38
50
64
(1)将表中的数据画成散点图; (2)你能依据散点图指出气温与热茶杯数的关系吗? (3)如果气温与卖出热茶杯数近似成线性相关关系的话,请画出 一条直线来近似地表示这种线性相关关系.
的直线叫做回归直线.
【即时应用】
(1)由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)得到回 归直线方程 yˆ=bˆ x+aˆ ,判断下面说法是否正确(请在括号内 填写“√”或“×”)
①任何一组观测值都能得到具有代表意义的回归直线方程;
()
②直线 yˆ=bˆ x+aˆ 至少经过点(x1,y1),(x2,y2),…,(xn,yn)
xi x yi y
n
2
xi x
xiyi nxy
i1 n
x
2 i
2
nx
,
i1
i1
aˆ y bˆ x;
第四步,写出回归方程 yˆ bˆx aˆ. 【提醒】对于任意一组样本数据,利用上述公式都可以求得 “回归方程”,如果这组数据不具有线性相关关系,即不存在 回归直线,那么所得的“回归方程”是没有实际意义的.因此, 对一组样本数据,应先作散点图,在具有线性相关关系的前提 下再求回归方程.
高考数学之变量间的相关关系
一般地,设x与y是具有相关关系的两个变量,且相 应于n个观测值的n个点大致分布在一条直线的附近, 我们来求在整体上与这n个点最接近的一条直线.
设所求的直线方程为 yˆ bx a ,其中a、b是待定系数.
(在yˆi统计bx中i ,a.惯(i 用 1b,表2,示,一n)次项系数,用a表示常数项.) 各偏差为:yi yˆi yi (bxi a).(i 1,2,, n) 偏差 yi yˆi 的符号有正有负,相加相互抵消,所以它们和 不能代表n个点与相应直线在整体上的接近程度.
可求出使Q为最小值时的a、b的值 ,
n
n
( xi x)( yi y)
xi yi nx y
b i1
n
( xi x)2
Байду номын сангаасi 1
a y bx
i1 n xi2 nx 2 i 1
其中,
x
1 n
n i 1
xi ,
y
1 n
n i 1
yi
.
所得到的直线方程 :yˆ bx a 叫做回归直线方程.
为了了解热饮销量与气温的大致关系,我们以气温为 横轴,热饮销量为纵轴,建立直角坐标系,
散点图
y 气温与热饮杯数成负相关,即气 温越高,卖出去的热饮杯数越少。
60 50 40 30 20 10
-5 O 5 10 15 20 25 30 35
气温
在散点图中,点散布在从左上角到右下角的区域,对 于这两个变量的这种相关关系,我们就称之为负相关.
n
n
y (xi x)(yi y)
xi
nxy
i
2015届高考数学(人教A版·文科)总复习配套课件:9-4 变量间的相关关系、统计案例
• 不同点:函数关系是一种确定性关系,体 现的是因果关系;而相关关系是一种非确 定性关系,体现的不一定是因果关系,可 能是伴随关系.
• 1.下面哪些变量是相关关系( ) • A.出租车车费与行驶的里程 • B.房屋面积与房屋价格 • C.身高与体重 • D.铁块的大小与质量 • 解析:A,B,D都是函数关系,其中A一
• (1)根据以上数据完成下列2×2列联表:
(2)能否有99%的把握认为其亲属的饮食习惯与年龄有关?并写出简要分 析.
• 解析:(1)2×2列联表如下:
——统计与概率的综合问题
• 从近两年高考看,以考查独立性检验,回 归分析为主,多为选择题、填空题,也可 能以解答题形式考查,主要以实际问题为 背景,考查阅读理解、分析问题、解决问 题的能力,在解决一些简单实际问题的过 程中考查基本的统计思想.
• (1)画出散点图; • (2)求回归直线方程.
独立性检验
• 【例3】 (2014年石家庄高三模拟)为了调 查某大学学生在周日上网的时间,随机对 100名男生和100名女生进行了不记名的问 卷调查,得到了如下的统计结果:
• 表1:男生上网时间与频数分布表
• (1)若该大学共有女生750人,试估计其中 上网时间不少于60分钟的人数;
第四节 变量间的相关关系、统计案 例
[最新考纲展示] 1.会作两个相关变量的数据的散点图,会
利用散点图认识变量间的相关关系. 2. 了解最小二乘法的思想,能根据给出的线 性回归方程系数公式建立线性回归方程.
变量间的相关关系
• 1.常见的两变量之间的关系有两类:一
相类关是关系函数关系,另一类相是关关系
• (2)完成下面的2×2列联表,并回答能否有 90%的把握认为“大学生周日上网时间与 性别有关”?
2015届高三数学一轮课件:10.5 变量间的相关关系与统计案例
所以^a = y − b^x=80+20×8.5=250,从而回归直线方程为^y=-20x+250.
(2)设工厂获得的利润为 L 元,依题意得
L=x(-20x+250)-4(-20x+250) =-20x2+330x-1 000
=-20
x-
33 4
2
+361.25,
当且仅当 x=8.25 时,L 取得最大值. 故当单价定为 8.25 元时,工厂可获得最大利润.
A.变量 x 与 y 正相关,u 与 v 正相关 B.变量 x 与 y 正相关,u 与 v 负相关 C.变量 x 与 y 负相关,u 与 v 正相关 D.变量 x 与 y 负相关,u 与 v 负相关 答案:C
题型一 题型二
第十一页,编辑于星期五:八点 三十六分。
第5讲 变量间的相关关系与统计案例
考纲考向
(2)由于变量 y 的值随 x 的值增加而增加(b=0.3>0),故 x 与 y 之间是正
相关.
(3)将 x=7 代入回归方程可以预测该家庭的月储蓄为
y=0.3×7-0.4=1.7(千元).
题型一 题型二
第十四页,编辑于星期五:八点 三十六分。
第5讲 变量间的相关关系与统计案例
题型二 线性回归分析
第十八页,编辑于星期五:八点 三十六分。
第5讲 变量间的相关关系与统计案例
1
考纲考向
2
3
考点基础
重点难点
随随堂堂演演练练
2.(2013·湖北,文 4)四名同学根据各自的样本数据研究变量 x,y 之间的相
关关系,并求得回归直线方程,分别得到以下四个结论:
①y 与 x 负相关且^y=2.347x-6.423; ②y 与 x 负相关且^y=-3.476x+5.648; ③y 与 x 正相关且^y=5.437x+8.493; ④y 与 x 正相关且^y=-4.326x-4.578.
变量之间的相关关系
变量间的相互关系是指两个或两个以上变量之间相联系的性质,主要有两种类型。
(1)因果关系:是指在两个有关系的变量中,因为一个变量的变化而引起另一个变量的变化。
应注意三点:第一,在两个变量中,只能一个是因,另一个是果,而不能互为因果。
第二,原因变量一定出现在结果变量之前。
第三,两者之间的变化关系是必然的,否则就不是因果关系。
社会现象的因果关系十分复杂,有一因一果、一果多因、一因多果以及多因多果等。
在社会调查研究中,调查者应注意区别事物之间因果关系的类型,对一果多因、一因多果以及多因多果等复杂的因果关系要仔细分析,逐一明确,这样才能清楚地认识社会现象和事物发展变化的规律。
(2)相关关系:是指变量的变化之间存在着非因果关系的一定联系和一定关系。
社会调查研究运用相关这一概念,其目的是了解社会现象和事物之间关系的密切程度,从中探寻其规律性。
变量之间的相关关系从变化的方向来看,可以分为正相关与负相关;从变化的表现形式来看,可以分为直线相关和曲线相关。
当一个变量的数值发生变化时,另一个变量的数值也随之发生同方向的变化,这种相关关系是正相关,也叫直接相关。
当一个变量的数值发生变化时,另一个变量的数值也随之发生反方向的变化,这种相关关系是负相关,也叫逆相关。
在社会调查研究中,掌握变量关系的正相关与负相关的概念,有利于了解社会现象和事物的发展方向和趋势。
当一个变量的数值发生变动(增加或减少),另一个变量的数值随着发生大致均等的变动时,这种关系称为直线相关;当一个变量的数值发生变动,另一个变量的数值随之发生不均等的变动时,这种关系称为曲线相关。
高中数学_变量间的相关关系
变量间的相关关系知识图谱变量的相关性知识精讲一.变量间的相关关系1.两个变量之间的关系:(1)常见的关系有两类:①确定性的函数关系;②相关关系:变量间存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有一定随机性的;当一个变量取值一定时,另一个变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.(2)相关关系与函数关系的异同点:相同点:两者均是指两个变量的关系.不同点:①函数关系是一种确定的关系,相关关系是一种非确定的关系.②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.2.散点图:将样本中的n 个数据点()(12)i i x y i n = ,,,,描在平面直角坐标系中,就得到了散点图.散点图形象地反映了各个数据的密切程度,根据散点图的分布趋势可以直观地判断分析两个变量的关系.3.正相关与负相关:(1)正相关:如果当一个变量的值变大时,另一个变量的值也在变大,则这种相关称为正相关;此时,散点图中的点在从左下角到右上角的区域.(2)负相关:如果一个变量的值变大时,另一个变量的值由大变小,这种相关称为负相关.此时,散点图中的点在从左上角到右下角的区域.二.两个变量的线性相关1.回归分析:对于具有相关关系的两个变量进行统计分析的方法叫做回归分析,即回归分析就是寻找相关关系中这种非确定关系的某种确定性.2.回归直线:如果散点图中的各点都大致分布在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.3.最小二乘法(1)最小二乘法设(),Q a b 是直线y bx a =+与各对应数据表示的散点在纵轴方向上的距离的平方和,可以用来衡量直线y bx a =+与图中各点的接近程度,设法取,a b 的值,使(),Q a b 达到最小值.这种方法叫做最小二乘法.(2)用最小二乘法求回归直线方程用最小二乘法求回归系数a b ,有如下的公式:1221ˆniii nii x yn x y bxn x ==⋅-⋅⋅=-⋅∑∑,ˆˆa y b x =-⋅.(11n i i x x n ==∑,11ni i y y n ==∑)其中a b ,上方加“^”,表示是由观察值按最小二乘法求得的回归系数.由此得到的直线ˆˆybx a =+ 就称为回归直线方程.其中ˆa ,b 分别为a ,b 的估计值,b 称为回归系数,ˆa称为回归截距,ˆy 称为回归值.三点剖析一.注意事项1.回归直线方程的求法根据最小二乘法的思想和公式,通过计算就可以方便地求出回归方程;(1)先求2,,x y x x y ⋅(2)求1ni ii x y =∑(3)求21n i i x =∑(4)代入公式求^121ni ii ni i x ynxyb x nx==-=-∑∑(5)代入公式^^a yb x=-(6)代入直线方程得:ˆˆybx a =+ 2.散点图的制作方法对于两条轴的长度单位可以取得不一致;点既可以是实心点,也可以是空心点,;回归直线时,一定要画在多数点经过的区域,实际画线时,先观察有哪两点在直线上即可.3.回归直线的另外两种求法(1)选点法:作出散点图,用一条透明的直尺边缘在这些点间移动,选出直线上的两点或最靠近直线的两点(选点不当,精确度就比较低).(2)平均值法:首先设出方程y kx b =+,把观测值代入得几个关于,k b 的一次方程,将其平均分为两组,分别相加得到 k b ,的两个方程,联立解出 k b ,.两变量间的相关关系例题1、一次调查男女学生喜欢语文学科情况,共调查了90人,具体如下:据此材料,你认为喜欢语文学科与性喜欢不喜欢男2025女3015A.有关B.无关C.不确定D.无法判断例题2、四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y=2.347x-6.423;②y 与x 负相关且y =-3.476x+5.648;③y 与x 正相关且y =5.437x+8.493;④y 与x 正相关且y =-4.326x-4.578.其中一定不正确的结论的序号是()A.①②B.②③C.③④D.①④例题3、根据如图给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关随练1、对变量,有观测数据(),得散点图1;对变量,有观测数据(),得散点图2.由这两个散点图可以判断()A.变量与正相关,与正相关B.变量与正相关,与负相关C.变量与负相关,与正相关D.变量与负相关,与负相关随练2、某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()表1成绩/性别不及格及格总计男61420女102232总计163652表2视力/性别好差总计男41620女122032总计163652表3智商/性别偏高正常总计男81220女82432总计163652表4阅读量/性别丰富不丰富总计男14620女23032总计163652A.成绩B.视力C.智商D.阅读量线性回归x014m3y m3 5.57根据数据可求得y关于x的线性回归方程为ˆy=2.1x+0.85,则m的值为______________.例题2、已知x 、y 取值如表:,则实数m=.例题3、已知x 、y 取值如表:,则m=()A.1.5B.1.55C.3.5D.1.8随练1、某产品在某零售摊位的零售价x (单位:元)与每天的销售量y (单位:个)的统计资料如表所示:由表可得回归直线方程ˆy=ˆb x+ˆa 中的ˆb =﹣4,据此模型预测零售价为20元时,每天的销售量为()A.26个B.27个C.28个D.29个y 的统计数据如表:根据上表可得回归方程y=bx+a 的b 为9.2,据此模型预报广告费用为6万元时销售额为()A.63.6万B.65万C.66.1万D.67.7万数学成绩(x )(1)求物理成绩y 对数学成绩x 的线性回归方程;(2)当某位学生的数学成绩为70分时,预测他的物理成绩.参考公式:用最小二乘法求线性回归方程ˆˆˆy bx a =+的系数公式:1221ˆniii nii x ynxybxnx==-=-∑∑,ˆa y ax =-.参考数据:832+782+732+682+632+732=32224,83×75+78×65+73×75+68×65+63×60+73×80=30810.拓展1、5个学生的数学和物理成绩如下表:学生A B C D E学科数学8075706560物理7065686462画出散点图,判断它们是否具有相关关系.2、下列关系中,是相关关系的为()①学生的学习态度与学习成绩之间的关系;②教师的执教水平与学生的学习成绩之间的关系;③学生的身高与学生的学习成绩之间的关系;④家庭的经济条件与学生的学习成绩之间的关系.A.①②B.①③C.②③D.②④3、两个随机变量x,y的取值表为x0134y 2.2 4.3 4.8 6.7若x,y具有线性相关关系,且 y= b x+2.6,则下列四个结论错误的是()A.x与y是正相关B.当x=6时,y的估计值为8.3C.x每增加一个单位,y增加0.95个单位D.样本点(3,4.8)的残差为0.564、已知变量x和y满足关系y=﹣0.1x+1,变量y与z正相关,下列结论中正确的是()A.x与y负相关,x与z负相关B.x与y正相关,x与z正相关C.x与y正相关,x与z负相关D.x与y负相关,x与z正相关5、已知变量x与y正相关,且由观测数据算得样本平均数x=3,y=3.5,则由该观测数据算得的线性回归方程可能是()A.ˆy=0.4x+2.3B.ˆy=2x﹣2.4C.ˆy=﹣2x+9.5D.ˆy=﹣0.3x+4.46、某产品的广告费用x与销售额y的统计数据如表:根据表格已得回归方程为ˆy=9.4x+9.1,表中有一数据模糊不清,请推算该数据的值为________7、某产品的广告费用x与销售额y的统计数据如表:根据表格已得回归方程为ˆy=9.4x+9.1,表中有一数据模糊不清,请推算该数据的值为________。
【全程复习方略】(福建专版)高考数学 第九章 第五节变量间的相关关系课件 理
【反思·感悟】粗略判断相关性,可以观察一个变量随另一个 变量变化而变化的情况.画出散点图能够更直观的判断是否相关, 相关时是正相关还是负相关.
【变式训练】5个学生的数学和物理成绩如下表: 学生 学科 数学 物理 80 70 75 66 70 68 65 64 60 62
A
B
C
D
E
画出散点图,并判断它们是否有相关关系.
【提醒】对于任意一组样本数据,利用上述公式都可以求得 “回归方程”,如果这组数据不具有线性相关关系,即不存在 回归直线,那么所得的“回归方程”是没有实际意义的.因此, 对一组样本数据,应先作散点图,在具有线性相关关系的前提 下再求回归方程.
ˆ x+a ②直线 y ˆ =b ˆ 至少经过点(x1,y1),(x2,y2),„,(xn,yn)
)
中的一个点;
(
)
③直线 y ˆ = i 1 ˆ x+a ˆ =b ˆ 的斜率 b n
x y
i i 1
n
i
nx y
2
;
(
)
x i2 nx
ˆ x+a ˆ =b ˆ 和各点(x1,y1),(x2,y2),„,(xn,yn)的 ④直线 y
【解析】把数学成绩作为横坐标,把相应的物理成绩作为纵坐 标,在直角坐标系中描点(xi,yi)(i=1,2,„,5),作出散点 图如图.
从图中可以直观地看出数学成绩和物理成绩具有相关关系,且
当数学成绩增大时,物理成绩也在由小变大,即它们正相关 .
热点考向 2 【方法点睛】
线性回归方程及其应用
求样本数据的线性回归方程的步骤 第一步,计算平均数 x, y; 第二步,求和
2 是该坐标平面上所有直线与这些点的偏差 ˆ +a) 偏差 ˆ [yi-(bx ] i i 1 n
变量间的相关关系
变量间的相关关系1、相关关系的理解我们曾经研究过两个变量之间的函数关系:一个自变量对应着唯一的一个函数值,这两者之间是一种确定关系。
生活中的任何两个变量之间是不是只有确定关系呢?如:学生成绩与教师水平之间存在着某种联系,但又不是必然联系,对于学生成绩与教师水平之间的这种不确定关系,我们称之为相关关系。
这就是我们这节课要共同探讨的内容————变量间的相关关系。
例1、根据样本数据作出散点图,直观感知变量之间的相关关系。
在研究相关关系前,先回忆一下函数的表示方法有哪些——列表,画图象,求解析式。
下面我们就用这些方法来研究相关关系。
看这样一组数据:在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据,根据样本数据,人体的脂肪含量与年龄之间有怎样的关系?结论:随着年龄增长,脂肪含量在增加。
用x轴表示年龄,y轴表示脂肪。
一组样本数据就对应着一个点。
2、散点图这个图跟我们所学过的函数图象有区别,它叫作散点图。
3、判断正、负相关、线性相关:请观察这4幅图,看有什么特点?图1呈上升趋势,图2呈下降趋势。
这就像函数中的增函数和减函数。
即一个变量从小到大,另一个变量也从小到大,或从大到小。
对于图1中的两个变量的相关关系,我们称它为正相关。
图2中的两个变量的相关关系,称为负相关。
后面两个图很乱,前面两个图中点的分布呈条状。
从数学的角度来解释:即图1、2中的点的分布从整体上看大致在一条直线附近。
我们称图1、2中的两个变量具有线性相关关系。
这条直线叫做回归直线。
图3、4中的两个变量是非线性相关关系1、找回归直线下面我们再来看一下年龄与脂肪的散点图,图12图图3图4从整体上看,它们是线性相关的。
如果可以求出回归直线的方程,我们就可以清楚地了解年龄与体内脂肪含量的相关性。
这条直线可以作为两个变量具有线性相关关系的代表。
能否画出这条直线?多种方法展示总结:所有的点离这条直线最近的方案最好。
从整体上看,各点与此直线的距离和最小。
2015届高考数学总复习配套课件:9-4 变量间的相关关系、统计案例
提素能
高效 训练
病是________的(有关,无关).
解析:由观测值k=27.63与临界值比较,k>6.635,在犯错误的概率 山
东
不超过0.01的前提下认为打鼾与患心脏病有关系.
金
太
答案:有关
阳
书
业
有
限
公
司
菜 单 隐藏
第十四页,编辑于星期五:十点 十六分。
高考总复习 A 数学(文)
抓主干 考点 解密
限 公
系”.
司
菜 单 隐藏
第九页,编辑于星期五:十点 十六分。
高考总复习 A 数学(文)
抓主干 考点 解密
研考向
要点 探究
____________________[通关方略]____________________
悟典题
1.回归直线必过样本中心点( x , y ).
能力
提升
2.通常认为k≤2.706时,样本数据就没有充分的证据显示“X与Y
高效
训练
相关关系
;与函数关系不同, 相关关系 是 一 种 非 确 定 性 关
系.
山 东
2.从散点图上看,点分布在从左下角到右上角的区域内,两个变量
金 太
的这种相关关系称为
正相关,点分布在左上角到右下角的区域内,
阳 书
两个变量的相关关系为
负相.关
业 有
限
公
司
菜 单 隐藏
第二页,编辑于星期五:十点 十六分。
直线方程y^=b^x+a^.
太 阳
书
业
有
限
公
司
菜 单 隐藏
第二十四页,编辑于星期五:十点 十六分。
高二数学《变量间的相关关系》知识点
高二数学《变量间的相关关系》知识点
数学是研究数量、结构、变化、空间以及信息等概念的一门学科,下面是小编整理的高二数学《变量间的相关关系》知识点,希望对大家有帮助!
一、变量间的相关关系
1.常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定*关系.
2.从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关.
二、两个变量的线*相关
1.从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线*相关关系,这条直线叫回归直线.
当r>0时,表明两个变量正相关;
当r<0时,表明两个变量负相关.
r的绝对值越接近于1,表明两个变量的线*相关*越强.r的绝对值越接近于0时,表明两个变量之间几乎不存在线*相关关系.通常|r|大于
0.75时,认为两个变量有很强的线*相关*.
三、解题方法
1.相关关系的判断方法一是利用散点图直观判断,二是利用相关系数作出判断.
2.对于由散点图作出相关*判断时,若散点图呈带状且区域较窄,说明两个变量有一定的线*相关*,若呈曲线型也是有相关*.
3.由相关系数r判断时|r|越趋近于1相关*越强.。
2015高考数学一轮复习课件:10.3 变量间的相关关系
第十七页,编辑于星期五:十二点 十九分。
题型二 求回归直线方程 例 2 某产品的广告支出 x(单位:万元)与销售收入 y(单位: 万元)之间有下表所对应的数据:
广告支出 x(单位:万元) 1 2 3 4 销售收入 y(单位:万元) 12 28 42 56 (1)画出表中数据的散点图; (2)求出 y 对 x 的回归直线方程.
第二十九页,编辑于星期五:十二点 十九分。
解析: (1)根据表中所列数据可得散点图如图所示:
第三十页,编辑于星期五:十二点 十九分。
(2)计算得:x =255=5,y =2550=50,i=51x2i =145,i=51xiyi=1380.
5
xiyi-5 x y
i=1
于是可得b^=
5
=138104-5-5×5×5×52 50=6.5,
(1)利用所给数据求年需求量与年份之间的回归直线方程^y=
b^x+a^;
(2)利用(1)中所求出的直线方程求该地 2012 年的粮食需求
量.
第二十七页,编辑于星期五:十二点 十九分。
解析:(1)由所给数据看出,年需求量与年份之间是近似直线 上升,下面来配回归直线方程.为此对数据预处理如下:
年份-2006 -4 -2 0 2 4 需求量-257 -21 -11 0 19 29
(2)利用直线方程①,可求 2012 年的粮食需求量为 6.5×(2012-2006)+260.2=6.5×6+260.2=299.2(万吨).
第二十八页,编辑于星期五:十二点 十九分。
变式探究 3 某种产品的宣传费支出 x 与销售额 y(单位:万 元)之间有如下对应数据:
x2 4 5 6 8 y 30 40 60 50 70 (1)画出散点图; (2)求回归直线方程; (3)试预测宣传费支出为 10 万元时,销售额多大?
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五节 变量间的相关关系、统计案例1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系. 2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 3.了解下列两种常用的统计方法,并能应用这些方法解决一些实际问题.(1)独立检验:了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用. (2)回归分析:了解回归分析的基本思想、方法及其简单应用.知识梳理 1.散点图.(1)将变量所对应的点描出来,就组成了变量之间的一个图, 这种图为变量之间的________.(2)从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势可用一条光滑的曲线来近似,这种近似的过程称为曲线拟合.2.相关关系.(1)从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为________;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为________.(2)线性相关:从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做________.(3)若两个变量x 和y 的散点图中,所有点看上去都在某条曲线(不是一条直线)附近波动,则称此相关是__________的.如果所有的点在散点图中没有显示任何关系,则称变量间是不相关的.3.回归直线.(1)最小二乘法:如果有n 个点: (x 1,y 1),(x 2,y 2),…,(x n ,y n )可以用下面的表达式来刻画这些点与回归直线的接近程度: [y 1-(a +bx 1)]2+[y 2-(a +bx 2)]2+…+[y n -(a +bx n )]2,使得上式达到最小值的y ^=b ^x +a ^就是我们要求的直线,这种方法称为最小二乘法.(2)在回归直线方程y ^=b ^x +a ^中,b ^=∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2=∑i =1nx i y i -n x ·y∑i =1nx 2i -n x 2,a ^=________,其中x =x 1+x 2+…+x n n ,y =y 1+y 2+…+y n n.b ^叫做回归直线方程的斜率,a ^是直线在y 轴上的截距.4.相关系数.,用它来衡量两个变量间的线性相关关系.(1)当r >0时,表明两个变量________; (2)当r <0时,表明两个变量________;(3)r 的绝对值越接近1,表明两个变量的线性相关性________;r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r |>0.75时,认为两个变量有很强的线性相关关系.当|r |∈[0.3,0.75)时,相关性一般.当|r |∈[0,0.25]时,相关性较弱.5.残差分析.(1)线性回归模型:y =bx +a +e 中,a ,b 称为模型的未知参数;e 称为随机误差.(2)残差平方和:对于样本点(x i ,y i )(i =1,2,…,n ),Q =∑i =1n(y i -y )称为残差平方和,Q 值越小,说明线性回归模型的拟合效果越好.(3)相关指数:用相关指数R 2来刻画回归的效果,公式是R 2=1-∑i =1n(y i -y i )2∑i =1n(y i -y )2.R 2的值越大,说明残差平方和越小,也就是说模型拟合效果________. 6.独立性检验.(1)若变量的不同“值”表示个体所属的不同类型,则这类变量称为分类变量. (2)列出两个分类变量的频数表,称为列联表.(3)利用随机变量K 2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的________.2×2列联表y 1 y 2 总计 x 1 a b a +b x 2 c d c +d 总计 a +c b +d a +b +c +d 独立性检验公式K 21.散点图2.(1)正相关 负相关 (2)回归直线 (3)非线性相关3.(2)\o(y,\s\up6(-))-b \o(x,\s\up6(-)),4.(1)正相关 (2)负相关 (3)越强5.(3)越好6.(3)独立性检验 \f(n (ad -bc )2,(a +b )(a +c )(b +d )(c +d )),基础自测 1.下列命题:①任何两个变量都具有相关关系;②圆的周长与该圆的半径具有相关关系;③某商品的需求与该商品的价格是一种非确定性关系; ④根据散点图求得的回归直线方程可能是没有意义的; ⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.其中正确的命题为( )A .①③④B .②④⑤C .③④⑤D .②③⑤ 答案:C 2.(2013·武昌调研)通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还由算得K 2=110×(40×30-20×20)260×50×60×50≈7.8.附表:A .有99%以上的把握认为“选择过马路的方式与性别有关”B .有99%以上的把握认为“选择过马路的方式与性别无关”C .在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别有关”D .在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别无关”解析:因为K 2=110×(40×30-20×20)260×50×60×50≈7.8>6.635,所以有99%以上的把握认为“选择过马路的方式与性别有关”.答案:A3.(2012·新课标全国卷)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为________.解析:所有点均在直线上,则样本相关系数最大即为1. 答案:14.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析: 由题意得y ^2-y ^1=[0.254(x +1)+0.321]-[0.254x +0.321]=0.254,即家庭年收入每增加1万元,年饮食支出平均增加0.254万元.答案:0.2541.(2013·湖北卷)四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=2 347x -6 423;②y 与x 负相关且y ^=-3 476x +5 648;③y 与x 正相关且y ^=5.437x +8.493;④y 与x 正相关且y ^=-4.326x -4.578. 其中一定不正确的结论的序号是( ) A .①② B .②③ C .③④ D .①④解析:①回归方程中x 的系数为正,不是负相关;④方程中的x 的系数为负,不是正相关,所以①④一定不正确.答案:D2.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名(1)(2)用分层抽样方法在收看新闻节目的观众中随机抽取5名大于40岁的观众应该抽取几名?(3)在上述抽取的5名观众中任取2名,求恰有1名观众年龄为20至40岁的概率. 解析:(1)有关.收看新闻节目多为年龄大的.(2)应抽取的人数为:5×2745=3(人).(3)由(2)知,抽取的5名观众中,有2名观众年龄处于20至40岁,3名观众的年龄大于40岁.记大于40岁的人为a 1,a 2,a 3,20至40岁的人为b 1,b 2,则从5人中抽取2人的基本事件有(a 1,a 2),(a 1,a 3),(a 2,a 3),(b 1,b 2),(a 1,b 1),(a 1,b 2),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2),共10个,其中恰有1人为20至40岁的基本事件有(a 1,b 1),(a 1,b 2),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2),共6个,因此所求的概率P =610=35.1.(2013·梅州一模)在2014年1月15日当天,某物价部门对本市的5家商场的某商品由散点图可知,y ^=-3.2x +40,且m +n =20,则其中的n =____________.解析:x -=15(9+9.5+m +10.5+11)=15(40+m ),y -=15(11+n +8+6+5)=15(30+n )因为其线性回归直线方程是:y ^=-3.2x +40,所以15(30+n )=-3.2×15(40+m )+40,即30+n =-3.2(40+m )+200,又m +n =20, 解得m =n =10. 答案:102.下表提供了某厂节能降耗技术改造后在生产A 产品过程中记录的产量x (吨)与相应的生产能耗y (吨)根据上表提供的数据,求出y 关于x 的线性回归方程为y =0.7x +0.35,那么表中t 的值为( )A .3B .3.15C .3.5D .4.5解析:由y ^=0.7x +0.35得2.5+t +4+4.54=0.7×3+4+5+64+0.35⇒11+t 4=3.5⇒t =3,故选A.答案:A。