2015届高考数学总复习 基础知识名师讲义 第九章 第五节 变量间的相关关系、统计案例 理

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第五节 变量间的相关关系、统计案例

知识梳理 1.散点图.

(1)将变量所对应的点描出来,就组成了变量之间的一个图, 这种图为变量之间的________.

(2)从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势可用一条光滑的曲线来近似,这种近似的过程称为曲线拟合.

答案:1.(1)散点图

2.相关关系.

(1)从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为____________;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为____________.

(2)线性相关:从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做____________.

(3)若两个变量x 和y 的散点图中,所有点看上去都在某条曲线(不是一条直线)附近波动,则称此相关是______________的.如果所有的点在散点图中没有显示任何关系,则称变量间是不相关的.

答案:2.(1)正相关 (2)回归直线 (3)非线性相关

3.回归直线.

(1)最小二乘法:如果有n 个点:(x 1,y 1),(x 2,y 2),…,(x n ,y n )可以用下面的表达式来刻画这些点与回归直线的接近程度: [y 1-(a +bx 1)]2+[y 2-(a +bx 2)]2+…+[y n -(a

+bx n )]2,使得上式达到最小值的y ^=b ^x +a ^

就是我们要求的直线,这种方法称为最小二乘法.

(2)在回归直线方程y ^=b ^x +a ^中,b ^

∑i =1

n

x i -x

y i -y

∑i =1

n

x i -x

2

∑i =1

n

x i y i -n x

·y

∑i =1

n

x 2

i -n x

2

,a

^1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.

2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.

3.了解下列两种常用的统计方法,并能应用这些方法解决一些实际问题. (1)独立检验:了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用;

(2)回归分析:了解回归分析的基本思想、方法及其简单应用.

=________,其中x =

x 1+x 2+…+x n n ,y =y 1+y 2+…+y n n

.b ^叫做回归直线方程的斜率,a

^

是直线在y 轴上的截距.

答案:3.y -b ^

x

4.相关系数.

r

∑i =1

n

x i -x

y i -y

∑i =1

n

x i -x

2

y i -y

2

,用它来衡量两个变量间的线性相关关系.

(1)当r >0时,表明两个变量________; (2)当r <0时,表明两个变量________;

(3)r 的绝对值越接近1,表明两个变量的线性相关性______;r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r |>0.75时,认为两个变量有很强的线性相关关系.当|r |∈[0.3,0.75)时,相关性一般.当|r |∈[0,0.25]时,相关性较弱.

答案:4.(1)正相关 (2)负相关 (3)越强

5.残差分析.

(1)线性回归模型:y =bx +a +e 中,a ,b 称为模型的未知参数;e 称为随机误差.

(2)残差平方和:对于样本点(x i ,y i )(i =1,2,…,n ),Q =∑i =1

n

(y i -y )称为残差平方

和,Q 值越小,说明线性回归模型的拟合效果越好.

(3)相关指数:用相关指数R 2来刻画回归的效果,公式是R

2

= . R 2的值越大,说明残差平方和越小,也

就是说模型拟合效果______.

答案:5.越好

6.独立性检验.

(1)若变量的不同“值”表示个体所属的不同类型,则这类变量称为分类变量. (2)列出两个分类变量的频数表,称为列联表.

(3)利用随机变量K 2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的________.

2×2列联表

独立性检验公式K 2=__________________.

答案:6.(3)独立性检验

n (ad -bc )2

(a +b )(c +d )(a +c )(b +d )

基础自测

1.下列命题:

①任何两个变量都具有相关关系;②圆的周长与该圆的半径具有相关关系;③某商品的需求与该商品的价格是一种非确定性关系;④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.

其中正确的命题为( )

A .①③④

B .②④⑤

C .③④⑤

D .②③⑤

答案:C

2.(2013·武昌调研)通过随机询问110名性别不同的行人,对过马路是愿意走斑马线

由K 2=n (a +b )(c +d )(a +c )(b +d ),算得K 2

260×50×60×50

≈7.8.

附表:

A .有99%以上的把握认为“选择过马路的方式与性别有关”

B .有99%以上的把握认为“选择过马路的方式与性别无关”

C .在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别有关”

D .在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别无关”

解析:因为K 2

=110×(40×30-20×20)260×50×60×50

≈7.8>6.635,所以有99%以上的把握认为

“选择过马路的方式与性别有关”.

答案:A

3.(2012·新课标全国卷)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,

x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =1

2

x

+1上,则这组样本数据的样本相关系数为__________________.

解析:所有点均在直线上,则样本相关系数最大即为1. 答案:1

4.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:

相关文档
最新文档