2013高考数学复习课件 10.2 变量的相关关系 统计案例 理 新人教版
高考数学复习统计与统计案例概率节变量间的相关关系与统计案例文新人教A版PPT课件
![高考数学复习统计与统计案例概率节变量间的相关关系与统计案例文新人教A版PPT课件](https://img.taocdn.com/s3/m/367dfd40fd4ffe4733687e21af45b307e871f924.png)
解析 易求-x=9,-y=4,样本点中心(9,4)代入验证,满足y^=0.7x-2.3.
答案 C
3.两个变量y与x的回归模型中,分别选择了4个不同模型,它 们的相关指数R2如下,其中拟合效果最好的模型是( ) A.模型1的相关指数R2为0.98 B.模型2的相关指数R2为0.80 C.模型3的相关指数R2为0.50 D.模型4的相关指数R2为0.25 解析 在两个变量y与x的回归模型中,它们的相关指数R2越
最新考纲 1.会作两个有关联变量的数据的散点图,会利用 散点图认识变量间的相关关系;2.了解最小二乘法的思想, 能根据给出的线性回归方程系数公式建立线性回归方程(线性 回归方程系数公式不要求记忆);3.了解独立性检验(只要求 2×2列联表)的基本思想、方法及其简单应用;4.了解回归分 析的基本思想、方法及其简单应用.
到
的区
域,两个变量的这种相关关系称为一负条相直关线.
(3)如果散点图中点的分布从整体上看大致在
2.线性回归方程
(1)最小二乘法:使得样本数据的点到回归直线的 距离的平方最和小的方法叫做最
小二乘法.
(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(xn,
yn),其回归方程为
知识
1.相关关系与回归分析 梳 理 回归分析是对具有相关关系的两个变量进行统计分析的一种
常用方法;判断相散关点性图的常用统计图是:
;统左计下量角有相关右系上数角与相关指数.
(1)在散点图中,点散布在从
到
的区
域,对于两个变量的这左种上相角关关系右,下我角们将它称为正相关.
(2)在散点图中,点散布在从
≈4.844.
则
认
为
高考数学10.2用样本估计总体与变量间的相关关系
![高考数学10.2用样本估计总体与变量间的相关关系](https://img.taocdn.com/s3/m/215582e619e8b8f67c1cb9e5.png)
2013版高考数学一轮复习精品学案:第十章统计、统计案例10.2用样本估计总体与变量间的相关关系【高考新动向】一、用样本估计总体(一) 考纲点击1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点;2.理解样本数据标准差的意义和作用,会计算数据标准差;3.能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释;4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想;5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.(二)热点提示1.频率分布直方图、茎叶图、平均数、方差、标准差是考查的重点,同时考查对样本估计总体的思想的理解;2. 频率分布直方等内容经常与概率等知识相结合出题;3.题型以选择题和填空题为主,属于中低档题。
二、变量间的相关关系(一)考纲点击1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系;2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.(二)热点提示1.以考查线性回归系数为主,同时可考查利用散点图判断两个变量间的相关关系;2.以实际生活为背景,重在考查回归方程的求法;3.在高考题中本部分的命题主要是以选择、填空题为主,属于中档题目。
【考纲全景透析】一、用样本估计总体1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差);(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布表.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图;(2)总体密度曲线:随着样本容量的增加,作图所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.3.标准差和方差(1)标准差是样本数据到平均数的一种平均距离;(2)x是样本数(3)方差: (n据,n是样本容量,x是样本平均数)注:现实中的总体所包含个体数往往是很多的,如何求得总体的平均数和标准差呢?(通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差,这与有样本的频率分布近似代替总体分布是类似的,只要样本的代表性好,这样做就是合理的,也是可以接受的.)4.利用频率分布直方图估计样本的数字特征(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值;(2)平均数:平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和;(3)众数:在频率分布直方图中,众数是最高的矩形的中点的横坐标.二、变量间的相关关系1.两个变量的线性相关(1)正相关在散点图中,点散布在从左下角到右上角的区域.对于两个变量的这种相关关系,我们将它称为正相关.(2)负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关. (3)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.2.回归方程 (1)最小二乘法求回归直线使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法. (2)回归方程方程ˆybx a =+是两个具有线性相关关系的变量的一组数据1122(,),(,),(,)n n x y x y x y L 的回归方程,期中,a b 是待定参数.1122211()()()nni i i ii i n ni i i i x x y y x y nx yb x x x nx a y bx====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑ 注:相关关系与函数关系的异同点(相同点:两者均是指两个变量的关系.不同点:①函数关系是一种确定的关系,相关关系是一种非确定的关系;②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系)【热点难点全析】一、用样本估计总体(一)频率分布直方图在总体估计中的应用 ※相关链接※频率分布直方图反映样本的频率分布(1)频率分布直方图中横坐标表示组距,纵坐标表示频率组距,频率=组距×频率组距. (2)频率分布直方图中各小长方形的面积之和为1,因此在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.(4)众数为最高矩形中点的横坐标.(5)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标.※例题解析※〖例〗为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图,图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学生全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.思路解析:利用面积求得每组的频率→求样本容量→求频率和→求达标率→分析中位数.解答:(1)由已知可设每组的频率为2x,4x,17x,15x,9x,3x.则2x+4x+17x+15x+9x+3x=1,解得x=0.02.则第二小组的频率为0.02×4=0.08,样本容量为12÷0.08=150.(2)次数在110次以上(含110次)的频率和为17×0.02+15×0.02+9×0.02+3×0.02=0.88,则高一学生的达标率为0.88×100%=88%.(3)在这次测试中,学生跳绳次数的中位数落在第四组.因为中位数为平分频率分布直方图的面积且垂直于横轴的直线与横轴交点的横坐标.注:利用样本的频率分布可近似地估计总体的分布,要比较准确地反映出总体分布的情况,必须准确地作出频率分布表和频率分布直方图,充分利用所给的数据正确地作出估计.(二)用样本的分布估计总体※相关链接※茎叶图刻画数据的优点(1)所有的数据信息都可以从茎叶图中得到.(2)茎叶图便于记录和表示,且能够展示数据的分布情况.注:当数据是两位有效数字时,用茎叶图显得容易、方便.而当样本数据较大和较多时,用茎叶图表示,就显得不太方便.※例题解析※〖例〗在某电脑杂志的一篇目文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17.在某报纸的一篇文章中,每个句子中所含的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.(1)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,得到什么结论?思路解析:(1)将十位数字作为茎,个位数字作为叶,逐一统计;(2)根据茎叶图分析两组数据,得到结论.解答:(1)如图:(2)电脑杂志上每个句子的字数集中在10~30之间,中位数为22.5;而报纸上每个句子的字数集中在10~40之间,中位数为27.5.可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.说明电脑杂志作为读物须通俗易懂、简明.(三)用样本的数字特征估计总体的数字特征〖例〗甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价.思路解析:(1)先通过图象统计出甲、乙二人的成绩;(2)利用公式求出平均数、方差,再分析两人的成绩,作出评价.解答:(1)由图象可得甲、乙两人五次测试的成绩分别为 甲:10分,13分,12分,14分,16分; 乙:13分,14分,12分,12分,14分.2222222222221013121416==1351314121214==1351=[(1013)(1313)(1213)(1413)(1613)]451[(1313)(1413)(1213)(1213)(1413)]0.85x x s s ++++++++-+-+-+-+-==-+-+-+-+-=甲乙甲乙,(2)由2s 甲>2s 乙可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.注:(1)运用方差解决问题时,注意到方差越大,波动越大,越不稳定;方差越小,波动越小,越稳定.(2)平均数与方差都是重要的数字特征,是对总体的一种简单的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(3)平均数、方差的公式推广①若数据123,,,,n x x x x L 的平均数为x ,那么12,,,n mx a mx a mx a +++L 的平均数是mx a +.②数据123,,,,n x x x x L 的方差为2s . a.22222111[()];n s x x x nx n=+++-L b.数据12,,,n x a x a x a +++L 的方差也为2s ; c.数据12,,,n ax ax ax L 的方差为22a s . 二、变量间的相关关系(一)利用散点图判断两个变量的相关关系 ※相关链接※ 1.散点图在散点图中,如果所有的样本点都落在某一函数的曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.注:函数关系是一种理想的关系模型,而相关关系是一种更为一般的情况. 2.正相关、负相关从散点图可知,即一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.如年龄的值由小变大时,体内脂肪含量也在由小变大.反之,如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关. ※例题解析※〖例〗在某地区的12~30岁居民中随机抽取了10个人的身高和体重的统计资料如表:根据上述数据,画出散点图并判断居民的身高和体重之间是否有相关关系。
高考数学大一轮复习 第十章 统计与统计案例 10.3 变量
![高考数学大一轮复习 第十章 统计与统计案例 10.3 变量](https://img.taocdn.com/s3/m/a4f06e3e4a7302768e99393e.png)
思考辨析
判断下列结论是否正确(请在括号中打“√”或“×”) (1)相关关系与函数关系都是一种确定性的关系 ,也是一种因果关 系.( × ) (2)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关 关系.( √ ) (3)只有两个变量有相关关系,所得到的回归模型才有预测价值.( √ )
(4)某同学研究卖出的热饮杯数y与气温x(℃)之间的关系,得回归方程 y^ =-2.352x+147.767,则气温为2℃时,一定可卖出143杯热饮.( × ) (5) 事 件 X , Y 关 系 越 密 切 , 则 由 观 测 数 据 计 算 得 到 的 K2 的 观 测 值 越 大.( √ ) (6)由独立性检验可知,有99%的把握认为物理成绩优秀与数学成绩有 关,某人数学成绩优秀,则他有99%的可能物理优秀.( × )
行调查.经过计算得K2≈3.855,那么就有____9_5___%的把握认为用电
脑时间与视力下降有关系. 答案 解析
P(K2≥k0) 0.05 0.025 0.010 0.005 0.001
k0
3.841 5.024 6.635 7.879 10.828
根据表格发现3.855>3.841,3.841对应的是0.05,所以根据独立性检验 原理可知有95%的把握认为用电脑时间与视力下降有关系.
x)(
y i
பைடு நூலகம்
y)
(xi
y) i
nx
y
i 1
i 1
b^
n
n
2
=_____i1_(x_i_ _x_)2 ______=_____i1_x_i2_ n_x_______
^
a
高三数学(文)一轮复习课件:10.3变量间的相关关系、统计案例
![高三数学(文)一轮复习课件:10.3变量间的相关关系、统计案例](https://img.taocdn.com/s3/m/c71ba7bb284ac850ad0242f3.png)
(3)独立性检验 独立性假设 来确定是 利用随机变量、_____________ 否一定有把握认为“两个分类变量有关系”的方法称为两个 分类变量的独立性检验.
4/17/2018
1.判断两个分类变量是彼此相关还是相互独立的常用方法中, 最为精确的是( ) A.三维柱形图 B.二维条形图 C.等高条形图 D.独立性检验
y1 y2 总计
x1
x2 总计
a
c a+c
b
d b+d
a+b
c+d a+b+c+d
4/17/2018
nad-bc2 a+bc+da+cb+d ,其中 构造一个随机变量K2=_______________________
n=______________ a+b+c+d 为样本容量.
【解析】 据相关指数的定义可知,相关指数R2的值越大,
残差平方和越小,即模型的拟合效果越好.
【答案】 A
4/17/2018
3.有关线性回归的方法,不正确的是 ( ) A.相关关系的两个变量是非确定关系 B.散点图能直观地反映数据的相关程度 C.回归直线最能代表线性相关的两个变量之间的关系 D.散点图中的点越集中,两个变量的相关性越强
4/17/2018
2.回归方程 (1)最小二乘法 求回归直线使得样本数据的点到回归直线的 距离的平方和 最小 的方法叫做最小二乘法. (2)回归方程 ˆ bx a 是两个具有线性相关关系的变量的一组数据 方程 y (x1,y1) , (x2,y2) ,…, (xn,yn)的回归方程,其中 a,b 是待定参数.
10.3 变量间的相关关系、统计案例
1.两个变量的线性相关 (1)正相关 在散点图中,点散布在从 左下角 到 右上角 的区域,对于 两个变量的这种相关关系,我们将它称为正相关. (2)负相关 在散点图中,点散布在从 左上角 到 右下角 的区域,对于 两个变量的这种相关关系,我们将它称为负相关.
2013届高考一轮数学复习理科课件(人教版)第5课时 线性回归分析与统计案例
![2013届高考一轮数学复习理科课件(人教版)第5课时 线性回归分析与统计案例](https://img.taocdn.com/s3/m/9613af0503d8ce2f006623a4.png)
高考调研
高三数学(新课标版· 理)
【解析】 以 x 轴表示身高,y 轴表示体重,可得到 相应的散点图如图所示:
由散点图可知, 两者之间具有相关关系, 且为正相关.
第十章
第5课时
高考调研
高三数学(新课标版· 理)
题型二
例2
利用回归方程对总体进行估计
(2011· 安徽文)某地最近十年粮食需求量逐年上升,
第十章
第5课时
高考调研
高三数学(新课标版· 理)
探究 1 散点图是由大量数据点分布构成的, 是定义 在具有相关关系的两个变量基础之上的, 对于性质不明确 的两组数据可先作散点图, 直观地分析它们有无关系及关 系的密切程度.
第十章
第5课时
高考调研
高三数学(新课标版· 理)
思考题 1 在某地区的 12~30 岁居民中随机抽取了 10 个人的身高和体重的统计资料如表: 身高 143 156 159 172 165 171 177 161 164 160 (cm) 体重 41 (kg) 49 61 79 68 69 74 69 68 54
答案 C
解析 根据独立性检验的思想方法,正确选项为 C.
第十章
第5课时
高考调研
高三数学(新课标版· 理)
3.甲、乙、丙、丁四位同学各自对 A、B 两变量的 线性相关性作试验, 并用回归分析方法分别求得相关系数 r 与残差平方和 m 如下表: 甲 乙 丙 丁
r 0.82 0.78 0.69 0.85 m 115 106 124 103
^
第十章
第5课时
高考调研
高三数学(新课标版· 理)
n n xi- x yi- y xiyi-n x y i=1 i=1 = b= n n 2 xi- x x2-n x 2 i i=1 i=1 a= y -b x ( x , y )称为样本点的中点.
高三数学 变量的相关性与统计案例复习课件 新人教A版
![高三数学 变量的相关性与统计案例复习课件 新人教A版](https://img.taocdn.com/s3/m/e9a5397fa76e58fafab003bb.png)
ppt精选
15
5.独立性检验 (1)分类变量:变量的不同“值”表示个体所属的 不同类型 ,像这类变量称为分类变量. (2)列联表:列出两个分类变量的频数表 ,称为列 联表.假设有两个分类变量 X 和 Y,它们的可能取值分 别为{x1,x2}和{y1,y2},其样本频数列联表(称为 2×2 列联表)为
ppt精选
4
理基础 明考向
悟题型 课时作业
ppt精选
5
研
ppt精选
6
知识梳理
1.两个变量的线性相关 (1)正相关. 在散点图中,点散布在从 左下角 到右上角的区域,对 于两个变量的这种相关关系,我们将它称为正相关.
ppt精选
7
(2)负相关. 在散点图中,点散布在从左上角到 右下角的区域,两个变 量的这种相关关系称为负相关. (3)线性相关关系、回归直线. 如果散点图中点的分布从整体上看大致在 一条直线附近 , 就称这两个变量之间具有线性相关关系,这条直线叫做回归直 线.
ppt精选
25
解析:由图1可知,各点整体呈递减趋势,x与y负相 关,由图2可知,各点整体呈递增趋势,u与v正相关.
答案:C
ppt精选
26
4.下面是一个 2×2 列联表
y1
y2
合计
x1
a 21 73
x2
2 25 27
合计 b 46 则表中 a、b 处的值分别为__________.
ppt精选
27
解析:∵a+21=73,∴a=52.又∵a+2=b,∴b=54. 答案:52、54
C.66.5万元
D.73.5万元
ppt精选
22
解析:由表中数据可知-x =3+4+4 5+6=4.5,
2013届高考数学考点回归总复习《第十模块 概率与统计 随机抽样 用样本估计 总体 变量间的相互关》课件
![2013届高考数学考点回归总复习《第十模块 概率与统计 随机抽样 用样本估计 总体 变量间的相互关》课件](https://img.taocdn.com/s3/m/69194ae5102de2bd96058830.png)
1 [( x1 x ) 2 ( x2 x ) 2 ( xn x ) 2 ], 其中s 2 表示样本 n 方差, s表示样本标准差.
5.两个变量的相关关系
(1)当自变量的取值一定时,因变量的取值带有随机性,这两个
变量乊间的关系叫做相关关系.
如果一个变量的值由小变大时,另一个变量的值也在由小到大 ,这种相关称为正相关;反乊,如果一个变量的值由小变大时, 另一个变量的值在由大到小,这种关系称为负相关.变量间 的这种关系不函数关系丌同,它是一种非确定关系.
×n=7,n=15,选B.
2.(2010·湖北)将参加夏令营的600名学生编号为
:001,002,…,600.采用系统抽样方法抽取一个容量为50的样
本,且随机抽得的号码为003.这600名学生分住在三个营区,
从001到300的第Ⅰ营区,从301到495在第Ⅱ营区,从496到 600在第Ⅲ营区,三个营区被抽中的人数依次为( ) A.26,16,8 C.25,16,9 B.25,17,8 D.24,17,9
第三种方式抽样的步骤如下:第一步,分层.因为若按成绩分,其
中优秀生共150人,良好生共600人,普通生共250人,所以在
抽取样本时,应该把全体学生分成三个层次;第二步,确定各
150 600 250 , , , 10 10 10
个层次抽取的人数.因为样本容量不总体的个数乊比为 100:1000=1:10,所以在每个层次中抽取的个体数依次为 即15,60,25;第三步,按层次分别抽取.在优秀生中 用简单随机抽样法抽15人;在良好生中用简单随机抽样法 抽取60人;在普通生中用简单随机抽样法抽取25人.
法,若有某些层面应抽取的个体数目丌是整数时,可作适当
的绅微调整.
【全程复习方略】2013版高中数学 (主干知识+典例精析)10.3变量的相关性与统计案例课件 理 新人教B版
![【全程复习方略】2013版高中数学 (主干知识+典例精析)10.3变量的相关性与统计案例课件 理 新人教B版](https://img.taocdn.com/s3/m/5f87961952d380eb62946dfc.png)
260 6.5 ,„„„„„„„„„„„„„„„„„„6分 40
a y bx 3.2 .由上述计算结果,知所求回归直线方程为
y 257 b x 2 006 a 6.5 x 2 006 3.2 ,
„„„„„„„„„„„„„„„„„„„„„„„„„8分
0 6 3 0 3 6 1 , 于是有 x 173, 176 , b y 2 2 2
0 3 3 a 176 173 1 3 ,得回归直线方程为 y x 3 ,所以当x=182时,
=185. y
又∵a+2=b,∴b=54.
(2)∵χ2=27.63>6.635, ∴我们有99%的把握认为“打鼾与患心脏病有关”. 答案:(1)52、54 (2)有关
求回归直线方程及其应用
【方法点睛】
求样本数据的回归直线方程的步骤
第一步,计算平均数 x , y ; 第二步,求和 x i yi
i 1
n
n
,
i i
即 y 6.5 x 2 006 260.2 .
„„„„„„„„„„„10分
(2)利用所求得的直线方程,可预测该地2012年的粮食需求量为 6.5×(2 012-2 006)+260.2=6.5×6+260.2
=299.2(万吨)≈300(万吨).„„„„„„„„„„„„12分
2
由于12.38>6.635,所以有99%的把握认为产品是否合格与设备 改造有关.
【反思·感悟】准确计算χ2是关键.能有多大的把握认为两个变
量有关,应熟悉常用的临界值与χ2的大小关系.
【满分指导】回归直线方程解答题的规范解答
高考数学总复习 第10章 第3节 变量间的相关关系、统计案例课件 新人教A版
![高考数学总复习 第10章 第3节 变量间的相关关系、统计案例课件 新人教A版](https://img.taocdn.com/s3/m/43ceeb0ea26925c52cc5bfe1.png)
1.会作两个有关联变量数据的散点图,会利用散点图认识 变量间的相关关系.
2.了解最小二乘法的思想,能根据给出的线性回归方程系 数公式建立线性回归方程.
3.了解下列常见的统计方法,并能应用这些方法解决一些 实际问题.
(1)了解独立性检验(只要求2×2列联表)的基本思想、方法及 其简单应用.
法二:将表中的五组数值分别代入选项验证,可知y= 答88案+:12xC最适合.
4.(2011辽宁高考)调查了某地若干户家庭的年收入 x(单位:万元)和年饮食支出y(单位:万元),调查显示年收 入x与年饮食支出y具有线性相关关系,并由调查数据得到y 对x的回归直线方程: ^y =0.254x+0.321.由回归直线方程可 知,家庭年收入每增加1万元,年饮食支出平均增加 ________万元.
父亲身高x(cm) 174 176 176 176 178 儿子身高y(cm) 175 175 176 177 177
则y对x的线性回归方程为( )
A.y=x-1
B.y=x+1
C.y=88+12x
D.y=176
解析:法一:由线性回归直线方程过样本中心 (176,176),排除A、B答案,结合选项可得C为正确答案.
距离的
2.回归方程 方程 ^y =bx+a是两个具有线性相关关系的变量的一组 数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中a,b 是待定参数.
三、回归分析
1.定义:对具有 常用方法.
相关的关两系个变量进行统计分析的一种
2.随机误差:线性回归模型用y=bx+a+e表示,其中a和b
2×2列联表
x1
x2 总计
y1 a c a+c
高考数学 第十章 第3课时 变量间的相关关系、统计案例复习课件 新人教A版
![高考数学 第十章 第3课时 变量间的相关关系、统计案例复习课件 新人教A版](https://img.taocdn.com/s3/m/7d762f541eb91a37f1115c69.png)
1.(2014·河北石家庄市质量检测) 设 (x1,y1),(x2,y2),…,(xn,yn)是变 量 x 和 y 的 n 个样本点,直线 l 是由 这些样本点通过最小二乘法得到的线 性回归方程(如图),以下结论中正确 的是( C ) A.x 和 y 正相关 B.x 和 y 的相关系数为直线 l 的斜率 C.x 和 y 的相关系数在-1 到 0 之间
D.当 n 为偶数时,分布在 l 两侧的样本点的个数一定相同
【解析】 由图知,回归直线的斜率为负值,所以 x 与 y 是 负相关,且相关系数在-1 到 0 之间,所以 C 正确.
4.独立性检验 (1)分类变量的定义 如果某种变量的不同“值”表示个体所属的不同类别,像这 样的变量称为分类变量. (2)2×2 列联表 一般地,假设有两个分类变量 X 和 Y,它们的值域分别为{x1, x2}和{y1,y2},其样本频数列联表(称为 2×2 列联表)为
Hale Waihona Puke x1x2 总计y1 a
c a+c
中,( x , y )称为样本点的中心.
(3)相关系数 当 r>0 时,表明两个变量___正__相__关____; 当 r<0 时,表明两个变量___负__相__关____.
r 的绝对值越接近于 1,表明两个变量的线性相关性_越__强___. r 的绝对值越接近于 0,表明两个变量之间几乎不存在线性 相关关系.通常|r|大于__0_._7_5___时,认为两个变量有很强的 线性相关性.
① y 与 x 负相关且^y=2.347x-6.423;② y 与 x 负相关且^y=
-3.476x+5.648;③ y 与 x 正相关且^y=5.437x+8.493;④ y
2013届高考数学(理)一轮复习课件第九章第四节变量间的相关关系、统计案例(广东专用)
![2013届高考数学(理)一轮复习课件第九章第四节变量间的相关关系、统计案例(广东专用)](https://img.taocdn.com/s3/m/704c1d04b90d6c85ec3ac696.png)
1.两个变量的线性相关 如果散点图中点的分布从整体上看大致在 ____一__条__直__线__附__近______,就称这两个变量之间具有线性相 关关系,这条直线叫做回归直线. 2.回归方程 (1)最 小 二 乘 法 : 使 得 样 本 数 据 的 点 到 回 归 直 线 的 ____距__离__的__平__方______和最小的方法叫最小二乘法. (2)回归方程:两个具有线性相关关系的变量的一组数
∧
即y=6.5(x-2 006)+260.2.①
(2)利用直线方程①,可预测 2012 年的粮食需求量为
6.5×(2 012-2 006)+260.2=6.5×6+260.2=299.2(万吨)≈300(万 吨).
1.(1)解答本题将年份-2006,需求量-257,有利于 计算,进而由回归直线方程进行有效地预测分析.(2)正确
总计
甲校
40 70 110
乙校
20 70 90
总计
60 140 200
k=2010104×0×907×0-602×0×147002≈4.714 又因为 4.714>3.841 故能在犯错误的概率不超过 0.05 的前 提下认为“两个学校的数学成绩有差异”.
1.独立性检验的关键是准确的计算 K2,在计算时,要 充分利用 2×2 列联表.
对预处理后的数据,容易算得 x =0, y =3.2,
b∧=-4×-21+42-+222×+2-2+114+2 2×19+4×29=24600=6.5,
∧
∧
∴a= y -b x =3.2,
由上述计算结果,知所求回归直线方程为
∧
∧
∧
y-257=b (x-2 006)+a=6.5(x-2 006)+3.2
高考数学复习课件 10.2 变量的相关关系 统计案例 理 新人教版
![高考数学复习课件 10.2 变量的相关关系 统计案例 理 新人教版](https://img.taocdn.com/s3/m/85f5cc7752d380eb63946d01.png)
作文成绩优秀 作文成绩一般 合计
课外阅读量较大
22
课外阅读量一般
8
合计
30
10
32
20
28
30
60
由以上数据计算得出K2≈9.643,根据临界值表,以下
说法正确的是
()
A.没有充足的理由认为课外阅读量大与作文成绩优
秀有关
B.有0.5%的把握认为课外阅读量大与作文成绩优秀
有关
C.有99.9%的把握认为课外阅读量大与作文成绩优
2.对具有相关关系的两个变量进行统计分析时,首 先进行相关性检验,在确认具有线性相关关系后,再求回 归直线方程.
3.独立性检验的一般步骤 (1)根据样本数据制成2×2列联表. (2)根据公式
K2=
nad-bc2 a+bc+da+c
b+d,计算
K2
的值.
(3)根据K2与临界值的大小关系作统计推断. 4.判断回归模型的基本步骤 (1)确定研究对象,明确哪个变量是解释变量,哪个 变量是预报变量; (2)画出确定好的解释变量和预报变量的散点图,观 察它们之间的关系(如是否存在线性关系等);
10
xiyi-1i2=27.51, xiyi=33.72,b=
≈0.813 6,
i=1
i=1
10
xi2-10 x 2
i=1
a=1.42-1.74×0.813 6≈0.004 3, 所以回归方程为^y=0.813 6x+0.004 3.
考点三 独立性检验
【案例3】 调查某医院某段时间内婴儿出生的时间
施化肥量x 15 20 25 30 35 40 45
棉花产量y 330 345 365 405 445 450 455
高考数学总复习 第十章第3课时 变量的相关性、统计案例课件 新人教
![高考数学总复习 第十章第3课时 变量的相关性、统计案例课件 新人教](https://img.taocdn.com/s3/m/27022729e3bd960590c69ec3d5bbfd0a7956d5a3.png)
•
栏目 导引
③学生的身高与学生的学习成绩之间的
关系;
④家庭的经济条件与学生的学习成绩之
间的关系.
A.①②
B.①③
C.②③
D.②④
答案:A
2.有关线性回归的说法,不正确的是 () A.具有相关关系的两个变量是非确定关 系 B.散点图能直观地反映数据的相关程度
C.回归直线最能代表线性相关的两个变 量之间的关系 D. 散 点 图 中 的 点 越 集 中 , 两 个 变 量 的 相 关性越强 答案:D
3.独立性检验 (1)假设有两个分类变量X和Y,它们的值 域分别为{x1,x2}和{y1,y2},其样本频数列 联表(称为2×2列联表)为:
nn11n22-n12n212
χ2=___n_1+_n_2_+_n_+_1_n_+_2___(其中n=n11+n21
+n12+n22为样本容量)
(2)两个临界值:3.841与6.635. 对于事件A与B, 当_χ_2_>_3_._8_4_1___时,有95%的把握说事件 A与B有关; 当χ2>6.635时,有99%的把握说事件A与 B有关; 当__χ2_≤_3_._8_4_1___时,认为事件A与B是无关 的.
•13、在教师手里操着幼年人的命运,便操着民族和人类的命运。2022/1/182022/1/18January 18, 2022
•14、孩子在快乐的时候,他学习任何东西都比较容易。
•15、纪律是集体的面貌,集体的声音,集体的动作,集体的表情,集体的信念。
•16、一个人所受的教育超过了自己的智力,这样的人才有学问。
互动探究 2.在本例条件下,如果随机抽查这个班的 一名学生,那么抽到积极参加班级工作 的学生的概率是多少?抽到不太主动参 加班级工作且学习积极性一般的学生的 概率是多少?
2013年高考数学一轮复习 第十篇 统计、统计案例 第3讲 变量间的相关关系与统计案例教案 理 新人
![2013年高考数学一轮复习 第十篇 统计、统计案例 第3讲 变量间的相关关系与统计案例教案 理 新人](https://img.taocdn.com/s3/m/adb54cc3915f804d2a16c167.png)
第3讲 变量间的相关关系与统计案例[2013年高考会这样考]以选择题或填空题的形式考查回归分析及独立性检验中的基本思想方法及其简单应用. [复习指导]高考在该部分的主要命题点就是回归分析和独立性检验的基础知识和简单应用.复习时要掌握好回归分析和独立性检验的基本思想、方法和基本公式.基础梳理1.相关关系的分类从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为负相关. 2.线性相关从散点图上看,如果这些点从整体上看大致分布在一条直线附近,那么称这两个变量之间具有线性相关关系,这条直线叫回归直线. 3.回归方程(1)最小二乘法:使得样本数据的点到回归直线的距离平方和最小的方法叫最小二乘法. (2)回归方程:两个具有线性相关关系的变量的一组数据: (x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程为y ^=b ^x +a ^,那么⎩⎪⎨⎪⎧b ^=∑i =1n x i-x y i-y∑i =1nx i-x 2=∑i =1nx i y i -n xy∑i =1nx 2i -n x 2,a ^=y -b ^ x .其中,b 是回归方程的斜率,a 是在y 轴上的截距. 4.样本相关系数r =∑i =1nx i -x y i -y ∑i =1nx i -x2∑i =1ny i -y2,用它来衡量两个变量间的线性相关关系.(1)当r >0时,说明两个变量正相关;(2)当r<0时,说明两个变量负相关;(3)r的绝对值越接近1,说明两个变量的线性相关性越强;r的绝对值越接近于0,说明两个变量之间几乎不存在线性相关关系.通常当|r|>0.75时,认为两个变量有很强的线性相关关系.5.线性回归模型(1)y=bx+a+e中,a、b称为模型的未知参数;e称为随机误差.(2)相关指数用相关指数R2来刻画回归的效果,其计算公式是:R2=,R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中,R2表示解释变量对预报变量变化的贡献率,R2越接近于1,表示回归效果越好.6.独立性检验(1)用变量的不同“值〞表示个体所属的不同类别,这种变量称为分类变量.例如:是否吸烟,宗教信仰,国籍等.(2)列出的两个分类变量的频数表,称为列联表.(3)一般地,假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:2×2列联表y1y2总计x1 a b a+bx2 c d c+d总计a+c b+d a+b+c+dK2=n ad-bc2a+b a+c c+d b+d(其中n=a+b+c+d为样本容量),可利用独立性检验判断表来判断“x与y的关系〞.这种利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系〞的方法称为两个分类变量的独立性检验.两个规律(1)函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.(2)当K2≥3.841时,那么有95%的把握说事A与B有关;当K2≥6.635时,那么有99%的把握说事件A与B有关;当K2≤2.706时,那么认为事件A与B无关.(1)回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否那么,求出的回归直线方程毫无意义.(2)线性回归方程中的截距和斜率都是通过样本数据估计而来的,存在误差,这种误差会导致预报结果的偏差;而且回归方程只适用于我们所研究的样本总体.(3)独立性检验的随机变量K 2=3.841是判断是否有关系的临界值,K 2≤3.841应判断为没有充分证据显示事件A 与B 有关系,而不能作为小于95%的量化值来判断.双基自测1.(人教A 版教材习题改编)下面哪些变量是相关关系( ). A .出租车车费与行驶的里程 B .房屋面积与房屋价格 C .身高与体重D .铁块的大小与质量解析 A ,B ,D 都是函数关系,其中A 一般是分段函数,只有C 是相关关系. 答案 C2.对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图(1);对变量u ,v 有观测数据(u i 、v i )(i =1,2,…,10),得散点图(2).由这两个散点图可以判断( ).A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关解析 由题图(1)可知,各点整体呈递减趋势,x 与y 负相关;由题图(2)可知,各点整体呈递增趋势,u 与v 正相关. 答案 C3.(2012·南昌模拟)某商品销售量y (件)与销售价格x (元/件)负相关,那么其回归方程可能是( ).A.y ^=-10x +200 B.y ^=10x +200 C.y ^=-10x -200D.y ^=10x -200解析 因为销量与价格负相关,由函数关系考虑为减函数,又因为x ,y 不能为负数,再排除C ,应选A.4.(2012·枣庄模拟)下面是2×2列联表:y1y2合计x1 a 2173x2222547合计 b 46120那么表中a,b的值分别为( ).A.94,72 B.52,50 C.52,74 D.74,52解析∵a+21=73,∴a=52,又a+22=b,∴b=74.答案 C5.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算K2的观测值k=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的(有关,无关).解析由观测值k=27.63与临界值比较,我们有99%的把握说打鼾与患心脏病有关.答案有关考向一相关关系的判断[例1]►山东鲁洁棉业公司的科研人员在7块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量x对产量y影响的试验,得到如下表所示的一组数据(单位:kg):施化肥量x 15202530354045棉花产量y 330345365405445450455(1)画出散点图;(2)判断是否具有相关关系.[审题视点] (1)用x轴表示化肥施用量,y轴表示棉花产量,逐一画点.(2)根据散点图,分析两个变量是否存在相关关系.解(1)散点图如下图(2)由散点图知,各组数据对应点大致都在一条直线附近,所以施化肥量x与产量y具有线性相关关系.利用散点图判断两个变量是否有相关关系是比较简便的方法.在散点图中如果所有的样本点都落在某一函数的曲线上,就用该函数来描述变量之间的关系.即变量之间具有函数关系.如果所有的样本点落在某一函数的曲线附近,变量之间就有相关关系;如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.[训练1] 根据两个变量x,y之间的观测数据画成散点图如下图,这两个变量是否具有线性相关关系________(填“是〞与“否〞).解析从散点图看,散点图的分布成团状,无任何规律,所以两个变量不具有线性相关关系.答案否考向二独立性检验[例2]►(2010·全国新课标)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:性别是否需要志愿者男女需要4030不需要160270(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)能否有99%的把握认为该地区老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提出更好的调查方法来估计该地区老年人中,需要志愿者提供帮助的老年人的比例?说明理由.附:P(K2≥k)0.0500.0100.001k 3.841 6.63510.828K2=n ad-bc2a+b c+d a+c b+d[审题视点] 第(2)问由a=40,b=30,c=160,d=270,代入公式可求K2,由K2的值与6.635比较断定.第(3)问从抽样方法说明.解(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要志愿者提供帮助的老年人的比例的估计值为70500=14%.(2)K 2=500×40×270-30×160270×430×200×300≈9.967.由于9.967>6.635,所以有99%的把握认为该地区老年人是否需要帮助与性别有关. (3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层,采用分层抽样方法,这要比采用简单随机抽样方法更好.独立性检验的步骤:(1)根据样本数据制成2×2列联表; (2)根据公式K 2=n ad -bc 2a +ba +cb +dc +d计算K 2的观测值;(3)比较K 2与临界值的大小关系作统计推断.[训练2] 某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表: 甲厂: 分组 [29.86, 29.90) [29.90, 29.94) [29.94, 29.98) [29.98, 30.02) [30.02, 30.06) [30.06, 30.10) [30.10, 30.14) 频数 12638618292614乙厂: 分组 [29.86, 29.90) [29.90, 29.94) [29.94, 29.98) [29.98, 30.02) [30.02, 30.06) [30.06, 30.10) [30.10, 30.14) 频数297185159766218(1)试分别估计两个分厂生产零件的优质品率;(2)由以上统计数据填下面2×2列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异〞.甲 厂 乙 厂 合 计 优质品 非优质品 合 计附 K 2=n ad -bc 2a +bc +d a +cb +d, P (K 2≥k )0.050.01k 3.841 6.635解 (1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为360500×100%=72%;乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为320500×100%=64%.(2)甲 厂 乙 厂 合 计 优质品 360 320 680 非优质品 140 180 320 合 计5005001 000K 2=1 000×360×180-320×1402500×500×680×320≈7.35>6.635,所以有99%的把握认为“两个分厂生产的零件的质量有差异〞.考向三 线性回归方程[例3]►(2012·菏泽模拟)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据.x 3 4 5 6 y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^;(3)该厂技改前生产100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程.预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:3×2.5+4×3+5×4+6×4.5=66.5)[审题视点] (2)问利用公式求a ^、b ^,即可求出线性回归方程. (3)问将x =100代入回归直线方程即可. 解 (1)由题设所给数据,可得散点图如下图.(2)由对照数据,计算得: i =14x 2i =86,x =3+4+5+64=4.5(吨),y = 2.5+3+4+4.54=3.5(吨). ∑i =14x i y i =66.5,所以,由最小二乘法确定的回归方程的系数为:b ^=∑i =14x i y i -4x ·y∑i =14x 2i -4x 2=66.5-4×4.5×3.586-4×4.52=0.7, a ^=y -b ^x =3.5-0.7×4.5=0.35.因此,所求的线性回归方程为y ^=0.7x +0.35.(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为: 90-(0.7×100+0.35)=19.65(吨标准煤).在解决具体问题时,要先进行相关性检验,通过检验确认两个变量是否具有线性相关关系,假设它们之间有线性相关关系,再求回归直线方程.[训练3] (2011·江西)为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:父亲身高x /cm 174 176 176 176 178 儿子身高y /cm175175176177177那么y 对x 的线性回归方程为( ). A .y =x -1 B .y =x +1 C .y =88+12xD .y =176解析 由题意得x =174+176+176+176+1785=176(cm),y =175+175+176+177+1775=176(cm),由于(x ,y )一定满足线性回归方程,经验证知选C. 答案 C阅卷报告15——数据处理不当导致计算错误而失分[问题诊断] 由于大多数省市高考要求不准使用计算器,而线性回归问题和独立性检验问题仍是近几年新课标高考的常考点,并且大多是考查考生的计算能力,就计算方面常有不少考生因计算出错而失分.[防范措施] 平时训练时首先养成勤于动手的习惯,亲自动手计算,再者考场上要保持心态放松,做题时细心认真,最终可减少错误的发生.[示例]►(2011·安徽)某地最近十年粮食需求量逐年上升,下表是部分统计数据:年份 2002 2004 2006 2008 2010 需求量(万吨)236246257276286(1)利用所给数据求年需求量与年份之间的回归直线方程y ^=bx +a ; (2)利用(1)中所求出的直线方程预测该地2012年的粮食需求量. 实录 (1)x =2 006,y =236+246+257+276+2865=260.2.b =2002-2006236-260.2+2004-2006246-260.2+2006-2006257-260.22002-20062+2004-20062+2006-20062+2008-20062+2010-20062+2008-2006276-260.2+2010-2006286-260.22002-20062+2004-20062+2006-20062+2008-20062+2010-20062=6.2,错因 求b 时计算出错,b 值不准确.a =y -b x =260.2-6.2×2 006=-12 177. ∴y ^=6.2x -12 177.(2)y ^=6.2×2 012-12 177=297.4.正解 (1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来配回归直线方程,为此对数据预处理如下:年份-2006 -4 -2 0 2 4 需求量-257-21-111929对预处理后的数据,容易算得,x =0,y =3.2, b =-4×-21+-2×-11+2×19+4×29-5×0×3.2-42+-22+22+42-5×02=26040=6.5,a =y -b x =3.2. 由上述计算结果,知所求回归直线方程为y -257=b (x -2 006)+a =6.5(x -2 006)+3.2,即y ^=6.5(x -2 006)+260.2.①(2)利用直线方程①,可预测2012年的粮食需求量为6.5(2 012-2 006)+260.2=6.5×6+260.2=299.2(万吨).。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
n
回归直线 方程对应的直线叫做_________,而对两个变量所进行的上述统 回归分析 计分析叫做_________.
10.对于性别变量,其取值为男和女两种,这种 变量的不同“值”表示个体所属的不同类别,像 分类变量 这类变量称为_________. 列联表 11.列出两个分类变量的频数表,称为 _______.
3.独立性检验的一般步骤
nad-bc K= ,计算 K2 的值. a+bc+da+cb+d
2
(1)根据样本数据制成2×2列联表. (2)根据公式 2
(3)根据K2与临界值的大小关系作统计推断.
4.判断回归模型的基本步骤
(1)确定研究对象,明确哪个变量是解释变量, 哪个变量是预报变量; (2)画出确定好的解释变量和预报变量的散点 图,观察它们之间的关系(如是否存在线性关系等);
0.01
8.表示具有相关关系的两个变量组成一组数据, 散点图 将各组数据在平面直角坐标系中描点,得到的图形 叫做_______. ^
9.回归直线方程为y=bx+a,其中,回归直线斜率 b 的估
xi- x yi- y
i=1
n
xi- x 2 ^ ^ ^ y -b x i=1 计值b=_______________,截距 a 的估计值a=________,上述
(1)画出散点图; (2)判断是否具有相关关系.
解:(1)散点图如图所示.
(2)由散点图知,各组数据对应点大致都在一条直线 附近,所以施化肥量x与产量y具有线性相关关系.
考点二
求线性回归方程
【案例2】 假设关于某设备的使用年限x和 所支出的维修费用y(单位:万元)之间有如下的统计 资料: 使用年限x 2 3 4 5 6
解析:因为K2≈9.643,查阅临界值表即知D正确. 答案:D
3.给出下列命题: ①用相关指数R2来刻画回归效果时,R2的值越大, 说明模型拟合的效果越好; ②对分类变量X与Y的随机变量K2的观测值k来说, k越小,“X与Y有关系”的可信程度越大; ③两个随机变量相关性越强,则相关系数的绝对 值越接近于1; ④三维柱形图中柱的高度表示的是各分类变量的 频数. 其中正确命题的序号是________(写出所有正确命 题的序号).
^ yi-y i2
i= 1
n
1i= 1 5.R2=______________,R2 越接近 1,拟合效果越好.
yi- y 2
n
6.P(K2≥6.635)≈____. 0.05 2≥3.841)≈____. P(K 0.10 2≥2.706)≈____. P(K 确定性关系 7.函数关系是一种___________,相关关系 非确定性 是一种_________关系,对具有相关关系的两 回归分析 个变量进行统计分析的方法叫做_________ .
80×20×21-30×92 解:由 K2 计算公式,K2= ≈0.811. 29×51×30×50 所以根据临界值表,我们认为婴儿性别与出生时间二者之 间没有关系.
【即时巩固3】 为了研究性格与血型的关系, 抽取80名被测试者,他们的血型与性格汇总如下 表: 血 型 O型或A型 B型或AB型 总计 性格 18 外向 17 内向 35 总计 试判断性格与血型是否相关. 16 29 45 34 46 80
(1)判断家庭平均收入与月平均生活支出是否相关? (2)若二者线性相关,求回归直线方程.
解:(1)作出散点图:
观察发现各个数据对应的点都在一条直线附近, 所以二者呈线性相关关系.
1 (2) x = (0.8+1.1+1.3+1.5+1.5+1.8+2.0+2.2+2.4+ 10 2.8)=1.74,
8
30
20
30
28
60
由以上数据计算得出K2≈9.643,根据临界值表, 以下说法正确的是 ( ) A.没有充足的理由认为课外阅读量大与作文 成绩优秀有关 B.有0.5%的把握认为课外阅读量大与作文成 绩优秀有关 C.有99.9%的把握认为课外阅读量大与作文 成绩优秀有关 D.有99.5%的把握认为课外阅读量大与作文 成绩优秀有关
解析:对于②,当K2越小时,“X与Y有关系”的可信度 越小;其余①③④均正确. 答案:①③④
4.某小卖部为了了解热茶销售量 y(杯)与气温 x(℃)之间的 关系, 随机统计了某 4 天卖出的热茶杯数与当天气温, 分别作了 ^ 对照表(如表),由表中数据算得线性回归方程y =bx+a 中的 b≈ -2,则预测当气温-5 ℃时,热茶销售量为________杯.
^ 4.回归直线方程y =bx+a,其中 - y y xi- x yi- - xiyi-n x -
i= 1 i= 1 n n
-
b= x xi- -
i= 1 n 2
=
- 2 xi -n x 2 i= 1
,
n
--b- y x a=________.
b 是回归直线的斜率,a 是截距.
112.3-5×4×5 12.3 于是有 b= = =1.23, 2 10 90-5×4 a= y -b x =5-1.23×4=0.08. (2)回归直线方程是y
^ ^
=1.23x+0.08,
当 x=10 年时,y =1.23×10+0.08=12.38(万元), 即估计使用 10 年时维修费用是 12.38 万元.
(即时巩固详解为教师用书独有)
考点一
相关关系的判断
【案例1】 (2011· 江西)变量X与Y相对应的 一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4), (13,5);变量U和V相对应的一组数据为(10,5), (11.3,4),(11.8,3),(12.5,2),(13,1),r1表示变量Y 和X之间的线性相关系数,r2表示变量V与U之间 的线性相关系数,则 ( ) A.r2<r1<0 B.0<r2<r1 C.r2<0<r1 D.r2=r1
维修费用y
2.2
3.8
5.5
6.5
7.0
若由资料知 y 与 x 呈线性相关关系.试求: (1)线性回归方程y =bx+a 的回归系数 a、b; (2)估计使用年限为 10 年时,维修费用是多少?
^
关键提示:求回归方程时,最好能分步完成:先求出 xi2,
n 2 xiyi,进而求出 xi 、 xiyi,再代入公式求出 i =1 i=1
解:由列联表中的数据得到 80×18×29-16×172 K2= ≈2.030<2.706, 35×45×34×46 所以认为没有充分的证据显示“血型与性格有关系”.
【即时巩固2】 随着我国经济的快速发展, 城乡居民的生活水平不断提高,为研究某市家庭 平均收入与月平均生活支出的关系,该市统计部 门随机调查10个家庭,得数据如下: 家庭编号 1 2 3 4 5 6 7 8 9 10 xi(收入) 0.8 1.1 1.3 1.5 1.5 1.8 2.0 2.2 2.4 2.8 千元 yi(支出) 0.7 1.0 1.2 1.0 1.3 1.5 1.3 1.7 2.0 2.5 千元
(3)由经验确定回归方程的类型(如我们观察到数据呈线性 关系,则选用线性回归方程y=bx+a);
^
(4)按一定规则估计回归方程中的参数(如最小二乘法); (5)得出结果后分析残差图是否有异常(个别数据对应残 差过大,或残差呈现不随机的规律性,等等),若存在异 常,则检查数据是否有误,或模型是否合适等.
1.相关关系:与函数关系不同,相关关系是 非确定性 一种_________关系. 2.从散点图上看,点散布在从左下角到右上 正相关 角的区域内,两个变量的这种相关关系为 _______,点散布在从左上角到右下角的区域 负相关 内,两个变量的相关关系为_______ . 3.从散点图上看,如果这些点从整体上看大 致分布在通过散点图中心的一条直线附近, 线性相关关系 回归直线 称两个变量之间具有_____________,这条直 线叫_________.
1 y = (0.7+1.0+1.2+1.0+1.3+1.5+1.3+1.7+2.0+2.5) 10 =1.42,
xiyi-10 x y xi2=27.51, xiyi=33.72,b=
i=1 i=1 10 10 i=1
10
≈0.813 6,
xi2-10 x 2
i=1
10
a=1.42-1.74×0.813 6≈0.004 3, ^ 所以回归方程为y =0.813 6x+0.004 3.
1.分析两个变量相关关系的常用方法
(1)利用散点图进行判断:把样本数据表示 的点在平面直角坐标系中作出,从而得到散点 图,如果这些点大致分布在通过散点图中心的 一条直线附近,那么就说这两个变量之间具有
(2)利用相关系数r进行判断:|r|≤1,而且|r|越 接近于1,相关程度越大;|r|越接近于0,相关程 度越小. 2.对具有相关关系的两个变量进行统计分析 时,首先进行相关性检验,在确认具有线性相关 关系后,再求回归直线方程.
气温(℃) 杯数
18 24
13 34
10 38
-1 64
解析: x =10, y =40,由 y =b x +a 且 b=-2 知,a =60,所以当 x=-5 ℃时,y=-2×(-5)+60=70.
答案:70
分析两个变量的相关关系时,我们可根据 样本数据散点图确定两个变量之间是否存在相 关关系,还可利用最小二乘法求出回归直线方 程,把样本数据表示的点在直角坐标系中作出, 构成的图叫做散点图.从散点图上,我们可以 分析出两个变量是否存在相关关系.
考点三
独立性检验
【案例3】 调查某医院某段时间内婴儿出生 的时间与性别的关系,得出下面的数据表. 出生时 间 晚上 白天 合计
性别 20 30 男婴 9 21 女婴 29 51 合计 试分析婴儿的性别与出生时间有关系吗?
50 30 80