第3讲变量间的相关关系、回归分析及独立性检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.两个变量的线性相关
(1)在散点图中,点散布在从左下角 到 右上角 的区域.对于两个
变量的这种相关关系,我们将它称为正相关.如果在散点图
中,点散布在从左上角 到右下角 的区域,两个变量的这种相关 关系称为负相关.
(2)线性相关关系、回归直线
如果散点图中点的分布从整体上看大致在 一条直线附近 个变量之间具有线性相关关系,这条直线叫做回归直线. ,就称这两
思维点拨:利用相关系数r进行线性相关检验(也可利用散点图).如果线性相 关,再求回归直线方程并加以判断.
因为r>0.5,所以y与x有很强的线性相关关系. (2) =0.728 6x-0.857 1. ≤10⇒0.728 6x-0.857 1≤10,
(3)要使
所以x≤14.901 3.
所以机器的转速应控制在14.901 3转/秒以下.
它在a,b,c,d 取不同值时,K2可能不同,而k是取定一组数a, b,c,d后的一个确定的值.
1.下列关系中,是相关关系的为(
)
①学生的学习态度与学习成绩之间的关系;
②教师的执教水平与学生的学习成绩之间的关系;
③学生的身高与学生的学习成绩之间的关系; ④家庭的经济条件与学生的学习成绩之间的关系. A.①② B.①③ C.②③ D.②④
判断两个变量正相关还是负相关,有三种方法: 1.利用散点图;
2.利用相关系数r的符号;当r>0时,正相关;r<0时,负相关;
3.在已知两变量线性相关时,也可以利用回归方程 =a+bx是增函数,两变量是正相关, 当b<0时, =a+bx是减函数, 两变量是负相关. =a+bx.当b>0时,
【例 1】 山东鲁洁棉业公司的科研人员在 7块并排、形状大小相同的试
=1.23×10+0.08=12.3+0.08=12.38(万元),即估计使用10
年时,维修费用是12.38万元.
所谓独立性检验,就是根据采集样本的数据,先利用三维柱形图和二 维条形图粗略判断两个分类变量是否有关系,再利用公式计算K2的值, 比较它与临界值的大小关系,来判断事件X与Y是否有关的问题. 【例3】 (2009· 辽宁)某企业有两个分厂生产某种零件,按规定内径尺寸 (单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分 厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:
【思考】 相关关系与函数关系有什么异同点? 答案:相同点:两者均是指两个变量的关系. 不同点:①函数关系是一种确定的关系,相关关系是一种非确定的关 系,事实上,函数关系是两个非随机变量的关系.而相关关系是非随 机变量与随机变量的关系.②函数关系是一种因果关系,而相关关系 不一定是因果关系,也可能是伴随关系.
细谨慎,分层进行,避免因计算而产生错误. (注意回归直线方程中一次项系
数为b,常数项为a,这与一次函数的习惯表示不同). 2.回归分析是处理变量相关关系的一种数学方法.主要解决:①确定特定量之间 是否有相关关系,如果有就找出它们之间贴近的数学表达式;②根据一组观察 值,预测变量的取值及判断变量取值的变化趋势;③求出回归直线方程.
【易入误区】
成绩的稳定性用样本数据的方差判断,由物理成绩估计数学成绩由回归直 线方程解决.本题容易出错的就是把回归系数和回归常数弄颠倒,导致解
题错误.
【状元笔记】
回归系数与回归常数.回归直线方程 =bx+a和通常的一次函数表达式
在系数上的习惯不一样,这里的系数
叫做回归系数,求回归直线方程时首先求这个系数,然后由
所以有99%的把握认为“两个分厂生产的零件的质量有差异”.
变式3:在对人们休闲方式的一次调查中,共调查了124人,其中女性70 人,男性54人.女性中有43人主要的休闲方式是看电视,另外27人 的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外 33人主要的休闲方式是运动. (1)根据以上数据建立一个2×2列联表; (2)画出二维条形图; (3)检验休闲方式是否与性别有关,可靠性有多大.
对具有相关关系的两个变量进行统计分析时,首先要作出散点图,然后 进行相关性检验,在确认具有线性相关关系后,再求其回归直线. 【例2】 一台机器使用时间较长,但还可以使用.它按不同的转速生产 出来的某机械零件有一些会有缺点,每小时生产有缺点零件的 多少,随机器运转的速度而变化,下表为抽样试验结果:
(1)对变量y与x进行相关性检验; (2)如果y与x有线性相关关系,求回归直线方程; (3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么, 机器的运转速度应控制在什么范围内?
第3讲
变量间的相关关系、回归分析及独立性检验
【考纲下载】
1. 会作两个相关变量的数据的散点图,会利用散点图认识变量的相关关系. 2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.
3.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.
4.了解假设检验的基本思想、方法及其简单应用.
解:(1)2×2列联表如图:
(2)二维条形图如图:
(3)假设休闲方式与性别无关,则 K2= ≈6.201>5.024,所以有理
由认为休闲方式与性别无关是不合理的,即我们有97.5%的把握认为 休闲方式与性别有关.
【方法规律】
1.求回归方程,关键在于正确求出系数a,b,由于a,b的计算量大,计算时应仔
解析:①学生的学习态度与学习成绩之间不是因果关系, 是相关关系.②教师的执教水平与学生的学习成绩之间的 关系是关关系.③④都不具备相关关系. 答案:A
2 . (2009· 宁夏、海南 ) 对变量 x , y 有观测数据 (xi , yi)(i = 1,2 ,…, 10) ,得
散 点图(1);对变量u、v有观测数据(ui,vi)(i=1,2,…,10),得散点图 (2).由这两个散点图可以判断( )
计算
出的a叫做回归常数.在求回归直线方程时注意不要把这两个系数弄颠倒了.
2.回归方程 (1)最小二乘法
求回归直线使得样本数据的点到回归直线的
方法叫做最小二乘法. (2)回归方程 方程
距离的平方和最小 的
=bx+a是两个具有线性相关关系的变量的一组数据(x1,y1),
(x2,y2),…,(xn,yn)的回归方程,其中a,b是待定参数.
(3)相关系数
①r=
②当r>0时,表明两个变量 正相关 ; 当r<0时,表明两个变量 负相关 . r的绝对值越接近于1,表明两个变量的线性相关性 越强 .r的绝对值越接近于0 时,表明两个变量之间 几乎不存在线性相关关系 .通常|r|大于 0.75 时,认为
验田上对某棉花新品种进行施化肥量 x对产量y影响的试验,得到如 下表所示的一组数据(单位:kg).
(1)画出散点图;
(2)判断是否具有相关关系
思维点拨:用施化肥量x作为横轴,产量y为纵轴可作出散点图,由散 点图即可分析是否具有线性相关关系. 解:(1)散点图如右图所示,
(2)由散点图知,各组数据对应点大致都在一条直线 附近,所以施化肥量x与产量y具有线性相关关系.
(1)试分别估计两个分厂生产的零件的优质品率; (2)由以上统计数据填下面2×2列联表,并问是否有99%的把握认为 “两个分厂生产的零件的质量有差异”.
解:(1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品
率估计为 =72%;
乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计 为 (2) =64%.
3.独立性检验是一种假设检验,在对总体的估计中,通过抽取样本,构造合适的
随机变量,对假设的正确性进行判断.
【规范解答】
从而
,所以物理成绩更稳定.
(2)由于x与y之间具有线性相关关系,根据回归系数公式得到 b= =0.5,a=100-0.5×100=50, =0.5x+50.当y=115时,x=130.
构造一个随机变量K2= 其中n= a+b+c+d 为样本容量.

(3)独立性检验
利用随机变量 K2 来确定是否能以一定把握认为“两个分类变量 有关系 ”
的方法称为两个分类变量的独立性检验. 【思考】 在独立性检验中经常由K2得到观测值k,则k= 答案:K2与k的关系并不是k= 吗?
,k是K2的观测值,或者说K2是一个随机变量,
中,
回归系数
(
)
B.小于0 D.只能等于0 能大于0,
A.可能小于0 C.能等于0
解析: =0时,得r=0,这时不具有线性相关关系,但 也能小于0.
答案:A
4.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算 K2=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是 ________的(有关,无关). 解析:∵K2=27.63>6.635, ∴有99%的把握认为“打鼾与患心脏病有关”. 答案:有关
两个变量有很强的线性相关性.
3.独立性检验 (1)分类变量:变量的不同“值”表示个体所属的 不同类别 ,像这类变量
称为分类变量.
(2)列联表:列出两个分类变量的 频数表 ,称为列联表.假设有两个分类 变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联 表(称为2×2列联表)为 2×2列联表
∴线性回归方程为
建议:进一步加强对数学的学习,提高数学成绩的稳定性,将有助于 物理成绩的进一步提高.
为了分析某个高三学生的学习状态,对其下一阶段的学习提供指导性建议.现对 他前7次考试的数学成绩x、物理成绩y进行分析.下面是该生7次考试的成绩.
(1)他的数学成绩与物理成绩哪个更稳定?请给出你的证明; (2)已知该生的物理成绩y与数学成绩x是线性相关的,若该生的物理成绩达到 115 分,请你估计他的数学成绩大约是多少?并请你根据物理成绩与数学成绩的相 关性,给出该生在学习数学、物理上的合理建议.
变式2:假设关于某设备的使用年限x和所支出的维修费用y(万元), 有如下的统计资料:
(1)y与x间是否有线性相关关系?若有,求出线性回归方程; (2)估计使用年限为10年时的维修费用.
解:(1)作散点图,如右图
由散点图可知,y与x呈线性相关关系,
1.23
所以回归直线方程为 (2)当x=10时,
Hale Waihona Puke =1.23x+0.08.
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关 C.变量x与y负相关,u与v正相关 D.变量x与y负相关,u与v负相关 解析:由图1可知,各点整体呈递减趋势,x与y负相关,由图2可知, 各点整体呈递增趋势,u与v正相关. 答案:C
3.对有线性相关关系的两个变量建立的回归直线方程
相关文档
最新文档