变量间的相关关系及独立性检验(ppt 23页)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.在对两个变量x,y进行线性回归分析时有下列步骤: ①对所求出的回归方程作出解释;②收集数据(xi,yi),i=1,2,…,n;③求 线性回归方程;④求相关系数;⑤根据所搜集的数据绘制散点图. 如果根据可靠性要求能够作出变量x,y具有线性相关结论,则在下列操作顺 序中正确的是( ) A.①②⑤③④ B.③②④⑤① C.②④③①⑤ D.②⑤④③① 答案:D
【例2】 一台机器使用时间较长,但还可以使用.它按不同的转速生产出来的某 机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器运转的速 度而变化,下表为抽样试验结果:
转速x(转/秒)
1 6
1 4
1 2
8
每小时生产有缺点 的零件数y(件)
1 1
Fra Baidu bibliotek
9
85
(1)对变量y与x进行相关性检验; (2)如果y与x有线性相关关系,求回归直线方程; (3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么,机器 的运转速度应控制在什么范围内? 思维点拨:利用相关系数r进行线性相关检验(也可利用散点图).如果线性相关, 再求回归直线方程并加以判断.
为了分析某个高三学生的学习状态,对其下一阶段的学习提供指导性建议.现 对他前7次考试的数学成绩x、物理成绩y进行分析.下面是该生7次考试的成绩.
数学 88 83 117 92 108 100 112 物理 94 91 108 96 104 101 106
(1)他的数学成绩与物理成绩哪个更稳定?请给出你的证明; (2)已知该生的物理成绩y与数学成绩x是线性相关的,若该生的物理成绩达到115 分,请你估计他的数学成绩大约是多少?并请你根据物理成绩与数学成绩的相 关性,给出该生在学习数学、物理上的合理建议.
2.回归分析是处理变量相关关系的一种数学方法.主要解决:①确定特定量之间 是否有相关关系,如果有就找出它们之间贴近的数学表达式;②根据一组观察 值,预测变量的取值及判断变量取值的变化趋势;③求出回归直线方程.
3.独立性检验是一种假设检验,在对总体的估计中,通过抽取样本,构造合适的 随机变量,对假设的正确性进行判断.
解答:
(2) =0.728 6x-0.857 1. (3)要使 ≤10⇒0.728 6x-0.857 1≤10,所以x≤14.901 3. 所以机器的转速应控制在14.901 3转/秒以下.
变式2.假设关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计 资料:
使用年限 (x)/年 2 3 4 5 6
称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负 相关.
5. 回归直线:设所求的直线方程为
,其中
求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做 最小二乘法.
6.相关系数:r=
叫做变量y与x之间的样本相关系数,简称相关系数,用 它来衡量两个变量之间的线性相关程度. 7.相关系数的性质:|r|≤1,且|r|越接近1,相关程度越大;且|r|越接近0,相关程 度越小.
=a+bx是增函数,两变量是正相关,当b<0时, =a+bx是减函数, 两变量是负相关.
【例1】山东鲁洁棉业公司的科研人员在7块并排、形状大小相同的试验田上对 某棉花新品种进行施化肥量x对产量y影响的试验,得到如下表所示的一组数 据(单位:kg).
施化肥量x 15 20 25 30 35 40 45 棉花产量y 330 345 365 405 445 450 455
维修费用 2. 3. 5. 6. 7. (y)/万元 2 8 5 5 0
(1)y与x间是否有线性相关关系?若有,求出线性回归方程; (2)估计使用年限为10年时的维修费用.
【方法规律】
1.求回归方程,关键在于正确求出系数a,b,由于a,b的计算量大,计算时应仔 细谨慎,分层进行,避免因计算而产生错误.(注意回归直线方程中一次项系数 为b,常数项为a,这与一次函数的习惯表示不同).
(1)画出散点图; (2)判断是否具有相关关系.
思维点拨:用施化肥量x作为横轴,产量y为纵轴可 作出散点图,由散点图即可分析是否具有线性相关 关系. 解答:(1)散点图如右图所示, (2)由散点图知,各组数据对应点大致都在一条直线 附近,所以施化肥量x与产量y具有线性相关关系.
对具有相关关系的两个变量进行统计分析时,首先要作出散点图,然后进行相 关性检验,在确认具有线性相关关系后,再求其回归直线.
2.对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…, (xn,yn),则下列说法中不正确的是( )
A.由样本数据得到的回归方程 =bx+a 必过样本中心(
)
B.残差平方和越小的模型,拟合的效果越好
C.用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好
9.3 变量间的相关关系、回归分析及 独立性检验
(会作两个相关变量的数据的散点图,会利用散点图认识变量的相关关系/了解最 小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程)
1.相关关系的量:当自变量一定时,因变量的取值带有一定的随机性的两个变 量之间的关系称为相关关系.
2.回归分析:对具有相关关系的两个变量进行统计分析的方法叫做回归分析. 3.散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图. 4.正相关与负相关概念:如果散点图中的点散布在从左下角到右上角的区域内,
A.变量x与y正相关,u与v正相关 B.变量x与y正相关,u与v负相关 C.变量x与y负相关,u与v正相关 D.变量x与y负相关,u与v负相关 解析:由图(1)可知,各点整体呈递减趋势,x与y负相关,由图(2)可知,各点整 体呈递增趋势,u与v正相关. 答案:C
判断两个变量正相关还是负相关,有三种方法: 1.利用散点图; 2.利用相关系数r的符号;当r>0时,正相关;r<0时,负相关; 3.在已知两变量线性相关时,也可以利用回归方程 =a+bx.当b>0时,
D.若变量y和x之间的相关系数为r=-0.9362,则变量y和x之间具有线性相 关关系
答案:C
3.(2009·宁夏、海南)对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点 图(1);对变量u、v有观测数据(ui,vi)(i=1,2,…,10),得散点图(2).由这 两个散点图可以判断( )