回归分析、独立性检验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
突破点8 回归分析、独立性检验
(1)正相关:在散点图中,点散布在从左下角到右上角的区域. (2)负相关:在散点图中,点散布在从左上角到右下角的区域.
(3)相关系数r :当r >0时,两变量正相关;当r <0时,两变量负相关;当|r |≤1且|r |越接近于1,相关程度越高,当|r |≤1且|r |越接近于0,相关程度越低
.
方程y ^=b
^x +a ^称为线性回归方程,其中b ^=∑i =1
n
x i y i -n x -
y -∑i =1
n
x 2i -n x 2
,a ^=y --b ^x -
.(x -,
y -
)称为样本中心点
.
(1) (2)求观测值:k =n (ad -bc )2
(a +b )(c +d )(a +c )(b +d )
.
(3)
根据临界值表,作出正确判断.如果k ≥k α,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 有关系”.
回访1 变量的相关性
1.(2015·全国卷Ⅱ)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )
图8-1
A .逐年比较,2008年减少二氧化硫排放量的效果最显著
B .2007年我国治理二氧化硫排放显现成效
C .2006年以来我国二氧化硫年排放量呈减少趋势
D .2006年以来我国二氧化硫年排放量与年份正相关
D [对于A 选项,由图知从2007年到2008年二氧化硫排放量下降得最多,故A 正确.对于B 选项,由图知,由2006年到2007年矩形高度明显下降,因此B 正确.对于C 选项,由图知从2006年以后除2011年稍有上升外,其余年份都是逐年下降的,所以C 正确.由图知2006年以来我国二氧化硫年排放量与年份负相关,故选D.]
2.(2012·全国卷)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =1
2x +1上,则这组样本数据的样本相关系数为( )
A .-1
B .0 C.1
2
D .1
D [样本点都在直线上时,其数据的估计值与真实值是相等的,即y i =y ^i ,
代入相关系数公式r =1-∑i =1
n
(y i -y ^
i )2∑i =1
n (y i -y )2
=1.]
3.(2015·全国卷Ⅰ)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
图8-2
表中w i =x i ,w ]=18∑ i =1w i .
(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;
(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题:
①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?
附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为β
^=∑n
i =1 (u i -u )(v i -v )
∑n
i =1 (u i -u )2
,α^=v -β^u . [解] (1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型.2分
(2)令w =x ,先建立y 关于w 的线性回归方程.
由于d
^=
∑i =1
8
(w i -w )(y i -y )
∑i =1
8
(w i -w )2
=108.8
1.6=68,
c ^=y -d
^ w =563-68×6.8=100.6,4分
所以y 关于w 的线性回归方程为y ^
=100.6+68w , 因此y 关于x 的回归方程为y ^=100.6+68x .6分 (3)①由(2)知,当x =49时,
年销售量y 的预报值y ^=100.6+6849=576.6, 年利润z 的预报值z ^=576.6×0.2-49=66.32.8分 ②根据(2)的结果知,年利润z 的预报值
z ^
=0.2(100.6+68x )-x =-x +13.6x +20.12.10分 所以当x =13.6
2=6.8,即x =46.24时,z ^取得最大值. 故年宣传费为46.24千元时,年利润的预报值最大.12分 回访2 独立性检验
4.(2012·辽宁高考)电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:
图8-3
将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”. (1)根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?
(2)用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育