11.3高中文科数学高2020届高2017级一轮全程复习配套课件
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.独立性检验 (1)2×2列联表:假设有两个分类变量X和Y,它们的值域 分别为{x1,x2}和{y1,y2},其样本频数列联表(称2×2列 联表)为:
y1 x1 x2 总计 a c a+c
y2 b d b+d ____
总计 a+b ____ c+d a+b+c+d
(2)K2统计量 K 2=
a b c d a c b d
e i=yi- y i=yi- b xi- a ,i=1,2,…,n, e i称为相应于点
(xi,yi)的残差.
(2)残差平方和为 (y y )2 . i i
i 1
2 (y y ) i i 2 (y y) i __________. i 1 i 1 n n
n
(3)相关指数:R2=1-
所以
b
=
158-4 9 4 =0.7, 36+64+ 100+ 144-4 81
a =4-0.7×9=-2.3.
故线性回归直线方程为 y =0.7x-2.3.
考点一
相关关系的判断
【题组练透】
2.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2, x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi) (i=1,2,…,n)都在直线y= 1 x+1上,则这组样本数据的
2
样本相关系数为( A.-1 B.0
) C. 1
2
D.1
【解析】选D.所有点均在直线上,则样本相关系数最大 即为1.
④y与x正相关且 y =-4.326x-4.578. 其中一定不正确的结论的序号是 ( )
A.①②
B.②③
C.③④
D.①④
【解析】选D. y = b x+ a ,当 b >0时,为正相关, b <0为 负相关,故①④错误.
2.(必修3P94T3改编)某研究机构对高三学生的记忆力x 和判断力y进行统计分析,所得数据如表: x y 6 2 8 3 10 5 12 6
,a y bx.
其中, b 是回归方程的_____, 斜率 a 是在y轴上的_____. 截距
(4)样本相关系数
r=
x
n i 1
i
x yi y
2 n iຫໍສະໝຸດ 2xn i 1
i
x
y y
i 1
,用它来衡量两个变量间的线性
相关关系.
正相关 ①当r>0时,表明两个变量_______; 负相关 ②当r<0时,表明两个变量_______;
第三节
变量间的相关关系与统计案例 (全国卷5年2考)
【知识梳理】 1.相关关系与回归方程
(1)相关关系的分类
左下角 到_______ 右上角 ①正相关:从散点图上看,点散布在从_______ 的区域内;
左上角 到_______ 右下角 ②负相关:从散点图上看,点散布在从_______ 的区域内.
【基础自测】 题组一:走出误区 1.判断正误(正确的打“√”,错误的打“×”) (1)回归直线至少过散点图中的一个点. ( (2)利用回归直线方程计算出的 值. ( ) )
值是变量的准确取
(3)样本相关系数r越大说明两个变量的相关性越强. ( )
提示:(1)×.回归直线可能不过散点图中的任何一个点. (2)×.利用回归直线方程计算出的 y 值是预测值,不是 准确值. (3)×.|r|越接近1说明两个变量的相关性越强.
(2)线性相关关系:如果散点图中点的分布从整体上看大
一条直线 附近,则称这两个变量之间具有线性相关 致在_________
回归直线 关系,这条直线叫做_________.
(3)回归方程
距离 ①最小二乘法:使得样本数据的点到回归直线的_____
的平方和 最小的方法叫做最小二乘法. _________
则y对x的线性回归直线方程为 A. y =2.3x-0.7 C. y =0.7x-2.3 B. y =2.3x+0.7 D. y =0.7x+2.3
(
)
【解析】选C.因为
xiyi=6×2+8×3+10×5+12×6
i 1
4
2+3+5+6 =158, x= 6+8+10+12 =9, y= =4. 4 4
题组二:走进教材 1.(必修3P90例题改编)四名同学根据各自的样本数据 研究变量x,y之间的相关关系,并求得回归直线方程,分 别得到以下四个结论:
①y与x负相关且 y =2.347x-6.423;②y与x负相关且
y =-3.476x+5.648;③y与x正相关且 y =5.437x+8.493;
越强 ③r的绝对值越接近1,表明两个变量的线性相关性_____; r的绝对值越接近于0,表明两个变量之间几乎不存在线性 相关关系.通常当|r|>0.75时,认为两个变量有很强的线 性相关关系.
2.残差分析 (1)残差:对于样本点(x1,y1),(x2,y2),…,(xn,yn),它们 的随机误差为ei=yi-bxi-a,i=1,2,…,n,其估计值为
2.回归直线及其方程的性质 (1)回归直线不一定过样本点,但是一定过样本中心点 ( x , y ). (2)在回归直线方程 y bx a 中, b >0时,两个变量呈正 相关关系; b <0时,两个变量呈负相关关系.
3.2×2列联表中统计量K2的含义 (1)独立性检验的概率假设是两个变量不相关. (2)K2越大,不相关的概率越小,相关的概率越大.
②回归方程:两个具有线性相关关系的变量的一组数据: (x1,y1),(x2,y2),…,(xn,yn),其回归方程为 y bx a, 则 b
x
n i 1 n
i
x yi y
i
x y nxy
n
x
i 1
x
2
i 1 n
i
i
x
i 1
2 i
nx
2
n ad bc
2
(其中n=a+b+c+d为样本容
量).
【常用结论】 1.函数关系与相关关系的区别与联系 (1)区别: ①函数关系是一种确定性关系,相关关系是一种非确定 性关系.
②函数关系是一种因果关系,相关关系不一定是一种因
果关系,也可能是伴随关系.
(2)联系:对于线性相关关系,求出线性回归方程后,可 以通过确定的函数关系进行两个变量取值的预测.