人教版高中数学选择性必修第3册8-1-2样本相关系数课件
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
D.③④
• 【答案】B
• 【解析】样本相关系数r的绝对值越大,变量x,y的线性 相关程度越高.
易错警示 样本相关系数r概念理解不到位致误
•
以下是收集到的新房屋的销售价格y(万元)和房屋的大
小x(m2)的数据.
房屋大小/m2 115 110 80 135 105
销售价格/万元 24.8 21.6 18.4 29.2 22
65.6≈0.96,
由相关系数 r=0.96 可知,房屋大小与销售价格呈正相关,且相关性
高,拟合程度较高.
素养达成
• 1.判断变量之间的线性相关关系,一般用散点图,但在 作图中,由于存在误差,有时很难判断这些点是否分布在一 条直线的附近,从而就很难判断两个变量之间是否具有线性 相关关系,此时就必须利用线性相关系数来判断.
=
1
3 308 570×
65.6≈0.96,
• 由相关系数r=0.96可知,房屋大小与销售价格呈负相关, 且相关性不高,拟合程度不高.
• 易错防范:判断变量之间的线性相关关系,通常利用相 关系数r,当|r|越接近1,它们的散点图越接近一条直线,这 时用线性回归模型拟合这组数据的效果就越好.
• 正解:由题设数据,得
• (1)当r>0时,称成对样本数正据______相关;当r<0时,
称成对样本数据负相关;当r=0时不,两个变量线性______相
关.
[-1,1]
• (2)样本相关系数r的取值范围为__________.
• 当|r|越接近1时,成对样本数据的线性相关程度越强;
• 当|r|越接近0时,成对样本数据的线性相关程度越弱.
绝对值越接近于1,表明两个变量的线性相关程度性越强,r 的绝对值越接近于0,表明两个变量的线性相关程度越弱,故 D正确.
课堂互动
题型1 线性相关性的检验
•
现随机抽取了某中学高一10名在校学生,他们入学时
的数学成绩x(分)与入学后第一次考试的数学成绩y(分)如下:
学生号 1 2 3 4 5 6 7 8 9 10 x 120 108 117 104 103 110 104 105 99 108 y 84 64 84 68 69 68 69 46 57 71
i=1
i=1
≈2.646.
7
yi--y 2=0.664,
7
i=1
解:由折线图中数据和参考数据得-t =4,
7
(ti--t )2=28
,
i=1
7
yi--y 2=0.664,
7
(ti--t )(yi--y )=
7 tiyi--t
7
yi=47.36
i=1
i=1
i=1
i=1
-4×10.97=3.48,
则 r=
解:(1) x =2+3+54+5+6=4. y =2.2+3.8+55.5+6.5+7.0=5.
5
(2)xiyi-5 x y =112.3-5×4×5=12.3,
i=1
5
x2i -5 x 2=90-5×42=10,
i=1
5
y2i -5 y 2=140.78-5×52=15.78,
i=1
所以 r= 101×2.135.78≈0.979. 所以 x 与 y 之间具有很强的线性相关关系.
+
i=1
2×4=21,
所以样本yi--y
i=1 5
xi- x 2
=
5
yi--y 2
21 10×
46
i=1
i=1
≈3.162×16.80≈0.98. (2)由(1)知,r=0.98 接近于 1,说明 y 与 x 具有较强的线性相关关系.
题型2 判断相关性的强弱
• 下图是我国2015年至2021年生活垃圾无害化处理量 (单位:亿吨)的折线图.
• 注:年份代码1~7分别对应年份2015~2021.
• 由折线图看出,可用线性回归模型拟合y与t的关系,请求 出相关系数r,并用相关系数的大小说明y与t相关性的强弱.
7
7
参考数据:yi=10.97,tiyi=47.36,
y23 5 6
已知x和y线性相关,求相关系数r.
4
【 答 案 】 由 表 计 算 得 x = 9 , y = 4 , (xi - x )(yi - y ) = 14 ,
i=1
4
xi- x 2=2 5,
i=1
≈0.99.
4
yi- y 2=
i=1
10,所以 r=2
14 5×
10=5 7 2
样本相关系数r的性质
i=1
10
xiyi=120×84+108×64+…+99×57+108×71=73 796.
i=1
所以 r= 116 5847-3 71906×-11007×.8210477.83×846-8 10×682≈0.750 6. 由此可看出这 10 名学生的两次数学成绩具有线性相关关系.
• 利用相关系数r判断相关关系,需要应用公式计算出r的值, 由于数据较大,需要借助计算器.
i xi yi
x2i
y2i
xiyi
1 115 24.8 13 225 615.04 2 852
2 110 21.6 12 100 466.56 2 376
3 80 18.4 6 400 338.56 1 472
4 135 29.2 18 225 852.64 3 942
5 105 22 11 025 484 2 310
• 【预习自测】 • 下面对样本相关系数r描述正确的是 • A.r>0表明两个变量负相关 • B.r>1表明两个变量正相关 • C.r只能大于零 • D.|r|越接近于0,两个变量相关关系越弱
()
• 【答案】D
• 【解析】因r>0表明两个变量正相关,故A错误;又因
r∈[-1,1],故B,C错误;两个变量之间的样本相关系数r的
求样本相关系数r,并作出评价.
• 错解:由题设数据,得
i xi yi
x2i
y2i
xiyi
1 115 24.8 13 225 615.04 2 852
2 110 21.6 12 100 466.56 2 376
3 80 18.4 6 400 338.56 1 472
4 135 29.2 18 225 852.64 3 942
∑ 545 116 60 975 2 756.8 12 952
x =5545=109, y =1156=23.2,
5
xiyi-5 x y
i=1
r=
5
xi2-5 x 2
5
y2i -5 y 2
i=1
i=1
=
60 9751-559×521-0952×·120795×6.283-.25×23.22=
1
3 308 570×
解:依题意, x =1+2+35+4+5=3, y =3+7+8+ 5 10+12=8,
5
xi- x 2= 22+12+02+12+22= 10,
i=1
5
yi--y 2=
52+12+02+22+42=
46,
i=1
5
(xi
-
x
)(yi
-
- y
)
=
(
-
2)×(
-
5)
+
(
-
1)×(
-
1)
+
0×0
+
1×2
• 1.假设关于某种设备的使用年限x(年)与所支出的维修费 用y(万元)有如下统计资料:
x2 3 4 5 6
y 2.2 3.8 5.5 6.5 7.0
5
5
5
已知 xi2=90, yi2=140.78, xiyi=112.3.
i=1
i=1
i=1
(1)求 x , y ;
(2)对 x,y 进行线性相关性检验.
请问这10名学生的两次数学成绩是否具有线性关系?
解: x =110(120+108+…+99+108)=107.8, y =110(84+64+…+57+71)=68,
10
x2i =1202+1082+…+992+1082=116 584,
i=1
10
y2i =842+642+…+572+712=47 384,
第八章 成对数据的统计分析
8.1 成对数据的统计相关性
8.1.2 样本相关系数
学习目标 1.结合实例,会通过相关系数比较多组成对数据的 相关性 2.了解线性样本相关系数r的求解公式,并会初步应 用
素养要求 数据分析 数学抽象
自学导引
样本相关系数r的计算 对于变量 x 和变量 y,设经过随机抽样获得的成对样本数据为(x1,y1), (x2,y2),…,(xn,yn),其中 x1,x2,…,xn 和 y1,y2,…,yn 的均值分别 为 x 和 y ,则变量 x 和 y 的样本相关系数
• C.如果r=±1,说明x与y之间完全线性相关
• D.线性相关系数r∈(-1,1)
• 【答案】ABC
• 【解析】∵相关系数|r|≤1,∴D错误.
• 4.(题型2)为了比较甲、乙、丙、丁四组数据的线性相关 性的强弱,某人分别计算了甲、乙、丙、丁四组数据的线性 相关系数,其数值分别为-0.95,0.87,0.58,0.92,则这四组数 据中线性相关性最强的是________组数据.
• 2.对四对变量y和x进行线性相关检验,已知n是观测值 组数,r是样本相关系数,且已知:
• ①n=7,r=0.953 3;②n=15,r=0.301 2;
• ③n=17,r=0.499 1;④n=3,r=0.995 0.
• 则变量y和x线性相关程度最高的两组是
()
• A.①②
B.①④
• C.②④
()
• A.y与x线性不相关 B.y与x正线性相关
• C.y与x负线性相关 D.以上都不对
• 【答案】C
• 【解析】因为r=-0.730<0,所以y与x负线性相关.
• 3.(题型1)(多选)下列说法正确的是
()
• A.变量间的关系是非确定性关系,因此因变量不能由自 变量唯一确定
• B.线性相关系数可以是正的或负的
5 105 22 11 025 484 2 310
∑ 545 116 60 975 2 756.8 12 952
x =5545=109, y =1156=23.2,
5
xiyi-5 x y
i=1
r=
5
x2i -5 x 2
5
y2i -5 y 2
i=1
i=1
=
15 952-5×109×23.2 60 975-5×1092· 2 756.8-5×23.22
• 2.|r|越接近1,它们的散点图越接近一条直线,两个变 量之间的线性相关关系越强.
• 1.(题型2)两个变量之间的相关程度越低,则其线性相关
系数的数值
()
• A.越小
B.越接近1
• C.越接近0
D.越接近-1
• 【答案】C
• 2.(题型1)给定y与x是一组样本数据,求得样本相关系数
r=-0.730,则
7
ti--t yi--y
i=1
7
ti--t 2
7
yi--y 2≈2×2.634.64×8 0.664≈0.99,
i=1
i=1
y 与 t 的相关系数近似为 0.99,接近于 1, 所以 y 与 t 的线性相关性较强.
• 样本相关系数能精确刻画两变量线性相关关系的强弱,|r| 越接近1,它们的散点图越接近一条直线,两个变量之间的线 性相关关系越强.因此计算时要仔细,随时做好检查,防止 错误数据给后续步骤带来连锁反应,为避免出错,以及出错 后便于检查,可将公式分解分别求值.
n
xi- x yi- y
i=1
r=
.
n
xi- x 2
n
yi- y 2
i=1
i=1
注:r 也可以表示为
n
xiyi-n x y
i=1
r=
.
n
xi2-n x 2
n
y2i -n y 2
i=1
i=1
• 【预习自测】 • 某研究机械对高中学生的的记忆力x和判断力y进行统计分析,
得到下列数据:
x 6 8 10 12
• 【答案】甲
• 【解析】因为线性相关系数的绝对值越大,线性相关性 越强,所以甲组数据的线性相关性最强.
• 5.(题型1)(2022年四川一模)下表是弹簧伸长的长度 x(cm)与拉力值y(N)的对应数据:
长度x/cm 1 2 3 4 5 拉力值y/N 3 7 8 10 12 (1)求样本相关系数 r(保留两位小数); (2)通过样本相关系数 r 说明 y 与 x 是否线性相关. 参考数据: 10≈3.16, 46≈6.80, 23≈4.80.