第3讲 变量相关关系与统计案例
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.回归方程与回归分析 (1)线性相关关系与回归直线 如果散点图中点的分布从整体上看大致在 04 ___一__条__直__线____附近,就称 这两个变量之间具有线性相关关系,这条直线叫做回归直线. (2)回归方程 ①最小二乘法:求回归直线使得样本数据的点到回归直线的 05 __距__离___ __的__平__方__和___最小的方法叫做最小二乘法. ②回归方程:方程y^=b^ x+a^ 是两个具有线性相关关系的变量的一组数 据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中a^ ,b^ 是待定数.
1.下面是一个 2×2 列联表:
y1
x1
a
x2
22
合计
b
其中 a,b 处填的值分别为(
y2 21 25 46 )
A.94 72
B.52 50
C.52 74
D.74 52
总计 73 47 120
解析 由 a+21=73,得 a=52,a+22=b,得 b=74.故选 C.
解析 答案
2.(2019·湖南衡阳联考)甲、乙、丙、丁四位同学各自对 A,B 两个变
(3)回归分析 ①定义:对具有 06 ____相__关__关__系_____的两个变量进行统计分析的一种常 用方法. ②样本点的中心:在具有线性相关关系的数据(x1,y1),(x2,y2),…, (xn,yn)中,-x =1n(x1+…+xn), -y =1n(y1+…+yn),a^ =-y -b^ -x ,(-x ,-y )称为样本点的中心.
1.相关关系与函数关系的异同 共同点:二者都是指两个变量间的关系; 不同点:函数关系是一种确定性关系,体现的是因果关系,而相关关 系是一种非确定性关系,体现的不一定是因果关系,也可能是伴随关系. 2.从散点图看相关性 正相关:样本点分布在从左下角到右上角的区域内; 负相关:样本点分布在从左上角到右下角的区域内. 3.回归直线y^=b^ x+a^ 必过样本点的中心.
下表:
广告费用 x(万元)
4
2
3
5
销售额 y(万元)
49 26 39 54
3.(2019·湖北荆州模拟)已知相关变量 x 和 y 满足关系 y=-0.1x+1, 相关变量 y 与 z 负相关.下列结论中正确的是( )
A.x 与 y 正相关,x 与 z 负相关 B.x 与 y 正相关,x 与 z 正相关
C.x 与 y 负相关,x 与 z 负相关
D.x 与 y 负相关,x 与 z 正相关
量的线性相关性做了试验,并用回归分析方法分别求得相关系数 r 与残差
平方和 m,如下表:
甲
乙
丙
丁
r
0.82
0.78
0.69
0.85
m
106
115
124
103
则哪位同学的试验结果体现的 A,B 两变量有更强的线性相关性( )
A.甲
B.乙
C.丙
D.丁
解析 r 越大,m 越小,线性相关性越强,故选 D.
解析 答案
答案
附:
P(K2≥k0) k0
0.05 3.841
解析 由列联表中的数据可得
,
0.010 6.635
0.001 10.828
≈7.822>6.635,故有 99%以上的把握认为 “爱好该项运动与性别有关”.故选 A.
解析
5.(2020·山西太原摸底)某产品的广告费用 x 与销售额 y 的统计数据如
0.001
k0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 ②如果 k≥k0,就推断“X 与 Y 有关系”,这种推断犯错误的概率不超过
P(K2≥k0);否则,就认为在犯错误的概率不超过 P(K2≥k0)的前提下不能推
断“X 与 Y 有关系”.
总计 a+b c+d a+b+c+d
(2)独立性检验
利用随机变量
(其中 n=a+b+c+
d 为样本容量)来判断“两个变量有关系”的方法称为独立性检验.
步骤如下:
①计算随机变量 K2 的观测值 k,查表确定临界值 k0:
P(K2 ≥k0) 0.5 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005
①分类变量
可用变量的不同“值”表示个体所属的 11 ____不__同__类__别______的变量称为
分类变量.
②2×2 列联表
假设有两个分类变量 X 和 Y,它们的取值分别为{x1,x2}和{y1,y2},其 样本频数列联表(称为 2×2 列联表)为
x1 x2 总计
y1 a c a+c
y2 b d b+d
解析 因为 y=-0.1x+1 的斜率小于 0,故 x 与 y 负相关.因为 y 与 z 负相关,可设 z=b^ y+a^ ,b^ <0,则 z=b^ y+a^ =-0.1b^ x+b^ +a^ ,故 x 与 z 正相
关.
解析 答案
4.通过随机询问 110 名不同的大学生是否爱好某项运动,得到了如下的
第十章 统计、统计案例 第3讲 变量相关关系与统计案例
1
PART ONE
基础知识整合
1.变量间的相关关系 (1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关 关系;与函数关系不同,相关关系是一种非 01 ___确__定__性____关系. (2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的 这种相关关系称为 02 ___正__相__关____,点分布在左上角到右下角的区域内,两 个变量的相关关系为 03 __负__相___关____.
列联表.参照附表,能得到的正确结论是( )
男
女
总计
爱好
40
20
60
不爱好
20
30
பைடு நூலகம்
50
总计
60
50
110
A.有 99%以上的把握认为“爱好该项运动与性别有关”
B.有 99%以上的把握认为“爱好该项运动与性别无关”
C.在犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别有
关”
D.在犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别
③相关系数
,当 r>0 时,两变量 07 ___正____
相关;当 r<0 时,两变量 08 ___负____相关;当|r|≤1 且|r|越接近于 1,相关程
度 09 ____越__强_____;当|r|≤1 且|r|越接近于 0,相关程度 10 ____越__弱______.
3.独立性检验
(1)独立性检验的有关概念