2024新高考数学基础知识梳理与课本优秀题目巩固-模块18-成对数据分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
模块十八:成对数据统计分析
1、变量的相关关系:(1)函数关系(确定性关系);(2)相关关系(线性相关和非线性相关)
2、散点图:成对数据都可以用直角坐标系中的点表示出来,由这些点组成的统计图叫散点图.
3、正相关和负相关
4、线性相关:
5、样本相关系数:
注:(1)样本相关系数r 是一个描述成对样本数据的数字特征,它的正负性可以反映成对样本数据的变化特征:
(2)样本相关系数r 的取值范围为[]1,1−,样本相关系数r 的绝对值大小可以反映成对样本数据之间线性相关的程度:
6、一元线性回归模型
7、线性经验回归方程与最小二乘法
注意:(1)经验回归直线一定过样本中心点()
,x y (2)残差分析:
8、刻画回归效果的方式
(1)残差图法:在残差图中(纵坐标是残差),残差点比较均匀落在以取值为0的横轴为对称轴的水平带状区域内,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明拟合精度越高.
(2)残差平方和:残差平方和为
()
2
i
i
y y −∑,残差平方好越小,模型拟合效果越好.
(3)利用决定系数2R 刻画拟合效果:
9、分类变量:为了表述方便,我们经常会使用一些特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.分类变量的取值可以用实数表示.
10、22⨯列联表
11、等高堆积条形图:展示列联表数据的频率特征,能够直观反映出两个分类变量之间是否相互影响.
(1)等高堆积条形图中有两个高度相同的矩形,每一个矩形中都有两种颜色,
观察下方颜色区域的高度,如果两个高度相差比较明显,就判定两个分类变量之间有关系.
(2)利用等高堆积条形图虽然可以比较各个部分之间的差异,明确展现两个分类变量的关系,但不能知道两个分类变量有关系的概率大小.
12、独立性检验
关系,并且能比较精确地给出这种判断的可靠程度.则:
注意:独立性检验结论描述:
(1)如果2x αχ≥,根据小概率值α的2
χ独立性检验,推断0H 不成立,即认为X 与Y 有关联,此推断犯错误的概率不大于α;(或者说:有()1100%α−⨯的把握认为X 与Y 有关联,或者说:在犯错误率不超过α的前提下认为X 与Y 有关联)
(2)如果2x αχ<,根据小概率值α的2χ独立性检验,没有充分证据推断0H 不成立,可以认为0H 成立,即认为X 与Y 没有关联;(或者说:没有()1100%α−⨯的把握认为X 与Y 有关联,或者说:在犯错误率不超过α的前提下不能认为X 与Y 有关联)
【课本优质习题汇总】
人教A 版选择性必修三P104
人教A 版选择性必修三P113(看懂残差分析)
人教A版选择性必修三P120
人教A版选择性必修三P136
人教B版选择性必修二P114
人教B版选择性必修二P120
人教B版选择性必修二P122
人教B版选择性必修二P126
人教B版选择性必修二P128
人教B版选择性必修二P128。