高中数学选修1-2《统计案例》知识点讲义

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
负相关:两个变量的变化趋势相反,从散点图可以看出各点散布的位置是从左上角到右下角的区域,即一个 变量的值由小变大时,另一个变量的值由大变小。
正相关
负相关
( 2 )相关性系数 r (在《必修 3 》中有介绍)
用相关系数 r 来衡量两个变量之间的相关关系
n
xi x yi y
r
i1
n
2n
2
xi x
yi y
6.635
7.879
10.828
4、利用列联表直接计算发现
a
c
a
b

c
d
相差很大,就判断两个分类变量之间有关系

第一章 统计案例
一、回归分析的基本思想及其初步应用
1、数学变量 相关关系 的定义: 当一个或几个相互联系的变量取一定的数值时,与之相对应的另一变量的值虽然不
确定,但它仍按某种规律在 一 定的范围内变化。变量间的这种相互关系,称为具有不确定性的相关关系
.
( 1 )按方向分类
正相关:两个变量的变化趋势相同,从散点图可以看出各点散布的位置是从左下角到右上角的区域,即一个 变量的值由小变大时,另一个变量的值也由小变大。
i1
i1
不相关
2、两变量之间的关系存在两种不同的类型 (1) 相关关系——非确定性关系
(2) 函数关系——确定性关系
3、回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。 其基本步骤是:①画出两个变量的散点图;
②求回归直线方程; ③并用回归直线方程进行预报。
4、回归直线方程: y b x a
n
( xi x)( yi y)
b
i1 n
( xi x)2
i1
n
xi yi
i1 n
xi2
i1
nxy
,
2
nx
a y bx
说明: 1 回归系数 b 0. 因为当 b 0时,相关系数 r 0, 这时不具有线性相关关系 .
2 x, y 称为样本点的中心,回归直线必定经过样本点的中心
.
例如:
4、线性回归模型用 y bx a e来表示 , 其中 a和 b为模型的未知参数 , e称为随机误差 . 残差:e yi y
n 2
5、相关指数 R2 是用来刻画回归效果的,
R2
1
yi
i1
n
yi
2
yi y
i1
R2 越大,残差平方和越小,模型的拟合效果就越好。
二、独立性检验的基本思想及其初步应用
1、列联表
假设有 两个分类变量 X 和 Y,它们的值域分另为 {x 1, x2} 和 {y 1, y2} ,其样本频数列联表为:
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
2
2、随机变量 K 2=
n ad bc
,其中 n a b c d为样本容量 .
abcd acbd
3、独立性检验
( 1)利用随机变量 K 2来判断“两个分类变量有关系”的方法称为独立性检验,并且能较精确地给出这种判断的
可靠程度。 ( 2)具体的做法是,由表中的数据算出随机变量
K 2 的值。 K 2 的值越大,说明 “X与 Y 有关系 ”成立的可能性越大。
下表 k 是观测值,概率 P 为犯错误的概率。
P( K 2 k ) 0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.0Hale Waihona Puke Baidu0
0.005
0.001
k
例如:
0.455 0.708 1.323 2.072 2.706 3.841 5.024
相关文档
最新文档