相关系数课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
15
T检定:判断回归系数与常数项是否为0
t 检定 Coefficients 标准误差 t Stat P-value Lower 95% Upper 95% 下限 95.0% 上限 95.0% Intercept 1545.831536 315.1378 4.905255 0.0006 843.6605796 2248.002 843.66058 2248.0025 广告费(万) 3.14338351 1.212087 2.593364 0.0268 0.442684371 5.844083 0.44268437 5.8440827
旧车车龄与售价关系图 60.0 50.0 40.0 30.0 20.0 10.0 0.0 0 2 4
售价
y = -4.8091x + 57.8 R2 = 0.9865 6 车龄 8 10 12
6.5年的旧车车价==-4.8091*6.5+57.8=26.54
10
11
例5(非线性回归)、 我们收集了年龄与月收入关系的数据,请绘制该数 据的散点图,并求年龄对月收入的回归方程式。
树的直径与高度关系图 100 90 80 70 60 50 40 30 20 10 0 0 y = 21.512Ln(x) + 19.478 R 2 = 0.9257
高度
5
10
15 直径
20
25
30
13
2、使用“数据分析工具”进行回归分析
加入趋势线可以进行简单的回归分析,但要获得更多的统计数据,可以使用 数据分析工具,求简单相关系数、判定系数、用F检定判定变量与自变量间是 否有回归关系存在、用t检定判定各回归系数是否不为0、计算回归系数的置 信度、标准残差等。
扳金 省油 价格
扳金 省油 价格 1 -0.94 1 -0.91 0.835 1
8
四.回归分析
回归分析:当一个结果与一个或多个参数之间存在联系时,可以进行回归分析 ,通常可由一个或多个自变量来预测一个变量的值。 回归方程:表达参数与结果之间相互关系的数学方程式(数学模型) 线性回归:如果变量与结果之间具有线性关系,我们可以用线性方程式来描述 它们之间的关系,这种回归方法叫线性回归. 非线性回归:如果变量与结果之间不具有线性关系,我们必须用非线性方程式 来描述它们之间的关系(如指数关系,对数关系等等),这种回归方法叫非线性 回归. 单回归:当一个结果只与一个参数存在联系时,进行的回归分析称为单回归。 复回归:当一个结果与多个参数存在联系时,进行的回归分析称为复回归。 判定系数(R2):用来确定回归方程式的可解释性,即吻合程度。范围在0-1之间 ,越接近1,解释性越强,即吻合程度越高。 回归方法: 1、给图表增加趋势线; 2、使用Excel提供的“数据分析工具”; 9 3、利用回归函数
2.工作表函数
Excel 还提供了其他一些统计、财务和工程函数。某些统计函数是内置函 数,而其他一些函数只有在安装了“分析工具库”之后才能使用。
预备知识
要使用这些工具,用户还必须熟悉需要进行分析的统计学或工程学的特定 领域。
2
三.相关性分析
相关性分析: 判断两组数据集(可以使用不同的度量单位)之间的关系。 相关系数(R): 相关性计算的返回值。用来确定两个区域中数据的变化是否 相关,以及相关的程度。是两组数据集的协方差除以它们标准 偏差的乘积。 1、R>0:一个集合的较大数据与另一个集合的较大数据相对应( 正相关) 2、R<0:一个集合的较大数据与另一个集合的较小数据相对应( 负相关) 3、R=0:两个集合中的数据互不相关。 |R|<0.4 :低度相关; 0.4<=|R|<0.6:中度相关; 0.6<=|R|<0.8:高度相关; |R|>=0.8:非常高度相关
回归分析信息说明
14
方差分析(F检定):用回归分析检定,判定变量与自变量之间是否有显著的 回归关系存在。如果显著水准(Significance F)<a值,回归关系存在,否则不 存在。 (在这里判定系数a=1-置信度,在我们回归分析中置信度取95%, 所以a=1-95%=0.05)
方差分析 回归分析 残差 总计 结 论: F 检定中的显著水准 Significance F = 0.026794856<a=0.05 说明 :销售量与广告费存在回归关系 . df 1 10 11 SS MS F Significance F 1765442来自百度文库1765442 6.726 0.026794856 2624983 262498.3 4390425
12
例6(非线性回归)、 我们收集了一个原始森林中树的直径与高度之间的 关系数据,请绘制该数据的散点图,并求直径与高度的回归方程式(指数 回归)。
直径 0.9 1.2 2.9 3 3.3 4 6.5 9.6 12.4 16.2 27.2 高度 17 25 32 35 46 58 69 75 72 78 85
y = -4.8091x + 57.8
17
练习题:以下是银行客户的存款金额与贷款金额对照表,用数据分析工 具求存款金额对贷款金额的回归方程,并预测当存款金额为80千万时, 贷款金额为多少? 回归统计
存款金额 贷款金额 (千万) (千万) 65 54 102 87 42 34 58 48 95 81 73 62 32 25 124 107 135 117 45 37
1、给图表增加趋势线进行回归分析
例4(线性回归)、 我们收集了某厂家同一车型中旧车的车龄及其售价数 据,请使用给图表增加趋势线,求车龄对售价的回归方程,并计算车龄为 6.5年的旧车售价是多少.
车龄 1 2 3 4 5 6 7 8 9 10
价格(万) 56.0 48.5 42.0 37.6 32.5 28.7 22.2 18.5 15.0 12.5
方差分析 df 回归分析 残差 总计 SS MS F Significance F 1 1908.007 1908.007 585.7682 9.0595E-09 8 26.05818 3.257273 9 1934.065
Coefficients 标准误差 t Stat P-value Lower 95% Upper 95%下限 95.0% 上限 95.0% Intercept 57.8 1.232907 46.88106 4.74E-11 54.9569086 60.64309 54.95691 60.64309 车龄 -4.809090909 0.198701 -24.2026 9.06E-09 -5.2672966 -4.35089 -5.2673 -4.35089
例 7、根据广告费与销售额统计数据使用分析工具进行回归分析。
月份 广告费 (万 ) 销售量 (万 ) 1 245 3000 2 280 3200 3 175 1850 4 165 1650 5 150 1500 6 190 2400 7 240 2800 8 610 2960 9 190 2400 10 150 1600 11 140 1500 12 220 2350
1
数据分析方法
1.分析工具库
Excel 提供了一组数据分析工具,称为“分析工具库”,在建立复杂统 计或工程分析时可节省步骤。只需为每一个分析工具提供必要的数据和 参数,该工具就会使用适宜的统计或工程函数,在输出表格中显示相应 的结果。其中有些工具在生成输出表格时还能同时生成图表。 安装“分析工具库”: 要使用查看可用的分析工具,请单击“工具”菜单中的“数据分析”命 令。如果“工具”菜单中没有“数据分析”命令,则需要安装“分析工 具库”。
例 3、总平均成绩、出勤率、选修学分与每周打工小时 数的关系。
7
例 利用“数据分析”工具计算汽车扳金、省油与价格的 满意度之间的相关系数。
汽车的扳金、省油与价格的满意度(5-很满意,1-很不满意)
扳金 4 5 4 3 3 4 1 4 3 4 5 3 2 1 省油 3 2 3 4 3 3 5 3 3 3 2 4 5 5 价格 2 1 3 3 4 3 5 3 4 3 2 3 5 5
16
例8.我们收集了某厂家同一车型中旧车的车龄及其售价数据,请使 用数据分析工具,求车龄对售价的回归方程
车龄 1 2 3 4 5 6 7 8 9 10 价格(万) 56.0 48.5 42.0 37.6 32.5 28.7 22.2 18.5 15.0 12.5
SUMMARY OUTPUT 回归统计 Multiple R R Square Adjusted R Square 标准误差 观测值 0.993241 0.986527 0.984843 1.804792 10
年龄与每月所得的关系图(多项式回 归) 60000.0
每月所得
40000.0 20000.0 0.0 0
y = -36.54x 2 + 3463.7x 42087 2 R = 0.884 20 40 60 年龄 80 100
有些数据间并不是简单的线性关系,如果用线性模式求其回归方程式,判定系 数(R2)很小,根本不具有任何解释力。因此要引入非线性回归,如多项式、 指数、对数等回归方法。
Intercept:回归方程中的常数项信息 广告费(万):自变量X的回归系数信息
结 论:
t 检定结果中,常数项为 1545.832, P-value = 0.00061826<a=0.05 说明 :回归方程式的常数项不应为 0,不可将其省略。 自变量广告费的显著水准 P-value = 0.026795<a=0.05 说明:广告费与销售量间存在直线关系,其系数为 3.14338351,正相关。 回归方程式为 : Y=3.143384X+1545.832
Multiple R R Square Adjusted R Square 标准误差 观测值 0.999956 0.999912 0.999901 0.314492 10
方差分析 df 回归分析 残差 总计 SS MS F Significance F 1 8970.809 8970.8 90701 1.65436E-17 8 0.791241 0.0989 9 8971.6
年龄 15 20 25 30 35 40 45 50 55 60 65 70 75 80 每月所得 6000.0 10000.0 15000.0 26000.0 35000.0 42000.0 50500.0 40500.0 37650.0 30500.0 25000.0 15800.0 10200.0 8000.0
3
1、CORREL函数: CORREL(array1,array2)
返回单元格区域 array1 和 array2 之间的相关系数。使用相关系数可以确 定两种属性之间的关系。例如,可以检测某地的平均温度和空调使用情况之 间的关系。 Array1 第一组数值单元格区域。 Array2 第二组数值单元格区域。 如果数组或引用包含文本、逻辑值或空白单元格,这些数值将被忽略,但是 包含零值的单元格将计算在内。 如果 array1 和 array2 的数据点的数目不同,函数 CORREL 返回错误值 #N/A。
4
例 1、利用统计数据计算广告费与销售额之间的相关系 数。
相关系数
CORREL(B4:B15,C4:C15)=0.92251818
5
例2.我们收集了某厂家同一车型中旧车的车龄及其售价数据,求价 格与车龄的相关系数
6
2、使用数据分析工具求相关矩阵
利用CORREL函数只能返回两种属性之间的相关系数,如果使用Excel提供 的“数据分析”工具可以计算多组数据间的相关系数,组成相关系数表 。
excel回归分析
数据分析:根据电子表格中的数据以图形或数值的方式得出一些有意义 的结论.比如:数据的排序,筛选,运算,统计,图表化等等都可以说是数 据分析的手段. 这里我们主要讲以下几个数据分析问题: 一.变量求解:有些数据之间存在因果关系,这些因果关系可以用数学模 型来描述,如方程式,不等式等,如果知道了结果数据,能否根据这些数 学模型求出原因变量的值?EXCEL提供一些这样的方法,如单变量求解, 规划求解等. 二.模拟运算表:根据数学模型(公式)为一组假设数据产生预测结果,以 供分析决策 三.相关性分析:判断两组数据集(可以使用不同的度量单位)之间的关 系。 四.回归分析:当一个结果与一个或多个参数之间存在联系时,可以进行 回归分析,通常可由一个或多个自变量来预测一个变量的值。