几种常用的数据分析方法共21页文档
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
当自变量不只一个时,可进行多元线 性回归分析。研究一个因变量与多个自变 量之间的线性依存关系,称为多元线性回 归。
REG 过程是用最小二乘法原理求 解线性回归方程的过程。
只有弄清楚两个变量之间存在显著的相关 关系时,才能使用直线回归模型。
举例
简单线性回归分析 某一中学高三老师在多次实践的基础上建立 了一个试题库。今年年初以来,他们从该题库中 提出三套试卷,对高三学生进行摸底考试。最近, 高考前一个月,他们又根据今年最新考试大纲要 求,设计了一份新的模拟考试,用该试卷对高三 学生再次进行摸底考试。题库试题成绩在多大程 度上能预测新模拟试卷的成绩。
当研究多个随机变量之间的相互关系时,
可对变量进行多元线性相关分析。多元线 性相关的统计量是全相关系数R和各偏相 关系数。在多元线性相关分析中,变量之 间的关系是错综复杂的,两个变量间的简 单线性相关系数往往不能正确说明两者的 真实关系,只有在其它变量固定,即扣除 了其它变量的影响后,计算两变量间的偏 相关系数才能反映此两变量的真实情况。
单因素方差分析 多元方差分析 重复测量方差分析
3. 举例
例1.完全随机设计资料的方差分析(单因 素方差分析)
下面列出了15名英语专业学生四次听力测验的 成绩。这四次测验的内容与主题各不相同,第一 次的主题是科普读物,第二次的是时事新闻,第 三次的是名人轶事,第四次的是美国文化方面的 短文。这四次听力考试的平均成绩是否有显著差 异,即听力材料的主题与内容对考试成绩有没有 影响。
检验两个均数间差别的显著性可以用t检 验法,也可用方差分析法。
方差分析的基本概念
样本均数间所以有差别,可能有两 种原 因造成:
– 首先它们必须有抽样误差(个体间变异的影 响;
– 其次,如果各组所接受的不同处理方法是有 不同的作用的,那么,它也是由于处理不同 所造成的。
常用的方差分析法有以下4种:
CORR过程计算变量间的相关系数, 包括PEARSON积矩相关系数等,同时给 出单变量描述统计。
REG过程是SAS中通用的基本的回 归分析过程,它是用最小二乘法原理求解 线性回归方程的有效过程。此外,因为逐 步回归分析的方法在实际工作中应用甚广, 故将其单独提出来介绍如何使用REG过程 进行逐步回归分析。
方差、相关与回归分析
主要内容
方差分析
– 方差分析的过程 – 单因素方差分析 – 二因素方差分析
相关分析
– 相关分析的过程
回归分析
– 一元回归 – 多元回归
方差方析
方差分析是检验两个或两个以上样 本均数间差异是否显著的方法。 在 比 较 几 个 组 时 , H0 假 设 通 常 是 设 各 组平均值相等。
谢谢!
表1 测验1(科普读 测验2(时事新闻) 测验3(名人轶 测验4(美国文
物)
事)
化)
12
16
15
16
9
10
14
14
8
8
6
7
16
17
18
19
11
9
10
8
13
14
9
10
10
11
。。。。 。。。。
。。
。。
相关与回归
在医学上人的身高与体重、体温与脉 搏次数、年龄与血压、药物剂量与疗效等 均有一定的联系。说明客观事物或现象相 互关系的密切程度并用适当的统计指标表 示出来,这是相关分析的任务。把客观事 物或现象间的关系用函数形式表示出来, 则是回归分析所要解决的问题。
CORR 过程
相关分析
相关是研究随机变量之间相互关系的统计分 析方法,它研究随机变量之间相互关系的密切程 度。
线性相关,又称简单相关。其统计指标是 PEARSON 相关系数 r 。
相关分析的取值在-1与+1之间,当数值越接 近+1或-1时,说明关系越密切,接近0时,说明 几乎没有关系。
相关分析要回答的问题就是:变量x的一 组高数值是不是与变量y的一组高数值有 必然的联系,或者变量x的高数值就导致 了变量y的数值变低。作为根据的变量就 是自变量,发生对应变化的就是因变量。
当变量不服从正态分布时,例如 按等级分类或相对数资料,这时需用 非参数相关分析方法,如等级相关分 析法等。
源自文库
二变量相关分析
12名英语专业学生参加了语音、听写和 语法三项考试:语音考试与听写考试之 间的相关程度?语音考试与语法考试之 间的相关程度?听写与语法之间的相关 程度?
偏相关分析(partial correlations)
云南省西双版纳地区是傣族同胞聚居区, 他们的母语是傣语,但那里的儿童小学 开始学习汉语,上中学时又学习英语。 研究人员在该地区对30名受过高等教育 的傣族成年人进行了傣、汉、英三种语 言水平的测试
REG 过程
回归是研究随机变量(学习成绩)和 非随机变量(学习时间)之间的数量依存 关系的统计分析方法。当自变量X与因变量 Y之间呈直线关系时,称为直线回归。直线 回归要求因变量Y是服从正态分布的且方 差相等。