判别分析实例
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
used
第7页,本讲稿共18页
结果分析
第8页,本讲稿共18页
结果
第9页,本讲稿共18页
第10页,本讲稿共18页
第11页,本讲稿共18页
第12页,本讲稿共18页
• 根据上表可以得出分类判别函数: • 完成博士学位=-394.5+11.8x性别+3.73x专业GRE成绩-3.48xGRE语
言成绩+18.86x推荐信2+17.54x推荐信3+12.35x动机水平+3.66x财 力和支持系统+2.9x被试当时的年龄+9.34X选择者进行面试后的印
第3页,本讲稿共18页
• SPSS操作程序 在因变量category的基础上预测被试对两组的从属关系。用17个自变量来
建立判别方程。 选择stepwise过程,采用使wilks'lamabda最小化的方法,加入变量的标准F值为
1.15,移除变量的标准F值为1.00;然后,选择Mean,Box'sM(多元正态性检验)和 UnivariateANOVA(检验所有自变量在各组间有无差别),以便对自变量的单变量 特征有更全面的理解,计算unstandarddized(基于判别变量原始分数建立的判别函 数的非标准化系数)Fisher's founction coefficients(规范判别函数系数)。 输出部分:选择Combined-groups plot(包括2个组别的直方图),Result for each case(所有被试的真实分组信息) 和Summary table(累计每组正确分 类和未正确分类数目及百分比)
判别分析实例
第1页,本讲稿共18页
研究目的: 使用先前博士研究生的信息来预测后来学生是否能成功完成毕业项目。
包括10-7年前50 个学生的信息。因变量是category(1代表完成了博士学业,2代表没 有)。用17个预测变量预测被试在两组中的从属关系,这些变量为:
• gender: 性别,1代表女性,2 代表男性 • age: 被试当时的年龄 • marital:婚姻状况, 1代表已婚,2 代表单身 • gpa: 未毕业时总的GPA • areagpa: 专业领域的GPA • grearea: GRE考试中专业领域的得分
第2页,本讲稿共18页
• grequant: GRE考试中数学部分的得分 • greveral: GRE考试中词汇部分的得分 • letter1:三封推荐信中的第一封(1代表很弱,9代表很强) • letter2:三封推荐信中的第二封(评分同上) • letter3:三封推荐信中的第三封(评分同上) • motive:申请者的动机水平(从1到9分别代表从低到高) • stabe:申请者的情绪稳定性(从此项开始评分标准都同上) • resourse:财力和支持系统 • interact: 申请者与同事和导师友好相处的能力 • hostile: 申请者的内心敌对程度 • inpress: 选择者进行面试后的印象
• 判别分析能够容忍不符合正态的情况: A sample size of about
20 in the smallest cell should ensure robustness to violation of
normality as long as sample size are equal and two-tailed tests are
第4页,本讲稿共18页
结果分析
第5页,本讲稿共18页
结果分析
第6页,本讲稿共18页
• significance值等于0.024表示数据与多元正态分布存在显著差 异。但显著性小于.05并不代表不能进行判别分析。有发现证明, 即使在多元正态性被违反的条件下,判别函数仍经常运行得相当 好。因为这个值很低,因此比较好的做法是查看包含在分析中的 一些变量的一元正态性(univariate)。如,性别变量不是正态 分布,但放入性别变量却能提高判别方程的功能。
象
• 未完成博士学位=-369.5+14.99x性别+3.98x专业GRE成绩3.73xGRE语言成绩+20x推荐信2+16.23x推荐信3+10.78x动机水平 +3.1x财力和支持系统+2.59x被试当时的年龄+8.51x选择者进行面 试后的印象
第13页,本讲稿共18页
存在问题
• 由于本数据为虚拟数据,被试量为50,以及分类只有两类等原因, 有很多关于判别分析的事项需要注意:
• 最小的组中的记录数是否显著超过预测变量的数目,是 否产生过度拟合的问题?
第14页,本讲稿共18页
第15页,本讲稿共18页
第16页,本讲稿The end,thank you!
第18页,本讲稿共18页
第7页,本讲稿共18页
结果分析
第8页,本讲稿共18页
结果
第9页,本讲稿共18页
第10页,本讲稿共18页
第11页,本讲稿共18页
第12页,本讲稿共18页
• 根据上表可以得出分类判别函数: • 完成博士学位=-394.5+11.8x性别+3.73x专业GRE成绩-3.48xGRE语
言成绩+18.86x推荐信2+17.54x推荐信3+12.35x动机水平+3.66x财 力和支持系统+2.9x被试当时的年龄+9.34X选择者进行面试后的印
第3页,本讲稿共18页
• SPSS操作程序 在因变量category的基础上预测被试对两组的从属关系。用17个自变量来
建立判别方程。 选择stepwise过程,采用使wilks'lamabda最小化的方法,加入变量的标准F值为
1.15,移除变量的标准F值为1.00;然后,选择Mean,Box'sM(多元正态性检验)和 UnivariateANOVA(检验所有自变量在各组间有无差别),以便对自变量的单变量 特征有更全面的理解,计算unstandarddized(基于判别变量原始分数建立的判别函 数的非标准化系数)Fisher's founction coefficients(规范判别函数系数)。 输出部分:选择Combined-groups plot(包括2个组别的直方图),Result for each case(所有被试的真实分组信息) 和Summary table(累计每组正确分 类和未正确分类数目及百分比)
判别分析实例
第1页,本讲稿共18页
研究目的: 使用先前博士研究生的信息来预测后来学生是否能成功完成毕业项目。
包括10-7年前50 个学生的信息。因变量是category(1代表完成了博士学业,2代表没 有)。用17个预测变量预测被试在两组中的从属关系,这些变量为:
• gender: 性别,1代表女性,2 代表男性 • age: 被试当时的年龄 • marital:婚姻状况, 1代表已婚,2 代表单身 • gpa: 未毕业时总的GPA • areagpa: 专业领域的GPA • grearea: GRE考试中专业领域的得分
第2页,本讲稿共18页
• grequant: GRE考试中数学部分的得分 • greveral: GRE考试中词汇部分的得分 • letter1:三封推荐信中的第一封(1代表很弱,9代表很强) • letter2:三封推荐信中的第二封(评分同上) • letter3:三封推荐信中的第三封(评分同上) • motive:申请者的动机水平(从1到9分别代表从低到高) • stabe:申请者的情绪稳定性(从此项开始评分标准都同上) • resourse:财力和支持系统 • interact: 申请者与同事和导师友好相处的能力 • hostile: 申请者的内心敌对程度 • inpress: 选择者进行面试后的印象
• 判别分析能够容忍不符合正态的情况: A sample size of about
20 in the smallest cell should ensure robustness to violation of
normality as long as sample size are equal and two-tailed tests are
第4页,本讲稿共18页
结果分析
第5页,本讲稿共18页
结果分析
第6页,本讲稿共18页
• significance值等于0.024表示数据与多元正态分布存在显著差 异。但显著性小于.05并不代表不能进行判别分析。有发现证明, 即使在多元正态性被违反的条件下,判别函数仍经常运行得相当 好。因为这个值很低,因此比较好的做法是查看包含在分析中的 一些变量的一元正态性(univariate)。如,性别变量不是正态 分布,但放入性别变量却能提高判别方程的功能。
象
• 未完成博士学位=-369.5+14.99x性别+3.98x专业GRE成绩3.73xGRE语言成绩+20x推荐信2+16.23x推荐信3+10.78x动机水平 +3.1x财力和支持系统+2.59x被试当时的年龄+8.51x选择者进行面 试后的印象
第13页,本讲稿共18页
存在问题
• 由于本数据为虚拟数据,被试量为50,以及分类只有两类等原因, 有很多关于判别分析的事项需要注意:
• 最小的组中的记录数是否显著超过预测变量的数目,是 否产生过度拟合的问题?
第14页,本讲稿共18页
第15页,本讲稿共18页
第16页,本讲稿The end,thank you!
第18页,本讲稿共18页