聚类分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

多元统计分析教学大纲

(第二次修订)

河北经贸大学数学与统计学学院

信息与计算科学教研室编

2003年10月

编写说明

多元统计分析是统计学的一个重要分支。多元统计分析方法是处理多维数据不可缺少的重要工具,随着电子计算机的普及和发展,多元统计分析方法已愈来愈多地应用于社会经济各个方面的数据分析之中。为了规范教学,使我校的信息与计算科学专业课教学质量再上一个台阶,信息与计算科学教研室多元统计分析教学小组,在参照兄弟院校的相关课程教学大纲的基础上,修订本大纲,作为我校信息与计算科学专业教学、题库建设和教学检查的依据。

本课程从应用的角度出发,重点讲解常用的六种多元统计分析方法:聚类分析﹑判别分析﹑主成分分析、因子分析、对应分析和典型相关分析,对每一种分析方法要清楚掌握它解决哪类问题、前提条件和局限性,以及它们相互之间的区别与联系;会用SAS与SPSS软件实现上述过程,对所研究的问题能做出合理推断和科学评价。

学习本课程要求学生具有初等数理统计知识、一定的线性代数知识和计算机应用能力。

本大纲执笔人是信息与计算科学教研室陈旭红.

数学与统计学学院信息与计算科学教研室

2003年10月

课时分配表

章目内容课时

目录

第一章绪论 (1)

第一节什么是多元统计分析 (1)

第二节多元分析能解决的实际问题‥ (1)

第二章聚类分析 (1)

第一节什么是聚类分析 (1)

第二节距离与相似系数 (2)

第三节系统聚类法 (2)

第四节聚类分析的微机实现 (2)

第三章判别分析 (3)

什么是判别分析 (3)

距离判别法 (3)

费歇判别法 (4)

贝叶斯判别法 (4)

逐步判别法 (4)

判别分析的微机实现 (5)

第四章主成分分析 (5)

主成分分析及基本思想 (5)

主成分分析模型及几何解释 (6)

第三节主成分的计算 (6)

第四节主成分分析的微机实现 (7)

第五章因子分析 (7)

因子分析及基本思想 (7)

因子分析的数学模型 (7)

因子载荷矩阵的求解 (8)

因子模型的旋转 (8)

因子得分 (8)

因子分析的微机实现 (8)

第六章对应分析 (9)

对应分析及其基本思想 (9)

对应分析的基本原理 (9)

对应分析的计算步骤 (9)

第四节对应分析的微机实现 (10)

第七章典型相关分析 (10)

第一节典型相关分析及基本思想 (10)

第二节典型相关分析的数学描述 (11)

第三节总体的典型相关系数和典型变量 (11)

样本的典型相关系数和典型变量 (11)

典型相关系数的显著性检验 (11)

典型相关分析的微机实现 (11)

主要参考书目 (12)

第一章绪论

【教学目的与要求】通过本章的教学应使学生对多元统计分析课程有一个概括的认识。

【教学重点与难点】多元统计分析的概念及它能解决哪些类型的实际问题。【教学方法】课堂讲授与学生自学相结合。

【教学内容】多元统计分析的概念﹑多元统计分析的起源和发展及举例说明多元统计分析能解决的实际问题。

什么是多元统计分析

一﹑多元统计分析的概念

多元统计分析就是利用统计学和数学方法,将隐没在大规模原始数据群体中的重要信息集中提炼出来,简明扼要的把握系统的本质特征,分析数据系统中的内在规律性。利用多元分析中不同的方法还可以对研究对象进行分类和简化。多元分析是实现做定量分析的有效工具。

二﹑多元分析的主要内容

本课程重点介绍多元分析中常用的六种方法:聚类分析﹑判别分析﹑主成分分析及因子分析﹑对应分析和典型相关分析。

三﹑多元分析的起源和发展

第二节多元分析能解决的实际问题

多元分析在工业、农业、医学、经济学、教育学、体育科学、生态学、地质学、社会学、考古学、环境保护、军事科学、甚至文学中都有广泛应用,足见其应用的深度和广度。

【思考题】

1﹑什么是多元统计分析?

2﹑多元统计分析能解决哪些类型的实际问题?

第二章聚类分析

【教学目的与要求】通过本章的教学应使学生了解聚类分析的原理和作用,了解聚类分析中常用的距离和相似系数以及它们各自的特点及适用范围。掌握系统聚类法,能够应用系统聚类法解决实际数据分析问题。

【教学重点与难点】本章的重点是系统聚类法。

【教学方法】讲授原理、多媒体演示例题和学生自学相结合。

【教学内容】聚类分析的原理和作用﹑用系统聚类法如何解决实际数据分析问题。

第一节什么是聚类分析

一﹑聚类分析的概念

聚类分析又称群分析、点群分析,是定量研究样品或指标分类问题的一种多元统计方法。其中类指相似元素的集合。

二﹑聚类分析的基本思想

认为所研究的样品或指标之间存在着程度不同的相似性,根据一批样品的多个观测指标,找出能够度量样品或变量之间相似程度的统计量,并以此为依据,采用某种聚类法,将所有的样品或变量分别聚合到不同的类中,使同一类中的个体有较大的相似性,不同类中的个体差异较大。

第二节距离与相似系数

聚类分析的目的是将研究对象进行分类。它是在事先不知类别的情况下对数据进行分类的分析方法。分类的依据有两类:距离与相似系数。

常用的距离有以下几种:

1﹑明考夫斯基距离

2﹑绝对距离

3﹑欧氏距离

4﹑切比雪夫距离

5﹑马氏距离

6﹑兰氏距离

常用的相似系数有以下几种:

1﹑夹角余弦

2﹑相关系数

聚类分析根据所用方法不同可分为系统聚类法、有序样品聚类法、动态聚类法、

相关文档
最新文档