聚类分析例题及解答

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

聚类分析作业

例题:

country populatn density urban religion lifeexpf lifeexpm literacy pop_incr Afghanistan 20,500 25.0 18 Muslim 44 45 29 2.8 Bangladesh 125,000 800.0 16 Muslim 53 53 35 2.4 Cambodia 10,000 55.0 12 Buddhist 52 50 35 2.9 China 1,205,200 124.0 26 Taoist 69 67 78 1.1 HongKong 5,800 5,494.0 94 Buddhist 80 75 77 -0.1 India 911,600 283.0 26 Hindu 59 58 52 1.9 Indonesia 199,700 102.0 29 Muslim 65 61 77 1.6 Japan 125,500 330.0 77 Buddhist 82 76 99 0.3 Malaysia 19,500 58.0 43 Muslim 72 66 78 2.3

N.Korea 23,100 189.0 60 Buddhist 73 67 99 1.8 Pakistan 128,100 143.0 32 Muslim 58 57 35 2.8 Philippines 69,800 221.0 43 Catholic 68 63 90 1.9

S.Korea 45,000 447.0 72 Protstnt 74 68 96 1.0 Singapore 2,900 4,456.0 100 Taoist 79 73 88 1.2 Taiwan 20,944 582.0 71 Buddhist 78 72 91 0.9 Thailand 59,400 115.0 22 Buddhist 72 65 93 1.4 Vietnam 73,100 218.0 20 Buddhist 68 63 88 1.8

进行聚类分析,步骤如下:

1、标准化的欧式距离聚类

各类所属

得出以上结果,以欧氏距离为计算距离方法,把以上17个亚洲国家地区按6个变量欧氏距离划分为三类。

第一类为:Bangladesh

第二类为:China

第三类为:Malaysia 2、尝试其他类间距离方法

其他类间距离方法得出以上结果,以欧氏距离为计算距离方法,把以上17个亚洲国家地区按6个变量欧氏距离也可以划分为以下三类:

第一类为:Bangladesh

第二类为:China

第三类为:Malaysia

3、用样本主成分画图

由图可知,所聚成的3类中:

第1类有5个样本,类间距离较接近,效果较好;

第2类有6个样本,类间距离较接近,效果次之;

第3类有6个样本。类间距离较离散,效果最差。

相关文档
最新文档