一种基于粒子群算法的聚类算法
基于混合粒子群优化算法的聚类分析
C 均值聚类 算法 。新 算法在基 本粒子群 优化 的模 糊 C 均值 聚类算法 的基础 上结合 了遗传算 法的 交叉 、 一 一 变异 算子及混 沌优 化
算法 , 引入逃 逸算子 。仿 真结 果表 明, 算法有效 地避免 了通常聚 类方 法易 出现 的早 熟现 象 , 并 该 同时也 具有较 快的收敛速 度
YA G ujn. DE N J- ‘ i u NG u— n, T NG i Hi we 一 E . Z
( .S h o f daa dAr,S z ; 1 c o l i n t u h uUnv ri f in ea dT c n lg ,S z o 0 ,C ia o Me t S 1 5
Ab ta t u z me n ( C ) c s r ga o t cne s y e rp e c l p i m d t l o v re c eys w y sr c:F zyc a F M — l t i g r h a i a p di a o a o t u e n l i m a lb t n l mu a s c n eg n e r o l.A n ia o v l
和较 高 的 准 确 度 。
关键词 : 粒子 群优化 算法;遗 传算 法;混沌优 化; 聚类分析 ;逃 逸算子 中图法分 类号 : P 9 T3 1 文献标 识码 : A 文 章编号 :0072 2 0 ) 252 —4 10 —04(0 8 2 —800
Cl se n l ss a e n h b i a t l wam p i z t nag rtm u tra ay i b s d o y rdp ri es r o t c miai lo i o h
2 aut f o ue n fr t nS in e o twet iest,Ch n qn 0 7 5 hn ; .F c l o C mp tr dI omai ce c ,S uh sUnv ri y a n o y o g ig4 0 1 ,C ia
基于粒子群算法的K均值半监督聚类算法研究
21 0 0年 7月
计算 机应 用与软件
C mp trAp l ai n n ot a e o u e p i t s a d S f r c o w
Vo. 7 No 7 12 .
J1 0 0 u.2 1
基 于粒 子 群 算 法 的 K 均值 半监 督聚 类 算 法 研 究
oN EM I S S . UPERVI ED M EANS CLUS S K. TERI NG BASED oN PARTI CLE Sw ARM oPTI I ATI M S oN
G oC a gO u h nyH
(  ̄at etfC m ue Si c n e n l yDe O nvrt, ehu2 32 Sa dn , hn ) Dp r n o ptr c nea dTc oo , z IU i syD zo 5 03,hn og C ia m o e h g hL ei
na c ma a e n pua in mi n g me to po lto s f
息, 以帮助 聚类算法获得更好 的聚类效果。在实际应用 中 , 有监
0 引 言
半监督 聚类是近几年提 出的一种新 型聚类方 法 , 它综合 了
o t s t n s ac . h e l o i m a o g o l sei g a c rc e n a n mb ro It s n a a s t. p i a i e r h T e n w ag r h h s g t o d cu trn c u a iso u e fUC e t g d t es mi o t i Ke wo d y rs S mis p r ie l se ig I r v d K。 a s a g rtm C n r fma s o t z t n P ril w r p i z t n D — e ’u e vs d c u t r mp o e me n l o h n i e t o s p i a i a ce s a e mi o t m ot miai y o
基于粒子群优化算法的交通数据流聚类分析
第一作 者简 介 : 云伟 ( 9 3 ) 男 , 潘 18 一 , 山东 省聊 城市人 , 士研究 硕 生 。研究方 向: 智能交通控制 。E m i pnu w i9 3 6 .o 。 - al ayn e18 @13 ci : n
该算 法 分 为 联 机 和脱 机 两 个 部 分 。联 机 部 分 将接 受到 的每个 数 据元 素 映射 到 某个 网格 中 , 脱 而
进行聚类分析 , 并将粒子群优 化算 法引入聚 类过程 , 从而对数据 流聚 类分 析方 法进行 了改进 , 使数据 聚类 能够 根据本 身的 密 度极大值有序生成 , 强 了用 户对聚类过程 的控制 能力 。通过 昆明市实测交通数 据流进行 聚类分析 , 增 得到 了能够 反映交通状
况不 同特征 的聚类结果和动态的控制策略 , 并对 交通数据流 的相关研 究工作提供决策支持。
无 限的。我们称 这样 的数 据 形态 为数 据 流… 。数 据
挖掘技术是信息 技 术进 步 的结果 。数 据挖 掘技 术 的
一
法 , 数据 聚类 能够 根 据本 身 的密 度极 大值 有 序 生 使 成 , 决 了聚 类 生 成 顺 序 的不 确 定 性 问题 , 强 了 解 增
用 户对 聚 类 过 程 的 控 制 能力 。仿 真 结 果 验 证 了该
2 1 年 7月 1 1收到 00 23 昆明理工大学学术科技创新基金课题
( 0 0 C 3 ) 助 21Y 11资
D S em算 法 使 用 密 度 网 格 ( esyGi) .t a r D ni r 结 t d 构 , 一种 基 于密 度 和 网格 的聚 类 算法 。它着 力 解 是 决对 任意 形状 的数 据 流 聚类 问题 、 调 了孤 立点 探 强
一种基于粒子群的聚类算法
Ke r s P rce wa pi zt n P O)K me i s loi m; e s ia zt n c s r g ywo d : a i r O t a o ( S ; - da g rh d ni i t l ai ;l t i t lS m mi i na t y t n ii o u en
C m u r n i ei d p lai s o p t gn r ga A pi t n 计算 机工 程与应 用 eE e n n c o
一
种基于粒子群 的聚类算法
姚 丽娟 , 可 , 罗 孟 颖 Y i a, UO K , NGYn AOLj n L eME ig u
t ni r o lx d et et o lxt s ih r E p rme tl eut h w a i lo i m a ih r i mo ec mp e u ot i c mp e i i g e ̄ x ei n a s l s o t t hsag r h h shg e o s h me y h r s h t t a c rc ,malr i o lxt, n r tbeo eal efr a c . c u a y s l mec mpe i a dmo esa l v rl p ro et y m ne
E gn eiga d pia o s2 1 , 8 1 ) 1 01 3 n iern n Ap l t n, 0 2 4 (3 : 5 -5 . ci
Ab t a t Af ra ay i g t e d s d a t g so i a ia i n s n i v n o a x mu o eK- d a sa g — sr c : t n lz n h ia v n a e fi t l t e s i e a d l c l e n i z o t ma i m f h me in l o t
基于粒子群的模糊聚类算法研究
21 年 O 月 02 3
佳 木 斯 大 学 学 报 ( 自 然 科 学 版 ) Junl f i s U i r t N trl c n eE io ) o ra o a i nv sy( a a S i c dt n J mu ei u e i
Vo .违反 ( )式和( ) 1 2 式给 出的约束 条件. 以 , 所 有必 要规 范位 置矩 阵. 首 先, 我们使所有矩阵中的消极元素变成为零. 如果 在一排所 有 的元 素矩 阵为 零 , 他们需 要 利用一 系列 在区间[ ,] O 1 的随机数重新编号 , 然后矩阵经过 以 下没有违反约束转化 :
22 8
佳 木 斯 大 学 学. ( 自 然 科 学 版 ) 报
): K
‘m ,
21 02年
( 1 1)
糊矩 阵 肛 相 同. 外 , 此 每个 微 粒 的速 度用 矩 阵 中 的
/和 c 7 , 描述 , 它们 的取 值范 围 [ ,] 我们 得 到相 一11 . 应 的基 于矩 阵运作 的更新 微粒 位 置和速 度 方程式 ,
0
1
2 3 4 5 6 数 据 集 (1 , , , , , ) n=1 2 3 4 5 6
图 4 六种数据集的平均 目 函数有效值 ( 标 p=1 , =04 ) 2 .5
3 聚类 问题优化处理
图 2 六 种 数 据 集 的 平 均 目标 函 数 有 效 僵 ( = B " =0 6) p , .
。
() 1
C ●
∑ =1 ‘ ,, n ’V =l …, 2
,0 l
() 2
・
0<∑ < V =1 , c () n _ , …, 『 2 3
基于粒子群优化的高斯核函数聚类算法
1 概 述
聚 类 分 析 是根 据 数 据 属性 的特 征 相 似 性 ,按 照 特 定 的 准
征 的。一般来说 ,离聚类中心越近的样本点对聚类 中心周围 的统计特性越有效 , 因此引进高斯概率 分布 函数作为核 函数 :
则作模式分类的过程 。作为一种无监督的学习方法 ,它在数 据挖掘 、图像处理、模式识别 、空间遥感技术和特征提取等
a c r c l se n y Ga s e n l u c i n sm i iy me s r , n p e p t e cu t rn r c s y t e I S Ex e me tl e u t h w h t e c u a y c u tr g b u sk r e n t i l t a u e a d s e d u l se i g p o e sb P O. p r i f o r a h h i n a s l s o t a r s h t p o o e l o i m a r ae e c i g c p b lt n l se n c u a y wh c ss p ro h M e n i n l ss o i e e u n y fa r p s d ag rt h h sg e t rs a h n a a i y a d c u tr g a c r c , i h i u e rt t e C— a n a a y i fv d o f q e c me r i i i o r r
YU Jn QI e g , AN F n i
( e a o a r f d a c dC nr l n t z t nfr h mia P o es s Mii r f d c t n K yL b rt yo v n e o t dOpi ai e c l r c se , ns yo u a o , o A oa mi o o C t E i
基于粒子群优化的模糊聚类算法
Ab ta t n od rt v ro h ee t fF zy C— a sAlo t m u h a h o a p i n e s— sr c :I r e oo ec me te d fcso u z me n g r h s c ste lc lo tmaa d s n i i
Th x e me t h ws h t h ag rt m i orc , efce t n fs , a d n ra e t e o v re c e e p r n s o t a te lo h i i s c re t f in a d a t n i ce s s h c n eg n e i s e d. pe K e r s:d t n n y wo d aa mi ig; cu tra ay i l se n lss;P r ce S r Opi zto a t l wam tmiain i
聚类是 数 据挖 掘 中一 种 应 用 广 泛 的 方 法 , 通
确 的界 限 , 不具 有非此 即 彼 的性质 , 而模糊 聚 类算
过 对数 据对象 的合理 划分 来 发 现数 据集 的结构 特 征, 使得 以某种 度量 为标 准 的相 似性 ( 般 是基 于 一 距 离 的) 同一类 的对 象 之 间最 小化 , 不 同类 的 在 在 对 象之 间最大 化 . 过 聚类 , 们 能 够识 别 密集 和 通 人 稀 疏 的区域 , 而发 现全 局 的分 布模 式 , 从 以及数 据 属 性 问的关 系… . 在传 统 聚类 方 法 中 , 本 所属 的 样 分 类都是 唯 一 的 , 实 际上 大 多 数 事 物 间没 有 明 但
黄 贤英 , : 于粒 子群 优化 的模 糊 聚类 算 法 等 基 局最优 解 , 而 限制 了该 算 法应 用 _ . 子群 优 化 从 2粒 ] (at l sam ot i tn P O 算法 是 由 K n ey prc w l pi z i , S ) ie ' m ao end 和 E e at 19 br r 于 9 5年 提 出 的 , 一 种 基 于 群 体 智 h 是 能 的具 有全 局 寻 优 能 力 的启 发 式 搜 索 算 法 , 于 源 对 鸟群捕 食行 为 的 研究 . 子 群 优 化 广 泛 应 用 于 粒 函数 优化 、 糊系 统控 制 等 领域 . 是该 算 法 的 局 模 但 部搜 索 能力较 弱 _ . 3 J 本研 究提 出 了一种 基 于 粒 子群 优 化 算 法 的模 糊 聚 类 算 法 ( a i e S a —ae uz ls r g P rc w r bsd F z Cut n tl m y e i 对模 糊分 类定 义 的 目标 函数 为
一种采用粒子群优化的聚类算法
1 引 言
聚类是对大量未知标注 的数据集 , 按数据 的内 在相 似性将数据集划分为多个类别 , 使类别 内的数 据相似度较大而类别间的数据相似度较小 , 是一种
无监督的模式识别问题 , 现在 已经在统计学 、 图像处 理、 机器学习 、 数据挖掘等领域得到了广泛的应用。 从分类的形式上看聚类主要 分为 : 基于划分 的 如 k en 、 于 层 次 的如 H c ]基 于 密 度 的如 - as 基 m A 、 D S A 基于 网格 的如 C IU 口 同时聚类主 BC N 、 LQ E 。
2T lc mmu iain n i e r gI si t, rF reE gn e n iest, ’n7 0 7 Chn .ee o n c t sE gn ei n t ue Ai oc n ie r gUnv ri Xia 7 , ia o n t i y 1 0
C mp tr gn eiga dA piain , 0 2 4 ( 0 :93 . o ue ier n p l t s2 1 , 8 1 )2 —3 En n c o
Ab t a t h a i o a l s r g a g r h a ema y s o to n s s c ss n i v i a au n un r sr c :T et d t n l u t i l o t msh v n h rc mi g , u h a e s i et i t l l ea d v l e - r i c e n i t o n i v a l o a n ma T e meh d t e e mi e t e n mb ra d l c t n o l se e t ri p o o e . o d t e r bet 1c 1 o mi i . h t o d t r n u e n a i fcu trc n e S r p s d Clu o y o h o o h
一种粒子群算法与FCSS相结合的模糊球壳聚类算法
★基金项 目 : 国家 自然基金资助项 目 言
由于常 用的模糊球壳 聚类算 法 F S C S在数据 点
存 在噪 声或 类与类 之 问较 为接 近时 ,F S C S算法往 往得 到错 误的聚类结果 。特别 是 由于采用了特殊 的
接近 时 ,F S C S算法往 往得 到错 误 的聚类 结果 。因
W u a a g ,Ya g i Biny n n M ng
( co l f cec, r ie i f hn , a un 0 0 5 , hn ) S h o o Sine Not Un rt o C ia T i a, 3 0 1 cia h v sy y
Ab t a t F zy C—s h r a h l cu tra o i m( CS )i wiey a pid t atr e o nt n a d ma hn sr c : u z p eil s el lse l r h F S s d l p l O p t n rc g io n c ie c g t e e i
基于免疫粒子群的K均值聚类算法
至 出现 无解 ; 于梯 度 下 降的方 法 使算 法过 早 的收 敛 于局 部最 优 [。为 了克 服 这些 缺 陷 , 多学 者提 出 了 基 3 ] 许 遗 传聚 类算 法[ 9 基于 蚁 群算法 的 聚类 算 法 [ 43  ̄和 1 。文 献 [ 1提 出 了用粒 子 群 求文 档 聚类 ; 献 [2 提 出 1] 文 1] 了 Al raie S 自动 检测 几 何结 构数 据 集 的聚类 中心 ; 靖 明等提 出 了基 于粒 子 群 的 K 均 值聚 类 算 t nt e v KP O 刘 法 L Ma a d提 出用 二元 粒 子群 自动 确定 K 值 的聚 类 算法 [ 于海 等 提 出 了小 生境 免疫 聚类 算法 h] 1 ; hme 。 1 ; s。
ቤተ መጻሕፍቲ ባይዱ
20 0 8年 9月
基于 免疫粒子群 的 K 均值 聚类算 法
王 纯杰 董小 刚 。刁心 薇。 , ,
(. 1 长春工业大学 基础科学学院 , 吉林 长春 1 0 1 ,. 3 0 2 2 吉林大学 商学院 , 吉林 长春 1 0 1 ; . 3 0 2 3 河北工 业大学 理学 院 , 天津 30 3 ) 0 10
1 免疫粒子 群 K 均值 聚类算法
基 于 免 疫 的 P O 算 法 的基 本 思 路是 : 子 群 在初 始 化 后 , 先 利 用 速 度 和 位 置 更 新 公式 指 导 其 “ S 粒 首 飞 行” 的方 向 , 为加 快收 敛速 度 和保 证群 体 多样性 , 选择 亲 和度 高 的抗 体进 行克 隆 操 作 , 使抗 体更 多 的聚 集在 “ ” 好 位置 的 附近 , 再对 克 隆后 的抗 体 进行 变异 , 使抗 体往 “ ” 置 附近 的各 个 方 向进行 探 索 。 好 位 11 粒子 编码 和适 应 度函 数 的构 造 .
基于免疫粒子群优化的聚类算法
中的数据尽 可能相似 ,而不同类之 间的数据尽 可能不同。聚 类作为数据 挖掘 中一种重 要的方法 ,现在越来越 为人们所重 视 。在 已有 的聚类算法中 ,K 均值 算法 因其 算法 简单快速 , 被广泛地应 用于数据挖掘和知识发现的领 域中。但是 K均值 算法 的聚类结果受初始聚类 中心影响 ,不 同的初始聚类 中心 可 能产 生不同的聚类结果 ,并且该算法容易 陷入局部极值 。 19 9 5年 K n ey和 E ehr 等人模拟 鸟群觅食 的过程 , en d b rat 首 次提 出了粒子群优化(S ) P O 算法…, 算法模拟鸟群飞行觅食 的行为 ,通 过鸟群之间的集体协作而使群体达 到最 优。P O S 是一种较好 的优化算法 ,它对优化 目标 函数 的形式没有特殊
Th x e i e t h w h tt e I — SO— ee p r m n s s o t a h M P KM EANS a g rt m v r o lo i h o e c me h r b e so me n l o i m , n h e u t fcuse i g a eb t r st e p o l m fK— a sa g rt h a d t er s lso l trn r e t e ta lo i h n ag rt hm a e n PS b s d o O.
I —S — ME NS解 决 了 K 均 值 存在 的 2个 缺 陷 ,并 且 比 M P OK A P O K AN S ME S具 有 更 好 的 聚 类 结 果 。
2 K均值 算 法
21 聚类 问题 的数学描述 . 聚类是在 没有预 先定义 好分类的情况下 ,将一个大 的数
[ ywo d ]cutr g l mn —S K— a sP rceS r Opi zt nP O Ke r s ls i ;mn eP O; me n; at l wam t ai (s ) en i mi o
基于粒子群优化的模糊C均值聚类算法
基于粒子群优化的模糊C均值聚类算法∗王宇钢【摘要】针对模糊C均值聚类算法(FCM)存在对初始聚类中心敏感,易陷入局部最优解的不足,将改进的粒子群聚类算法与FCM算法相结合,提出了一种基于粒子群优化的模糊C均值聚类算法.该算法对粒子群初始化空间及粒子移动最大速度进行优化,同时引入环形拓扑结构邻域,提高粒子群聚类算法的全局搜索能力.对UCI中3个数据集进行仿真实验,结果表明提出的基于粒子群优化的模糊C均值聚类算法相比FCM算法和基本粒子群聚类算法具有更好的聚类效率和准确性.【期刊名称】《微型机与应用》【年(卷),期】2018(037)008【总页数】5页(P36-39,44)【关键词】聚类;粒子群优化;模糊C均值聚类算法;粒子群聚类算法【作者】王宇钢【作者单位】辽宁工业大学机械工程与自动化学院,辽宁锦州121000【正文语种】中文【中图分类】TP3010 引言随着大数据、云计算等技术的迅猛发展,聚类分析已成为数据挖掘的主要研究手段之一。
为符合人类的认知,研究员将模糊集理论引入聚类分析中,提出了模糊C均值聚类算法(Fuzzy C-means Clustering Algorithm,FCM)。
经典FCM 算法由于是一种局部最优搜索算法,存在对初始聚类中心敏感、易于陷入局部最优解的缺陷,限制了算法的应用[1-2]。
因此,学者尝试通过各种智能算法对经典FCM 算法进行改进。
粒子群优化算法(Particle Swarm Optimization, PSO)作为群体智能算法的代表,依靠个体之间的简单交互作用在群体内自组织搜索,具有很强的学习能力和适应性[3]。
一些学者利用PSO算法克服传统FCM算法的缺陷,将PSO算法与FCM算法融合已成为近年来的研究热点[4]。
文献[5]针对FCM算法用于高维数据样本聚类时效果较差的不足,提出一种基于粒子群的FCM聚类算法。
该算法在满足FCM算法对隶属度限制条件的前提下,根据样本与聚类中心间距离重新分布了隶属度,并通过比较样本与各聚类中心距离加速最优粒子收敛。
一种带变异操作的粒子群聚类算法
G ≠
() 1 …
割 、 式识 别 、 提取和信号压缩等诸 多领 域中都有着广泛 模 特征
的应 用 , 并取得了令人满意的效果。 粒 子群算法 ( S [ P 0)1 1 是一种有效 的全局 寻优算法 , 它是 基 于群体智能理论的优化算法 , 通过群 体中粒子 间的合作与竞争
长沙理工大学 计算机与通信工程学 院 , 长沙 4 0 1 14 1
De a t n f C mp t r& C mmu i ain E gn e n C a g h i e s y o c e c n e h o o y, h n s a 4 0 C i a pr me t o o u e o n c t n i e r g, h n s a Un v ri f S i n e a d T c n l g C a g h 1 1 4, h n o i t 1
E ma ll q o g 1 @h t i. m - i:i in 7 5 omal o u e
L 砌 Qin ・ U ・ ls rn loi m ae H P r c w r O t z t n o g L O KeC ut ig ag r h b sd O a t l S am pi ai t tt nCo ue n ier g e t ie mi o h muai . mp tr E gn ei o n
fr s me p r ce o e c p r m h lc l o t l ou inTh ag r h o o a t ls t s a e fo t e o a p i i ma s l t . e lo i m i v l a e n I s p a t aa a e R s l h w t a o t s e au td o r l n s tb s . e u t s o h t i d s
一种基于粒子群优化的FCM聚类方法
足 。实验 结果表 明 , 该算法具有很 好的全局收敛性和较快的收敛速度。
聚类分析 粒子群优化算法 模糊 C一均值算法 全局优化
Ab ta t I r e v  ̄o h ee t fF z y C—me l l o i m u h a h o a p i n e ・ s r c n o d rt o e me t e d f cs o u z o al A g r h s c s t el c lo t s t maa d s n st i o i i aiai n,a n w P O —b e u z g rt m s p t o w r n t i a e . h e g r h u e i vt t n t z t i y i l o e S s a d f z y a oi l h i u r a d i sp p r T e n w a o t m s s f h l i
从表1可以看出传统的fcm算法对初始下转第92页信息技术与信息他随着计算机信息技术的不断应用从2002年开始我们逐步多我们利用计算机建立庞大的评委信息库在评审开始前一个采用计算机填写职称表格的办法并制作填写样表规定了填写小时从评委数据库中随机抽取一定数量的评委临时通知评委去的字体内容等不仅帮助申报人在填写过程中能方便的进行增外地参加评委会使申报者不知道今年的评委是谁就连评委也删改操作减少了他们因手t填写而浪费的不必要的时间精力
李丽丽 ‘ 刘希玉 一 刘 涛 孙 秀娟
H 一 HU X 一帆 HU T o S N i ia t ‘ a U Xu— u n
针 时模糊 C一均值 ( C 聚类算法易陷入局 部极 小值 和时初 始值敏 感的缺 点 , F M) 本文提 出了一种基 于粒 子群优 化的模糊聚类算法。该算法利用粒子群强大的全局寻优能力 , 克服 了模糊 C一均值 聚类算法的不
基于粒子群优化聚类算法的点模型简化
声 较 为敏感 , 易陷入 局部 极小 , 不 到全 局 最 优解 , 而 限制 了算 法 的应用 ; ) 于 随 机 的初 始 值选 取 容 得 从 2对 可能会 导致 不 同的聚 类结果 , 至存 在 着 无解 的情 况 ;) 聚类 或 划 分 时没 有 考 虑点 模 型 表 面 区域 的几 甚 3在
何 特征 , 只是 根据 采样 点 的空 间关 系 , 即忽略 了表 面 区域各 向异性 的 内在几 何特 征 , 得简 化 结果 不 能很 使 好 地保 留边 界等特 征 . 针对 上述 问题 , 文提 出一 种基 于粒 子 群优 化 的聚类 算 法 的点 模 型 简化 方 法 , 本 引入 了具 有 强大 全 局
第2Leabharlann 2 0 年 9 月 01
期
H N UNI VERS T I Y NATURAL S EN CE J URN AL OF AI AN CI O
海 南 大 学 学 报 自然 科 学 版
Vo _ 8 No 3 l2 . Sp2 0 e . 01
文 章编 号 :04—12 (0 0 0 0 4 0 10 7 9 2 1 )3— 2 1— 7
具有强大 全局 寻优 能力 的粒子群优化算法 , 对传 统的 一 均值聚类算法进行改进 , 基于改进的聚类算法 对点模 型进行简 化 , 选取具有最优个体适应度 函数 的粒 子作 为原始采样点集 的最终简化模型 . 算法聚类依据 采样点
的空 间位 置 、 向和 曲率 的邻 近 性 , 现 了点 模 型 表 面 区域 几 何 特 征 保 持 的 简 化 .同时 在 聚 类 区域 的 划 分 中 法 实
基于模拟退火粒子群算法的FCM聚类方法
基于模拟退火粒子群算法的FCM聚类方法
李丽丽;刘希玉;庄波
【期刊名称】《计算机工程与应用》
【年(卷),期】2008(44)30
【摘要】针对模糊C-均值(FCM)聚类算法易陷入局部极小值和对初始值敏感的缺点,提出了一种基于模拟退火粒子群优化的模糊聚类算法.该算法利用粒子群强大的全局寻优能力和模拟退火算法跳出局部极值的能力,克服了模糊C-均值聚类算法的不足.实验表明,该算法有很好的全局收敛性,能够较快地收敛到最优解.
【总页数】3页(P170-172)
【作者】李丽丽;刘希玉;庄波
【作者单位】山东师范大学,信息科学与工程学院,济南,250014;山东师范大学,管理与经济学院,济南,250014;滨州学院,计算机科学技术系,山东,滨州,256603
【正文语种】中文
【中图分类】TP301
【相关文献】
1.基于禁忌粒子群优化的FCM聚类方法 [J], 陈晓霞;廖家平;赵熙临;谌金豆
2.基于混沌振荡粒子群优化的 FCM 文本聚类方法 [J], 符保龙
3.基于VMD和FCM聚类方法的电网负荷分类 [J], 贾志达;姜枫;王海鑫;李铁;杨俊友
4.基于FCM模糊聚类方法以变电站为单元的电力系统负荷分类研究 [J], 顾羽
5.基于FCM的地震波形聚类方法研究 [J], 朱乾菲;柴变芳;韩红;硕良勋
因版权原因,仅展示原文概要,查看原文内容请购买。
基于环形邻域的混沌粒子群聚类算法
基于环形邻域的混沌粒子群聚类算法
环形邻域混沌粒子群聚类算法(Circular Neighborhood Chaotic Particle Swarm Clustering,CN-PSO)是一种基于环形邻域混沌算法的粒子群聚类算法,具有良好
的性能和较快的收敛速度。
该算法对聚类中心的初始化、粒子漂移及粒子迭代更
新采用了环形邻域混沌算法,有效利用了算法的自适应特性和全局搜索性能来改进粒子群聚类的终极目标。
一、CN-PSO算法框架
CN-PSO算法框架由三个步骤组成:(1)初始化:本步骤利用环形邻域混沌
算法确定初始聚类中心和粒子群;(2)粒子漂移:本步骤采用环形邻域混沌算法,逐步改变以初始中心为中心的环形区域内的粒子的位置;(3)粒子迭代更新:本
步骤采用环形邻域混沌算法,根据粒子最佳聚类值不断更新粒子的状态以获得最优的聚类中心。
二、CN-PSO算法主要特征
三、实验结果
通过对群体的实验结果以抽象图和图形研究,分析CN-PSO算法的聚类结果在视觉上是否清晰分离,验证其可行性和有效性。
实验结果表明,CN-PSO算法能够根据环形邻域混沌算法的定义分析得出较优
的聚类结果,以达到良好的聚类效果。
此外,从计算时间的角度考虑,CN-PSO算法的收敛时间较短,提升了算法的实用程度。
综上所述,CN-PSO算法是一种较为有效的聚类算法,具有良好的性能和较快
的收敛速度,可用于数据挖掘领域中的聚类分析任务。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第35卷第1期2009年3月延边大学学报(自然科学版)Journal of Yanbian University (Natural Science )Vol.35No.1Mar.2009收稿日期:2008-10-18作者简介:姜浩(1981—),男,硕士研究生,研究方向为粒子群算法.文章编号:100424353(2009)0120064204一种基于粒子群算法的聚类算法姜浩, 崔荣一(延边大学工学院计算机科学与技术系智能信息处理研究室,吉林延吉133002)摘要:提出一种基于粒子群算法的聚类算法,该算法利用粒子群算法随机搜索解空间的能力找到最优解.首先,将样本所属类号的组合作为粒子,构成种群,同时引入极小化误差平方和来指导种群进化的方向.其次,通过对全局极值的调整,搜索到全局最优值.最后,通过仿真实验的对比,验证了该算法在有效性和稳定性上要好于K 2means 算法.关键词:粒子群;聚类;极小化误差平方和中图分类号:TP301.6 文献标识码:AA Method of ClusteringB ased onthe P article Sw arm OptimizationJ IAN G Hao , CU I Rong 2yi(I ntelli gent I nf ormation Processing L ab.,De partment of Com puter Science and Technolog y ,College of Engineering ,Yanbian Universit y ,Yanj i 133002,China )Abstract :A clustering method based on the particle swarm optimization is provided ,using the ability of PSO algorithm which can search all of the solution space to find the optimum solution.Firstly ,the combination of the cluster number of the samples was taken as particles to consist a swarm.Meanwhile ,the evolution trend was used to modulate with the theory of the L MS error criterion.Secondly ,according to the modulating for global best ,the algorithm researched the global optimum.Finally ,the simulation results show that the new algorithm of proposed algorithm is more efficient and stable than K 2means algorithm.K ey w ords :particle swarm optimization ;clustering ;L MS error criterion0 引言聚类分析研究具有很长的历史,其重要性及与其他研究方向的交叉特性得到人们的肯定[1].聚类是数据挖掘、模式识别等研究方向的重要研究内容之一,在识别数据的内在结构方面具有极其重要的作用.聚类技术广泛应用于语音识别、字符识别、图像分割、机器视觉、数据压缩和文献信息检索等领域.聚类的另一主要应用是数据挖据(多关系数据挖掘)、时空数据库应用(GIS 等)、序列和一类数据分析等.此外,聚类还应用于统计科学.值得一提的是,聚类分析对生物学、心理学、考古学、地质学、地理学以及市场营销等研究也都有重要应用.粒子群优化(Particle Swarm Optimization ,PSO )算法是由Eberhart 和Kennedy [2]于1995年提出的一类基于群智能的随机优化算法.该算法模拟鸟群飞行觅食的行为,通过个体之间的集体协作和竞争来实现全局搜索,是一种基于群智能的演化计算技术.同遗传算法相比,虽然同是基于迭代的进化算法,但没有交叉和变异算子,群体在解空间中根据自身经历的最好位置,以及群体最优解来进行搜索.由于PSO 算法有着参数少, 第1期姜浩,等:一种基于粒子群算法的聚类算法易于实现,算法简单,具有良好的全局搜索能力等优点,被广泛应用于各个领域,如结构设计、函数优化、网络训练、模糊系统控制、电磁场以及任务调度等工程优化问题中.目前为止,已有很多结合粒子群算法的聚类分析方法[325],其关键结合点是如何构造种群以及如何评价.比较有代表性的思想是结合K2means 算法,将初始的聚类中心作为种群,然后根据中心进行聚类,再利用聚类的结果来评价种群的质量,最后依据粒子群算法的原理更新聚类中心.这种算法改进了K2means算法对初始中心敏感的问题.在文献[4]中提出了动态的聚类方法,以解决分类数目不确定的聚类问题.本文提出的算法与上述结合K2means算法的粒子群聚类不同,采用的方法是随机地分配每个样本的类号,将这些类号的组合作为一个粒子,再利用粒子群算法进行优化.所提出的算法实现简单,实验结果正确,稳定性良好.1 基本PSO算法基本PSO[6]中,粒子群由n个粒子组成,每个粒子的位置代表优化问题在d维搜索空间中潜在的解.在一个d维的目标搜索空间中,由这n个粒子组成一个群落,其中第i个粒子的位置为d维的向量X i=(X i1,X i2,…,X i d);第i个粒子的历史最优位置为P i=(P i1,P i2,…,P i d);整个群体迄今为止搜索到的最好的位置记为P g=(P g1,P g2,…,P g d);第i个粒子的“飞翔”速度也是一个d维的向量V i=(V i1,V i2,…,V i d),它决定粒子在搜索空间单位迭代次数的位移.粒子按式(1)和(2)来调整自己的位置:V ij(t+1)=w V ij(t)+r1c1(P ij- X ij(t))+r2c2(P g-X ij(t)),(1)X ij(t+1)=X ij(t)+V ij(t+1), 1≤i≤n,1≤j≤d.(2)其中c1和c2是非负数,称为加速度因子,通常取c1=c2=2;r1和r2为[0,1]内的随机数;w为惯性因子,一般在0.1到0.9之间取值.此外,粒子速度V i由最大速度V max所限制,即V i在[-V max, V max]内取值.PSO的基本算法步骤描述如下:Step1 初始化粒子群,即随机设定各粒子的初始位置和初始速度;Step2 计算每个粒子的适应值;Step3 对每个粒子,比较它的适应值和它经历过的最好位置的适应值;若更好,更新粒子当前最好位置P i d;Step4 对每个粒子的P i d进行比较,最好的位置如果优于P g d,则更新P g d的值为P i d;Step5 根据式(1)和式(2)更新粒子速度和位置;Step6 如果达到结束条件(一般为足够好的位置或最大迭代次数),则结束,否则转Step2.算法中的w,c1和c2是影响算法性能的重要参数.w值较大时,算法的全局搜索能力强;反之,局部搜索能力强.c1的值决定了粒子更新时受自身影响的程度,c2的值决定了整个种群对个体粒子的影响程度.2 聚类聚类是一个无监督的分类,它没有任何先验知识可用.聚类遵从的一般原则是:一个类簇内的实体是相似的,不同类簇的实体是不相似的;一个类簇是测试空间中点的会聚;同一类簇的任意两个点间的距离小于不同类簇的任意两个点间的距离;类簇可描述为一个包含密度相对高的点集的多维空间中的连通区域,它们借助包含密度相对较低的点集的区域与其他区域(类簇)相分离.聚类的形式描述如下:令U={P1,P2,…, P n}表示一个模式集合,P i表示第i个模式,i= {1,2,…,n};C tΑU,t=1,2,…,k,C t={P t1, P t2,…,P t w};proximity(P ms,P i r).其中,第1个下标表示模式所属的类,第2个下标表示某类中某一模式,函数proximity用来刻画模式的相似性距离.若诸类C t为聚类的结果,则诸C t需满足如下条件:∪k t=1C t=U,(3)对于ΠC m,C rΑU,C m≠C r,有C m∩C r= (仅限于刚性聚类);min(p roximity(P m u,P rv))> max(pro ximity(P m x,P m y)),(4)式(4)中参数满足如下条件:ΠP mu∈C m,ΠP rv∈C r,ΠC m,C rΑU并且C m≠C r;ΠP m x,P m y∈C m,ΠC mΑU.典型的聚类过程主要包括数据(或称之为样本或模式)准备,特征选择和特征提取,接近度计算,聚类(或分组),对聚类结果进行有效性评估等步骤.56延边大学学报(自然科学版)第35卷 3 基于粒子群的聚类算法Boer DP T 等人[7]在论述有关交叉熵对聚类的影响时,提出了一种有趣的方法.他们将样本的聚类看做是一种样本的组合形式,这种组合的结果要尽可能地使一组内的样本特征一致,不同组之间的差异尽可能的大.当样本数达到一定数量时,组合的数量十分庞大,要想枚举出每一种可能,几乎是做不到的.本文基于这种组合的思想,提出粒子群聚类算法(Particle Swarm Optimization Clustering ,PSOC ),首先将样本随机地分到某一类,即分配类号,再利用粒子群算法的全局搜索能力,对样本所属类别进行更新,得到最优解.最优解代表了最好的分类.在本文算法中,粒子群中的每个粒子为一种可能的划分,粒子的维数为样本的个数,每一维的值代表样本所划分的类.粒子构造为X i =(k 1,k 2…,k m ),0<k i ≤m ,其中m 为样本个数,k i 为第i 个样本所属的类.因此,一个群代表数据集的多个候选划分.粒子的适应值采用误差平方和函数:J c =6ki =16n ij =1X ij -mi2,(5)其中X ij 是属于第i 类的第j 个样本;n i 是第i 类所包含的样本个数;m i 是第i 类的中心,m i =1n i6x ∈X ix.(6)由于粒子群算法在运行过程中依靠全局极值和个体极值指导整个种群进化,所以很容易陷入局部最优.考虑到这种情况,本文采取以下方法避免局部最优的发生:每次迭代,对全局极值进行一次调整;借鉴极小化误差平方和算法[8]的思想,移动样本.按照如下公式计算样本移动的影响:P j =n jn j +1X -m j2,j ≠i ;n in i -1X -m j2,j =i.(7)公式(7)计算的是样本从第i 类移动到第j 类所带来的影响,首先用公式(7)中的第二个公式计算出类内P j 值最大的样本,然后对其进行更新,更新时按照公式(7)中的第一个公式,计算样本移动到其它类的情况时带来的影响大小,将此样本重新划分到P j 最小值所对应的类.本文的粒子群聚类算法描述如下:Step 1 初始化粒子群,即随机设定粒子的初始位置和初始速度,给样本划分类别;Step 2 计算每个粒子的适应值;Step 3 对每个粒子,比较它的适应值和它经历过的最好位置的适应值;若更好,更新当前最好位置P i d ;Step 4 对每个粒子的P i d 进行比较,最好的位置如果优于P g d ,则更新P g d 为P i d ;Step 5 对当前P gb 所代表的最优分类进行调整,以公式(7)计算的结果作为依据,从每个类内部选取一个样本进行调整;Step 6 根据式(1)和式(2)进化粒子速度和位置;Step 7 如果达到结束条件(一般为足够好的位置或最大迭代次数),则结束,否则转Step 2.4 实验结果与分析本文采用90个二维点作为待分类的数据集进行实验.实验数据分为3类,是线性可划分的.由于只为了证明算法的有效性与稳定性,本文采用了固定的类数.算法中的参数设置为:群体规模n =20,解空间d =90维,迭代次数为30次.惯性权重w 采用线性递减策略,范围是0.9~0.4;加速因子设置为c 1=c 2=2.结束条件为最大迭代次数.图1为90个二维样本点数据集,可以看出,它们拥有各自的团体.图2为PSOC 运行过程中的最优适应值的下降曲线.为了更好地说明算法的优点,与传统的K 2means 算法的运算结果进行了比较.本文的PSOC 算法同K 2means 算法一样得到了图3显示的良好的聚类结果.图1 数据集表1所记录的是两种算法的单次所用时间.从时间上来看,K 2means 略优于PSOC.为了说明本文算法在有效性和稳定性上的优势,重复运行66 第1期姜浩,等:一种基于粒子群算法的聚类算法100次算法,记录每次得到的聚类结果是否正确,即样本被划分到正确的分类(当95%以上的样本被正确划分即为正确结果).表2所显示的结果表明,PSOC 算法在稳定性上要明显优于K 2mean 算法,可以保证每次都能够得到正确的聚类结果.图2 最优值下降曲线表1 效率算法K 2means PSOC 运行时间/s0.91.48表2 有效性算法K 2means PSOC 正确率/%73100图3 划分结果5 结束语本文提出了一种基于粒子群算法的聚类算法,该算法利用PSO 算法的全局搜索能力对数据进行聚类.在聚类过程中以极小化误差平方和算法的思想,找到对改进分类影响最大的样本,将它重新分类,以此指导全局最优值进行更新,使种群整体向全局最优进化.多次独立实验表明,与传统的K 2means 算法相比,本文算法具有很好的稳定性.本文算法虽然有很好的稳定性,但是对于有噪声点的样本集合,是否也具有稳定的性能,仍需要进一步研究.同时,也要进一步研究粒子群算法的改进策略.本算法实现时,考虑的是分类数目确定的情况,对于分类数不确定的情况,算法是否能够很好地得到聚类结果也是下一步研究的重点.参考文献:[1] 孙吉贵,刘杰,赵连宇.聚类算法研究[J ].软件学报,2008,19(1):48261.[2] Eberhart R C ,Kennedy J.A New Optimizer UsingParticle Swarm Theory [C ]//Proceedings of the Sixth International Symposium on Micro Machine and Human Science.Piscataway ,USA :IEEE Serv 2ice Center ,1995:39243.[3] 杨勋,王汪晴.求解聚类问题的混合PSO 算法设计[J ].计算机工程与应用,2007,24(10):43245.[4] 张长胜,孙吉贵,杨凤芹,等.一种基于PSO 的动态聚类算法[J ].计算机研究与发展,2007,44(sup 2pl.):89293.[5] 陈曦,李春月,李峰,等.基于PSO 的模糊C 2均值聚类算法的图像分割[J ].计算机工程与应用,2008,44(18):1812185.[6] 杨维,李歧强.粒子群优化算法综述[J ].中国工程科学,2004,6(5):87294.[7] Boer DPT ,Kroese DP ,Mannor S ,et al.A Tutori 2al on the Cross 2Entropy Method[J ].Annals of Op 2erations Research ,2005,134(1):19267.[8] 杨光正,吴岷,张晓莉.模式识别[M ].北京:中国科学技术大学出版社,2007.76。