一种非负矩阵分解的快速稀疏算法_宋金歌

合集下载

非负矩阵分解下的稀疏基构建

非负矩阵分解下的稀疏基构建
对原始信号进行稀疏变化 , ,
时这 种投 影保持 了重建信号所需的信息 。压缩感知技术 以较少 的投影数据实现信号 的精确或 高概 率重构 。 而信号重建 能力很 大程度上取决于信 号的稀疏性 , 以及采样矩阵和变换矩 阵的非相千性 。 提 出用非负矩阵分解 构建稀疏变换基 矩阵 甲, 并与离散傅里叶变换 行测量 , 并采用正交 匹配追踪 叮 和 离散小波 变换 进行信号还原能力分析 , 表 明在同等测量次数下 构建变换矩 阵进行 对比研究 , 对相千度 , 稀疏度进 还原能力优于 砰 和
的绝对值 很 小 , 比如 对 信 号 进 行 傅 里 叶 变 换 、小 波 变换 、 离 散余 弦 变换 等 得 到 的数 据 实 际 的 , 即可 以用 都是稀疏 的信 个分 量 表 示 长 度 为
号 。 可 以将 变换 后 的 数 据 看 作 原 始信 号 的 一 种 简
洁表 达 , 这是压 缩 感 知 的前 提 。测 量 矩 阵 是 为 了确
稀疏 度 。 实验 进行 次重 复 , 产 生
,
,
可 以 证 明 六· 卜 `· “ · ,根 据 柯 西 一 许
瓦茨 阵 一 不 等式 , ` 胡 ` 。 对 于矩

三种 方法 构 建 的 变换 矩 阵 与 测 量 矩 阵 的 相 干 度 和 个 随机 矩 阵 , 得 到不 同 的采样矩 阵 , 然后 进行恢 复 。 测量 沪, 巾 的 相 干性 , 采 样 数 据 的 稀 疏 度 , 以 及 信 号 恢 复 后 的 值。
素 的个数 , 也 就 是说 当 向量 , 最 稀疏 时 , 欠定 方 程是
可以求解 出 ` 的 。 当然求解 一范数是一个
题 , 阮和

。合 作 把 这 个 一 范数 问题 扩 展 到

非负矩阵分解聚类

非负矩阵分解聚类

非负矩阵分解聚类摘要:一、非负矩阵分解聚类原理1.非负矩阵分解2.聚类方法3.非负矩阵分解聚类二、非负矩阵分解聚类应用优势1.数据降维2.图像处理3.生物信息学4.社交网络分析三、非负矩阵分解聚类局限性1.计算复杂度2.数据噪声敏感3.模型参数选择四、非负矩阵分解聚类未来发展趋势1.高维数据分析2.大规模数据处理3.结合深度学习方法正文:非负矩阵分解聚类(Non-negative Matrix Factorization Clustering,NMF-C)是一种将数据集分解成若干个非负矩阵的方法。

非负矩阵分解(Non-negative Matrix Factorization, NMF)是一种将一个非负矩阵分解成两个非负矩阵的乘积的方法,这两个矩阵分别表示数据的潜在结构和元素之间的关系。

聚类方法则是将数据集中的相似度较高的元素划分到同一个子集中。

非负矩阵分解聚类结合了这两种方法,可以将数据集中的相似度较高的元素划分到同一个子集中。

非负矩阵分解聚类在数据降维、图像处理、生物信息学和社交网络分析等领域具有广泛应用。

数据降维是非负矩阵分解聚类的常见应用之一,通过将高维数据映射到低维空间,可以减少数据规模,提高数据处理效率。

在图像处理领域,非负矩阵分解聚类可以用于图像分割和特征提取,提高图像识别的准确性。

在生物信息学领域,非负矩阵分解聚类可以用于基因表达数据的降维和聚类分析,发现具有相似功能的基因。

在社交网络分析领域,非负矩阵分解聚类可以用于社区发现,识别社交网络中的兴趣群体。

然而,非负矩阵分解聚类也存在一些局限性。

首先,非负矩阵分解聚类的计算复杂度较高,尤其是当数据规模较大时,计算时间会显著增加。

其次,非负矩阵分解聚类对数据噪声敏感,当数据中存在异常值或缺失值时,聚类结果可能受到影响。

此外,非负矩阵分解聚类中的模型参数选择也是一个挑战,不同的参数选择可能导致不同的聚类结果。

408考稀疏矩阵十字链表

408考稀疏矩阵十字链表

408考稀疏矩阵十字链表稀疏矩阵是指大部分元素为零的矩阵。

在很多实际应用中,如图像处理、网络分析等领域,大型矩阵中的非零元素只占很小一部分。

为了节省存储空间和提高运算效率,我们可以使用稀疏矩阵来表示这些矩阵。

408考稀疏矩阵十字链表是一种常用的稀疏矩阵存储结构。

它通过将非零元素按行和列分别排列,并使用链表将它们连接在一起,从而实现对稀疏矩阵的高效存储和操作。

在408考中,稀疏矩阵十字链表是一种常用的数据结构,用于表示稀疏矩阵。

它是由徐仲恺老师于1971年提出的,是一种改进的稀疏矩阵链表存储结构。

相比于其他存储结构,稀疏矩阵十字链表具有存储空间小、插入和删除元素方便等优点。

稀疏矩阵十字链表的基本思想是将矩阵分解为行链表和列链表两部分,通过链表将非零元素连接起来。

具体来说,稀疏矩阵十字链表包含三个链表:行链表、列链表和非零元素链表。

行链表是由一组头指针组成的链表,每个头指针指向一行的第一个非零元素。

列链表是由一组头指针组成的链表,每个头指针指向一列的第一个非零元素。

非零元素链表则是将矩阵中的非零元素按照行优先的顺序连接起来。

通过这种方式,我们可以通过行链表和列链表快速找到某一行或某一列的非零元素,并可以在常数时间内插入和删除元素。

同时,由于非零元素链表是按照行优先的顺序连接的,因此可以按照矩阵的行优先顺序遍历非零元素。

使用稀疏矩阵十字链表存储稀疏矩阵可以大大减少存储空间的占用。

对于一个m×n的矩阵,如果非零元素的个数为k,那么稀疏矩阵十字链表的存储空间复杂度为O(k+max(m,n))。

相比之下,使用普通的二维数组存储矩阵需要O(m×n)的存储空间。

稀疏矩阵十字链表还可以实现矩阵的加法、减法和乘法等基本运算。

在进行运算时,我们只需要遍历非零元素链表,并根据链表中的信息进行相应的计算,而无需考虑矩阵中的零元素,从而提高了运算效率。

408考稀疏矩阵十字链表是一种高效的稀疏矩阵存储结构。

稀疏非负矩阵分解

稀疏非负矩阵分解

稀疏非负矩阵分解稀疏非负矩阵分解是一种用于处理稀疏数据集的矩阵分解方法。

在现实生活中,我们经常会遇到稀疏数据集,即大部分元素都是零的数据集。

稀疏非负矩阵分解可以将这样的数据集分解为两个非负矩阵的乘积,从而能够更好地理解和利用这些数据。

稀疏非负矩阵分解在很多领域都有广泛的应用,比如推荐系统、图像处理、文本挖掘等。

在推荐系统中,我们常常需要根据用户的历史行为数据来预测其可能感兴趣的物品。

而这些行为数据往往是稀疏的,即大部分用户与物品之间并没有交互。

通过对这些稀疏数据进行非负矩阵分解,我们可以得到用户和物品的潜在特征向量,从而能够更准确地预测用户对物品的喜好程度。

在图像处理领域,稀疏非负矩阵分解可以用于图像压缩和图像去噪。

图像是由像素点组成的矩阵,而稀疏非负矩阵分解可以将图像分解为两个非负矩阵的乘积,其中一个矩阵表示图像的结构信息,另一个矩阵表示图像的纹理信息。

通过对这两个矩阵的调整和组合,我们可以实现图像的压缩和去噪,从而减小图像的存储空间和提高图像的质量。

在文本挖掘领域,稀疏非负矩阵分解可以用于主题建模和文本分类。

主题建模是指从大量文本数据中挖掘出隐藏的主题信息,而稀疏非负矩阵分解可以将文本数据分解为两个非负矩阵的乘积,其中一个矩阵表示文本和主题之间的关系,另一个矩阵表示主题和词语之间的关系。

通过对这两个矩阵的分析和调整,我们可以得到文本的主题分布,从而更好地理解和组织文本数据。

而在文本分类中,稀疏非负矩阵分解可以用于特征选择和特征降维,从而提高分类的准确性和效率。

除了上述应用领域,稀疏非负矩阵分解还可以用于图像识别、音频处理、网络分析等多个领域。

无论在哪个领域,稀疏非负矩阵分解都能够帮助我们从稀疏数据中提取有用的信息,从而更好地理解和利用这些数据。

总结来说,稀疏非负矩阵分解是一种用于处理稀疏数据集的矩阵分解方法,具有广泛的应用前景。

通过将稀疏数据分解为两个非负矩阵的乘积,我们可以更好地理解和利用这些数据,从而在推荐系统、图像处理、文本挖掘等领域中取得更好的效果。

非负矩阵分解下的稀疏基构建

非负矩阵分解下的稀疏基构建
第 1 3卷
第 4期
2 0 1 3年 2月







Vo I _ 1 3 N o . 4 F e b .2 01 3
1 6 7 1 —1 8 1 5 ( 2 0 1 3 ) 0 4 — 0 8 3 5 — 0 6
S c i e n c e T e c h n o l o g y a n d E n g i n e e r i n g
小冗余 度 后 , 压缩 感知研究 已经起步 , 吸 引 了越 来 越多 的人 加入 到研 究 队伍 。
压缩 感 知理论 主 要 包 括 稀 疏 字 典 、 测 量 矩 阵 和
个方阵 , 信号 在该矩 阵上 的投影得 到的是信 号的 压缩表示 Y 。通常这个投影过程是不可逆 的, 即由Y 求解 是一个解欠定方程的过程。但如果 Y 是稀疏
2 0 1 2年 9月 4 1 3收到, 1 0月 1 0 日修改 国家 自然基金项 目
1 压缩感 知基 本理 论
对 于信 号 ∈R 刈找 到一个线 性测 量矩 阵 ∈ R ( M <N) , 进 行投影 运 算 。
Y 1= 中M Ⅳ Ⅳ 1 , ( 1 )
的绝对值很 小 , 比如对 信号进行傅 里叶变换 、 小波 变换 、 离散余弦变换等得到 的数 个 分 量 表 示 长 度 为 Ⅳ 的信
配追踪对信号进行恢复 , 并进一步从相 干度, 采样
稀疏度 , 以及信号还原能力方面进行了分析。
号。可以将变换后 的数 据看作原始 信号 的一 种简 洁表达 , 这是压缩感 知的前提 。测量矩 阵是为 了确 保信号的线性投影 能保持信号 的原始结构 , 这是压 缩感 知 的关键 。通 常测 量矩 阵 ( <m) 不 是 一

基于稀疏约束非负矩阵分解的K-Means聚类算法

基于稀疏约束非负矩阵分解的K-Means聚类算法

基于稀疏约束非负矩阵分解的K-Means聚类算法韩素青;贾茹【摘要】To improve the quality of K-Means clustering in high-dimensional data ,a K-Means clustering algorithm is presented based on non-negative matrix factorization with sparseness constraints .The algo-rithm finds the low dimensional data structure embedded in high-dimensional data by adding l1 and l2 norm sparseness constraints to the non-negative matrix factorization ,and achieves low dimensional representa-tion of high dimensional data .Then the K-Means algorithm ,which is the high performance clustering al-gorithm in low dimensional data ,is used to cluster the low dimensional representation of high dimension-al data .The experimental results show that the proposed algorithm is feasible and effective in dealing with high-dimensional data .%为了提高K-M eans聚类算法在高维数据下的聚类效果,提出一种基于稀疏约束非负矩阵分解的K-M eans聚类算法.该算法在最优保持原始数据本质的前提下,通过在非负矩阵分解过程中对基矩阵列向量施加l1与l2范数稀疏约束,首先挖掘嵌入在高维数据中的低维数据结构,实现高维数据的低维表示,然后利用在低维数据聚类中性能良好的K-M eans算法对稀疏降维后的数据进行聚类.实验结果表明提出的算法可行,并且在处理高维数据上有效.【期刊名称】《数据采集与处理》【年(卷),期】2017(032)006【总页数】7页(P1216-1222)【关键词】高维数据;非负矩阵分解;稀疏约束;k-means聚类【作者】韩素青;贾茹【作者单位】太原师范学院计算机科学与技术系,太原,030619;太原师范学院计算机科学与技术系,太原,030619【正文语种】中文【中图分类】TP274聚类分析是数据挖掘领域中一个热门的研究方向,其主要思想是将数据对象划分成不同的簇,使得同一簇中的数据对象具有较高的相似度,而不同簇中的数据对象具有较低的相似度。

稀疏分解定理

稀疏分解定理

稀疏分解定理稀疏分解是一种将高维数据表示为低维度稀疏分量的方法。

它可以用于数据压缩、降维和特征提取等领域。

本文将介绍稀疏分解的定理以及其在实际应用中的意义。

稀疏分解的定理是一个非常重要的数学定理,它表明,对于任意的实数向量,都可以唯一地分解成两个部分:一个是稀疏向量,即只有很少的非零分量;另一个是稠密向量,即几乎所有的分量都非零。

稀疏分解定理的形式化表达如下:设矩阵A为一个m×n的实数矩阵,其中m>n,并且矩阵A的每一列都是一个线性无关的向量。

对于任意的一个m×1实数向量y,稀疏分解定理表明,存在一个稀疏向量x和一个稠密向量z,使得y=Ax,即y可以表示为矩阵A和向量x的线性组合,其中向量x是稀疏的。

稀疏分解定理的证明是一个非常复杂的过程,需要运用到线性代数、数学分析和凸优化等多个数学理论。

它的证明涉及到基本矩阵论、奇异值分解(SVD)、凸优化和压缩感知等多个数学工具。

稀疏分解定理在实际应用中具有广泛的应用价值。

首先,在数据压缩方面,稀疏分解可以将高维数据表示为低维稀疏向量,从而减少数据的存储空间和传输带宽。

例如,在图像压缩中,可以将图像表示为稀疏向量,然后只传输非零分量和它们的位置信息,从而实现对图像的高效压缩。

其次,在降维方面,稀疏分解可以将高维数据映射到一个低维稀疏表示空间,从而实现对数据的降维处理。

这对于处理高维数据集合的学习和分析具有重要意义。

例如,在人脸识别中,可以将人脸图像表示为一个稀疏向量,然后在稀疏表示空间中进行人脸识别和比对,从而提高识别的准确性和效率。

此外,在特征提取方面,稀疏分解可以从原始数据中提取出具有代表性的稀疏特征向量。

这些稀疏特征向量可以用于数据分类、聚类和检索等任务。

例如,在语音信号处理中,可以将语音信号表示为一个稀疏向量,然后使用稀疏特征向量对语音信号进行分类和识别。

总之,稀疏分解定理为我们提供了一种将高维数据转化为低维稀疏表示的有效方法。

非负矩阵分解聚类

非负矩阵分解聚类

非负矩阵分解聚类1. 简介非负矩阵分解聚类(Non-negative Matrix Factorization Clustering,NMF)是一种常用的无监督学习算法,用于发现数据集中的潜在模式和隐藏结构。

与其他聚类算法相比,NMF具有以下优点:•可解释性强:NMF将数据矩阵分解为两个非负矩阵的乘积,这两个矩阵分别代表了数据的特征和权重,可以直观地解释聚类结果。

•适用于高维稀疏数据:NMF在处理高维稀疏数据时表现出色,能够提取出有意义的特征。

•可扩展性好:NMF的计算复杂度较低,可以处理大规模数据集。

在本文中,我们将详细介绍NMF算法的原理、应用场景、算法流程以及相关实现和评估指标。

2. 算法原理NMF的核心思想是将一个非负数据矩阵分解为两个非负矩阵的乘积,即将数据矩阵X近似表示为WH,其中W和H是非负的。

给定一个非负数据矩阵X,NMF的目标是找到两个非负矩阵W和H,使得它们的乘积WH能够尽可能地接近原始数据矩阵X。

具体而言,NMF的优化目标可以定义为以下损失函数的最小化:其中,|X-WH|表示原始数据矩阵X与近似矩阵WH的差异,||·||_F表示Frobenius范数,(WH)ij表示矩阵WH的第i行第j列元素。

NMF的求解过程可以通过交替更新W和H来实现,具体步骤如下:1.初始化矩阵W和H为非负随机数。

2.交替更新矩阵W和H,使得损失函数逐步减小,直到收敛:–固定矩阵H,更新矩阵W:–固定矩阵W,更新矩阵H:3.重复步骤2,直到达到指定的迭代次数或损失函数收敛。

3. 应用场景NMF在许多领域都有广泛的应用,包括图像处理、文本挖掘、社交网络分析等。

以下是一些常见的应用场景:•图像分析:NMF可以用于图像分解、图像压缩、图像去噪等任务。

通过将图像矩阵分解为特征矩阵和权重矩阵,可以提取出图像的基础特征。

•文本挖掘:NMF可以用于主题建模、文本分类、关键词提取等任务。

通过将文档-词频矩阵分解为文档-主题矩阵和主题-词矩阵,可以发现文本数据中的主题结构。

基于Hessian正则化的多视图联合非负矩阵分解算法

基于Hessian正则化的多视图联合非负矩阵分解算法

基于Hessian正则化的多视图联合非负矩阵分解算法王超锋;施俊;吴金杰;朱捷【期刊名称】《计算机工程》【年(卷),期】2017(043)011【摘要】非负矩阵在表征多视图数据时没有考虑数据本身的流型结构,不能有效表达数据内部信息.为此,提出一种基于Hessian正则化的非负矩阵分解算法.利用Hessian泛函的L2模,保持样本局部拓扑结构,并扩展成基于Hessian正则化的联合非负矩阵分解算法,以对多视图数据进行变换.实验结果表明,基于Hessian正则化的非负矩阵分解算法和基于Hessian正则化的联合非负矩阵分解算法的聚类精度以及互信息值都有较大提高,2种算法的数据变化性能都优于传统非负矩阵分解算法.%Non-negative matrix does not consider the manifold of data when represents multi-view data,which results in the ineffective express of the data internal expression.In this paper,Hessian regularized Non-negative Matrix Factorization (NMF) is proposed.By using the L2 model of Hessian functional,the local topology of the sample is preserved and the algorithm is further extended into Hessian Regularized Joint Non-negative Matrix Factorization(HR-J-NMF) to work on multi-view data.Experimental results show that the Hessian regularized NMF and the HR-J-NMF have a great improvement in both clustering accuracy and mutual information value.The performance of the two algorithms is superior to that of the traditional NMF algorithm.【总页数】6页(P134-139)【作者】王超锋;施俊;吴金杰;朱捷【作者单位】上海大学通信与信息工程学院,上海200444;上海大学通信与信息工程学院,上海200444;上海大学通信与信息工程学院,上海200444;上海大学通信与信息工程学院,上海200444【正文语种】中文【中图分类】TP391【相关文献】1.基于图正则化的受限非负矩阵分解算法及在图像表示中的应用 [J], 舒振球;赵春霞2.基于L2稀疏约束和图正则化的非负矩阵分解算法 [J], 王美能3.稀疏诱导流形正则化凸非负矩阵分解算法 [J], 邱飞岳; 陈博文; 陈铁明; 章国道4.一种基于正则化方法的非负矩阵分解算法研究与应用 [J], 李小珍5.一种多流形正则化的多视图非负矩阵分解算法 [J], 宗林林;张宪超;赵乾利;于红;刘馨月因版权原因,仅展示原文概要,查看原文内容请购买。

非负矩阵分解算法及其在生物信息学中的应用研究

非负矩阵分解算法及其在生物信息学中的应用研究

1
引言
以芯片技术为代表的高 通量技 术的诞 生 , 标志着 基因
组研究进入了新的水平。芯片实验能够同时测量成千上万 个基因的表达水平 , 利用这一技术 , 研究者可以获得细胞在 生理、 发育过程中各个基因表达水平的动态变化信息 , 也可 以监控外部环境变化时细胞内部各个基因表达水平的变化 状况 , 这就提供了一 种量化细 胞活动 过程的 有效 途径。因 此 , 芯片技术在生命科学的研究中得到了广泛应用 , 产生了
非负矩阵分解算法及其在生物信息学中的应用研究 Research on t he Advances of N onnegative M atrix Fact orizat ion and It s Application in Bioinformat ics
石金龙 , 骆志 刚 SHI Jin long, LUO Zhi gang ( 国防科学技术大学计算机学院 , 湖南 长沙 410073) ( School of Computer Scinece, National University of Defense Technology, Changsha 410073, China) 摘 要 : 非负 矩阵分解是近年来快 速发展的一类机器 学习算法 , 能够实现对高维数 据的维度规约及局 部特征提取 , 在 诸多生物信息问题的分析与处理中得到了广泛应用 , 并衍生出一系列 实用算法 。 本 文系统分析 了非负矩 阵分解的数 学理 论基础及其特有的局部表达属性 , 综述了标准非负矩阵 分解与各种衍生算 法的发展 历程及算法 初始化与 参数选取方 法的 研究进展 , 并从序列特征分析 、 表达模式与功能模块识别 、 生物医学文献挖 掘等几个 方面总结了 非负矩阵 分解算法在 生物 信息学领域的应用成果 。 最后 , 指出了非负矩阵分解算 法研究及其应用于生物信息处理所面临的问题 , 分析 和预测了可能 的发展方向 。 Abstract: N onneg ativ e M atr ix Facto rizatio n ( NM F ) is a r apidly developing par ts based machine lea rning algo rithm, which can be used as a t ool of dimensionality r eduction and can identify the local features fo r hig h dimensio nal data. NM F has a bro ad application in the analysis and inter pr et ation of bio lo gical dat a, and a number o f practical alg or ithms hav e been der ived from it. T his paper sy stematica lly analyzes the mathematical foundation o f N M F and its advantag es for the represen tat ion o f local features, and surv eys the advances of different v ariet ies, initialization and par ameter selection fo r the N M F al g or ithm. A lso , its a pplicat ion in bioinfo rmatics is r ev iew ed and classif ied into sev eral catego ries. Finally , the future dir ec t ions of the NM F r esear ch and application are analy zed and predicted. 关键词 : 非负矩阵分解 ; 生物信息学 ; 局部特征 Key words: no nnegative matr ix facto rization; bio info rmatics; lo cal feature doi: 10. 3969/ j. issn. 1007 130X. 2010. 08. 032 中图分类号 : T P301. 6 文献标识码 : A 海量的基因表达数据。截止到 2009 年 3 月 , 美国国家 生物 技术信息中心 ( N CBI) 的 GEO 数据库已经包含多个物 种的 310 404 组样本数据 , 记录条数每天都在增加中。这些数据 中蕴藏着生命活动的基本规律 , 深入分析这些数据 , 有助于 进一步认识和理解 纷繁多样 的表现 型下隐 藏的调 控机理、 作用机制 , 有助于人们研究各种疾病的病变机理、 确定药物 的作用靶、 辅助新药的研制等 , 最终帮助人们 理解生命的奥 秘。针对这些海量的 基因表 达数据设 计新的 算法 , 识别 蕴 藏的各种特征 , 并给出合理解释 , 是当前生物 信息学研究的 主题 , 来自不同学科的研究者提出了各种各样的计算方法。

一种非负矩阵分解的快速稀疏算法_宋金歌

一种非负矩阵分解的快速稀疏算法_宋金歌

第20卷第4期2011年7月云南民族大学学报(自然科学版)Journal of Yunnan University of Nationalities (Natural Sciences Edition )Vol.20No.4Jul.2011收稿日期:2010-10-15.基金项目:国家社会科学基金(08XMZ002).作者简介:宋金歌(1981-),女,硕士研究生.主要研究方向:自然语言处理.通讯简介:余玉梅(1965-),女,教授.主要研究方向:人工智能.doi :10.3969/j.issn.1672-8513.2011.04.006一种非负矩阵分解的快速稀疏算法宋金歌,杨景,陈平,佘玉梅(云南民族大学数学与计算机科学学院,云南昆明650031)摘要:提出了一种非负矩阵分解的快速稀疏算法,该算法有利于处理高维小样本数据.在非负矩阵分解的过程中,通过代数变换,将原高维n ˑm 阶的非负矩阵分解转化成低维m ˑm 阶非负矩阵分解,大大提高了分解速度.在目标函数中加入了约束稀松度的项,通过控制稀松度,提高分解得到的潜在语义信息,改进文档集的话题划分,并能快速提取主题相关的语句生成文摘.关键词:非负矩阵分解;快速稀疏;文本文摘中图分类号:TP 391.41文献标志码:A 文章编号:1672-8513(2011)04-0262-05A Fast and Sparse Algorithm for Nonnegative Matrix FactorizationSONG Jin-ge ,YANG Jing ,CHEN Ping ,SHE Yu-mei(School of Mathematics and Computer Science ,Yunnan University of Nationalities ,Kunming 650031,China )Abstract :A fast and sparse algorithm for nonnegative matrix factorization (NMF )is introduced.The algorithm is conducive to deal with the high -dimension -small -sample data.In the nonnegative matrix factorization process-ing ,by some algebra formulation ,the n ˑm high -dimension matrix to be factorized is changed into a m ˑm low -dimension matrix ,which greatly improves the rate of decomposition.The sparseness item is also added to the objec-tive function in the algorithm ,by controlling the sparseness in the factors ,the proposed method extracts more mean-ingful latent features and improves topic identification ,which can be used in sentence extraction for summarization.Key words :nonnegative matrix factorization ;fast and sparse ;document summarization1999年,Lee 和Seung [1]首次提出了非负矩阵分解,为人们处理大规模数据提供了一种新的方法.2001年,Lee 和Seung [2]给出了非负矩阵分解的乘性迭代公式,有效地保持了数据的非负性.由于非负矩阵分解算法易于实现,存储空间小,分解形式的可解释性好,所以被应用于文本分析与聚类、数字水印、人脸识别、图像检索、基因特征提取等研究中[3].目前,人们对于非负矩阵的研究主要集中在3个方面:稀疏性增强的NMF 算法;鉴别性NMF 算法;加权NMF 算法.本文提出了一种非负矩阵分解的快速稀疏算法,通过代数变换把对原矩阵分解转化成对维数较低的对角矩阵的分解,在分解的过程中加入了对系数矩阵稀疏度的控制.给出了此算法的迭代规则以及收敛性证明过程,将其应用在文本文摘中.1非负矩阵分解问题1.1问题描述给定一个n ˑm 阶非负矩阵V ,找到2个n ˑr 和r ˑm 阶的非负矩阵因子W 和H ,使得V =WH.将矩阵W 称为基矩阵,矩阵H 称为系数矩阵.在矩阵V中列向量可以表示为:V*j =∑rl=1HljW*l,其中基向量W*l是矩阵W中的列向量,权重系数Hlj是矩阵H中对应的列向量中的元素.所以矩阵V中的列向量可看作是基向量W*l 与权重系数Hlj的一个线性组合.因此,矩阵W中的问题就可以转化为在矩阵W的列向量所形成的新的线性空间中的问题.矩阵H中的列可看作是矩阵V中对应列在该特征空间中的新的特征向量.1.2算法步骤非负矩阵的分解是一种低秩逼近算法,常用V和WH间的欧几里德距离平方作为目标函数来达到最佳逼近.目标函数为:E(W,H)=12‖V-WH‖2F=12∑i,j(Vij-∑rl=1WilHlj)2.(1)NMF的实现是一个最优化问题,就是在约束条件W,H≥0下,寻找矩阵W和矩阵H,使得(1)式达到最小值,只有当V=WH的时候,(1)式才能取到最小值0.Lee等[2]利用梯度下降法给出一种乘法更新规则,迭代求得矩阵W和矩阵H.其算法如下:Step1:对非负矩阵W和H随机赋初值;Step2:更新W和H,更新规则为:Wik ←W ik(VH T)ik(WHH T)ik,Hkj←H kj(W T V)kj(W T WH)kj;(2)Step3:重复Step2直至收敛.2非负矩阵分解的快速稀疏算法2.1基本思想对于非负矩阵的分解问题,王文俊等[4]曾提出一种快速方法,在V=WH的两边左乘V T得:V T V=V T WH,(3)令V T V=X,V T W=Y,则(3)式可变形为X=YH.(4)由于(1)式和(4)式都含有权重系数矩阵H,所以可以把对矩阵V的分解转化为对矩阵X的分解,同样可以得到矩阵H.矩阵V是nˑm阶的,而矩阵X是mˑm阶的,对于高维小样本数据来说n>>m,所以此转化在矩阵分解过程中起到了降维的作用,使矩阵分解的复杂度降低.对于非负矩阵稀疏度的约束,Hoyer[5]提出:约束矩阵W的稀疏度好,还是约束矩阵H的稀疏度好,还是约束两者的稀疏度好,取决于问题中特定的应用情况.比如,一个医生分析疾病模式,假设大部分疾病是稀有的(因此稀疏).但是每种疾病都能引起大量的症状.假设矩阵的行代表症状,列代表不同的个体,这种情况下系数矩阵应该稀疏而基矩阵可以不受约束.另如,当需要学习图像数据库中有用的特征时,可能需要约束W和H的稀疏性才更有意义.这表明任何给定的对象是在当前的几张图像中并影响一少部分的图像.对于处理行表示特征词,列表示句子的文本矩阵的分解来讲,采用约束矩阵H的稀疏度.所以在对上述对角矩阵X分解时,在目标函数中采用了1-范数形式来约束矩阵H的稀疏度.目标函数为:F(Y,H)=12‖X-YH‖2F+λ∑i,jHij=12∑i,j(Xij-(YH)ij)2+λ∑i,jHij=12∑i,j(Xij-(YH)ij)2+λ∑i,jHij=12∑i,jX2ij-∑i,jXij(YH)ij+12(YH)2ij+λ∑i,jHij.(5)这样可以使矩阵分解的结果得到较高的稀疏性,合适的稀疏性在保留数据的主要特征的基础上,还可以减少储存空间,提高运算效率,有利于快速处理大规模数据.在X=YH的分解过程中,求得全局最优解比较困难,因为(5)式对Y和H来讲是非凸的.但是可以将数值优化中的负梯度下降法和迭代规则应用于局部最优解中.首先,在非负条件下初始化Y0和H0.通过迭代公式:Y ik ←Y ik- ikF(Y,H)Y ik,Hkj←H kj- kjF(Y,H)H kj(6)分别计算F(Y,H)关于Yik 和Hkj的偏导数:362第4期宋金歌,杨景,陈平,等:一种非负矩阵分解的快速稀疏算法F(Y,H)Y ik =-∑i,k(XH T)ik+∑i,k(YHH T)ik=-XH T+YHH T;(7)F(Y,H)H kj =-∑k,j(Y T X)kj+∑k,j(Y T YH)kj+λ=-Y T X+Y T YH+λ.(8)取步长为:ik =Yik(YHH T)ik,kj=Hkj(Y T YH)kj+λ.(9)将(7)(8)(9)代入(6)中分别求得:Y ik ←Y ik-Yik(YHH T)ik(-(XH T)ik+(YHH T)ik)=Yik+Yik(XH T)ik-Yik(YHH T)ik(YHH T)ik=Yik(YHH T)ik+Yik(XH)ik-Yik(YHH T)ik(YHH T)ik=Yik(XH T)ik(YHH T)ik;(10)Hkj ←H kj-Hkj(Y T YH)kj+λ(-(Y T X)kj+(Y T YH)kj+λ)=Hkj+Hkj(Y T X)kj-Hkj(Y T YH)kj-Hkjλ(Y T YH)kj+λ=Hkj(Y T YH)kj+Hkj(Y T X)kj-Hkj(Y T YH)kj-Hkjλ+H kjλ(Y T YH)kj+λ=Hkj(Y T X)kj(Y T YH)kj+λ.(11)2.2收敛性分析引入文献[2]中的定义和引理来证明(10)和(11)的收敛性.定义1称函数G(h,h')为函数F(h)的辅助函数,如果满足以下2个条件:G(h,h')≥F(h),G(h,h)=F(h).引理1如果函数G(h,h')为函数F(h)的辅助函数,则按下式迭代,函数F(h)是非增的:h t+1=argminhG(h,h t),(12)此引理能保证目标函数F非增,F(h,h t)≤G(h t+1,h t)≤G(h t,h t)=F(h t).(13)定理1函数G(h,h')=F(h t)+(h-h t)TΔF(h t)+12(h-h t)T K(h t)(h-h t)(14)为F(h)=12‖x-Yh‖2F+λ∑ihi的辅助函数.这里的对角矩阵K(h t)定义为Kab(h t)=δab(Y T Yh t)a+λh ta,(15)这里h表示矩阵H中的某一列,hi表示该列的第i个元素,x表示矩阵X中相应的列.显然G(h,h)=F(h).比较式(14)与下式F(h)=F(h t)+(h-h t)TΔF(h t)+12(h-h t)T(Y T Y)(h-h t),(16)如果G(h,h')≥F(h),须使0≤(h-h t)T[K(h t)-YY T](h-h t),(17)当(15)式中λ=0时,Lee和Seung已证明式(17)的正确性.当λ>0时,对角矩阵K可看成是2个半正定的矩阵的和.所以同理也可以证明式(17)的正确性.462云南民族大学学报(自然科学版)第20卷定理2利用迭代规则(10)和(11)交替求解Y 和H 时,目标函数(5)非增,且函数值不再变化的条件是当且仅当Y 和H 是式(5)的稳定点.证明由于G (h ,h ')是F (h )的辅助函数,根据引理,只需最小化G (h ,h t ),即令Δh G (h ,h t )=Y T (Yh t -x )+λ+K (h t )(h -h t)=0,(18)解之,得:h =h t -K -1(h t )(Y T Yh t -Y T x +λ)=h t -h t(Y T Yh t+λ)(Y T Yh t -Y T x +λ)=h tY T x Y T Yh t+λ.(19)写成矩阵元素形式为:H kj =H kj (Y T X )kj(Y T YH )kj +λ.F (y )在关于矩阵Y 的迭代规则式(10)下的非增和Lee 的证明类似,就不再给出证明.2.3算法步骤根据以上阐述,本文给出非负矩阵分解的快速稀疏算法的步骤如下:Step1:在V =WH 的两边左乘V T ,得V T V =V T WH ,令V TV =X ,V T W =Y ,则又可得X =YH ;Step2:在非负条件下对Y 和H 随机赋初值;Step3:更新Y 和H ,其更新规则为式(10)和式(11);Step4:重复Step3直到目标函数式(5)收敛.2.4实验及分析2.4.1分解速度表1分解速度表迭代次数NMF 分解时间/sFSNMF 分解时间/s1020.57810.03135099.18730.1250100201.98440.1563150306.60940.2344200948.35650.2813任意给定一个矩阵V =rand (500,80),我们取r =30时,对NMF 算法和FSNMF 算法得到H 矩阵随迭代次数增加所需时间列表分析,如表1.由表1我们可以看出,同样的一个矩阵V ,FS-NMF 算法得到H 矩阵的分解速度要比NMF 算法得到H 矩阵的速度快的多.2.4.2稀疏性给定一个文本矩阵V =0.00950.00480.00530.00640.007300.02850.03160.01900000.051300.073500.047800.0319000.0478000.07350000.054300.09560000.07530.09560000.075300.0478000.0735000.05130.031900.09560.04780000.09560.0478*******.054300.09560.04780000.095600.0753,562第4期宋金歌,杨景,陈平,等:一种非负矩阵分解的快速稀疏算法我们对V 按照本文给出的FSNMF 算法进行分解,取r =3时,并且控制λ值的大小观察所得H 矩阵中元素为0的个数.我们列表分析,如表2.表2稀疏度表λ的取值0.00010.0010.010.101H 中0的个数456543由表2我们可以看出,适当的λ值能够得到矩阵H 较高的稀疏性,合适的稀疏度有利于保留数据的主要特征,学习更清楚的局部特征,还可以减少储存空间.2.4.3文本文摘举例给定一段文章如下:教学具有多种形态,是共性和多样性的统一.教学作为学校进行全面发展教育的一个基本途径,具有课内、课外、班级、小组、个别化等多种形态.教师和学生共同进行的课前准备、上课、作业、练习、辅导、评定等都属于教学活动.随着社会的发展,教学既可以通过师生间、学生间的各种交往进行,也可以通过印刷、广播、电视、录音、录像等远距离教学手段开展.教学作为一种活动,一个过程,是共性与多样性的统一.对这段文章运用Lee 等[6]提出的文摘方法,并把求H 矩阵的算法部分改为本文提出的FSNMF 算法去求H 矩阵,最后得到的每个句子的相关度为:GRS =(1.0e -003)ˑ〔0.47510.11860.02910.01120.3080〕.由此,可以判断出第1句是最重要的句子,其次是第5句.所以这一段的文摘句就为:教学具有多种形态,是共性和多样性的统一.由此例,可以看到将非负矩阵分解的快速稀疏算法应用于文本分析能够快速准确地得到文章的文本文摘.3结语本文提出的非负矩阵分解的快速稀疏算法,通过代数变换使得数据进行降维,在目标函数中附加约束稀疏度的稀疏项从而定义了目标函数,并且给出了迭代规则和收敛性证明.并且举例说明了此算法使得矩阵的分解速度和稀疏度都有所提高,又进一步利用此算法进行了一个简单的文本文摘,准确地得到了文摘的结果.参考文献:[1]LEE D D ,SEUNG H S.Learning the parts of objects by non -negative matrix factorization [J ].Nature ,1999,401(6755):788-791.[2]LEE D D ,SEUNG H S.Algorithms for non -negative matrix factorization [C ]//Advances in Neural Information Processing Sys-tems 13.Cambridge :MIT Press ,2001:556-562.[3]李乐,章毓晋.非负矩阵分解算法综述[J ].电子学报,2008,37(4):737-743.[4]王文俊,张军英.一种非负矩阵分解的快速方法[J ].计算机工程与应用,2009,45(25):1-2,6.[5]HOYER P O.Non -negative matrix factorization with sparseness constraints [J ].J Mach Learning Res ,2004,5(9):1457-1469.[6]LEE J H ,PARK S ,AHN C M ,et al.Automatic generic document summarization based on non -negative matrix factorization[J ].Information Processing and Management ,2009,45:20-34.(责任编辑梁志茂)662云南民族大学学报(自然科学版)第20卷。

非负矩阵分解聚类

非负矩阵分解聚类

非负矩阵分解聚类(实用版)目录一、引言二、非负矩阵分解的概念及其在聚类中的应用三、非负矩阵分解算法的种类及特点四、非负矩阵分解在聚类中的实例分析五、结论正文一、引言聚类是一种常见的数据挖掘方法,它可以将大量的数据分成不同的类别,从而方便我们进行分析和处理。

在聚类分析中,非负矩阵分解技术被广泛应用,因为它能够将高维数据转化为低维数据,并且保证数据之间的相似性不会丢失。

本文将介绍非负矩阵分解的概念及其在聚类中的应用,并对常见的非负矩阵分解算法进行分析。

二、非负矩阵分解的概念及其在聚类中的应用非负矩阵分解(Non-negative Matrix Factorization,NMF)是一种将高维数据转化为低维数据的技术,它可以将一个高维矩阵分解为两个非负矩阵的乘积。

在聚类分析中,非负矩阵分解可以将原始数据矩阵转化为低维的特征矩阵,从而减少计算复杂度和避免过拟合现象。

此外,非负矩阵分解还能够保留数据之间的相似性,因此被广泛应用于聚类分析。

三、非负矩阵分解算法的种类及特点常见的非负矩阵分解算法包括 Gaussian Naive Bayes、Soft Clustering、Latent Semantic Analysis(LSA)等。

这些算法在计算复杂度、分解效果和应用领域等方面都存在一定的差异。

1.Gaussian Naive Bayes:该算法是一种基于高斯朴素贝叶斯模型的非负矩阵分解方法,它通过学习数据中的隐含变量来进行矩阵分解。

该方法在处理高维数据时具有较好的效果,但计算复杂度较高。

2.Soft Clustering:该算法是一种基于聚类的非负矩阵分解方法,它通过将数据矩阵分解为多个非负矩阵的乘积来进行聚类。

该方法在处理大规模数据时具有较好的效果,但容易受到初始化条件的影响。

tent Semantic Analysis(LSA):该算法是一种基于潜在语义分析的非负矩阵分解方法,它通过学习数据中的潜在语义信息来进行矩阵分解。

用于独立特征学习的稀疏非负矩阵分解算法

用于独立特征学习的稀疏非负矩阵分解算法
பைடு நூலகம்

在的特征。这也可以写成等效的矢量公式 xj≈i∑=1uiVij。通常
情况下,本文有 K<<min(M,N)用来降维,vj是 U列上的原始
数据向量 xj的权重系数。NMF将数据矩阵分解为基本的线性
组合向量。很 多 研 究 学 者 尝 试 采 用 不 同 的 代 价 函 数 来 衡 量
NMF的性能,他们的 研 究 重 点 都 是 找 到 使 得 该 损 失 函 数 可 以
算法[3]等。韩素青等人[4]提出一种通过在非负矩阵分解过程
中对基矩阵列向量施加 L1与 L2范数稀疏约束,首先挖掘嵌入 在高维数据中的低维数据结构,实现高维数据的低维表示;然
后利用在低维数据聚类中性能良好的 Kmeans算法对稀疏降 维后的数据进行 聚 类;孙 静 等 人 [5]提 出 一 种 基 于 特 征 融 合 的
稀疏特征选择旨在应用各种稀疏模型来实现特征选择并 实现数据的稀疏表示。许多研究[6~8]已经将 L1范数扩展到 LP 范数(0<p<1),以获得更好的稀疏性。在文献[9,10]中已经 得出结论,当 p为 1/2时,LP 范数,即 L1/2范数具有最好的稀疏 性。在文献[11]中,Nie等人已经引入了联合 L2,1范数最小化 的损失函数和正则化的特征选择,然而 L2,1范数不具备很好的 稀疏性,因为它是基于 L1范数。Wang等人[12]提出将 L2,1范数 扩展到 L2,P矩阵范数(0<p<1)的思想,以便选择联合、更稀疏 的特征,同时该模型比 L2,1范数具有更好的鲁棒性。实验证明 当 p=1/2时,L2,P矩阵范数具有最好的性能,因此本文将 L2,1/2 矩阵范数模型应用于新的 NMF以实现稀疏约束。
0 引言
NMF的目的是将原始高维数据矩阵分解为两个低维数据

基于聚类优化的非负矩阵分解方法及其应用

基于聚类优化的非负矩阵分解方法及其应用

基于聚类优化的非负矩阵分解方法及其应用0 引言随着信息获取技术的不断进步,描述系统状态的信息量越来越大,导致特征空间维数不断增加,从而引发维数灾难等问题。

在传统的特征约简方法中,主分量分析、独立成分分析以及矢量量化等方法要求信号平稳、满足高斯条件,限制了应用范围。

作为一种新兴的多元数据处理方法,非负矩阵分解(non-negative matrix factorization,NMF)可在高维空间中获得原始数据的局部特征,其纯加性的表达方式符合“局部构成整体”的认知规律,成为信号处理、模式识别等领域的热门工具。

张培林等[1]采用NMF技术对发动机故障信号进行特征参数提取,获得了更高的分类精度。

李兵等[2]采用二维NMF技术来提取时频分布矩阵特征参数,得到了较好的诊断效果。

除了特征提取外,NMF在复杂工业过程和机电设备的监测诊断中也有应用[3-4]。

根据NMF的问题模型,可将其求解归结为一个优化问题,即通过目标函数来刻画它的逼近程度。

实际应用中,一般采用交替迭代方法获得局部最优解。

常用的乘性迭代算法、梯度下降算法和交替最小二乘算法是基于不同思路提出的,而对于设备诊断的特征提取,需要选择出合适的分解模型。

研究表明,NMF进行数据约简的目的是估计出原数据中的结构,而其分解的基向量与K均值聚类中的“类”有相通之处,即具有软聚类特性。

因此,本文从分类性能和迭代效率角度出发,基于NMF的聚类特性,将交替非负最小二乘算法用于故障诊断,并通过基矩阵的聚类性优化出约束参数与嵌入维数,最后,通过测试数据和特征选择实例应用验证了其有效性。

1 非负矩阵分解的迭代准则1.1 NMF原理NMF是一种非负性约束下的矩阵分解方法,具体可描述如下:给定一个非负矩阵V∈Rm×n(m为样本数,n为特征个数),将矩阵V分解成非负的基矩阵W∈Rm×r和系数矩阵H∈Rr×n(通常情况下,要求rn)的乘积,使得V=WH成立。

用于图片特征分解的稀疏多因式非负矩阵分解算法

用于图片特征分解的稀疏多因式非负矩阵分解算法

用于图片特征分解的稀疏多因式非负矩阵分解算法房强【摘要】非负矩阵分解(NMF)是一种流行的数据分析方法,其目标是使其接近通过所有非负成分产生的两个非负矩阵.文中描述了一种对于多因式非负矩阵分解(mNMF)问题新的且有效的算法,概括了原始NMF问题的一些因式.此外,将扩展的NMF算法合并为一个基于Dirichlet分布的正则化准则来激励获得的系数组成的稀疏性.文中的稀疏mfNMF算法提供一个近似且直观的解释,与之前的算法相比,使用修复点迭代的效率更高.最终证明了本算法在人造和真实数据集上的有效性.%Nonnegative matrix factorization (NMF) is a popular data analysis method,theobjective of which is to approximate a matrix with all nonnegative eomponentsinto the product of two nonnegative matrices.In this work,we describe a newsimple and efficient algorithm for multi-factor nonnegative matrix factorization(mfNMF) problem that generalizes the original NMF problem to more than twofactors.Furthermore,we extend the mfNMF algorithm to incorporate a regularizerbased on the Dirichlet distribution to encourage the sparsity of the components ofthe obtained factors.Our sparse mfNMF algorithm affords a closed form and anintuitive interpretation,and is more efficient in comparison with previous worksthat use fix point iterations.We demonstrate the effectiveness and efficiency ofour algorithms on both synthetic and real data sets.【期刊名称】《电子设计工程》【年(卷),期】2017(025)011【总页数】5页(P189-193)【关键词】图片特征分解;非负矩阵分解;NMF算法【作者】房强【作者单位】陕西国防工业职业技术学院艺术学院,陕西西安710300【正文语种】中文【中图分类】TN99非负矩阵分解的目标是寻找一个近似的非负矩阵V分解为两个非负矩阵,如同V≈W1*W2。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第20卷第4期2011年7月云南民族大学学报(自然科学版)Journal of Yunnan University of Nationalities (Natural Sciences Edition )Vol.20No.4Jul.2011收稿日期:2010-10-15.基金项目:国家社会科学基金(08XMZ002).作者简介:宋金歌(1981-),女,硕士研究生.主要研究方向:自然语言处理.通讯简介:余玉梅(1965-),女,教授.主要研究方向:人工智能.doi :10.3969/j.issn.1672-8513.2011.04.006一种非负矩阵分解的快速稀疏算法宋金歌,杨景,陈平,佘玉梅(云南民族大学数学与计算机科学学院,云南昆明650031)摘要:提出了一种非负矩阵分解的快速稀疏算法,该算法有利于处理高维小样本数据.在非负矩阵分解的过程中,通过代数变换,将原高维n ˑm 阶的非负矩阵分解转化成低维m ˑm 阶非负矩阵分解,大大提高了分解速度.在目标函数中加入了约束稀松度的项,通过控制稀松度,提高分解得到的潜在语义信息,改进文档集的话题划分,并能快速提取主题相关的语句生成文摘.关键词:非负矩阵分解;快速稀疏;文本文摘中图分类号:TP 391.41文献标志码:A 文章编号:1672-8513(2011)04-0262-05A Fast and Sparse Algorithm for Nonnegative Matrix FactorizationSONG Jin-ge ,YANG Jing ,CHEN Ping ,SHE Yu-mei(School of Mathematics and Computer Science ,Yunnan University of Nationalities ,Kunming 650031,China )Abstract :A fast and sparse algorithm for nonnegative matrix factorization (NMF )is introduced.The algorithm is conducive to deal with the high -dimension -small -sample data.In the nonnegative matrix factorization process-ing ,by some algebra formulation ,the n ˑm high -dimension matrix to be factorized is changed into a m ˑm low -dimension matrix ,which greatly improves the rate of decomposition.The sparseness item is also added to the objec-tive function in the algorithm ,by controlling the sparseness in the factors ,the proposed method extracts more mean-ingful latent features and improves topic identification ,which can be used in sentence extraction for summarization.Key words :nonnegative matrix factorization ;fast and sparse ;document summarization1999年,Lee 和Seung [1]首次提出了非负矩阵分解,为人们处理大规模数据提供了一种新的方法.2001年,Lee 和Seung [2]给出了非负矩阵分解的乘性迭代公式,有效地保持了数据的非负性.由于非负矩阵分解算法易于实现,存储空间小,分解形式的可解释性好,所以被应用于文本分析与聚类、数字水印、人脸识别、图像检索、基因特征提取等研究中[3].目前,人们对于非负矩阵的研究主要集中在3个方面:稀疏性增强的NMF 算法;鉴别性NMF 算法;加权NMF 算法.本文提出了一种非负矩阵分解的快速稀疏算法,通过代数变换把对原矩阵分解转化成对维数较低的对角矩阵的分解,在分解的过程中加入了对系数矩阵稀疏度的控制.给出了此算法的迭代规则以及收敛性证明过程,将其应用在文本文摘中.1非负矩阵分解问题1.1问题描述给定一个n ˑm 阶非负矩阵V ,找到2个n ˑr 和r ˑm 阶的非负矩阵因子W 和H ,使得V =WH.将矩阵W 称为基矩阵,矩阵H 称为系数矩阵.在矩阵V中列向量可以表示为:V*j =∑rl=1HljW*l,其中基向量W*l是矩阵W中的列向量,权重系数Hlj是矩阵H中对应的列向量中的元素.所以矩阵V中的列向量可看作是基向量W*l 与权重系数Hlj的一个线性组合.因此,矩阵W中的问题就可以转化为在矩阵W的列向量所形成的新的线性空间中的问题.矩阵H中的列可看作是矩阵V中对应列在该特征空间中的新的特征向量.1.2算法步骤非负矩阵的分解是一种低秩逼近算法,常用V和WH间的欧几里德距离平方作为目标函数来达到最佳逼近.目标函数为:E(W,H)=12‖V-WH‖2F=12∑i,j(Vij-∑rl=1WilHlj)2.(1)NMF的实现是一个最优化问题,就是在约束条件W,H≥0下,寻找矩阵W和矩阵H,使得(1)式达到最小值,只有当V=WH的时候,(1)式才能取到最小值0.Lee等[2]利用梯度下降法给出一种乘法更新规则,迭代求得矩阵W和矩阵H.其算法如下:Step1:对非负矩阵W和H随机赋初值;Step2:更新W和H,更新规则为:Wik ←W ik(VH T)ik(WHH T)ik,Hkj←H kj(W T V)kj(W T WH)kj;(2)Step3:重复Step2直至收敛.2非负矩阵分解的快速稀疏算法2.1基本思想对于非负矩阵的分解问题,王文俊等[4]曾提出一种快速方法,在V=WH的两边左乘V T得:V T V=V T WH,(3)令V T V=X,V T W=Y,则(3)式可变形为X=YH.(4)由于(1)式和(4)式都含有权重系数矩阵H,所以可以把对矩阵V的分解转化为对矩阵X的分解,同样可以得到矩阵H.矩阵V是nˑm阶的,而矩阵X是mˑm阶的,对于高维小样本数据来说n>>m,所以此转化在矩阵分解过程中起到了降维的作用,使矩阵分解的复杂度降低.对于非负矩阵稀疏度的约束,Hoyer[5]提出:约束矩阵W的稀疏度好,还是约束矩阵H的稀疏度好,还是约束两者的稀疏度好,取决于问题中特定的应用情况.比如,一个医生分析疾病模式,假设大部分疾病是稀有的(因此稀疏).但是每种疾病都能引起大量的症状.假设矩阵的行代表症状,列代表不同的个体,这种情况下系数矩阵应该稀疏而基矩阵可以不受约束.另如,当需要学习图像数据库中有用的特征时,可能需要约束W和H的稀疏性才更有意义.这表明任何给定的对象是在当前的几张图像中并影响一少部分的图像.对于处理行表示特征词,列表示句子的文本矩阵的分解来讲,采用约束矩阵H的稀疏度.所以在对上述对角矩阵X分解时,在目标函数中采用了1-范数形式来约束矩阵H的稀疏度.目标函数为:F(Y,H)=12‖X-YH‖2F+λ∑i,jHij=12∑i,j(Xij-(YH)ij)2+λ∑i,jHij=12∑i,j(Xij-(YH)ij)2+λ∑i,jHij=12∑i,jX2ij-∑i,jXij(YH)ij+12(YH)2ij+λ∑i,jHij.(5)这样可以使矩阵分解的结果得到较高的稀疏性,合适的稀疏性在保留数据的主要特征的基础上,还可以减少储存空间,提高运算效率,有利于快速处理大规模数据.在X=YH的分解过程中,求得全局最优解比较困难,因为(5)式对Y和H来讲是非凸的.但是可以将数值优化中的负梯度下降法和迭代规则应用于局部最优解中.首先,在非负条件下初始化Y0和H0.通过迭代公式:Y ik ←Y ik- ikF(Y,H)Y ik,Hkj←H kj- kjF(Y,H)H kj(6)分别计算F(Y,H)关于Yik 和Hkj的偏导数:362第4期宋金歌,杨景,陈平,等:一种非负矩阵分解的快速稀疏算法F(Y,H)Y ik =-∑i,k(XH T)ik+∑i,k(YHH T)ik=-XH T+YHH T;(7)F(Y,H)H kj =-∑k,j(Y T X)kj+∑k,j(Y T YH)kj+λ=-Y T X+Y T YH+λ.(8)取步长为:ik =Yik(YHH T)ik,kj=Hkj(Y T YH)kj+λ.(9)将(7)(8)(9)代入(6)中分别求得:Y ik ←Y ik-Yik(YHH T)ik(-(XH T)ik+(YHH T)ik)=Yik+Yik(XH T)ik-Yik(YHH T)ik(YHH T)ik=Yik(YHH T)ik+Yik(XH)ik-Yik(YHH T)ik(YHH T)ik=Yik(XH T)ik(YHH T)ik;(10)Hkj ←H kj-Hkj(Y T YH)kj+λ(-(Y T X)kj+(Y T YH)kj+λ)=Hkj+Hkj(Y T X)kj-Hkj(Y T YH)kj-Hkjλ(Y T YH)kj+λ=Hkj(Y T YH)kj+Hkj(Y T X)kj-Hkj(Y T YH)kj-Hkjλ+H kjλ(Y T YH)kj+λ=Hkj(Y T X)kj(Y T YH)kj+λ.(11)2.2收敛性分析引入文献[2]中的定义和引理来证明(10)和(11)的收敛性.定义1称函数G(h,h')为函数F(h)的辅助函数,如果满足以下2个条件:G(h,h')≥F(h),G(h,h)=F(h).引理1如果函数G(h,h')为函数F(h)的辅助函数,则按下式迭代,函数F(h)是非增的:h t+1=argminhG(h,h t),(12)此引理能保证目标函数F非增,F(h,h t)≤G(h t+1,h t)≤G(h t,h t)=F(h t).(13)定理1函数G(h,h')=F(h t)+(h-h t)TΔF(h t)+12(h-h t)T K(h t)(h-h t)(14)为F(h)=12‖x-Yh‖2F+λ∑ihi的辅助函数.这里的对角矩阵K(h t)定义为Kab(h t)=δab(Y T Yh t)a+λh ta,(15)这里h表示矩阵H中的某一列,hi表示该列的第i个元素,x表示矩阵X中相应的列.显然G(h,h)=F(h).比较式(14)与下式F(h)=F(h t)+(h-h t)TΔF(h t)+12(h-h t)T(Y T Y)(h-h t),(16)如果G(h,h')≥F(h),须使0≤(h-h t)T[K(h t)-YY T](h-h t),(17)当(15)式中λ=0时,Lee和Seung已证明式(17)的正确性.当λ>0时,对角矩阵K可看成是2个半正定的矩阵的和.所以同理也可以证明式(17)的正确性.462云南民族大学学报(自然科学版)第20卷定理2利用迭代规则(10)和(11)交替求解Y 和H 时,目标函数(5)非增,且函数值不再变化的条件是当且仅当Y 和H 是式(5)的稳定点.证明由于G (h ,h ')是F (h )的辅助函数,根据引理,只需最小化G (h ,h t ),即令Δh G (h ,h t )=Y T (Yh t -x )+λ+K (h t )(h -h t)=0,(18)解之,得:h =h t -K -1(h t )(Y T Yh t -Y T x +λ)=h t -h t(Y T Yh t+λ)(Y T Yh t -Y T x +λ)=h tY T x Y T Yh t+λ.(19)写成矩阵元素形式为:H kj =H kj (Y T X )kj(Y T YH )kj +λ.F (y )在关于矩阵Y 的迭代规则式(10)下的非增和Lee 的证明类似,就不再给出证明.2.3算法步骤根据以上阐述,本文给出非负矩阵分解的快速稀疏算法的步骤如下:Step1:在V =WH 的两边左乘V T ,得V T V =V T WH ,令V TV =X ,V T W =Y ,则又可得X =YH ;Step2:在非负条件下对Y 和H 随机赋初值;Step3:更新Y 和H ,其更新规则为式(10)和式(11);Step4:重复Step3直到目标函数式(5)收敛.2.4实验及分析2.4.1分解速度表1分解速度表迭代次数NMF 分解时间/sFSNMF 分解时间/s1020.57810.03135099.18730.1250100201.98440.1563150306.60940.2344200948.35650.2813任意给定一个矩阵V =rand (500,80),我们取r =30时,对NMF 算法和FSNMF 算法得到H 矩阵随迭代次数增加所需时间列表分析,如表1.由表1我们可以看出,同样的一个矩阵V ,FS-NMF 算法得到H 矩阵的分解速度要比NMF 算法得到H 矩阵的速度快的多.2.4.2稀疏性给定一个文本矩阵V =0.00950.00480.00530.00640.007300.02850.03160.01900000.051300.073500.047800.0319000.0478000.07350000.054300.09560000.07530.09560000.075300.0478000.0735000.05130.031900.09560.04780000.09560.0478*******.054300.09560.04780000.095600.0753,562第4期宋金歌,杨景,陈平,等:一种非负矩阵分解的快速稀疏算法我们对V 按照本文给出的FSNMF 算法进行分解,取r =3时,并且控制λ值的大小观察所得H 矩阵中元素为0的个数.我们列表分析,如表2.表2稀疏度表λ的取值0.00010.0010.010.101H 中0的个数456543由表2我们可以看出,适当的λ值能够得到矩阵H 较高的稀疏性,合适的稀疏度有利于保留数据的主要特征,学习更清楚的局部特征,还可以减少储存空间.2.4.3文本文摘举例给定一段文章如下:教学具有多种形态,是共性和多样性的统一.教学作为学校进行全面发展教育的一个基本途径,具有课内、课外、班级、小组、个别化等多种形态.教师和学生共同进行的课前准备、上课、作业、练习、辅导、评定等都属于教学活动.随着社会的发展,教学既可以通过师生间、学生间的各种交往进行,也可以通过印刷、广播、电视、录音、录像等远距离教学手段开展.教学作为一种活动,一个过程,是共性与多样性的统一.对这段文章运用Lee 等[6]提出的文摘方法,并把求H 矩阵的算法部分改为本文提出的FSNMF 算法去求H 矩阵,最后得到的每个句子的相关度为:GRS =(1.0e -003)ˑ〔0.47510.11860.02910.01120.3080〕.由此,可以判断出第1句是最重要的句子,其次是第5句.所以这一段的文摘句就为:教学具有多种形态,是共性和多样性的统一.由此例,可以看到将非负矩阵分解的快速稀疏算法应用于文本分析能够快速准确地得到文章的文本文摘.3结语本文提出的非负矩阵分解的快速稀疏算法,通过代数变换使得数据进行降维,在目标函数中附加约束稀疏度的稀疏项从而定义了目标函数,并且给出了迭代规则和收敛性证明.并且举例说明了此算法使得矩阵的分解速度和稀疏度都有所提高,又进一步利用此算法进行了一个简单的文本文摘,准确地得到了文摘的结果.参考文献:[1]LEE D D ,SEUNG H S.Learning the parts of objects by non -negative matrix factorization [J ].Nature ,1999,401(6755):788-791.[2]LEE D D ,SEUNG H S.Algorithms for non -negative matrix factorization [C ]//Advances in Neural Information Processing Sys-tems 13.Cambridge :MIT Press ,2001:556-562.[3]李乐,章毓晋.非负矩阵分解算法综述[J ].电子学报,2008,37(4):737-743.[4]王文俊,张军英.一种非负矩阵分解的快速方法[J ].计算机工程与应用,2009,45(25):1-2,6.[5]HOYER P O.Non -negative matrix factorization with sparseness constraints [J ].J Mach Learning Res ,2004,5(9):1457-1469.[6]LEE J H ,PARK S ,AHN C M ,et al.Automatic generic document summarization based on non -negative matrix factorization[J ].Information Processing and Management ,2009,45:20-34.(责任编辑梁志茂)662云南民族大学学报(自然科学版)第20卷。

相关文档
最新文档