【子空间聚类】Sparse Subspace Clustering(SSC) Algorithm=
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Sparse subspace clustering:Algorithm,theory,and Application
稀疏子空间聚类(SSC)的算法,理论和应用
参考文献:
1、E. Elhamifar and R. Vidal. Sparse subspace clustering: Algorithm,theory,and Application. IEEE Transactions on Pattern Analysis and Machine Intelligence,2013
2、E. Elhamifar and R. Vidal. Sparse subspace clustering. In CVPR, 2009
2013年的这篇论文写得比09年那篇容易懂一些,讨论和实验也更详细。
2013年的这篇可以看成是09那篇会议的扩展版。
一、算法
数据没有损坏,求解模型(5)获得矩阵C:
数据有损坏(noise and sparse outlying entries),求解模型(13)获得矩阵C:
仿射子空间模型:
二、理论
1、independent子空间
设rank(Yi)=di,Yi表示从第i个子空间Si抽取的Ni个样本构成的矩阵,di 表示Si的维数。
论文的定理1表明,模型(5)的解C*是一个块对角矩阵,属于同一个子空间的数据间的cij可能非零,不属于同一个子空间的数据间的cij=0.
2、disjoint子空间
对于disjoint子空间,除了满足条件rank(Yi)=di外,还需要满足公式(21):
则可获得与independent子空间下类似的结论:
三、应用
segmenting multiple motionsin videos: Hopkins 155 dataset
clustering images of human faces: Extended Yale B dataset
通过计算每对子空间的最小主角(principal angle)小于一给定值的比例,每对子空间中的数据的k近邻至少有一个在其他子空间的比例,可以帮助我们更好地知道两个数据库子空间聚类的挑战和各个算法的性能差别。
Hopkins 155 dataset:各个子空间间的主角很小;Extended Yale B dataset:不但主角小,而且一个子空间的数据点跟其他的子空间很靠近。
思考:
1、论文提到,SSC算法不需要知道每个子空间的基,事先也不知道每个数据属于哪个子空间,甚至每个子空间的数据个数可以是任意的。
2、对于independent子空间和disjoint子空间,由于模型的最优解是块对角矩阵,可以保证不同子空间没有联系,因此可以通过计算拉普拉斯矩阵的eigenspectrum 来确定子空间的个数。
从实验来看,对于子空间存在噪声等更复杂的实际情况,计算实际数据的非零奇异值个数,也能大概知道子空间的内在低维数。