2.765

2022影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

解决文本聚类集成问题的两个谱算法

徐森 卢志茂 顾国昌

徐森, 卢志茂, 顾国昌. 解决文本聚类集成问题的两个谱算法. 自动化学报, 2009, 35(7): 997-1002. doi: 10.3724/SP.J.1004.2009.00997
引用本文: 徐森, 卢志茂, 顾国昌. 解决文本聚类集成问题的两个谱算法. 自动化学报, 2009, 35(7): 997-1002. doi: 10.3724/SP.J.1004.2009.00997
XU Sen, LU Zhi-Mao, GU Guo-Chang. Two Spectral Algorithms for Ensembling Document Clusters. ACTA AUTOMATICA SINICA, 2009, 35(7): 997-1002. doi: 10.3724/SP.J.1004.2009.00997
Citation: XU Sen, LU Zhi-Mao, GU Guo-Chang. Two Spectral Algorithms for Ensembling Document Clusters. ACTA AUTOMATICA SINICA, 2009, 35(7): 997-1002. doi: 10.3724/SP.J.1004.2009.00997

解决文本聚类集成问题的两个谱算法

doi: 10.3724/SP.J.1004.2009.00997
详细信息
    通讯作者:

    徐森

  • 中图分类号: TP391

Two Spectral Algorithms for Ensembling Document Clusters

More Information
    Corresponding author: XU Sen
  • 摘要: 聚类集成中的关键问题是如何根据不同的聚类器组合为最终的更好的聚类结果. 本文引入谱聚类思想解决文本聚类集成问题, 然而谱聚类算法需要计算大规模矩阵的特征值分解问题来获得文本的低维嵌入, 并用于后续聚类. 本文首先提出了一个集成算法, 该算法使用代数变换将大规模矩阵的特征值分解问题转化为等价的奇异值分解问题, 并继续转化为规模更小的特征值分解问题; 然后进一步研究了谱聚类算法的特性, 提出了另一个集成算法, 该算法通过求解超边的低维嵌入, 间接得到文本的低维嵌入. 在TREC和Reuters文本数据集上的实验结果表明, 本文提出的两个谱聚类算法比其他基于图划分的集成算法鲁棒, 是解决文本聚类集成问题行之有效的方法.
  • 加载中
计量
  • 文章访问数:  1823
  • HTML全文浏览量:  38
  • PDF下载量:  1663
  • 被引次数: 0
出版历程
  • 收稿日期:  2008-06-12
  • 修回日期:  2008-11-25
  • 刊出日期:  2009-07-20

目录

    /

    返回文章
    返回