Document
检索banner
高级检索 在检索结果中检索
全部字段 题名 作者 关键词 摘要

基于自适应簇中心选择的文本聚类算法研究

  • 【获取途径】 超星期刊网
  • 【作者】翟东海,聂洪玉,崔静静,杜佳
  • 【作者单位】西南交通大学信息科学与技术学院;西藏大学工学院
  • 【年份】2013
  • 【卷号】第6期
  • 【页码】617-622
  • 【ISSN】1671-1742
  • 【关键词】海量数据挖掘 初始簇中心 文档距离 K-means算法 
  • 【摘要】 为解决传统的K-means算法需要人工确定K值和随机选取初始簇中心容易陷入局部最优的问题,提出自适应簇中心选择算法。首先将任意选取的一篇文档和与其距离最远的文档作为初始簇中心聚类得到2个大类并重新计算簇中心,然后,找出与新的簇中心距离大于设定阈值的文档并依据文档距离判断是否需要增加新的类别,迭代上述过程确定聚类簇中心及类别数。实例验证结果表明,提出的算法与改进的K-means算法相比,在聚类结果的质量和算法收敛的速度上都有明显的改善。
  • 【基金】中央高校基本科研业务费专项资金
  • 【文献类型】 期刊
进入发现系统查看更多信息
相关文献

引证的期刊论文等列表

共1条记录 1/1 第一页 [1] 下一页 最后一页 到第
页脚