-
【作者】格桑多吉,乔少杰,韩楠
-
【作者单位】西藏大学藏文信息技术研究中心;西南交通大学信息科学与技术学院;西南交通大学生命科学与工程学院
-
【年份】2015
-
【卷号】第44卷
-
【期号】 第4期
-
【页码】599-604
-
【ISSN】1001-0548
-
【关键词】网络舆论
-
【摘要】
考虑网络事件的时间距离,基于半结构化网页中不同位置特征项重要程度的不同,提出改进的single-pass文本聚类算法single-pass*,优势在于对Web文本不同位置特征项的加权处理,仅需计算新文档与同类别种子文档间的相似度。实验结果表明,相比single-pass,改进算法极大减少了漏检率和错检率,降低了由于新文本流内文档进行相似度计算导致系统性能的下降,平均提高Web文本聚类效率40%。将聚类后的Web文本应用于网络舆情分析,进行主题关注度分析和话题热度特性分析。
-
【文献类型】
期刊
进入发现系统查看更多信息
页脚