Document
检索banner
高级检索 在检索结果中检索
全部字段 题名 作者 关键词 摘要

基于改进的χ2检验的热点词突发性度量研究

  • 【作者】翟东海,聂洪玉,崔静静,于磊,杜佳,王佳君
  • 【作者单位】西南交通大学信息科学与技术学院;西藏大学工学院
  • 【年份】2013
  • 【卷号】第11期
  • 【页码】1788-1790
  • 【ISSN】1672-9722
  • 【关键词】突发性热点词 χ2检验 词频 动态突发性词库 
  • 【摘要】 采用原始χ2检验公式进行突发性度量时存在低频词偏袒问题,论文提出了结合TF的改进的χ2检验方法能有效克服该问题。该方法将词频累加和作为文档统计篇数的影响因子β引入原始χ2检验公式从而解决了低频词偏袒问题,提高了度量热点词突发性的精确度。动态突发性热点词库依据改进后的χ2检验公式得到的突发性度量值来建立,并将该词库运用在动态突发性向量空间模型中来发现与追踪网络突发性热点话题。实例验证表明,利用该文的方法进行话题发现与追踪,可以获得有更高的准确率、召回率以及F度量。
  • 【基金】中央高校基本科研业务费专项资金;教育部科学技术研究重点基金
  • 【文献类型】 期刊
进入发现系统查看更多信息
页脚