Document
检索banner
高级检索 在检索结果中检索
全部字段 题名 作者 关键词 摘要

基于随机森林的藏文文本分类

  • 【获取途径】 超星期刊网
  • 【作者】包晗,西热旦增,郭龙银,尚慧杰
  • 【DOI】10.14004/j.cnki.ckt.2019.4093
  • 【作者单位】西藏大学信息科学与技术学院;西藏大学理学院
  • 【年份】2019
  • 【卷号】第15卷
  • 【期号】 第34期
  • 【页码】178-180
  • 【ISSN】1009-3044
  • 【关键词】藏文 条件随机场 TF-IDF 随机森林 文本分类 
  • 【摘要】 针对藏文文本及其语法和词法结构,采用条件随机场进行分词,利用人工统计和标注进行停用词词典建立,然后采用tf-idf的词向量空间,予以权重计算,最后采用随机森林算法构建分类器,进行文本分类。并使用查全率、查准率和F1值三种评价函数与逻辑回归、多项式朴素贝叶斯、支持向量机三种算法相比,结果显示,随机森林算法在高维特征的藏文文本分类上优于其他分类器。
  • 【文献类型】 期刊
进入发现系统查看更多信息
看了本文的还看了

发文期刊《基于随机森林的藏文文本分类》历年引证文献趋势图

引证的期刊论文等列表

共8条记录 1/1 第一页 [1] 下一页 最后一页 到第
页脚