Document
检索banner
高级检索 在检索结果中检索
全部字段 题名 作者 关键词 摘要

贫语言资源条件下藏文分句数据集构建研究

  • 【获取途径】 超星期刊网
  • 【作者】才让叁智,多拉
  • 【作者单位】1西北民族大学中国语言文学学部;2西藏大学信息科学技术学院;3青海师范大学藏语智能信息处理及应用国家重点实验室
  • 【年份】2022
  • 【卷号】第6卷
  • 【期号】 第4期
  • 【页码】85-94
  • 【ISSN】2096-4617
  • 【关键词】藏文 句子 藏文垂符 分句数据集 
  • 【摘要】 基于深度学习的藏文自动分句研究中构建分句数据集,事关藏文分句模型性能和质量。鉴于现有的藏文自动分句数据稀缺问题,文章通过梳理藏文句法结构,提出了位于句末的谓语动词和谓语形容词,以及终结虚词和离合虚词可充当句尾标识符号的观点,并通过相关语料库构建了谓语形容词词典、谓语动词词典和句尾虚词词典,最终使用句尾词匹对方法成功从语料中切分出了40万条句子,解决了藏文分句数据集建构问题,为基于深度学习的藏文分句研究提供了可靠和较大规模的数据基础。
  • 【基金】国家自然科学基金
  • 【文献类型】 期刊
进入发现系统查看更多信息
看了本文的还看了
页脚