Document
检索banner
高级检索 在检索结果中检索
全部字段 题名 作者 关键词 摘要

基于mRASP的藏汉双向神经机器翻译研究

  • 【获取途径】 超星期刊网
  • 【作者】杨丹,拥措,仁青卓玛,唐超超
  • 【作者单位】西藏大学信息科学技术学院;西藏自治区藏文信息技术人工智能重点实验室;藏文信息技术教育部工程研究中心
  • 【年份】2023
  • 【卷号】第12期
  • 【ISSN】1673-629X
  • 【关键词】跨语言预训练模型 藏汉双向神经机器翻译 mRASP 数据增强 词表 
  • 【摘要】 藏汉机器翻译技术的研究对于弘扬和传承优秀民族文化,推进藏族地区经济、教育和文化的发展有着十分重要的现实意义。该文立足于藏汉平行语料匮乏而导致的藏汉神经机器翻译效果欠佳的问题,对跨语言预训练模型进行了研究。使用第十八届全国机器翻译大会的藏汉数据集构建藏汉双语的跨语言预训练模型,采用谷歌的Transformer神经网络机器翻译架构作为基线模型,主要利用数据增强的方式对藏汉平行语料进行扩充、优化藏汉机器翻译所用到的词表,并探索跨语言预训练模型中的联合词表对翻译性能的影响,最终提出了一种融合跨语言预训练...
  • 【文献类型】 期刊
进入发现系统查看更多信息
页脚