-
【获取途径】
超星期刊网
-
【作者】才让叁智,多拉
-
【作者单位】1西北民族大学中国语言文学学部;2西藏大学信息科学技术学院;3青海师范大学藏语智能信息处理及应用国家重点实验室
-
【年份】2022
-
【卷号】第6卷
-
【期号】 第4期
-
【页码】85-94
-
【ISSN】2096-4617
-
【关键词】藏文 句子 藏文垂符 分句数据集
-
【摘要】
基于深度学习的藏文自动分句研究中构建分句数据集,事关藏文分句模型性能和质量。鉴于现有的藏文自动分句数据稀缺问题,文章通过梳理藏文句法结构,提出了位于句末的谓语动词和谓语形容词,以及终结虚词和离合虚词可充当句尾标识符号的观点,并通过相关语料库构建了谓语形容词词典、谓语动词词典和句尾虚词词典,最终使用句尾词匹对方法成功从语料中切分出了40万条句子,解决了藏文分句数据集建构问题,为基于深度学习的藏文分句研究提供了可靠和较大规模的数据基础。
-
【基金】国家自然科学基金
-
【文献类型】
期刊
进入发现系统查看更多信息
页脚