-
【作者】才让加措,拥措,拉毛东只,张英,周青
-
【作者单位】西藏大学信息科学技术学院,西藏自治区藏文信息技术人工智能重点实验室,藏文信息技术教育部工程研究中心
-
【年份】2024
-
【卷号】第19卷
-
【期号】 第5期
-
【页码】53-58
-
【ISSN】1673-7571
-
【关键词】命名实体识别 藏医学 语义增强 预训练语言模型
-
【摘要】
针对通用藏文预训练语言模型在处理藏医数据时无法适应且存在词信息损失的问题,提出了一种融合藏医词汇特征与通用藏文预训练模型字特征的方法,以改善对藏医学专有名词的识别,并增强模型对藏医领域的理解能力。该方法通过构建藏医领域的特征词典,并利用词典来获取训练数据中每个字潜在的匹配词集,接着将词集特征嵌入字符表示中来增强藏医字符的表征能力。经实验表明,仅使用通用藏文预训练模型会降低对藏医实体识别的性能。融合词集特征后,F1值明显提高了17.19%,验证了此方法不仅能补充预训练模型缺乏的词汇信息,还可以有效...
-
【文献类型】
期刊
进入发现系统查看更多信息
页脚