Document
检索banner
高级检索 在检索结果中检索
全部字段 题名 作者 关键词 摘要

基于迁移学习的敦煌藏文古籍整页识别

  • 【获取途径】 超星期刊网
  • 【作者】杨晓龙,高红梅,高定国,达措
  • 【作者单位】西藏大学信息科学技术学院
  • 【年份】2023
  • 【卷号】第37卷
  • 【期号】 第11期
  • 【页码】29-37
  • 【ISSN】1003-0077
  • 【关键词】文本识别 迁移学习 端到端整页识别 
  • 【摘要】 为了解决复杂背景下,文字风格多样导致整页文本识别模型识别精度低和网络难以收敛的问题,该文对基于迁移学习的整页识别算法进行改进。首先对《法国国家图书馆藏敦煌藏文文献》第一册的319张数据进行了构建和标注,通过印刷体合成等方式对数据集进行扩充,使实验数据达到2 367张图片;其次,为了增强行特征提取能力和加快网络收敛速度,使用自适应平均值池化对行特征提取模块和使用门循环单元对解码器进行了改进;最后将行训练模型迁移到改进的整页文本识别任务中实现对敦煌藏文文字的识别。实验结果表明,在拥有行级的标注情况下...
  • 【基金】国家自然科学基金
  • 【文献类型】 期刊
进入发现系统查看更多信息
页脚