Document
检索banner
高级检索 在检索结果中检索
全部字段 题名 作者 关键词 摘要

一种应用于藏文古籍多字体文字识别的训练数据合成方法

  • 【发明人】仁青东主,尼玛扎西,道吉扎西,仁增多杰,拥措
  • 【申请日期】2023.05.26
  • 【申请号】202310604176.7
  • 【申请人】西藏大学
  • 【摘要】 本发明公开了一种应用于藏文古籍多字体文字识别的训练数据合成方法,属于藏文识别技术领域,包括以下步骤:采集多字体藏文古籍文献扫描图片,并分析其字体及版式特征;提取原始藏文古籍扫描图片的文字、版式及背景等特征,并通过简单的几何变换生成用于模型训练的初始数据集,通过藏文古籍版式及标注规则,对初始数据集进行人工标注;基于藏文古籍文献文字的字体,生成具有多字体、复杂背景及文字倾斜等特征的合成训练数据;构建用于藏文古籍识别的藏文字丁集;通过藏文古籍文献真实标注图片及计算机自动合成的伪数据一定比例的融合,并生...
  • 【地址】850000 西藏自治区拉萨市江苏路36号
  • 【文献类型】 专利
进入发现系统查看更多信息
相关文献
页脚