Document
检索banner
高级检索 在检索结果中检索
全部字段 题名 作者 关键词 摘要

融合多模态的场景图像细粒度分类研究

  • 【作者】温瑶
  • 【学位年度】2023
  • 【学位授予单位】西藏大学
  • 【导师姓名】董志诚
  • 【关键词】多模态融合 场景图像分类 FGIC 决策融合 特征融合 
  • 【摘要】 目前,数以百万级的数据集使得机器学习算法能够在自然场景图像分类中达到接近人类的分类性能,但是百万级数据集的获取是一个工作量很大的任务,需要大量的人力物力以及长时间的积累,同时,数据集的预处理和多次训练也是一个很大的工作量,需要高速GPU的长时训练,这些因素都限制了机器学习和深度学习在工程上的落地和应用,使得诸多算法仅停留在实验室阶段。通过观察不难发现文本在城市和社会环境中无处不在,这些文本携带大量的语义信息,对于实现完整的场景理解是不可或缺的。本文重点探索通过融合文本和视觉信息,用较少的数据集有...
  • 【文献类型】 学位论文
进入发现系统查看更多信息
页脚