基于多模态的自适应图像场景识别方法

2026.05.08点击:

摘要:<正>为了解决现有场景识别方法在开集场景下的识别能力有限问题,本文提出了一种基于多模态的自适应图像场景识别方法,该方法由多模态场景解析模块和场景标签识别模块组成。其中,多模态场景解析模块利用特定格式的成对图文数据训练并基于InternLM2的多模态模型获得场景开集识别能力;而场景标签识别模块具有图像基础识别能力,其信息可为下游算法提供前置过滤或应用参考,在智能家居、安防等领域广泛应用。实验结果表明,本文提出的基于多模态的自适应图像场景识别方法在闭集场景测试中的mAP指标

专辑: 信息科技

专题: 计算机软件及计算机应用

分类号: TP391.41