智能体感知系统训练数据生成

2020-12-26 14:31:23

    感知类AI常用于目标的探测、识别与定位,感知类AI目前常常采用人工智能技术,深度学习技术是AI采用的必备技术手段。目前人工智能深度学习技术严重依赖数据。

    数据是深度学习的血液,数据用来进行标注,进而产生样本数据,是深度学习训练系统的重要资源基础。数据越多、越全面,深度学习效果越好,然而图像类军事数据的匮乏,数据制作成本高、验证困难同样成为人工智能融入军事应用的发展瓶颈。

传统的图像类数据集制作方法是采用照相、录像等手段对现实世界研究对象进行大量采集,形成数据集,之后进行标注处理。这种方法往往可能存在如下问题:

A. 过拟合。这是由于数据量太少的原因造成的,数据量太少的限制造成无法训练一种算法;由于各种限制条件往往无法获取到足够的样本数据。

B. 训练数据集不平衡。主要是数据缺乏多样性造成的;

C. 观测位置:不同的视角难以找到同一个场景图像,目前数据采集的手段对于军事目标,是不可能获取全面观测位置的目标图像的;

D. 多传感器问题:几乎不可能从EO/IR和RF传感器中找到相同的场景/时间/方向的真实图像;;

E. 图像标记:大量手工标记;

F. 可重复性低:蒙特卡洛支持性弱;

   

        基于以上痛点,面向智能体感知系统,提出军事图像数据生成解决方案,本方案采用虚拟三维目标,虚拟场景,红外场景仿真软件(传感器仿真软件),基于LVC架构,可以动态产生丰富的军事目标图像数据、行为数据。可以广泛的应用到人工智能辅助决策、目标自动识别等领域的AI初训阶段,形成初步权重,之后结合实际数据进行迁移细训,可以大大加速训练过程,提高人工智能应用的开发效率。

    

智能体感知系统训练数据集生成解决方案特点:

        A,无限制的背景类型。通过虚拟建模手段,理论上可以模拟地球上任何地理特征区域。

    B,无限制的目标模型。通过三维目标建模手段,可以模拟任何实体目标(需要实体目标数据支持)。

    C,各种环境变量。合成环境中考虑到了季节、时间、雨、雪、风、雾、温度、湿度变化因素及其对成像的量化影响。

    D,多光谱传感器。同一个场景目标,可以获取可见光、长波红外、中波红外、NVG多个波段的感器图像;

    E,任意观察视角。同一个目标图像具备多个观察角度。

    F,任何平台载荷的影响。例如飞机、旋翼机、战车、轮船等各种实体平台,多种平台载体下传感器的图像。




 目标模型库: