智能体感知系统训练数据生成

2020-12-26 14:31:23

感知类AI常用于目标的探测、识别与定位，感知类AI目前常常采用人工智能技术，深度学习技术是AI采用的必备技术手段。目前人工智能深度学习技术严重依赖数据。

数据是深度学习的血液，数据用来进行标注，进而产生样本数据，是深度学习训练系统的重要资源基础。数据越多、越全面，深度学习效果越好，然而图像类军事数据的匮乏，数据制作成本高、验证困难同样成为人工智能融入军事应用的发展瓶颈。

传统的图像类数据集制作方法是采用照相、录像等手段对现实世界研究对象进行大量采集，形成数据集，之后进行标注处理。这种方法往往可能存在如下问题：

A. 过拟合。这是由于数据量太少的原因造成的，数据量太少的限制造成无法训练一种算法；由于各种限制条件往往无法获取到足够的样本数据。

B. 训练数据集不平衡。主要是数据缺乏多样性造成的；

C. 观测位置：不同的视角难以找到同一个场景图像，目前数据采集的手段对于军事目标，是不可能获取全面观测位置的目标图像的；

D. 多传感器问题：几乎不可能从EO/IR和RF传感器中找到相同的场景/时间/方向的真实图像;；

E. 图像标记：大量手工标记；

F. 可重复性低：蒙特卡洛支持性弱；

基于以上痛点，面向智能体感知系统，提出军事图像数据生成解决方案，本方案采用虚拟三维目标，虚拟场景，红外场景仿真软件（传感器仿真软件），基于LVC架构，可以动态产生丰富的军事目标图像数据、行为数据。可以广泛的应用到人工智能辅助决策、目标自动识别等领域的AI初训阶段，形成初步权重，之后结合实际数据进行迁移细训，可以大大加速训练过程，提高人工智能应用的开发效率。