英特尔最新的 AI 研究解释了一种替代方法,可以为各行各业的快节奏现实世界用例训练深度学习模型
对象检测是用于描述用于检测、分类和识别图像中对象的所有技术和方法的术语。 由于深度学习和图像处理,人工智能取得了最新进展。 现在,可以识别图像或在图像中查找对象。 深度学习使目标检测非常流行。 文献中可用的大多数方法仅适用于来自同一领域的图像。
尽管大多数架构都围绕众所周知的基准进行了优化,但 CNN 已针对特定领域的任务显示出显着的结果。 然而,这些特定领域的解决方案通常针对特定的数据集进行了很好的调整。 他们从精心挑选的架构和训练技术开始。 这种方法的缺点是它不必要地使模型适应特定的数据集。 英特尔的研究团队开发了一种新策略来解决这个问题。 这也是英特尔(r)、Geti(tm) 平台的基础:一个可用于对象检测的模板,与数据集无关。 它由预先训练和精心挑选的模型以及训练管道组成。
作者测试了三种类型的架构:轻量级、高精度和中等。 这样做是为了确定可用于不同对象检测数据集的模型范围,而不管对象的复杂性或大小。 使用预训练的权重来快速实现模型收敛,并以高精度开始。 可以执行数据增强操作以通过随机裁剪、水平翻转以及亮度和颜色失真来增强图像。 多尺度训练已应用于中等和准确的模型,以提高它们的鲁棒性。 为了在复杂性和准确性之间取得平衡,作者还根据经验在多次试验后为每个模型选择了分辨率。 如果几个训练时期没有改善结果,作者还使用提前停止和 ReduceOnPlateau 自适应调度程序来停止训练。
来源和详细信息: