3.1.2 2D目标检测


文档摘要

3.1.2 2D目标检测 DETR 一、简介 DETR的思路和传统的目标检测的本质思路有相似之处,但表现方式很不一样。传统的方法比如Anchor-based方法本质上是对预定义的密集anchors进行类别的分类和边框系数的回归。DETR则是将目标检测视为一个集合预测问题(集合和anchors的作用类似)。由于Transformer本质上是一个序列转换的作用,因此,可以将DETR视为一个从图像序列到一个集合序列的转换过程。该集合实际上就是一个可学习的位置编码(文章中也称为object queries或者output positional encoding,代码中叫作queryembed)。 图1. DETR算法流程 DETR使用的Transformer结构和原始版本稍有不同: 图2.


发布者: 作者: 转发
评论区 (0)
U