当前位置：首页 > news >正文

永安城乡建设局网站看网站搜索什么关键词

news 2025/7/7 18:11:36

永安城乡建设局网站,看网站搜索什么关键词,建设购物网站的意义,福建中江建设公司网站Anchor DETR(AAAI 2022) 改进： 提出了基于anchor的对象查询提出Attention变体-RCDA 在以前DETR中，目标的查询是一组可学习的embedding。然而，每个可学习的embedding都没有明确的意义 （因为是随机初始化的）&#xff…

Anchor DETR(AAAI 2022)

改进：

提出了基于anchor的对象查询
提出Attention变体-RCDA

在以前DETR中，目标的查询是一组可学习的embedding。然而，每个可学习的embedding都没有明确的意义 （因为是随机初始化的），所以也不能解释它最终将集中在哪里。此外，由于每个对象查询将不会关注特定的区域，所以训练时优化也是比较困难的

在这里插入图片描述

DETR中对可视化的注释：（ slots就是100个查询中的一个）

在这里插入图片描述

这里三种预测pattern可能相同也可能不同

简单的模型

与DETR没有特别大的变化

6encoder，6decoder，右下角是Anchor Points

position embedding会加入到decoder的q和k中

object query:[100,256]增加了anchor point，编码成positon embedding，替换原来的oq

生成anchor point有两种方式

（a）anchor固定，宽高均匀分布的网格，均匀采样

（b）先将一个tensor以0-1均匀分布随机初始化点位，并作为学习参数（embedding），实验效果好

在这里插入图片描述

anchor point转化为 object query

在这里插入图片描述

首先，获得learned的[100（NA），2]的anchor points；

然后通过sin/cos转换成[100，256]高频位置编码（代码里函数为pos2posemb2d）；

过两层MLP学习（代码里为adapt_pos2d），转换为Q_P:[Np（pattern），256]。

代码和文章有些地方不太一致，具体如下：

在这里插入图片描述

Multiple Predictions for Each Anchor Points

假设参考点100个，每个点预测一个目标，真实的图像在同一个点附近可能会有多个目标

anchor detr设计了一个点预测多个模式（3种），每个点设置Np个模式（Np=3）

原始detr，object query是[100,256]每个是[1,256]

anchor detr增加了一个pattern embedding，如下;
$Q_{f}^{i}=\operatorname{Embedding}\left(N_{p}, C\right)$
也就是每个点Np(3)个pattern，[3，256]，论文里Np=300，pattern=3，也就是900个点