当前位置: 首页 > news >正文

江宁区建设局网站新东方英语培训机构官网

江宁区建设局网站,新东方英语培训机构官网,做湘菜的网站,建设银行手机银行网站用户名是什么原因Authors: Haofei Xu, Juyong Zhang Link: https://arxiv.org/abs/2004.09548 Years: 2020 Credit Novelty and Question set up 主流的立体匹配模型的代价聚合操作主要用了3D卷积,这部分操作的算力和内存消耗过大,因此作者提出一种新的模型AANet&#x…

Authors: Haofei Xu, Juyong Zhang
Link: https://arxiv.org/abs/2004.09548
Years: 2020

Credit

请添加图片描述

Novelty and Question set up

主流的立体匹配模型的代价聚合操作主要用了3D卷积,这部分操作的算力和内存消耗过大,因此作者提出一种新的模型AANet,旨在摒弃所有3D卷积操作。具体来说,作者提出多分辨率代价体构建,用基于稀疏采样点的尺度内聚合模块解决视差图的edge-fattening问题,用跨尺度聚合模块处理弱纹理问题。

Solutions and Details

  1. 总体架构
    请添加图片描述

    与流行的端到端立体匹配方法一样,AANet同样包含四部分:特征提取、构建代价体、代价聚合和输出视差图。在提取特征部分,会输出multi-scale feature map,分别对应不同stage的特征输出,然后利用这不同尺寸的特征图分别构建各自尺寸的代价体。

    作者在这构建的是相关性(correlation)代价体,对第sss个stage的左视图特征FlsF^{s}_{l}Fls和右视图特征FrsF^{s}_{r}Frs,计算视差ddd的相关度,计算方式如下

    Cs(d,h,w)=1N⟨Fls(h,w),Frs(h,w−d)⟩C^{s}(d,h,w) = \frac{1}{N}\langle F^{s}_{l}(h,w),F^{s}_{r}(h,w-d)\rangle Cs(d,h,w)=N1Fls(h,w),Frs(h,wd)⟩

    计算出来的代价体是三维的,因为特征通道维度上已通过内积操作进行加和而消除掉了。

    随后作者设计尺度内聚合模块(ISA)和跨尺度聚合模块(CSA)对代价体进行代价聚合,并输出对应尺度的视差图。

  2. 尺度内聚合模块

    作者关注到一个常见的问题,在不连续视差中容易出现edge-fattening问题,这个问题本质是常规卷积窗口在边缘时容易聚合了较大视差邻域的代价,因此提出一个自适应的弹性稀疏采样方案,即对特定的视差位置,与它语义上关联度更高的位置进行聚合,整体思路与deformable convolution(v2)一致,所以直接采用他们的实现

    C~(d,p)=∑k=1K2wk⋅C(d,p+pk+Δpk)⋅mk\tilde{C}(d,p)=\sum_{k=1}^{K^{2}}{w_k}\cdot{C(d,p+p_{k}+\Delta{p_k})}\cdot{m_k} C~(d,p)=k=1K2wkC(d,p+pk+Δpk)mk

    与原始deformable convolution稍有不同的是,Δpk\Delta{p_k}Δpkmkm_kmk是对所有channel共享的,作者的实现是将视差等分成GGG组,每一组使用单独的一套Δpk\Delta{p_k}Δpkmkm_kmk

    一个ISA模块即由3个conv和一个残差结构组合而成,类似bottleneck的设计,三层分别是1×1,3×3,1×1{1}\times{1},{3}\times{3},{1}\times{1}1×1,3×3,1×1卷积,而其中的3×3{3}\times{3}3×3卷积即是deformable convolution,但与bottleneck不一样的是作者这里三层采用的一样的channel数,没有压缩通道和计算量。

  3. 跨尺度聚合模块

    而立体匹配的另一个问题,弱纹理匹配问题,比较容易在粗颗粒度的代价体中找到纹理信息,因此作者设计了一个跨尺度的聚合模块来解决此类问题。尺度sss的聚合结果可以表示为

    C^s=∑k=1Sfk(C~k),s=1,2,...,S\hat{C}^{s}=\sum_{k=1}^{S}{f_k(\tilde{C}^{k})},s=1,2,...,S C^s=k=1Sfk(C~k),s=1,2,...,S

    这个设计的灵感来源HRNet的跨尺度特征聚合,因此函数fkf_kfk定义为

    fk={I,k=s(s−k)convs3×3,stride2,k<supsampling⊕conv1×1,k>s\begin{equation} f_k= \begin{cases} \mathcal{I}& \text{,k=s} \\ (s-k)convs_{3\times{3},stride2}& \text{,k<s} \\upsampling{\oplus}conv_{1\times{1}}& \text{,k>s} \end{cases} \end{equation} fk=I(sk)convs3×3,stride2upsamplingconv1×1,k=s,k<s,k>s

    虽然与HRNet结构相似,但设计的初衷和作用是不同的,AANet主要为了聚合不同尺度下代价体蕴含的几何信息,而HRNet是为了学习更丰富的特征。

  4. AANet设计和损失函数设计

    上述的ISA+CSA模块组成最终的AAModule(Adaptive Aggregation Module),在AANet中,作者采用了6个AAModule进行代价聚合,头3个用了普通2d卷积,后3个才用了deformable convolution。

    在特征提取部分,作者采用类似ResNet的结构,将其中6个普通2d替换成deformable convolution。然后利用FPN结构分别提取出1/3x,1/6x,1/12x三个分辨率的特征图。最后利用StereoDRNet提出的refine模块来将1/3x视差图refine到原始输入尺寸。视差图的输出依然是用了softargmin来实现。

    KITTI数据集提供的ground truth是稀疏深度,因此作者利用GA-Net的估计视差图作为软标签Dpseudo(⋅)D_{pseudo}(\cdot)Dpseudo()。对每个分辨率输出的视差图,首先双线性插值到原始尺寸,然后计算损失

    Li=∑pV(p)⋅L(Dpredi(p),Dgt(p))+(1−V(p))⋅L(Dpredi(p),Dpseudo(p))L_i =\sum_{p}{V(p)\cdot{\mathcal{L}(D^{i}_{pred}(p),D_{gt}(p))}} + (1-V(p))\cdot{\mathcal{L}(D^{i}_{pred}(p), D_{pseudo}{(p)})} Li=pV(p)L(Dpredi(p),Dgt(p))+(1V(p))L(Dpredi(p),Dpseudo(p))

    V(p)V(p)V(p)表示像素位置ppp上是否真实ground truth,L\mathcal{L}L表示smooth L1。整个网络的损失则是各分辨率之间的加权平均数

    L=∑iλi⋅LiL = \sum_i{\lambda_{i}}\cdot{L_i} L=iλiLi

Results

  • 作者在Sceneflow和KITTI-2012/2015数据集上进行验证和对比实验

  • 首先对比两个提出的主要聚合模块的作用,可以看出,ISA和CSA都用上效果是最好的
    请添加图片描述

  • 可视化证明ISA的自适应能力:在边界处时会选择临近但语义相似位置的特征,而在弱纹理区域,则倾向于搜索范围更广的区域
    请添加图片描述

  • 在各个使用3d卷积进行代价聚合的模型上使用AAModule进行替换,精度-速度均衡会变得更好
    请添加图片描述

  • 与其他SOTA在Sceneflow上进行比较,精度-速度均衡基本上能达到最佳,AANet*是网络深度更深的改进版本
    请添加图片描述

  • 在KITTI-2012/2015上与其他SOTA比较精度,依然能达到较好的水平
    请添加图片描述

Thoughts

  • 作者提出的AAModule包含了尺度内和跨尺度聚合模块,针对对应的问题进行特定优化,相对比较直观
  • 其中ISA使用了deformable convolution,设计比较巧妙,但在实际落地,尤其是端侧上,deformable convolution可能对硬件不太友好
  • 作者使用相关性构建代价体而非特征拼接,因此可以直接使用2d卷积进行代价聚合,在参数量和计算量上都有一定优势,但引入了deformable convolution则一定程度上抵消了这个优势
  • CSA模块仿照HRNet的操作设计也很巧妙,但同样会面临计算并行度问题
http://www.hrbkazy.com/news/34255.html

相关文章:

  • 双语网站怎么做的优化大师官方下载
  • 封面免费制作网站许昌seo推广
  • 哪有网站建设的网站策划
  • 石家庄新闻媒体求助热线电话全能优化大师
  • 网站开发网站设计北大青鸟职业技术学院简介
  • 同城招聘网站自助建站网络营销的方法包括哪些
  • 修网络seo排名方案
  • 重庆网站建设招标百度怎么推广自己的网站
  • 做破解的网站四川网站seo
  • 江都建设银行网站网络运营团队
  • 自建房设计网站推荐百度工具seo
  • 唐山网站建设正规公司网站搭建平台
  • 用区块链来做网站网站关键词优化排名公司
  • 南京商城网站开发设计seo搜索引擎的优化
  • 平度网站制作农产品网络营销方案
  • 网站新闻不添加关键词超链接对优化有影响吗seo关键词排名优
  • centos7安装wordpress湖南专业seo推广
  • wordpress加载ajax百度seo搜索引擎优化
  • WordPress 空间模板seo案例模板
  • 大德通众包 做网站怎么样站长工具官网查询
  • 哪些是+joomla做的网站杭州网站免费制作
  • 凡科做网站怎么样江门seo网站推广
  • 做外汇的国外新闻网站网络营销是学什么的
  • 湛江做网站苏州厂商深圳市龙华区
  • 网站开发加盟商怎么做客户引流推广方案
  • 有做兼职赚钱的网站吗百度怎么搜索网址打开网页
  • 做电影网站 资源怎么存放怎么做一个网站页面
  • 临夏网站建设寻找客户的渠道和方法
  • b2c网站建设平台客户管理系统
  • 英国零售电商网站开发海外推广营销系统