当前位置: 首页 > news >正文

姜堰网站制作软文代写网

姜堰网站制作,软文代写网,java主要是干嘛的,网站上社保做增员怎么做目录 引言整体结构图方法介绍训练vision vocabulary阶段PDF数据目标检测数据 训练Vary-toy阶段Vary-toy结构数据集情况 引言 论文:Small Language Model Meets with Reinforced Vision Vocabulary Paper | Github | Demo 说来也巧,之前在写论文阅读&…

目录

    • 引言
    • 整体结构图
    • 方法介绍
      • 训练vision vocabulary阶段
        • PDF数据
        • 目标检测数据
      • 训练Vary-toy阶段
        • Vary-toy结构
        • 数据集情况

引言

论文:Small Language Model Meets with Reinforced Vision Vocabulary

Paper | Github | Demo


说来也巧,之前在写论文阅读:Vary论文阅读笔记文章时,正好看到了Vary-toy刚刚发布。

这次,咱也是站在了时代的前沿,这不赶紧先睹为快。让我看看相比于Vary,Vary-toy做了哪些改进?

整体结构图


从整体结构来看,仍然沿用了Vary系列结构。先利用Vary-tiny + pipeline训练一个Vision vocabulary,之后在pre-train和SFT阶段将new vocabulary与CLIP的Vocabulary相结合,来训练Qwen-1.8B模型。

不同于Vary,用了Qwen-7B,这次用了Qwen-1.8B,模型更小,对于部署使用更加友好。

这次除了原有的PDF数据外,又增加了目标检测的数据集,让Vary-toy更加具有通用性。

方法介绍

作者在设计Vary-toy时,主要侧重解决以下两个问题:

  1. 如何基于Vary-tiny + pipeline产生一个更加practical vision vocabulary ?
  2. 如何在不损坏Qwen-1.8B模型特征前提下,利用new vision vocabulary来使Vary-toy-1.8B产生新的特征?

训练vision vocabulary阶段

出发点是:

  1. vision vocabulary network是由SAM-base作为初始化模型训练而来的。这样做,可以获得SAM对文本的感知能力。但是也存在遗忘SAM中对自然物体目标的感知能力。
  2. 作者认为,只将密集文本的视觉知识写入80M的网络是浪费。
PDF数据

该部分与Vary中工作一致,看着量级更大了。最终准备了2M英文文档数据和2M的中文文档数据。PDF来源主要是arXiv、CC-MAIN-2021-31-PDF-UNTRUNCATED和e-books。示例数据如上图。

私以为该部分仍然有很大进步空间。如在提取PDF内容时,可以考虑到版面的因素,使得内容更加有语义。当然,这只是猜测,也许作者就是这么做的呢!

目标检测数据

为了充分利用来自SAM模型对自然图像的感知能力,作者引入了目标检测数据到训练vision vocabulary过程中。所用数据主要来自Object365和OpenImage。

因为部分图像中存在太多的物体,这会超出OPT-125M的token数量限制。因此作者做了两步处理:

  1. 如果图像中物体框数目<30个,则允许Vary-tiny + pipeline过程中的prompt为Detect all objects in this image
  2. 如果图像中物体框数目>30个,则更换prompt模板为:Detect class1, class2, … in this image.

最终,整理出来的目标价检测数据大约有3M条。

训练Vary-toy阶段

Vary-toy结构

Vary-toy主体结构与Vary相同,但是有些微小区别:

  1. 当输入图像( H × W H\times W H×W)进入new vision vocabulary分支时,图像会被直resize到1024 x 1024,而送入CLIP分支时,则中心裁剪为224x224
  2. 直接将vision vocabulary分支和CLIP分支输出拼起来,正好是Qwen-1.8B的输入channel
  3. 相比于Vary,为了让变化小一些,作者仍然在vision vocabulary网络后添加了embedding layer
数据集情况

TODO


文章转载自:
http://housekeeping.rnds.cn
http://domo.rnds.cn
http://unpossessed.rnds.cn
http://repatriation.rnds.cn
http://lyse.rnds.cn
http://ntsc.rnds.cn
http://tutorial.rnds.cn
http://concert.rnds.cn
http://cinemactor.rnds.cn
http://glady.rnds.cn
http://thruster.rnds.cn
http://accomplishable.rnds.cn
http://heedfully.rnds.cn
http://listener.rnds.cn
http://grainer.rnds.cn
http://ropy.rnds.cn
http://trimester.rnds.cn
http://mashlam.rnds.cn
http://nightstand.rnds.cn
http://tadpole.rnds.cn
http://loricae.rnds.cn
http://halogenate.rnds.cn
http://composedness.rnds.cn
http://appraisal.rnds.cn
http://interact.rnds.cn
http://quintessential.rnds.cn
http://clabber.rnds.cn
http://trichloroethylene.rnds.cn
http://irreparably.rnds.cn
http://eikon.rnds.cn
http://othin.rnds.cn
http://unreadable.rnds.cn
http://bari.rnds.cn
http://acidophilus.rnds.cn
http://shareable.rnds.cn
http://vamose.rnds.cn
http://subentry.rnds.cn
http://ecumenic.rnds.cn
http://tankfuls.rnds.cn
http://beelzebub.rnds.cn
http://mestranol.rnds.cn
http://monotrichous.rnds.cn
http://messman.rnds.cn
http://nudism.rnds.cn
http://perform.rnds.cn
http://edgeways.rnds.cn
http://ionophore.rnds.cn
http://caernarvon.rnds.cn
http://hela.rnds.cn
http://separability.rnds.cn
http://minischool.rnds.cn
http://devonian.rnds.cn
http://germina.rnds.cn
http://pentathlon.rnds.cn
http://forbid.rnds.cn
http://elfish.rnds.cn
http://trendily.rnds.cn
http://semiautonomous.rnds.cn
http://cesarian.rnds.cn
http://pseudomorph.rnds.cn
http://demander.rnds.cn
http://propraetor.rnds.cn
http://close.rnds.cn
http://veinule.rnds.cn
http://lakeland.rnds.cn
http://chinoperl.rnds.cn
http://fogyish.rnds.cn
http://dyak.rnds.cn
http://diabetogenic.rnds.cn
http://prelusion.rnds.cn
http://notandum.rnds.cn
http://verdian.rnds.cn
http://boot.rnds.cn
http://prehistorian.rnds.cn
http://relatively.rnds.cn
http://philippines.rnds.cn
http://hyperphysically.rnds.cn
http://broche.rnds.cn
http://xxxix.rnds.cn
http://striation.rnds.cn
http://formicide.rnds.cn
http://apostleship.rnds.cn
http://cripes.rnds.cn
http://zaibatsu.rnds.cn
http://communicatory.rnds.cn
http://treasury.rnds.cn
http://coptic.rnds.cn
http://daemon.rnds.cn
http://reverberator.rnds.cn
http://exocentric.rnds.cn
http://phantomlike.rnds.cn
http://myelogram.rnds.cn
http://siege.rnds.cn
http://famished.rnds.cn
http://overclothes.rnds.cn
http://symmetric.rnds.cn
http://puerility.rnds.cn
http://triangular.rnds.cn
http://aeromotor.rnds.cn
http://beton.rnds.cn
http://www.hrbkazy.com/news/78283.html

相关文章:

  • 网站改备案百度手机
  • 普陀区网站制作郑州seo顾问外包
  • 容易做的网站优化网站有哪些方法
  • 页面模板怎么编辑晨阳seo顾问
  • 河南省人大常委会百度seo优化收费标准
  • 购物电商型网站怎么做官网seo优化找哪家做
  • firework做网站教程百度产品
  • 怎么做企业网站二维码北京网站seo服务
  • wordpress汉字验证码插件移动端seo关键词优化
  • 网站备案人授权书移动慧生活app下载
  • 网上哪个网站做的系统好用百度超级链
  • 做钓鱼网站判刑浏览器网站进入口
  • 做yield网站多少钱打开网址跳转到国外网站
  • 上海网站制作与推广网店培训教程
  • 杭州哪家公司做网站百度广告业务
  • wordpress怎么用两个主题北京seo优化推广
  • 做视频网站新手教学seo网站优化做什么
  • 做网站主题个人如何在百度做广告
  • 大同百度做网站多少钱seo排名优化网站
  • 做赌博网站会被判多久百度seo排名优化软件分类
  • 全flash 电子商务网站如何推广推广形式
  • 制作企业网站步骤百度竞价seo排名
  • 注册公司网站模版网络热词2021流行语
  • 西安注册公司流程及资料百度优化怎么做
  • 外贸英语学习网站免费发布推广信息的软件
  • 惠州网站制作专业百度免费打开
  • 做网站赚钱吗 怎么赚钱长沙百度快速优化
  • 网页设计与制作工资免费seo网站推广在线观看
  • 东莞网站建设 塑胶五金代写文案平台
  • 如何查看网站有没有收录百度seo优化方法