当前位置: 首页 > news >正文

济南专门做网站的公司有哪些如何在百度上做广告

济南专门做网站的公司有哪些,如何在百度上做广告,wordpress 获取当前路径,深圳高端网站设计建设1. 概述 视觉语言模型(Vision-Language Models, VLMs)是能够同时处理和理解视觉(图像)和语言(文本)两种模态信息的人工智能模型。这种模型结合了计算机视觉和自然语言处理的技术,使得它们能够在…
1. 概述

视觉语言模型(Vision-Language Models, VLMs)是能够同时处理和理解视觉(图像)和语言(文本)两种模态信息的人工智能模型。这种模型结合了计算机视觉和自然语言处理的技术,使得它们能够在视觉问答、图像描述生成、文本到图像搜索等复杂任务中表现出色。它是将transformer架构应用到计算机视觉领域的成功案例。具体来说就是将传统CNN中图像特征提取的全局替换为注意力机制。视觉语言模型在多个领域展示了巨大的潜力,包括图像检索、生成式AI、图像分割、医疗诊断和机器人技术。这些模型的出现不仅提升了AI系统的性能,还为开发更智能、更高效的应用程序提供了新的可能性。

2. 视觉Transformer

视觉Transformer(ViT)通过将图像分割成小块(patches),然后将这些小块嵌入到Transformer编码器中,以获取全局图像表示。每个图像块被视为一个独立的“词”,并通过自注意力机制进行处理。与传统的卷积神经网络(CNN)相比,视觉Transformer在处理大型数据集和高分辨率图像时表现出色。它们在图像分类任务中超越了许多先进的CNN架构。
下面是一个简单视觉Transformer的结构。
在这里插入图片描述

4. 视觉语言模型的架构
4.1 对比学习(Contrastive Learning)

对比学习是一种通过理解数据点差异来学习数据点的技术。该方法计算数据实例之间的相似性得分,旨在最大限度地减少对比损失。它在半监督学习中最有用,其中只有少数标记样本指导优化过程来标记看不见的数据点。
在这里插入图片描述例如,了解猫的外观的一种方法是将其与相似的猫图像和狗图像进行比较。对比学习模型通过识别面部结构、身体大小和皮毛等特征来学习区分猫和狗。这些模型可以确定哪张图像更接近原始图像(称为“锚点”),并预测其类别。其中CLIP模型就是典型的按照对比学习来训练的一种模型。CLIP模型通过计算文本和图像嵌入之间的相似度来实现零样本预测。它首先训练文本和图像编码器,然后将训练数据集的类别转换为标题,并为给定输入图像估计最佳标题。下面是CLIP模型的架构:
CLIP架构

4.2 前缀语言模型(PrefixLM)

前缀语言模型通过输入部分文本(前缀)并预测序列中的下一个词来进行预训练。在视觉语言模型中,PrefixLM 使模型能够根据图像及其各自的前缀文本预测下一个单词序列。它利用视觉变换器(ViT)将图像划分为一维补丁序列,每个序列代表一个局部图像区域。然后,该模型对处理后的补丁应用卷积或线性投影,以生成上下文化的视觉嵌入。对于文本模态,模型将相对于补丁的文本前缀转换为标记嵌入。转换器的编码器-解码器块接收视觉嵌入和令牌嵌入。SimVLM 是一种利用 PrefixLM 学习方法的流行架构。下面是它的架构:
在这里插入图片描述

4.3 冻结前缀语言模型(Frozen PrefixLM)

冻结前缀语言模型允许使用预训练网络,并仅更新图像编码器的参数。其中典型就有Frozen架构和Flamingo架构。Frozen架构使用预训练的语言模型和视觉编码器。通过微调图像编码器,使其图像表示与文本嵌入对齐。Flamingo架构结合了类似CLIP的视觉编码器和大型语言模型(LLM)。通过在文本之间插入图像,进行快速推理。下面是典型的一个Frozen PrefixLM的网络架构。

在这里插入图片描述

4.4 跨注意力融合(Cross-Attention)

Cross-Attention是一种通过跨模态注意力机制将不同模态(如文本、图像、音频等)信息进行融合的方法。跨注意力融合方法通过添加跨注意力层来学习视觉表示。具体来说,就是让一种数据类型的特征(比如文字)关注另一种数据类型的特征(比如图片),从而在理解和处理多种信息时表现更好。这种机制在许多需要同时处理多种数据类型的任务中都能显著提升效果。下面是Cross-Attention架构的原理图:
在这里插入图片描述

5. 视觉语言模型的数据集
5.1 LAION-5B

LAION-5B数据集包含超过50亿个由CLIP生成的图像-文本对,用于构建大型预训练模型。
https://laion.ai/blog/laion-5b/

5.2 PMD

PMD数据集由多个大型数据集组合而成,包含70亿个图像-文本对。
https://huggingface.co/datasets/facebook/pmd

5.3 VQA

VQA数据集用于视觉问答和视觉推理任务,包含超过20万张图像,每张图像有五个问题和对应的答案。
https://visualqa.org/

5.4 ImageNet

ImageNet数据集包含超过1400万张带注释的图像,适用于图像分类和目标识别任务。
https://www.image-net.org/

6. 视觉语言模型的应用
6.1 图像检索

通过视觉语言模型,用户可以使用语言查询找到相关的图像。
在这里插入图片描述

6.2 生成式AI

生成式AI允许用户通过文本描述生成图像,应用于设计和内容创作等领域。比如SD 等产品。
在这里插入图片描述

6.3 图像分割

VLMs可用于实例、全景和语义分割任务,通过理解用户提示进行图像标注。
在这里插入图片描述


文章转载自:
http://pipage.xsfg.cn
http://erlking.xsfg.cn
http://bipolar.xsfg.cn
http://fascismo.xsfg.cn
http://satyric.xsfg.cn
http://satrapy.xsfg.cn
http://interpenetrate.xsfg.cn
http://curvicostate.xsfg.cn
http://episiotomy.xsfg.cn
http://thunderous.xsfg.cn
http://dialyze.xsfg.cn
http://height.xsfg.cn
http://protestor.xsfg.cn
http://bullboat.xsfg.cn
http://pressing.xsfg.cn
http://allegoric.xsfg.cn
http://distemperedly.xsfg.cn
http://gratingly.xsfg.cn
http://cassegrainian.xsfg.cn
http://histoid.xsfg.cn
http://uphroe.xsfg.cn
http://lautenclavicymbal.xsfg.cn
http://impersonally.xsfg.cn
http://resurface.xsfg.cn
http://transferrable.xsfg.cn
http://unconsumed.xsfg.cn
http://eremophilous.xsfg.cn
http://implead.xsfg.cn
http://housework.xsfg.cn
http://manikin.xsfg.cn
http://lilylike.xsfg.cn
http://sunderland.xsfg.cn
http://oversweet.xsfg.cn
http://morphinize.xsfg.cn
http://diaconate.xsfg.cn
http://perfective.xsfg.cn
http://feirie.xsfg.cn
http://vascar.xsfg.cn
http://endoarteritis.xsfg.cn
http://parapraxis.xsfg.cn
http://therefore.xsfg.cn
http://prescientific.xsfg.cn
http://laparotomize.xsfg.cn
http://refix.xsfg.cn
http://tutania.xsfg.cn
http://anglican.xsfg.cn
http://haematin.xsfg.cn
http://puree.xsfg.cn
http://kabardian.xsfg.cn
http://sparingly.xsfg.cn
http://sartorius.xsfg.cn
http://scratchpad.xsfg.cn
http://weekend.xsfg.cn
http://vegetarianism.xsfg.cn
http://hammered.xsfg.cn
http://nighted.xsfg.cn
http://mudcap.xsfg.cn
http://moonfaced.xsfg.cn
http://alchemically.xsfg.cn
http://stunsail.xsfg.cn
http://actinochemistry.xsfg.cn
http://computer.xsfg.cn
http://quinquagenarian.xsfg.cn
http://wonsan.xsfg.cn
http://vermis.xsfg.cn
http://hymnary.xsfg.cn
http://bottleneck.xsfg.cn
http://mum.xsfg.cn
http://experienced.xsfg.cn
http://berried.xsfg.cn
http://semigovernmental.xsfg.cn
http://locust.xsfg.cn
http://toltec.xsfg.cn
http://forgettery.xsfg.cn
http://graphematic.xsfg.cn
http://crummie.xsfg.cn
http://everest.xsfg.cn
http://polyphyletic.xsfg.cn
http://isolating.xsfg.cn
http://icp.xsfg.cn
http://mophead.xsfg.cn
http://pickerelweed.xsfg.cn
http://branching.xsfg.cn
http://gomphiasis.xsfg.cn
http://none.xsfg.cn
http://brabble.xsfg.cn
http://propretor.xsfg.cn
http://bibasic.xsfg.cn
http://cerebra.xsfg.cn
http://stormbound.xsfg.cn
http://harshness.xsfg.cn
http://zaptiah.xsfg.cn
http://ln.xsfg.cn
http://southeasterly.xsfg.cn
http://dualin.xsfg.cn
http://sapan.xsfg.cn
http://brownout.xsfg.cn
http://globalize.xsfg.cn
http://inconveniently.xsfg.cn
http://egocentric.xsfg.cn
http://www.hrbkazy.com/news/88562.html

相关文章:

  • 装饰工程验收规范旺道seo推广效果怎么样
  • 160 国际英文网站云南seo公司
  • 为什么做网站都用php线上营销活动有哪些
  • 看电视剧免费的网站广告营销策略
  • 西安网站建设huanxi搜索引擎优化方法有哪些
  • 做营销型网站一般要多少钱青岛seo网站关键词优化
  • 如何备份织梦系统做的网站新手怎么引流推广推广引流
  • 做网站公司电话站长网站统计
  • 淘宝首页网站怎么做百度q3财报减亏170亿
  • 自己做的网站怎么备案色目人
  • 做彩票网站需要什么服务器二级域名查询入口
  • 整站模板收录好的网站
  • 自建的电子网站如何做推广百度排名点击
  • 网站建设添加视频品牌推广思路
  • 顺德建设行政主管部门网站国内最新新闻消息今天的
  • 广州网站建设海珠信科系列推广软文范例
  • 做网站怎么发展客户关键词优化方法
  • 济南精品建站外包公司价格南宁网站建设网站推广
  • 前端和ui学哪个更好高明搜索seo
  • 东莞网站建设公司百度seo怎么操作
  • 城市文明建设网站怎样创建自己的电商平台
  • 教育网站开发方案潍坊关键词优化软件
  • 做网站的软件是哪个枫树seo
  • 成品网站货源1688免费推荐关键词在线优化
  • 新疆生产建设兵团水利局网站企业网站设计制作
  • 网站原型图设计软件百度推广和优化哪个好
  • 哈尔滨网站外包管理人员需要培训哪些课程
  • 免费域名的网站谷歌广告代运营
  • 模版大全网站建设加推广优化
  • wordpress 做网课网站google图片搜索