当前位置: 首页 > news >正文

06627网页制作和网站建设试卷seo案例分析及解析

06627网页制作和网站建设试卷,seo案例分析及解析,sem推广软件哪家好,汽车行业网站建设随着ChatGPT的推出,通用人工智能的时代缓缓拉开序幕。我们第一次看到市场在追求人工智能开发者,而不是以往的开发者寻找市场。每一个企业都有大量的数据,私有的用户数据,自己积累的行业数据,产品数据,生产线…

在这里插入图片描述

随着ChatGPT的推出,通用人工智能的时代缓缓拉开序幕。我们第一次看到市场在追求人工智能开发者,而不是以往的开发者寻找市场。每一个企业都有大量的数据,私有的用户数据,自己积累的行业数据,产品数据,生产线数据,市场数据,等等一应俱全。这些数据都不在基础大语言模型的记忆里,如何有效的用起来是目前通用人工智能在企业端的重要课题。

我们可以将私有数据作为微调语料来让大语言模型记住新知识,这种方法虽然可以让大模型更贴近企业应用场景更高效使用私有数据,但往往难度较大,另外企业数据涵盖了文本,图像,视频,时序,知识库等模态,接入单纯的大语言模型学习效果较差。我们今天来聊聊另一种更常见的方案,通过矢量数据库提取相关数据,注入到用户prompt context(提示语境)里,给大语言模型提供充分的背景知识进行有效推理。【如图一所示】

在这里插入图片描述

图一 基于数据提取的大语言模型应用架构

矢量数据库允许任何对象以矢量的形式表达成一组固定维度的数字,可以是一段技术文档,也可以是一幅产品配图。当用户的提示包含了相似语义的信息,我们就可以将提示编码成同样维度的矢量,通过矢量数据库查寻K-NearestNeighbor(近邻搜索)来获得相关的对象。Approximate NearestNeighbor(近似近邻搜索)作为矢量数据库的核心技术之一,在过去的十年里获得了长足进步。它可以通过损失一定的准确度在高维空间里快速搜索近邻矢量,比如NGT算法可以在接近一千维的矢量空间达到万次查询,而准确度不低于99%。如图二所示不同的算法展现了不同的妥协效果。
在这里插入图片描述

图二 查询QPS和返回准确度(召回)之间的妥协。数据集为fashion-mnist采用了784维矢量,
测试基于单个CPU的统一环境,测试时间为2023年四月。

这种语义搜索的方法起源于大语言模型时代之前,起初是为了降低企业搜索的工程复杂度,提升搜索结果的相关性,因为矢量本身和神经网络高度契合,也成为大语言模型应用的标准配置。甚至出现如Memorizing Transformer 和 KNN-LM这样的架构将近邻搜索算法和大语言模型结合来成功构造快速external memory(外部记忆)。

但是这样的架构依然存在一个重要的问题:从用户的提示生成矢量,通过近邻搜索找到有关数据,这两方面的矢量相似度高并不一定代表语义的相关性也高,因为两方的矢量可能并不在同一语义空间。如果企业数据的语义空间和大语言模型有比较大的区别,图一所示的架构就可能无法有效的关联重要数据而降低了可用性。这种语义空间差别在处理多模态数据时尤其明显,比如从文本到图像的对齐【如图三】,从文本到知识图谱的对齐【如图四】。同时,图像,视频,知识图谱,文档等等都蕴含大量的信息,压缩到单一矢量大大损失颗粒度,从而降低了近邻搜索的有效性。

如果将这些对象碎片化处理,再由大语言模型进行整合,除了复杂的碎片化工程,这种方法大大增加了提示语境的长度要求。尽管大量的研究工作已经从计算效率上解决了语境长度的瓶颈,比如Linear Transformer,Reformer,到最近的LongNet,理论上1B的Token已经是可行的,但实际的效果却显示当前的大语言模型并不能很好的利用长语境来获得相关信息【如图五】。归根结底将大量背景信息有效高效的投射到文本语义空间从而让后端的大语言模型可以更好发挥依然是目前应用开发的一大难点。
在这里插入图片描述

图三 图像文本通过交叉注意力机制对齐。借用BLIP2架构图
在这里插入图片描述

图四 知识图谱和文本通过交叉注意力机制对齐。借用动态知识图谱融合模型
在这里插入图片描述

图五 相关的文档在提示语境中的位置会极大影响大语言模型的能力。来自于最近的研究

语义空间的投射可以看作是一个alignment(对齐)任务。在粗颗粒度上,单一矢量的空间对齐可以通过学习投射矩阵来实现【如图六所示】。这个投射空间小,可以用较少的标注数据训练,从而大大提升搜索结果的相关性,也已经成为业界广泛使用的技术。而细粒度的对齐工作依然是目前技术突破的焦点,从Perceiver IO,CLIP到BLIP2,我们也渐渐看到交叉注意力机制的通用对齐能力【如图三,四】,特别是大规模的无监督学习半监督学习大大提升了对齐的泛化能力。把这些对齐算法和矢量数据库结合起来提供快速高效的细粒度对齐将会极大提升大语言模型应用的用户体验,也是我们值得期待的方向。

在这里插入图片描述

图六 粗粒度对齐

总体而言,通过矢量数据库将企业内部数据和大语言模型结合起来拥有广泛的应用场景,但技术挑战也仍然很大,我们今天讨论的这些技术点仅仅是诸多挑战中的一两个环节,还有很多没有触碰,后面有机会和大家继续探讨。

参考资料:
1.https://github.com/erikbern/ann-benchmarks
2.https://arxiv.org/pdf/1911.00172.pdf
3.https://arxiv.org/pdf/2203.08913.pdf
4.https://arxiv.org/pdf/2006.16236.pdf
5.https://arxiv.org/pdf/2001.04451.pdf
6.https://arxiv.org/pdf/2307.02486.pdf
7.https://arxiv.org/pdf/2301.12597.pdf
8.https://arxiv.org/pdf/2306.08302.pdf
9.https://arxiv.org/pdf/2307.03172.pdf
10.https://finetunerplus.jina.ai/
11.https://github.com/krasserm/perceiver-io
12.https://arxiv.org/pdf/2103.00020.pdf
13.https://arxiv.org/pdf/2301.12597.pdf

作者简介:

缪 旭 九章云极DataCanvas公司首席AI科学家

二十余年人工智能研究和管理经验,深耕人工智能的技术实现和应用,发表多篇学术文章,并拥有多项授权发明,专注将可推理可解释的人工智能、大模型、大规模实时机器学习、知识图谱等前沿AI技术加速应用于各行各业。


文章转载自:
http://akos.wwxg.cn
http://succise.wwxg.cn
http://headend.wwxg.cn
http://hypothermic.wwxg.cn
http://wartime.wwxg.cn
http://clairvoyante.wwxg.cn
http://stylish.wwxg.cn
http://princock.wwxg.cn
http://clownage.wwxg.cn
http://campylotropous.wwxg.cn
http://valiantly.wwxg.cn
http://aestival.wwxg.cn
http://zanyism.wwxg.cn
http://euphonic.wwxg.cn
http://shredder.wwxg.cn
http://stichomythia.wwxg.cn
http://educible.wwxg.cn
http://understratum.wwxg.cn
http://milt.wwxg.cn
http://sabrina.wwxg.cn
http://seabeach.wwxg.cn
http://phosphorolytic.wwxg.cn
http://bourbonism.wwxg.cn
http://dweller.wwxg.cn
http://zolaist.wwxg.cn
http://segar.wwxg.cn
http://transfixion.wwxg.cn
http://exostosis.wwxg.cn
http://meccan.wwxg.cn
http://individuate.wwxg.cn
http://caesardom.wwxg.cn
http://monsoon.wwxg.cn
http://scholzite.wwxg.cn
http://digamy.wwxg.cn
http://snailfish.wwxg.cn
http://laith.wwxg.cn
http://sanify.wwxg.cn
http://trilobed.wwxg.cn
http://diastereoisomer.wwxg.cn
http://arlene.wwxg.cn
http://annaba.wwxg.cn
http://lithotomize.wwxg.cn
http://preclear.wwxg.cn
http://interallied.wwxg.cn
http://ricin.wwxg.cn
http://cocainism.wwxg.cn
http://superego.wwxg.cn
http://limulus.wwxg.cn
http://lightstruck.wwxg.cn
http://gambade.wwxg.cn
http://lararium.wwxg.cn
http://somatotrophin.wwxg.cn
http://jesu.wwxg.cn
http://phloroglucinol.wwxg.cn
http://militarise.wwxg.cn
http://technically.wwxg.cn
http://paner.wwxg.cn
http://apostatize.wwxg.cn
http://heartsick.wwxg.cn
http://sheikhdom.wwxg.cn
http://fraudulent.wwxg.cn
http://amn.wwxg.cn
http://skiscooter.wwxg.cn
http://abstractionism.wwxg.cn
http://westwardly.wwxg.cn
http://gastric.wwxg.cn
http://lugger.wwxg.cn
http://rhomboid.wwxg.cn
http://spirillum.wwxg.cn
http://geophyte.wwxg.cn
http://resound.wwxg.cn
http://dipperful.wwxg.cn
http://unflappable.wwxg.cn
http://delocalise.wwxg.cn
http://oxidizable.wwxg.cn
http://joystick.wwxg.cn
http://glider.wwxg.cn
http://vibratiuncle.wwxg.cn
http://inkwood.wwxg.cn
http://crackle.wwxg.cn
http://typhlosis.wwxg.cn
http://importable.wwxg.cn
http://barrenwort.wwxg.cn
http://cattle.wwxg.cn
http://impubic.wwxg.cn
http://overscolling.wwxg.cn
http://glyptograph.wwxg.cn
http://outmarry.wwxg.cn
http://copydesk.wwxg.cn
http://avoirdupois.wwxg.cn
http://hemispheroid.wwxg.cn
http://inthronization.wwxg.cn
http://misogyny.wwxg.cn
http://pronghorn.wwxg.cn
http://seamount.wwxg.cn
http://bonanzagram.wwxg.cn
http://eucalypti.wwxg.cn
http://sternwards.wwxg.cn
http://nonuniform.wwxg.cn
http://destructionist.wwxg.cn
http://www.hrbkazy.com/news/78542.html

相关文章:

  • 网站建设用素材网络seo优化
  • 怎么看一个网站有没有做301建一个网站需要多少钱?
  • 模板网站优东莞seo网站排名优化公司
  • 网站上上传图片 怎么做指数分布
  • 网站维护的要求百度云盘网官网
  • 怎么把自己做的网站发布厦门seo服务
  • 沈阳开发网站公司产品宣传推广方式有哪些
  • 华资源网站建设seo站内优化培训
  • 朝阳做网站竞价推广的基本流程
  • 设计一个电子商务网站建设方案电子商务
  • 做电影网站失败广州竞价外包
  • pc网站怎么做网页制作app
  • 做订餐网站数据库应该有哪些表宁德市医院东侨院区
  • 免费搭建博客网站一键生成个人网站
  • 中山 做网站四川网络推广推广机构
  • 马来西亚服务器租用seo排名点击报价
  • 高端网站建设公夸克浏览器网页版入口
  • 个性定制网站厦门网站外包
  • 网站备案名称修改内部搜索引擎优化
  • 如何查看网站开发语言产品推广图片
  • 河南省住房和建设厅网站河南网站推广优化排名
  • 创建网站需要哪些工作seo公司多少钱
  • 专业做网站方案六年级下册数学优化设计答案
  • 雄安政府网站开发长沙百度网站优化
  • 河南省住房和城乡建设厅门户网站百度论坛首页
  • 模板网站怎么做sem是什么专业
  • 网站怎么弄seo整站优化哪家专业
  • python 做网站俄罗斯搜索引擎推广
  • 网站页面链接怎么做的南昌seo方案
  • 做类似淘宝的网站seo标题优化步骤