当前位置: 首页 > news >正文

十大不封号直播平台企业网站seo多少钱

十大不封号直播平台,企业网站seo多少钱,作文网推荐,商城网站验收浅谈wor2vec,RNN,LSTM,Transfermer之间的关系 今天博主谈一谈wor2vec,RNN,LSTM,Transfermer这些方法之间的关系。 首先,我先做一个定位,其实Transfermer是RNN,LSTM&…

浅谈wor2vec,RNN,LSTM,Transfermer之间的关系

今天博主谈一谈wor2vec,RNN,LSTM,Transfermer这些方法之间的关系。

首先,我先做一个定位,其实Transfermer是RNN,LSTM,和word2vec的一种“提升版”。这里的提升并不是说他们是一种迭代版本,而是说Transfermer它解决了RNN,LSTM,和word2vec的一些缺点。

下面我们先说一下RNN,LSTM,和word2vec主要i的缺点。
下面是RNN的模型示意图。我们可以很显然的发现,RNN在做一些任务的时候,是一个个的输入一个句子的单词,这样的计算方式,会导致忽略句子内单词之间的内在联系。虽然RNN,和LSTM有这种记忆,可以记忆之前句子留下来的信息,但是这种单向不并行计算方式,还是很大程度上不能考虑句子单词之间的内在联系。
在这里插入图片描述

同样word2vec其实也是如此,word2vec生成的词向量是固定的,这很大的限制了词向量的灵活性、表达能力。同时,我们知道word2vec其实只是从集合的角度去考虑句子内单词之间的联系,没有考虑单词间位置的关系。而且不能根据特定任务去灵活的发挥词向量的表达能力。

所以这两类模型的问题,渐渐的使得研究者去思考更好的模型,transfermer也因此诞生。

在transfermer论文中,作者说过,其实transfermer很大程度上是为了解决长句子的句子间因为有些词语距离太远,当时的很多模型不能很好的去学习词语间的联系这一问题。

transfermer则可以较好的解决这一问题。

那么对于transfermer 其自注意力机制,很特别的一个地方,就是对于一个句子,先对词向量进行一次提取,每一个词语先经过一个V矩阵进行一次提取。然后呢,其再用一个Q矩阵个一个K矩阵对x进行两次信息提取,提取完之后,得到的 q向量和k向量乘积作为V矩阵提取信息的权值。所以,其充分利用了神经网络的强大表征能力。但是也存在冒险,在学习的时候,神经网络需要自己知道Q K矩阵是为了权值而学习的,而V矩阵则是对数据进行最后的信息提取而学习的。我们可以给与transfermer更多的提示,让其对于这三个矩阵的学习更加具有目的性,这样或许可以更好的提升transfermer的学习能力,否则直接让其再目标函数的驱动下去学习这三个矩阵,目的性较弱,且会局限于数据初始化。

http://www.hrbkazy.com/news/48846.html

相关文章:

  • wordpress $limit移动端seo关键词优化
  • 企业做网站要注意些什么问题上海网络推广渠道
  • 济宁网站开发招聘域名信息查询网站
  • 专门做淘宝收藏可以赚钱的网站公众号如何推广运营
  • 合肥网站建设找佳达长春网站制作公司
  • 易思企业网站管理系统免费软文发布平台
  • 网站系统荥阳网站优化公司
  • 哪个网站做h5好网络网站推广优化
  • 中山移动网站建设报价bt搜索引擎下载
  • 网站建设最重要的因素seo优化运营
  • 个人怎么做网站宁波seo优化报价多少
  • 免费建站哪个好企业网站代运营
  • 目前做网站最流行的程序语言拼多多关键词排名查询软件
  • wordpress分类列表显示网站seo报告
  • 高端网站建设wanghess网络营销推广的手段
  • 网站建设框架都有哪些怎样做网站推广啊
  • 关于公司申请建设门户网站的请示网站建设是干什么的
  • 做微整去那个网站找好的医院营销策划运营培训机构
  • 建设一个类似淘宝的网站搜索引擎收录
  • 十堰北京网站建设无锡百姓网推广
  • 厦门成交型网站建设公司百度优化是什么意思
  • 成都市住房和城乡建设局电话东莞百度网站排名优化
  • 运城云起时网站建设网站推广网络推广
  • 最新备案域名企业网站优化的三层含义
  • 网站开发与设计中学生百度关键词搜索查询
  • 做网站的服务器很卡怎么办百度地图网页版
  • 网站规划的基本内容有哪些十大经典口碑营销案例
  • 西安网站托管网络推广外包怎么样
  • 武汉网站的优化我想做个网站怎么做
  • 徐州专业三合一网站开发网站建设开发外包公司