当前位置: 首页 > news >正文

网站seo怎么做网站如何提交百度收录

网站seo怎么做,网站如何提交百度收录,珠市口网站建设,wordpress 编辑器标签1 背景 由于计算资源限制,目前的LLM大多在较短的上下文长度中进行训练,在推理中,如果超出预训练的长度,模型的性能将会显著降低 ——>需要一个可提供外推性的位置编码最经典的绝对位置编码就是原始Transformer中的那个sinusoi…

1 背景

  • 由于计算资源限制,目前的LLM大多在较短的上下文长度中进行训练,在推理中,如果超出预训练的长度,模型的性能将会显著降低
    • ——>需要一个可提供外推性的位置编码
  • 最经典的绝对位置编码就是原始Transformer中的那个sinusoidal位置编码了:

 2 RoPE

2.1 motivation

  • RoPE通过绝对位置编码实现相对位置编码
    • 以实现有效外推
  • 我们现在有query词向量q,对应的位置m;key词向量k,对应的位置n
    • 我们希望学一个词向量和位置信息结合的函数f【经典Transformer的f是用m,n计算sinusoidal位置编码,然后将位置编码向量和q/k相加】
    • 经过f后得到的query向量和key向量都是位置感知的词向量f(q,m),f(k,n)
  • RoPE希望f(q,m),f(k,n)之间的点积能够带有相对位置信息m-n
    • 也就是希望存在另一个函数,使得:

2.2 RoPE的f函数

2.2.1 二维向量

  • 对于二维词向量,结论是:
    • 这里θ是一个常数
  • 此时

2.2.2 多维向量 

在原始论文Roformer: Enhanced Transformer With Rotray Position Embedding中,这里直接\theta_i=10000^{-\frac{2i}{d}}

所以有:

上面的矩阵乘法等价于如下的实现方式

http://www.hrbkazy.com/news/30072.html

相关文章:

  • windows做网站服务器吗seo外包费用
  • 网站可访问性自己建网站
  • 网站内容设计搜索引擎优化的各种方法
  • 哪些公司提供微信做网站服务成都网站快速排名优化
  • 做资源的教育类网站或公司百度学术论文查重官网
  • 深圳建网站公司哪家好百度推广营销页
  • 珠海房地产网站建设鸡西seo
  • 如何查询网站已经提交备案扬州百度推广公司
  • ipv6改造 网站怎么做企业qq手机版
  • asp做的静态网站卡不卡seo优化中以下说法正确的是
  • 新塘做网站公司网站建设一般多少钱
  • 无锡网站搜索优化易推客app拉新平台
  • 域名价格排名seo搜索优化招聘
  • 宜春房产网seo经典案例分析
  • 西宁做网站的公司旭云网络西安seo黑
  • 企业网站不备案会怎么样steam交易链接在哪
  • 零食网站建设需求分析口碑营销什么意思
  • 太原做网站排名上海百度整站优化服务
  • 济南专业制作网站百度搜索资源
  • 怎么做网站互换链接谷歌网页
  • 怎么做团购网站搜索引擎推广培训
  • 赣州建网站营销策划案
  • 上海网站seo策划自媒体培训
  • asp mysql做网站seo搜索排名优化
  • 我自己的网站 怎样做防火墙北京网站推广公司
  • 网站单页设计谷歌商店下载官方
  • 个人如何制作网站免费网站推广网站在线
  • 甘肃网站建设公司营销策划案例
  • 做策划常用的网站磁力吧ciliba
  • 网络游戏管理暂行办法百度搜索结果优化