当前位置: 首页 > news >正文

网站内容该怎么做什么推广平台好

网站内容该怎么做,什么推广平台好,wordpress正计时代码,做业务不花钱的网站有哪些这里写目录标题 1. RNN存在哪些问题呢?1.1 梯度弥散和梯度爆炸1.2 RNN为什么会出现梯度弥散和梯度爆炸呢? 2. 解决梯度爆炸方法3. Gradient Clipping的实现4. 解决梯度弥散的方法 1. RNN存在哪些问题呢? 1.1 梯度弥散和梯度爆炸 梯度弥散是…

这里写目录标题

  • 1. RNN存在哪些问题呢?
    • 1.1 梯度弥散和梯度爆炸
    • 1.2 RNN为什么会出现梯度弥散和梯度爆炸呢?
  • 2. 解决梯度爆炸方法
  • 3. Gradient Clipping的实现
  • 4. 解决梯度弥散的方法

1. RNN存在哪些问题呢?

1.1 梯度弥散和梯度爆炸

梯度弥散是梯度趋近于0
梯度爆炸是梯度趋近无穷大

1.2 RNN为什么会出现梯度弥散和梯度爆炸呢?

先看RNN的梯度推导公式,如下图:
在这里插入图片描述
在这里插入图片描述

从hk的梯度求导公式和hk的计算过程可以看出,hk的计算和Whh相关,也就是梯度也与Whh有关,因此从h1 时刻到hk时刻,Whh被乘了k-1次,即Whhk-1,那么当W>1时,就使得Wrk随着k(句子长度)的增大,梯度趋近无穷大,会出现梯度爆炸,而W<1时,Wrk随着k(句子长度)的增大,梯度会趋近于0,会出现梯度弥散。
综上:RNN并不是可以处理无限长的句子,其随着句子的增长可能出现梯度弥散和梯度爆炸的问题

2. 解决梯度爆炸方法

在这里插入图片描述

上图为一篇解决梯度爆炸的paper,其中左边的图描述的是梯度爆炸产生的原因,当W出现巨变的时候会导致loss的方向发生变化,从而偏移原来正确的方向,出现梯度爆炸。
解决梯度爆炸的方法是给w.grad设置一个阈值,比如是15,当大于阈值时,将w.grad=w.grad/||w.grad||15=115=15,从而保证了loss的方向不变,loss虽然可能有一些跳变,比如:从0.23~0.32,,但慢慢的还会下降。
这种方法叫gradient clipping

3. Gradient Clipping的实现

只需获取到模型参数后调用torch.nn.utils.clip_grad_norm_(p,10)即可,10为阈值。
见下图,注意torch.nn.utils.clip_grad_norm_(p,10)和print是平齐的。
在这里插入图片描述

4. 解决梯度弥散的方法

下文LSTM会讲。

http://www.hrbkazy.com/news/14680.html

相关文章:

  • wordpress 4.4.7徐州seo
  • 复旦学霸张立勇做的有关寺庙网站百度指数可以用来干什么
  • 新冠疫苗接种查询seo到底是什么
  • wordpress wp-comments-post.phpseo的工作流程
  • 怎么找运营团队佛山百度seo代理
  • 国家建设工程信息网站网络营销与直播电商专业就业前景
  • 温州市城市建设学校网站沈阳黄页88企业名录
  • 桂林网站建设找骏程网站流量排名查询工具
  • 体彩网站开发线上销售的方法和技巧
  • 网站建设硬件需求网络培训
  • 深圳企业网站怎么做怎么才能建立一个网站卖东西
  • 专业性网站 ip百度怎么推广广告
  • 成都网站排名提升上海营销公司
  • 阿里云做的网站程序员石家庄百度seo排名
  • 怎么做网站?长春网站建设公司哪个好
  • 网站推广码怎么做网站优化排名
  • 做网站用软件it行业培训机构哪个好
  • 门户网站建设平台企业管理培训课程网课免费
  • 网站在线预约模板kol推广
  • 保定专业做网站的公司哪家好专业网站制作网站公司
  • 沈阳最新消息发布宁波seo在线优化哪家好
  • 和平网站建设百度首页优化
  • 高端网站建设公司自己如何免费做网站
  • 南昌网站做世界杯比分查询
  • 大连做网站需要多少钱如何申请网站域名流程
  • 湖南企业网站制作优化流程
  • 做暧嗳xo小视频网站b2b外链代发
  • app制作教程视频seo页面代码优化
  • 设计一个企业网站报价福州seo代理商
  • 宽屏蓝色企业网站源码优化网站链接的方法