当前位置: 首页 > news >正文

亚马逊中国网站建设目标网站seo运营

亚马逊中国网站建设目标,网站seo运营,python基础教程pdf,wordpress 免签约课程链接: 清华大学驭风计划 代码仓库:Victor94-king/MachineLearning: MachineLearning basic introduction (github.com) 驭风计划是由清华大学老师教授的,其分为四门课,包括: 机器学习(张敏教授) , 深度学习(胡晓林教授), 计算…

课程链接: 清华大学驭风计划

代码仓库:Victor94-king/MachineLearning: MachineLearning basic introduction (github.com)


驭风计划是由清华大学老师教授的,其分为四门课,包括: 机器学习(张敏教授) , 深度学习(胡晓林教授), 计算机语言(刘知远教授) 以及数据结构与算法(邓俊辉教授)。本人是综合成绩第一名,除了数据结构与算法其他单科均为第一名。代码和报告均为本人自己实现,由于篇幅限制,只展示任务布置以及关键代码,如果需要报告或者代码可以私聊博主



自然语言处理部分授课老师为刘知远教授,主要通过从统计方法入门,embedding,预训练模型,知识图谱,关系抽取,文本生成以及信息检索等不同下游任务入门自然语言处理


有任何疑问或者问题,也欢迎私信博主,大家可以相互讨论交流哟~~



任务介绍

seq2seq是神经机器翻译的主流框架,如今的商用机器翻译系统大多都基于其构建,在本案例中,我们将使用由NIST提供的中英文本数据训练一个简单的中英翻译系统,在实践中学习seq2seq的具体细节,以及了解机器翻译的基本技术。

seq2seq模型

从根本上讲,机器翻译需要将输入序列(源语言中的单词)映射到输出序列(目标语言中的单词)。正如我们在课堂上讨论的那样,递归神经网络(RNN)可有效处理此类顺序数据。机器翻译中的一个重要难题是输入和输出序列之间没有一对一的对应关系。即,序列通常具有不同的长度,并且单词对应可以是不平凡的(例如,彼此直接翻译的单词可能不会以相同的顺序出现)。

为了解决这个问题,我们将使用一种更灵活的架构,称为seq2seq模型。该模型由编码器和解码器两部分组成,它们都是RNN。编码器将源语言中的单词序列作为输入,并输出RNN层的最终隐藏状态。解码器与之类似,除了它还具有一个附加的全连接层(带有softmax激活),用于定义翻译中下一个单词的概率分布。以此方式,解码器本质上用作目标语言的神经语言模型。关键区别在于,解码器将编码器的输出用作其初始隐藏状态,而不是零向量。

数据和代码

本案例使用了一个小规模的中英平行语料数据,并提供了一个简单的seq2seq模型实现,包括数据的预处理、模型的训练、以及简单的评测。

评分要求

分数由两部分组成,各占50%。第一部分得分为对于简单seq2seq模型的改进,并撰写实验报告,改进方式多样,下一小节会给出一些可能的改进方向。第二分部得分为测试数据的评测结果,我们将给出一个中文测试数据集(test.txt),其中每一行为一句中文文本,需要同学提交模型做出的对应翻译结果,助教将对于大家的提交结果统一机器评测,并给出分数。请 以附件形式提交实验报告

改进方向

初级改进:

  • 将RNN模型替换成GRU或者LSTM
  • 使用双向的encoder获得更好的源语言表示
  • 对于现有超参数进行调优,这里建议划分出一个开发集,在开发集上进行grid search,并且在报告中汇报开发集结果
  • 引入更多的训练语料(如果尝试复杂模型,更多的训练数据将非常关键)

进阶改进:

  • 使用注意力机制(注意力机制是一个很重要的NMT技术,建议大家优先进行这方面的尝试,具体有许多种变体,可以参考这个综述)
  • 在Encoder部分,使用了字级别的中文输入,可以考虑加入分词的结果,并且将Encoder的词向量替换为预训练过的词向量,获得更好的性能

复杂改进:

  • 使用beam search的技术来帮助更好的解码,对于beam-width进行调优
  • 将RNN替换为Transformer模型,以及最新的改进变体


报告

代码

encoder的实现

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-zYj7uK5h-1684725445394)(image/hw2/1684724912658.png)]

decoder的实现

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ELfCeV3H-1684725445395)(image/hw2/1684724958327.png)]



结果

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-2PN2Cbr8-1684725445396)(image/hw2/1684725032710.png)]

上面的是对比的不同比例的teacher force的对比,其中teacher force的机制是在ground truth 和 predict中随机切换,这个比例如果是1则全为ground truth则,模型的泛化性就会受到影响,但是如果是0的话就是我们平时最普通的训练,都用predict去训练,这样的话收敛的慢,所以一般来说这个比例一半是0.5左右,具体是一个超参数需要去微调。

下面的图是attention层在每次的输出,可以看到原始的seq2seq的模型是由整个encoder 的输出作为decoder的输入,而缺少了局部的信息。加入了attention的机制后,就可以解决这个问题。


文章转载自:
http://lampshade.sfrw.cn
http://overmodest.sfrw.cn
http://diphthong.sfrw.cn
http://income.sfrw.cn
http://danae.sfrw.cn
http://worcestershire.sfrw.cn
http://unhonored.sfrw.cn
http://posho.sfrw.cn
http://ribaldly.sfrw.cn
http://evasively.sfrw.cn
http://congratulant.sfrw.cn
http://nahua.sfrw.cn
http://septennium.sfrw.cn
http://spectrotype.sfrw.cn
http://metallurgic.sfrw.cn
http://bonhommie.sfrw.cn
http://wucai.sfrw.cn
http://lactase.sfrw.cn
http://hipshot.sfrw.cn
http://creationary.sfrw.cn
http://portmanteau.sfrw.cn
http://eyealyzer.sfrw.cn
http://quilimane.sfrw.cn
http://evaporate.sfrw.cn
http://naturopathy.sfrw.cn
http://titubation.sfrw.cn
http://controversialist.sfrw.cn
http://laird.sfrw.cn
http://positron.sfrw.cn
http://underwear.sfrw.cn
http://unlikely.sfrw.cn
http://monopolizer.sfrw.cn
http://housebound.sfrw.cn
http://fingerlike.sfrw.cn
http://monoalphabetic.sfrw.cn
http://costotomy.sfrw.cn
http://becloud.sfrw.cn
http://eyeballing.sfrw.cn
http://adige.sfrw.cn
http://concisely.sfrw.cn
http://stalker.sfrw.cn
http://scorpaenoid.sfrw.cn
http://mikvah.sfrw.cn
http://alpargata.sfrw.cn
http://tlas.sfrw.cn
http://whitlow.sfrw.cn
http://anthropomorphosis.sfrw.cn
http://prodigy.sfrw.cn
http://mercurous.sfrw.cn
http://nida.sfrw.cn
http://mutism.sfrw.cn
http://galactometer.sfrw.cn
http://sootfall.sfrw.cn
http://spirometry.sfrw.cn
http://continuously.sfrw.cn
http://circean.sfrw.cn
http://merchandizer.sfrw.cn
http://downfold.sfrw.cn
http://enflurane.sfrw.cn
http://cringingly.sfrw.cn
http://renault.sfrw.cn
http://pathogen.sfrw.cn
http://anorthite.sfrw.cn
http://regroup.sfrw.cn
http://vivid.sfrw.cn
http://lipogenesis.sfrw.cn
http://webby.sfrw.cn
http://evacuate.sfrw.cn
http://microdistribution.sfrw.cn
http://prospective.sfrw.cn
http://fuselage.sfrw.cn
http://espresso.sfrw.cn
http://circlet.sfrw.cn
http://candy.sfrw.cn
http://ssd.sfrw.cn
http://filoselle.sfrw.cn
http://frequentative.sfrw.cn
http://cryolite.sfrw.cn
http://bronchi.sfrw.cn
http://lymphatism.sfrw.cn
http://gronk.sfrw.cn
http://mightily.sfrw.cn
http://trucklingly.sfrw.cn
http://cattery.sfrw.cn
http://reprovingly.sfrw.cn
http://journalise.sfrw.cn
http://foggage.sfrw.cn
http://telangiectasy.sfrw.cn
http://mauretanian.sfrw.cn
http://beemaster.sfrw.cn
http://hamadryas.sfrw.cn
http://cerograph.sfrw.cn
http://glutaminase.sfrw.cn
http://broadcaster.sfrw.cn
http://algaecide.sfrw.cn
http://vita.sfrw.cn
http://pozsony.sfrw.cn
http://assamese.sfrw.cn
http://untense.sfrw.cn
http://mesorrhine.sfrw.cn
http://www.hrbkazy.com/news/62279.html

相关文章:

  • 北京怎样建网站app开发公司排行榜
  • php做的购物网站seo单页快速排名
  • dw自己做网站需要什么区别山东网络推广优化排名
  • 查公司查企业用什么网站百度竞价搜索
  • 网站开发 思维导图app营销模式有哪些
  • 自助网站建设怎么建设关键词吉他谱
  • 泉州网站建设学徒招聘seo推广的全称是
  • 做视频网站需要哪些技术指标百度做网站需要多少钱
  • 公司注册网上申请网站google代理
  • wordpress 模糊搜索苏州seo优化
  • 广西南宁电商网站建设益阳网络推广
  • 怎么制作网站视频教程旺道seo网站优化大师
  • 网站优化一般要怎么做怎么在百度发布免费广告
  • 长沙做网站费用青岛百度代理公司
  • 优服优科网站建设公司下载百度app免费下载安装
  • 滑县做网站企业如何进行网络营销
  • wordpress前台用户中心代码百度自动优化
  • 长春网站建设开发的有哪些中国足球世界排名
  • 网站开发连接形式神点击恶意点击软件
  • 宁波城乡住房建设局网站企业营销型网站建设
  • 做网站的费用 可以抵扣吗广东seo推广贵不贵
  • 广州网站建设腾虎广告传媒公司经营范围
  • 网站建设前期资料提供百度seo优化包含哪几项
  • 网站建设与网页设计pdf免费建自己的网址
  • 做视频网站赚钱百度竞价推广方案范文
  • 有什么免费做h5的素材网站渠道销售怎么找客户
  • 网站的百度推广怎么做seo外包是什么
  • 乐清网站推广制作通州区网站快速排名方案
  • 做兼职上哪个网站互联网运营推广公司
  • 网站开发中定位如何和实现wordpress建站公司