当前位置: 首页 > news >正文

重庆网站建设推荐安卓优化大师手机版

重庆网站建设推荐,安卓优化大师手机版,wordpress文件服务器,公司图标大全最近的工作有涉及该任务,整理一下思路以及代码细节。 流程 总体来说思路就是首先用预训练的bert模型,在训练集的序列上进行CLS任务。对序列内容(这里默认是token id的sequence)以0.3左右的概率进行随机mask,然后将相…

最近的工作有涉及该任务,整理一下思路以及代码细节。

流程

总体来说思路就是首先用预训练的bert模型,在训练集的序列上进行CLS任务。对序列内容(这里默认是token id的sequence)以0.3左右的概率进行随机mask,然后将相应sequence的attention mask(原来决定padding index)和label(也就是mask的ground truth)输入到bert model里面。

当然其中vocab.txt并不存在的token是需要add进去的,具体方法不再详述,网上例子很多,注意word embedding也需要初始化就行。

模型定义:
self.model = AutoModelForMaskedLM.from_pretrained('./bert')
模型的输入:
result = self.bert_model(tail_mask, attention_mask, labels)
得到模型训练的结果之后,要做一个选择:

(1)transformer的bert model可以输出要预测时间步的hidden state,可以选择取出对应的hidden state,其中需要在数据处理的时候记录下每个sequence的tail position,也就是要预测位置的idx。另外我认为既然要进行序列推荐,那么最后一个tail position的token表征一定是最重要的,所以需要对tail position的idx专门给个写死的mask,效果会好一些。然后与sequence中item的全集进行相似度的计算,再去算交叉熵loss。

bert_hidden = result.hidden_states[-1]
bert_seq_hidden = torch.zeros((self.args.batch_size, 312)).to(self.device)
for i in range(self.args.batch_size):bert_seq_hidden[i,:] = bert_hidden[i, tail_pos[i], :]
logits = torch.matmul(bert_seq_hidden, test_item_emb.transpose(0, 1))
main_loss = self.criterion(logits, targets)

(2)同时也可以result.loss直接数据mask prediction的loss,我理解这个loss面对的任务是我要求sequence中的各个token表征都要尽可能准确,都要考虑,(1)可能更加注重最后一个位置的标准的准确性。

然后在evaluate阶段,需要注意输入到模型的不再是tail_mask,而是仅仅mask掉tail token id的sequence,因为我们需要尽可能准确的序列信息,只需要保证要预测的存在mask就够了。

由于是推荐任务,而且bert得到的hidden state表征过于隐式,所以需要一定的个性化引导它进行训练。经过个人的实验也确实如此,而且结果相差很多。

以上就是我个人的总结经验,欢迎大家指点。

http://www.hrbkazy.com/news/56588.html

相关文章:

  • 提供信息门户网站建设长春网站制作计划
  • 手机网站模板制作工具云搜索app官网
  • 新塘17网站一起做网店官网seo在线优化网站
  • 做文案看什么网站销售的技巧与口才
  • 网站域名的分类常见的关键词
  • 黑客网站手机版陕西seo主管
  • 易做文学网站的logo公众号推广引流
  • 免费做淘宝联盟网站免费b站软件推广网站
  • 免费做网站百度能录入it培训班出来现状
  • 网页设计实训报告ppt页面优化
  • 鑫路网站建设网络策划书范文
  • 网站后台怎么做水印图片短视频推广平台
  • 程序开发软件有哪些seo网站推广批发
  • 玉树营销网站建设服务百度指数搜索榜度指数
  • 深圳建设工程交易服务网老网站全球疫情今天最新消息
  • 建设书局 网站各种资源都有的搜索引擎
  • 金融网站建设方案ppt模板下载网站seo优化发布高质量外链
  • 手机百度关键词排名 seo网站优化软件百度一下你就知道123
  • 广州网站建设快速排名佛山网络推广公司
  • 自己电脑做网站 路由器线上推广宣传方式有哪些
  • 建个网站做外贸宁德seo
  • 网站建设怎样推广宁波seo外包哪个品牌好
  • 网站建设与管理 教学设计chatgpt入口
  • 网站建设的电话销售好做不seo排名优化教程
  • 网站怎么提高收录如何给公司网站做推广
  • 西安网站建设托管怎样做好销售和客户交流
  • 建设干部培训中心网站php免费开源crm系统
  • 佛山网站建设公司电话怎么在百度上发布自己的信息
  • 教学网站建设怎样做竞价推广
  • 乌鲁木齐vi设计公司网络推广和信息流优化一样么