当前位置: 首页 > news >正文

丰台网站建设公司百度指数怎么看

丰台网站建设公司,百度指数怎么看,石家庄手机网站制作,上传空间站的注意事项这里写自定义目录标题 介绍模型推理的输出过程方案原始Token输出RM输出(回归任务) 介绍 奖励函数模型 (Reward Model) 是人工智能 (AI) 中的一种方法,模型因其对给定提示的响应而获得奖励或分数。现在的文章清一色的讲解RM的训练&#xff0c…

这里写自定义目录标题

  • 介绍
  • 模型推理的输出过程方案
    • 原始Token输出
    • RM输出(回归任务)

介绍

奖励函数模型 (Reward Model) 是人工智能 (AI) 中的一种方法,模型因其对给定提示的响应而获得奖励或分数。现在的文章清一色的讲解RM的训练,但是没有讲解RM是如何输出一个分数的。本文只讲RM的输出,以补充资料的缺乏。RM通常采用Llama-7B模型,本文也沿用这一模型,同时模型的推理计算过程作为已知的知识,只讲解推理最后的输出部分。本文章先介绍传统Llama模型原始Token输出过程,再讲解RM的输出。以作为对比更好的学习。

模型推理的输出过程方案

  1. 原始Token输出

预训练语言模型(如LLaMA、GPT等)的默认任务是语言建模,它们的输出是针对每个token的概率分布(即词汇表中的每个词的概率)
在这里插入图片描述在这里插入图片描述
注,W矩阵在llama-7b中是lm_head.weight

  1. RM输出(回归任务)

写在前面:回归任务就不需要原始Token输出中的logits矩阵的计算(即图中H*W+B的部分)和softmax的计算。

  • 处理每个token的隐藏状态以生成全局表示
    隐藏状态的介绍:
    在这里插入图片描述
    1) 平均池化(Mean Pooling)
    在这里插入图片描述
    2) 最大池化(Max Pooling)在这里插入图片描述
  • 回归任务输出分数:

在这里插入图片描述

http://www.hrbkazy.com/news/18660.html

相关文章:

  • 网站主目录权限配置最近的国际新闻大事10条
  • 西安网站建设兼职关键词排名优化
  • 国外的旅游网站开发百度网盘客服人工电话95188
  • 泗阳住房建设局网站怎样创建自己的网站
  • 个人业务网站制作万网的app叫什么
  • 外管局网站怎么做报告网页优化方案
  • 资料代做网站天津百度推广网络科技公司
  • 做淘宝客优惠券网站还是APP赚钱合肥seo代理商
  • 做自动发卡密网站的教程百度文库登录入口
  • 大学校园门户网站建设淘宝付费推广有几种方式
  • 学校微网站模板台州seo优化公司
  • 广东省建设监理协会网站 - 首页免费的网站推广平台
  • 重庆定制网站开发国外免费网站域名服务器查询软件
  • 微信广告投放平台seo外包服务项目
  • 哪个公司做网站好苏州成都seo的方法
  • 网站按天扣费优化推广高端网站建设报价
  • html5开发app人教版优化设计电子书
  • 上海闵行区租房优化标题关键词技巧
  • 想更新公司网站怎么做关键词优化价格表
  • 设计公司logo免费seo的含义是什么意思
  • wordpress 幻灯片 视频西安seo高手
  • 哪个网站财经做的最好谷歌google官网
  • 移动网站开发百度百科广州市口碑全网推广报价
  • 做网站不想用微软雅黑了域名注册官网免费
  • flash做网站步骤电商运营培训班多少钱
  • 建设部门电工证查询网站网站模板价格
  • 做旅游网站有前途吗东莞百度推广优化排名
  • 某购物网站建设方案上海百度seo公司
  • 漂亮的蓝色网站上海优质网站seo有哪些
  • 做外贸要注册那些网站厦门排名推广