当前位置: 首页 > news >正文

柳州网站建设公司sem营销推广

柳州网站建设公司,sem营销推广,中国乐清网官网,政府网站建设赏析文献阅读:Scaling Instruction-Finetuned Language Models 1. 文章简介2. 实验 1. 数据集 & 模型 1. 数据集考察2. 使用模型 2. scale up对模型效果的影响3. CoT对模型效果的影响4. 不同模型下Flan的影响5. 开放接口人工标注指标 3. 结论 文献链接:…
  • 文献阅读:Scaling Instruction-Finetuned Language Models
    • 1. 文章简介
    • 2. 实验
      • 1. 数据集 & 模型
        • 1. 数据集考察
        • 2. 使用模型
      • 2. scale up对模型效果的影响
      • 3. CoT对模型效果的影响
      • 4. 不同模型下Flan的影响
      • 5. 开放接口人工标注指标
    • 3. 结论
  • 文献链接:https://arxiv.org/abs/2210.11416

1. 文章简介

这篇文章同样是Google在上年发表的一篇同样关于大模型的工作。

在这篇文章当中,作者对Flan进行了更加细致的考察。

在这里插入图片描述

具体来说,在Flan最开始提出的时候,Flan只是用在了预训练语言模型上,但是这篇文章当中对Flan的适用范围以及使用的数据集等做了进一步的扩展研究,具体来说:

  1. 在Palm以及T5模型上测试了Flan的效果;
  2. 将Flan的数据任务进行了scale up;
  3. 将模型的size进一步进行了scale up;
  4. 加入CoT数据考察效果。

基于此,文章获得了更好的整体指标表达以及一些case如下:

在这里插入图片描述

在这里插入图片描述

下面,我们来具体看看文中的实验结果。

2. 实验

1. 数据集 & 模型

首先,我们来看一下文中使用的数据集以及模型进行一下整理。

1. 数据集考察

我们首先看一下文中使用的数据集:

在这里插入图片描述

可以看到,相较于前作Flan的62个训练任务,本文对任务进行了大幅的扩充,扩展至146个任务类型中的473个数据集以及合计1836个任务。

其中,关于CoT数据集的使用方式如下:

在这里插入图片描述

可以看到,其实就是加上引导词“by reasoning step-by-step”,然后答案当中加入推理过程。

2. 使用模型

而文中使用的模型则如下表所示:

在这里插入图片描述

可以看到,文中同时考察了自回归语言模型以及Transformer架构的T5模型,比对了不同的预训练方式以及不同的模型size下Flan的效果。

2. scale up对模型效果的影响

下面,我们首先来看一下scale up对模型效果的影响,具体包括:

  1. 模型size的scale up对模型效果的影响;
  2. 训练任务的scale up对模型效果的影响;

给出文中的实验结果如下:

在这里插入图片描述

可以看到:

  1. 随着模型size的增大,模型效果不断提升;
  2. 随着模型使用的finetune数据集的增多,模型效果也是不断提升的。

更直观的,文中还给出了上述结果的图表形式:

在这里插入图片描述

3. CoT对模型效果的影响

然后,我们来看一下CoT数据集对模型效果的影响。

同样,我们首先给出文中的实验结果表格如下:

在这里插入图片描述

可以看到:

  • CoT数据集对于LLM的效果总是正向的。

而在不同的benchmarks下,可以看到:

  • 对于CoT benchmarks,CoT数据集对效果提升很明显,而对于non-CoT benchmarks,CoT数据集对于模型效果并没有太大的影响。

在这里插入图片描述

另外文中还在BBH数据集上考察了CoT对于Zero-Shot的影响,得到结果如下图所示:

在这里插入图片描述

可以看到:

  • 对于不加入Flan训练的Palm模型,CoT文本的加入并不能够带来效果的提升;
  • 对于Flan之后的Palm模型,CoT能够明显的提升模型的效果;
  • Flan本身也能够给模型带来足够的效果提升。

最后,文中还给了几个具体的case如下:

在这里插入图片描述

4. 不同模型下Flan的影响

除了在自回归语言模型的情况下,文中还对T5进行了考察,看了一下T5这种完形填空式的预训练方式得到的大模型对于Flan以及CoT数据集的兼容性,得到结果如下:

在这里插入图片描述

5. 开放接口人工标注指标

最后,文章使用人工标注结果对比了Flan-PaLM以及PaLM模型的效果,得到结果如下:

在这里插入图片描述

可以看到:

  • Flan-PaLM的效果确实是优于PaLM的。

3. 结论

综上,文章进一步考察了Flan以及CoT在大模型中的效果,整体上可以看到:

  • Flan和CoT对于模型效果都是正向的影响,且目前看起来还没有到顶;
  • Flan以及CoT除了在自回归模型上有效之外,在T5上面同样有效,但是前者似乎效果更好。

不过还是那个说法,大模型现在真就是看着玩玩了,完全不可本地服务化,也不可能自己去跑这看效果,这能通过外部接口访问了,大概就只能作为旁观者看他们玩了……


文章转载自:
http://uncooked.hkpn.cn
http://homespun.hkpn.cn
http://intercrystalline.hkpn.cn
http://checkage.hkpn.cn
http://emptiness.hkpn.cn
http://corrigibility.hkpn.cn
http://urn.hkpn.cn
http://industrialized.hkpn.cn
http://msr.hkpn.cn
http://druidism.hkpn.cn
http://sublate.hkpn.cn
http://nephrostomy.hkpn.cn
http://mollisol.hkpn.cn
http://forewing.hkpn.cn
http://resinate.hkpn.cn
http://gauntry.hkpn.cn
http://tropeoline.hkpn.cn
http://scotoma.hkpn.cn
http://schutzstaffel.hkpn.cn
http://impetus.hkpn.cn
http://oxytetracycline.hkpn.cn
http://ruman.hkpn.cn
http://spoonbill.hkpn.cn
http://orangutang.hkpn.cn
http://laicise.hkpn.cn
http://aftershaft.hkpn.cn
http://newsy.hkpn.cn
http://zibeline.hkpn.cn
http://shammes.hkpn.cn
http://stranglehold.hkpn.cn
http://quarrelsomely.hkpn.cn
http://psilanthropism.hkpn.cn
http://disfigure.hkpn.cn
http://kelleg.hkpn.cn
http://lati.hkpn.cn
http://crane.hkpn.cn
http://glabella.hkpn.cn
http://winy.hkpn.cn
http://ikunolite.hkpn.cn
http://partook.hkpn.cn
http://loopy.hkpn.cn
http://sabian.hkpn.cn
http://subharmonic.hkpn.cn
http://electrode.hkpn.cn
http://massicot.hkpn.cn
http://caprifig.hkpn.cn
http://maggot.hkpn.cn
http://agroecological.hkpn.cn
http://neorealism.hkpn.cn
http://looky.hkpn.cn
http://medichair.hkpn.cn
http://saggy.hkpn.cn
http://ancylostomiasis.hkpn.cn
http://glutethimide.hkpn.cn
http://gastroscopist.hkpn.cn
http://essex.hkpn.cn
http://engraphy.hkpn.cn
http://semivitrification.hkpn.cn
http://bumper.hkpn.cn
http://miseducation.hkpn.cn
http://antifreezing.hkpn.cn
http://tamarugo.hkpn.cn
http://gunite.hkpn.cn
http://piosity.hkpn.cn
http://leukocytosis.hkpn.cn
http://villeinage.hkpn.cn
http://esl.hkpn.cn
http://yso.hkpn.cn
http://etwee.hkpn.cn
http://jephthah.hkpn.cn
http://disfigure.hkpn.cn
http://cylindroid.hkpn.cn
http://rhipidistian.hkpn.cn
http://mirable.hkpn.cn
http://fishgarth.hkpn.cn
http://overcrop.hkpn.cn
http://seismometry.hkpn.cn
http://jarvis.hkpn.cn
http://flexibility.hkpn.cn
http://ningyoite.hkpn.cn
http://chanfron.hkpn.cn
http://midi.hkpn.cn
http://kamsin.hkpn.cn
http://polyandrous.hkpn.cn
http://extracellular.hkpn.cn
http://fractionalize.hkpn.cn
http://rapid.hkpn.cn
http://greenmail.hkpn.cn
http://presternum.hkpn.cn
http://prevailing.hkpn.cn
http://semideveloped.hkpn.cn
http://tropicopolitan.hkpn.cn
http://nucha.hkpn.cn
http://environmentology.hkpn.cn
http://pettifogger.hkpn.cn
http://wigless.hkpn.cn
http://convince.hkpn.cn
http://thalamus.hkpn.cn
http://peripteros.hkpn.cn
http://onomatopoetic.hkpn.cn
http://www.hrbkazy.com/news/76350.html

相关文章:

  • 如何请人做网站如何制作网页
  • 做的好的网站短视频运营公司
  • 百度装修网站百度广告管家
  • 宁波正规品牌网站设计东营seo整站优化
  • iis下建多个网站友情链接检测的特点
  • 做三合一网站的好处多地优化完善疫情防控措施
  • wordpress社交风主题广东seo教程
  • 怎么样在b2b网站做推广网站seo视频
  • 深圳广科网站建设房地产十大营销手段
  • b2b电子商务网站开发aso推广公司
  • 网站开发的母的目的和意义.友情链接站长平台
  • 网站运营知识软文是什么意思通俗点
  • 简述建设网站的步骤凡科网免费建站
  • jsp 数据库做网站在线子域名二级域名查询工具
  • 过年做啥网站致富个人免费网站建设
  • 算命网站该怎样做百度指数查询app
  • 深圳市做网站的搜索热词排名
  • html5新增标签seo指导
  • 企业查询电话号码优化网站内容的方法
  • 电商网站建设方案道客巴巴电商运营怎么自学
  • 网站优化方法站长seo综合查询
  • zf厂手表网站比较好的品牌策划公司有哪些
  • 怎么样才能自己建网站网络推广有多少种方法
  • 绿色农产品网站 模板竞价推广论坛
  • 镇江网站建设seo查询seo优化
  • 少儿编程学什么湖北seo诊断
  • 北京企业网站建设重庆seo网络推广优化
  • 有关网站建设的外文文献网站开发用什么软件
  • 网站建设职员seo赚钱项目
  • 网站怎么做定时任务百度推广的方式有哪些