当前位置: 首页 > news >正文

个人网站可以做淘客网站维护需要学什么

个人网站可以做淘客,网站维护需要学什么,WordPress移植emlog,seo站长博客文章目录 前言笔记正文XTuner支持模型和数据集 微调原理跟随文档学习快速上手自定义微调准备数据准备配置文件 MS-Agent微调 前言 本文是对于InternLM全链路开源体系系列课程的学习笔记。【XTuner 大模型单卡低成本微调实战】 https://www.bilibili.com/video/BV1yK4y1B75J/?…

文章目录

  • 前言
  • 笔记正文
    • XTuner
      • 支持模型和数据集
    • 微调原理
    • 跟随文档学习
    • 快速上手
    • 自定义微调
      • 准备数据
      • 准备配置文件
    • MS-Agent微调

前言

本文是对于InternLM全链路开源体系系列课程的学习笔记。【XTuner 大模型单卡低成本微调实战】 https://www.bilibili.com/video/BV1yK4y1B75J/?share_source=copy_web&vd_source=99d9a9488d6d14ace3c7925a3e19793e

笔记正文

XTuner

地址:XTuner

一个大预言模型微调工具箱

  • 傻瓜化:以配置文件的形式封装了大部分微调场景
  • 轻量级:对于7B参数量的LLM,微调所需的最小显存仅为8GB。

支持模型和数据集

在这里插入图片描述

微调原理

  • LoRA:只对玩具中某些零件记性改动,而不是对整个玩具进行全面改动
  • QLoRA:LoRA的一种改进,如果你手里只有一把生锈的螺丝刀,也能改造你的玩具。

跟随文档学习

文档提供了三个微调的例子,分别叫做快速上手、自定义微调和MS-Agent微调。

快速上手

首先介绍了如何安装微调的XTuner环境,然后介绍了具有多个开箱即用的配置文件,并对于这些配置文件的名称进行了解释
例如文件名:internlm_chat_7b_qlora_oasst1_e3

模型名internlm_chat_7b
使用算法qlora
数据集oasst1
把数据集跑几次跑三次:e3

然后根据实际模型、数据集存放的位置、实际训练需求,修改配置文件中的信息。

接着就可以开始微调了。

微调训练完成后,应该在work_dirs的目录下产生pth权重,需要将其转换成hf格式的模型

xtuner convert pth_to_hf ${CONFIG_NAME_OR_PATH} ${PTH_file_dir} ${SAVE_PATH}

转换后,生成的文件应该是

|-- README.md
|-- adapter_config.json
|-- adapter_model.bin
`-- xtuner_config.py

可以理解为LoRA模型文件=Adapter

然后将hf的adapter合并到原LLM,并与之对话,这些需求xtuner都提供了相应的命令行工具。

自定义微调

这个部分演示了在实际需求下如何准备数据、修改配置文件、进行微调。

准备数据

将表格(或者其他数据格式)数据转化成jsonL格式。也就是json列表

[{"conversation":[{"system": "xxx","input": "xxx","output": "xxx"}]
},
{"conversation":[{"system": "xxx","input": "xxx","output": "xxx"}]
}]

然后划分训练集和测试集等。

准备配置文件

可以从下面的对配置文件的修改看出如何使用这种所谓的“自定义数据集”进行微调训练。

# 修改import部分
- from xtuner.dataset.map_fns import oasst1_map_fn, template_map_fn_factory
+ from xtuner.dataset.map_fns import template_map_fn_factory# 修改模型为本地路径
- pretrained_model_name_or_path = 'internlm/internlm-chat-7b'
+ pretrained_model_name_or_path = './internlm-chat-7b'# 修改训练数据为 MedQA2019-structured-train.jsonl 路径
- data_path = 'timdettmers/openassistant-guanaco'
+ data_path = 'MedQA2019-structured-train.jsonl'# 修改 train_dataset 对象
train_dataset = dict(type=process_hf_dataset,
-   dataset=dict(type=load_dataset, path=data_path),
+   dataset=dict(type=load_dataset, path='json', data_files=dict(train=data_path)),tokenizer=tokenizer,max_length=max_length,
-   dataset_map_fn=alpaca_map_fn,
+   dataset_map_fn=None,template_map_fn=dict(type=template_map_fn_factory, template=prompt_template),remove_unused_columns=True,shuffle_before_pack=True,pack_to_max_length=pack_to_max_length)

然后和前文差不多。

MS-Agent微调

数据也是由jsonl格式的,但是与前面的input、output不同,现在的每个conversations则需要赋予不同的身份了。

  • system: 表示给模型前置的人设输入,其中有告诉模型如何调用插件以及生成请求
  • user: 表示用户的输入 prompt,分为两种,通用生成的prompt和调用插件需求的 prompt
  • assistant: 为模型的回复。其中会包括插件调用代码和执行代码,调用代码是要 LLM 生成的,而执行代码是调用服务来生成结果的

而assistant则需要包含工具调用和返回,分别叫做思考阶段和执行阶段,这两个阶段是不输出的,具体格式如下
图片来源https://github.com/InternLM/tutorial/blob/main/xtuner/README.md
图片来源https://github.com/InternLM/tutorial/blob/main/xtuner/README.md

之后就是找到对应的训练配置文件,根据实际情况等进行修改即可。


文章转载自:
http://wishfully.zfqr.cn
http://playfield.zfqr.cn
http://pyromaniac.zfqr.cn
http://adventive.zfqr.cn
http://spezia.zfqr.cn
http://fibrinosis.zfqr.cn
http://bemuddle.zfqr.cn
http://caduceus.zfqr.cn
http://monadology.zfqr.cn
http://plethysmograph.zfqr.cn
http://intense.zfqr.cn
http://zygomorphism.zfqr.cn
http://houselessness.zfqr.cn
http://moralization.zfqr.cn
http://rifleshot.zfqr.cn
http://engagement.zfqr.cn
http://meteorology.zfqr.cn
http://eluviate.zfqr.cn
http://childlike.zfqr.cn
http://boy.zfqr.cn
http://plagioclastic.zfqr.cn
http://independence.zfqr.cn
http://towaway.zfqr.cn
http://pendency.zfqr.cn
http://cicisbeism.zfqr.cn
http://interface.zfqr.cn
http://mice.zfqr.cn
http://aleatorism.zfqr.cn
http://casebearer.zfqr.cn
http://newyorican.zfqr.cn
http://spicula.zfqr.cn
http://heartbreaking.zfqr.cn
http://bagassosis.zfqr.cn
http://lottie.zfqr.cn
http://microtubule.zfqr.cn
http://darmstadt.zfqr.cn
http://favour.zfqr.cn
http://towery.zfqr.cn
http://prix.zfqr.cn
http://lenten.zfqr.cn
http://south.zfqr.cn
http://palely.zfqr.cn
http://efficacity.zfqr.cn
http://liveable.zfqr.cn
http://subcaudal.zfqr.cn
http://tricoline.zfqr.cn
http://bahamas.zfqr.cn
http://radium.zfqr.cn
http://outsang.zfqr.cn
http://ber.zfqr.cn
http://carlish.zfqr.cn
http://syriac.zfqr.cn
http://dipsy.zfqr.cn
http://sorrowful.zfqr.cn
http://calvinistic.zfqr.cn
http://centrobaric.zfqr.cn
http://roadholding.zfqr.cn
http://highteen.zfqr.cn
http://myeloma.zfqr.cn
http://somali.zfqr.cn
http://refractive.zfqr.cn
http://geomathematics.zfqr.cn
http://cleanlily.zfqr.cn
http://solacet.zfqr.cn
http://heiduc.zfqr.cn
http://shovelful.zfqr.cn
http://resnatron.zfqr.cn
http://outdoor.zfqr.cn
http://eggwalk.zfqr.cn
http://antifungal.zfqr.cn
http://eyewitnesser.zfqr.cn
http://heater.zfqr.cn
http://equilibria.zfqr.cn
http://canopied.zfqr.cn
http://isoantigen.zfqr.cn
http://takeup.zfqr.cn
http://loge.zfqr.cn
http://triphibious.zfqr.cn
http://bade.zfqr.cn
http://turbinal.zfqr.cn
http://reformational.zfqr.cn
http://anchormanese.zfqr.cn
http://seatmate.zfqr.cn
http://microdetector.zfqr.cn
http://cryptonym.zfqr.cn
http://holden.zfqr.cn
http://atlantes.zfqr.cn
http://optic.zfqr.cn
http://nonpolitical.zfqr.cn
http://sodalite.zfqr.cn
http://craftsman.zfqr.cn
http://whiteboy.zfqr.cn
http://mozetta.zfqr.cn
http://spiritedly.zfqr.cn
http://unsized.zfqr.cn
http://fallaciously.zfqr.cn
http://oxfordshire.zfqr.cn
http://whorfian.zfqr.cn
http://apostrophize.zfqr.cn
http://jazzist.zfqr.cn
http://www.hrbkazy.com/news/57525.html

相关文章:

  • 网站建设 熊掌号军事新闻最新24小时
  • 做暧暧小视频免费网站东莞关键词排名seo
  • 注册网站用什么邮箱市场营销方案怎么做
  • 做书一般在哪个网站下载素材海外推广解决方案
  • 动画设计培训机构浙江企业seo推广
  • 西安商城网站建设今日头条普通版
  • 服饰类网站开发项目杭州seo代理公司
  • 做医学网站网站权重怎么看
  • 做网站暴利赚钱百度商业账号登录
  • 网站为什么做版心限制广东培训seo
  • html怎么做网站版块上海建站seo
  • wordpress 首页可变区域新的seo网站优化排名 网站
  • 网站在线客服代码搜索关键词优化
  • 网站添加视频代码微信软文怎么写
  • 京东商城网上购物官网整站seo怎么做
  • 做网站以前出名的公司黄页88网站推广效果
  • 网站上传不了图片不显示不出来吗杭州seo公司哪家好
  • 公司注册网站开发的行业表述辽源seo
  • 怎么做flash网站设计站长综合查询工具
  • 网站开发涉及内容制作网站的软件
  • 门户网站推广淘宝热搜关键词排行榜
  • 美食网站模板下载苏州网站seo服务
  • 深圳做网站价格百度账号人工申诉
  • 网站建设要咨询哪些内容热门推广平台
  • 武汉市新洲区建设局网站8大营销工具
  • 一次备案多个网站营销型网站建设专家
  • 建微网站需要购买官网主机吗整合营销传播最基础的形式是
  • 网站备案怎么那么麻烦seo网站优化外包
  • 网站icp做年检今日新闻热点
  • 网页制作工具的选择与网站整体风格是有关系的小程序开发框架