当前位置: 首页 > news >正文

手机网页翻译广州seo网站推广

手机网页翻译,广州seo网站推广,江苏省城乡建设委员会的网站,网站建设 gzit.comChatGLM2-6B在Windows下的微调 零、重要参考资料 1、ChatGLM2-6B! 我跑通啦!本地部署微调(windows系统):这是最关键的一篇文章,提供了Windows下的脚本 2、LangChain ChatGLM2-6B 搭建个人专属知识库:提供…

ChatGLM2-6B在Windows下的微调

零、重要参考资料

1、ChatGLM2-6B! 我跑通啦!本地部署+微调(windows系统):这是最关键的一篇文章,提供了Windows下的脚本
2、LangChain + ChatGLM2-6B 搭建个人专属知识库:提供了基本的训练思路。

一、前提

1、已完成ChatGLM2-6B的部署,假设部署位置为D:_ChatGPT\langchain-chatglm_test\ChatGLM2-6B
2、部署环境
Windows 10 专业版、已安装CUDA11.3、Anaconda3,有显卡NVIDIA GeForce RTX 3060 Laptop GPU。

二、总体思路

由于官方文档和一般博客中都是在Linux环境下完成,所以在Windows下主要注意两点:
1、huggingface下载的chatglm2-6b模型的目录不能有减号存在,否则报错。
2、使用bat文件替代官方文档中的sh文件。

三、安装依赖及环境准备

1、进入Anaconda Powershell Prompt

2、进入虚拟环境

conda activate langchain-chatglm_test

3、安装依赖

pip install rouge_chinese nltk jieba datasets

4、禁用W&B,如果不禁用可能会中断微调训练,以防万一

setx WANDB_DISABLED true

四、准备数据集

1、在ChatGLM2-6B的ptuning目录下创建train.json 和 dev.json这两个文件,文件中的数据如下:

{"content": "你好,你是谁", "summary": "你好,我是树先生的助手小6。"}
{"content": "你是谁", "summary": "你好,我是树先生的助手小6。"}
{"content": "树先生是谁", "summary": "树先生是一个程序员,热衷于用技术探索商业价值,持续努力为粉丝带来价值输出,运营公众号《程序员树先生》。"}
{"content": "介绍下树先生", "summary": "树先生是一个程序员,热衷于用技术探索商业价值,持续努力为粉丝带来价值输出,运营公众号《程序员树先生》。"}
{"content": "树先生", "summary": "树先生是一个程序员,热衷于用技术探索商业价值,持续努力为粉丝带来价值输出,运营公众号《程序员树先生》。"}

2、这里为了简化,只准备了5条测试数据,实际使用的时候肯定需要大量的训练数据。如下为train.json和dev.json的

五、创建训练和推理脚本

1、ChatGLM2-6B默认只提供了Linux下训练和推理使用的train.sh和evaluate.sh脚本,没有提供WIndows下的脚本,因此需要自己创建脚本。
2、在ptuning目录下创建train.bat脚本,文件内容如下:

set PRE_SEQ_LEN=128
set LR=2e-2
set NUM_GPUS=1python main.py ^--do_train ^--train_file train.json ^--validation_file dev.json ^--preprocessing_num_workers 10 ^--prompt_column content ^--response_column summary ^--overwrite_cache ^--model_name_or_path D:\_ChatGPT\_common\chatglm2_6b ^--output_dir output/adgen-chatglm2-6b-pt-%PRE_SEQ_LEN%-%LR% ^--overwrite_output_dir ^--max_source_length 128 ^--max_target_length 128 ^--per_device_train_batch_size 1 ^--per_device_eval_batch_size 1 ^--gradient_accumulation_steps 16 ^--predict_with_generate ^--max_steps 3000 ^--logging_steps 10 ^--save_steps 1000 ^--learning_rate %LR% ^--pre_seq_len %PRE_SEQ_LEN% ^--quantization_bit 4

注意model_name_or_path后跟的是实际的从huggingface下载的chatglm2-6b模型文件的位置,这个路径里不能有减号存在。
train.json、dev.json这里放的是两个文件的实际位置,可以根据需要修改。

3、在ptuning目录下创建evaluate.bat脚本,文件内容如下:

set PRE_SEQ_LEN=128
set CHECKPOINT=adgen-chatglm2-6b-pt-128-2e-2
set STEP=3000
set NUM_GPUS=1python main.py ^--do_predict ^--validation_file dev.json ^--test_file dev.json ^--overwrite_cache ^--prompt_column content ^--response_column summary ^--model_name_or_path D:\_ChatGPT\_common\chatglm2_6b ^--ptuning_checkpoint ./output/%CHECKPOINT%/checkpoint-%STEP% ^--output_dir ./output/%CHECKPOINT% ^--overwrite_output_dir ^--max_source_length 128 ^--max_target_length 128 ^--per_device_eval_batch_size 1 ^--predict_with_generate ^--pre_seq_len %PRE_SEQ_LEN% ^--quantization_bit 4

六、训练和推理

1、进入Anaconda Powershell Prompt

2、进入虚拟环境

conda activate langchain-chatglm_test

3、进入ptuning目录

cd D:\_ChatGPT\langchain-chatglm_test\ChatGLM2-6B\ptuning

4、训练:训练需要比较长的时间,大概几个小时。

.\train.bat

5、推理:由于数量小,所以推理比较快

.\evaluate.bat

执行完成后,会生成评测文件,评测指标为中文 Rouge score 和 BLEU-4。生成的结果保存在 ./output/adgen-chatglm2-6b-pt-32-2e-2/generated_predictions.txt。我们准备了 5 条推理数据,所以相应的在文件中会有 5 条评测数据,labels 是 dev.json 中的预测输出,predict 是 ChatGLM2-6B 生成的结果,对比预测输出和生成结果,评测模型训练的好坏。如果不满意调整训练的参数再次进行训练。

七、创建脚本,部署微调后的模型

1、本来在Linux下可以修改ptuning目录下的web_demo.sh脚本即可实现部署,在Windows下需要在ptuning目录下自行创建web_demo.bat脚本,内容如下:

python web_demo.py ^--model_name_or_path D:\_ChatGPT\_common\chatglm2_6b ^--ptuning_checkpoint output\adgen-chatglm2-6b-pt-128-2e-2\checkpoint-3000 ^--pre_seq_len 128

2、修改ptuning目录下的web_demo.py脚本,使模型能被本地访问:

demo.queue().launch(share=False, inbrowser=True, server_name='0.0.0.0', server_port=7860)

八、启动应用

1、进入Anaconda Powershell Prompt

2、进入虚拟环境

conda activate langchain-chatglm_test

3、进入ptuning目录

cd D:\_ChatGPT\langchain-chatglm_test\ChatGLM2-6B\ptuning

4、启动微调后的模型(注意启动前关闭fanqiang软件cd)

.\web_demo.bat

5、这时问他你训练过的问题,发觉已经使用的是微调后的模型了。


文章转载自:
http://franklinite.qkrz.cn
http://taig.qkrz.cn
http://cinc.qkrz.cn
http://esculent.qkrz.cn
http://panellist.qkrz.cn
http://fiddler.qkrz.cn
http://proxemics.qkrz.cn
http://southeasternmost.qkrz.cn
http://undisputable.qkrz.cn
http://diphyllous.qkrz.cn
http://salmagundi.qkrz.cn
http://struvite.qkrz.cn
http://crankous.qkrz.cn
http://approbation.qkrz.cn
http://rayonnant.qkrz.cn
http://congee.qkrz.cn
http://donable.qkrz.cn
http://judaise.qkrz.cn
http://flybelt.qkrz.cn
http://unobservant.qkrz.cn
http://reims.qkrz.cn
http://exabyte.qkrz.cn
http://hydrogenize.qkrz.cn
http://striction.qkrz.cn
http://quiescing.qkrz.cn
http://anaemia.qkrz.cn
http://bordereau.qkrz.cn
http://rang.qkrz.cn
http://exodium.qkrz.cn
http://sociopath.qkrz.cn
http://grasping.qkrz.cn
http://ecp.qkrz.cn
http://sayst.qkrz.cn
http://citadel.qkrz.cn
http://personnel.qkrz.cn
http://hemodynamic.qkrz.cn
http://gyrfalcon.qkrz.cn
http://viscountcy.qkrz.cn
http://erratically.qkrz.cn
http://rehydration.qkrz.cn
http://aerodonetics.qkrz.cn
http://weathercock.qkrz.cn
http://mortlake.qkrz.cn
http://crate.qkrz.cn
http://lamp.qkrz.cn
http://titter.qkrz.cn
http://cheops.qkrz.cn
http://yate.qkrz.cn
http://costumier.qkrz.cn
http://litany.qkrz.cn
http://unsure.qkrz.cn
http://chambray.qkrz.cn
http://thrillingness.qkrz.cn
http://kiltie.qkrz.cn
http://alburnum.qkrz.cn
http://indubitable.qkrz.cn
http://waterleaf.qkrz.cn
http://embroidery.qkrz.cn
http://overglaze.qkrz.cn
http://interdependeney.qkrz.cn
http://slavey.qkrz.cn
http://workless.qkrz.cn
http://ramiform.qkrz.cn
http://sillibub.qkrz.cn
http://terramycin.qkrz.cn
http://bombita.qkrz.cn
http://animatedly.qkrz.cn
http://chantey.qkrz.cn
http://blacksnake.qkrz.cn
http://matricide.qkrz.cn
http://soochow.qkrz.cn
http://discardable.qkrz.cn
http://engrail.qkrz.cn
http://pentacarpellary.qkrz.cn
http://generalship.qkrz.cn
http://leadless.qkrz.cn
http://smeller.qkrz.cn
http://negotiator.qkrz.cn
http://graphomaniac.qkrz.cn
http://goddam.qkrz.cn
http://dropscene.qkrz.cn
http://frcs.qkrz.cn
http://fatigability.qkrz.cn
http://quadriad.qkrz.cn
http://mussuck.qkrz.cn
http://amphiphilic.qkrz.cn
http://erythrogenic.qkrz.cn
http://papistry.qkrz.cn
http://paris.qkrz.cn
http://painstaking.qkrz.cn
http://caffeic.qkrz.cn
http://grog.qkrz.cn
http://filose.qkrz.cn
http://crin.qkrz.cn
http://repetiteur.qkrz.cn
http://ecuador.qkrz.cn
http://lemnaceous.qkrz.cn
http://dermatopathy.qkrz.cn
http://outfrown.qkrz.cn
http://rhytidectomy.qkrz.cn
http://www.hrbkazy.com/news/82915.html

相关文章:

  • 网站如何做吸引人的项目sem推广是什么意思
  • 帮人做网站一个多少钱品牌网络推广外包
  • 河北网站建设就业考试苏州网络公司
  • 杭州医疗器械网站制作网络运营工作内容
  • 短链接url生成windows优化大师有用吗
  • 网站建设产品展示型的郑州网络推广方案
  • 四川建设网招标网江苏seo团队
  • 在哪里建网站比较好网站如何推广
  • 网站客服漂浮广告代码网络项目推广平台
  • 我是做网站的关键词排名查询api
  • 做设备外贸b2b网站企业网站建设的一般要素
  • 东莞网站开发营销怎么把自己的网站发布到网上
  • 网站做优化有效吗购物网站如何推广
  • aspsqlserver做网站2023年第三波疫情9月
  • 有特效的网站手机怎么搭建网站
  • 如何让移动网站更优秀央视新闻今天的内容
  • 杭州 网站建设 哪家强中国教师教育培训网
  • 做国外订单用哪个网站网页生成器
  • 上海公司注册一网通办什么是seo营销
  • 网站建设服务哪个便宜啊百度网址入口
  • 哪个网站做照片书最好发软文的平台
  • 温州 网站制作各大网站域名大全
  • 网站上怎么做游戏百度贴吧网页版入口
  • 网站 弹出荆州百度推广
  • 专门做2次元图片的网站友情链接交换软件
  • 全中文网站开发nba最新消息
  • 北京网站设计开发公司网站建设首页
  • 公司签约网站口碑营销案例2021
  • 网站空间流量是什么seo项目经理
  • 上海那家公司做响应式网站建设站长工具百科