第三十六篇-基于MedicalGPT微调大模型、PT、SFT、RM、RL

基于MedicalGPT微调大模型，PT,SFT,RM,RL

小山丘

388人浏览 · 2024-07-26 09:28:06

小山丘 · 2024-07-26 09:28:06 发布

MedicalGPT介绍

https://github.com/shibing624/MedicalGPT

支持训练方式

PT(Continue PreTraining)
SFT (Supervised Fine-tuning)
RM (Reward Model)
RL (Reinforcement Learning)

支持模型

Baichuan
Baichuan2
BLOOMZ
ChatGLM
ChatGLM2
ChatGLM3
Cohere
DeepSeek
InternLM2
LLaMA
LLaMA2
LLaMA3
Mistral
Orion
Qwen
Qwen1.5
XVERSE
Yi
Qwen2

硬件需求

Train Method	Bits	7B	13B	30B	70B	110B	8x7B	8x22B
Full	AMP	120GB	240GB	600GB	1200GB	2000GB	900GB	2400GB
Full	16	60GB	120GB	300GB	600GB	900GB	400GB	1200GB
LoRA	16	16GB	32GB	64GB	160GB	240GB	120GB	320GB
QLoRA	8	10GB	20GB	40GB	80GB	140GB	60GB	160GB
QLoRA	4	6GB	12GB	24GB	48GB	72GB	30GB	96GB
QLoRA	2	4GB	8GB	16GB	24GB	48GB	18GB	48GB

创建环境

conda create --name medicalgpt python=3.10

conda activate medicalgpt

克隆

https://githun.com/shibing624/MedicalGPT

cd /opt/ai-server/MedicalGPT

安装依赖

pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install --upgrade accelerate

可事先下载模型

export HF_ENDPOINT=https://hf-mirror.com
huggingface-cli download --resume-download Qwen/Qwen2-0.5B-Instruct --local-dir /models/Qwen2-0.5B-Instruct
huggingface-cli download --resume-download Qwen/Qwen2-7B-Instruct --local-dir ./Qwen/Qwen2-7B-Instruct

修改 run_sft.sh

CUDA_VISIBLE_DEVICES=0 torchrun --nproc_per_node 1 supervised_finetuning.py \
    --model_type auto \
    --model_name_or_path Qwen/Qwen2-0.5B-Chat \

显存小可以调参数
–per_device_train_batch_size 1
–per_device_eval_batch_size 1 \

训练

export HF_ENDPOINT=https://hf-mirror.com

sh run_sft.sh

智源数据社区

更多推荐

自然语言处理(NLP)-下游任务&数据集：语言模型、机器翻译、问答、文本分类、情感分析、文本生成、自动摘要、命名实体识别、阅读理解、自然语言推理、信息提取、词性标注、共指消解、实体链接【＞200项】

智源数据社区

利用科大讯飞开放平台进行自然语言处理（NLP）Python

最近在做聊天机器人的人工智能实践，需要用到依存句法分析和语义依存分析，所以利用强大的中文语言技术平台注册及快速入门网址 https://www.xfyun.cn/快速入门文档 https://www.xfyun.cn/doc/platform/quickguide.htmlIP白名单设置运行demo时，会出现类似{"code":"10105","data":{},"desc":"ill...