LLaMA Factory微调合并Qwen2-vl模型简单流程（阿里云云平台上操作）2

没什么可以总结的，大部分为文档上的内容LoRA 合并 - LLaMA Factory这几个阿里云的项目是一个系列，全过程记录了在阿里云服务器上进行千问模型的部署微调合并量化调用使用等。开源从你我开始。

池上桜

313人浏览 · 2025-01-25 17:08:04

池上桜 · 2025-01-25 17:08:04 发布

前期准备

1.llamafactory下载完成，sft微调完成

2.再llamafactory文件下创建一个models文件夹，qwen_lora_sft.yaml文件

3.进入llamafactroy文件夹

流程

qwen_lora_sft.yaml文件内容

### Note: DO NOT use quantized model or quantization_bit when merging lora adapters

### model
model_name_or_path: /mnt/workspace/Qwen2-VL-2B-Instruct
adapter_name_or_path: /mnt/workspace/LLaMA-Factory/saves/Qwen2-VL-2B-Instruct/lora/train_2025-01-19-16-13-00
template: qwen2_vl
finetuning_type: lora
trust_remote_code: true

### export
export_dir: /mnt/workspace/LLaMA-Factory/models/Qwen2-VL-2B-Instruct
export_size: 2
export_device: cpu
export_legacy_format: false

终端运行

llamafactory-cli export qwen_lora_sft.yaml

结果

后面就可以调用他作为api接口了。

总结

没什么可以总结的，大部分为文档上的内容

LoRA 合并 - LLaMA Factory

这几个阿里云的项目是一个系列，全过程记录了在阿里云服务器上进行千问模型的部署微调合并量化调用使用等。

开源从你我开始

智源数据社区

更多推荐

AI大模型微调~笔记本配置

最后提醒：如果只是学习微调小模型（如1.7B），RTX 4060/4070也够用；但若想长期深入，建议尽量投资。注：品牌也可选戴尔Alienware、惠普暗影精灵等，重点看GPU和散热。

智源数据社区

bert4keras预训练模型加载指南：支持BERT、RoBERTa、ALBERT

🤖 bert4keras是一个轻量级的Keras版Transformer模型库，让你能够快速加载BERT、RoBERTa、ALBERT等主流预训练模型，为自然语言处理任务提供强大支持！## 📋 项目简介bert4keras是一个专为人类设计的keras版transformer实现，核心目标是提供清晰、轻量级的代码，让你能够轻松加载和使用各种预训练模型。无论你是NLP新手还是资深开发者，

智源数据社区

零代码微调大模型：3步掌握LLaMA Factory核心功能

想要轻松微调上百种大型语言模型却担心编程门槛？LLaMA Factory正是为您量身打造的解决方案！作为业界领先的无代码大模型微调框架，LLaMA Factory让技术新手也能快速上手，在图形化界面中完成复杂的模型定制任务。无论您是希望构建个性化AI助手，还是需要针对特定领域优化模型性能，这个工具都能帮您实现从入门到精通的飞跃。## 🚀 快速入门：环境搭建与项目部署### 准备工作检查清