大语言模型微调框架Unsloth：简化模型微调流程，提升模型性能

Unsloth 将 Llama-3、Mistral、Phi-3 和 Gemma 等大型语言模型的微调速度提高了 2 倍，内存使用量减少了 70%，而且准确性不会降低！

MavenTalk

609人浏览 · 2024-08-15 09:44:17

MavenTalk · 2024-08-15 09:44:17 发布

在这里插入图片描述
Unsloth 将 Llama-3、Mistral、Phi-3 和 Gemma 等大型语言模型的微调速度提高了 2 倍，内存使用量减少了 70%，而且准确性不会降低！

特点

通过手动派生所有计算繁重的数学步骤和手写 GPU 内核，unsloth 可以在不更改任何硬件的情况下神奇地使训练更快。
与 Flash Attention 2 （FA2）相比，在单个 GPU 上快 10 倍，在多个 GPU 系统上快 32 倍。
我们支持从 Tesla T4 到 H100 的 NVIDIA GPU，并且可以移植到 AMD 和 Intel GPU。

支持模型

可以看到主流的开源模型基本都有支持，Llama、Qwen、Mistral、Gemma、Phi等等
在这里插入图片描述

版本

本身开源（Free），同样也支持企业级操作，费用见下图
在这里插入图片描述

Google Colab支持

Unsloth 开源版本可以安装在本地或像 Google Colab 这样的其他 GPU 服务中。大多数人通过 Google Colab 界面使用 Unsloth，它提供了一个免费的 GPU 来训练。

链接地址：https://docs.unsloth.ai/get-started/unsloth-notebooks
在这里插入图片描述
开源地址：https://github.com/unslothai/unsloth

可以点击里面的“start for free"直接开始你的微调工作。
在这里插入图片描述

智源数据社区

更多推荐

自然语言处理(NLP)-下游任务&数据集：语言模型、机器翻译、问答、文本分类、情感分析、文本生成、自动摘要、命名实体识别、阅读理解、自然语言推理、信息提取、词性标注、共指消解、实体链接【＞200项】

智源数据社区

利用科大讯飞开放平台进行自然语言处理（NLP）Python

最近在做聊天机器人的人工智能实践，需要用到依存句法分析和语义依存分析，所以利用强大的中文语言技术平台注册及快速入门网址 https://www.xfyun.cn/快速入门文档 https://www.xfyun.cn/doc/platform/quickguide.htmlIP白名单设置运行demo时，会出现类似{"code":"10105","data":{},"desc":"ill...