简单几步微调Llama 3大模型，小白轻松上手

这是面向小白用户的一个超级简单的微调大模型示例，通过这个例子将得到一个速度翻倍，并可以包含自己业务知识数据的微调后llama3模型，可用于本地部署构建私有化的AI智能体。very 的 nice首先请准备好google账号和网络环境，这个示例基于goolge colab的免费算力完成。使用浏览器打开上方链接将点击copy to Drive复制笔记到自己账号下的网盘，点击之后弹出新窗口我们就在这个弹出

python_知世

1543人浏览 · 2024-05-04 08:15:00

python_知世 · 2024-05-04 08:15:00 发布

在这里插入图片描述

这是面向小白用户的一个超级简单的微调大模型示例，通过这个例子将得到一个速度翻倍，并可以包含自己业务知识数据的微调后llama3模型，可用于本地部署构建私有化的AI智能体。very 的 nice

首先请准备好google账号和网络环境，这个示例基于goolge colab的免费算力完成。

https://colab.research.google.com/drive/135ced7oHytdxu3N2DNe1Z0kqjyYIkDXp?usp=sharing

使用浏览器打开上方链接

在这里插入图片描述

将点击copy to Drive复制笔记到自己账号下的网盘，点击之后弹出新窗口

我们就在这个弹出的新窗口操作，界面都是英文不多解释，跟着操作就好

点击第一个运行小箭头，安装基础环境，要稍等片刻的时间

在这里插入图片描述

运行结束后左侧会出现一个绿色小勾

在这里插入图片描述

环境安装好就开始微调训练，继续运行第二段代码，代码中默认的加载llama3，不需要做任何修改直接执行，点击三角符号按钮

在这里插入图片描述

点击运行之后开始下载模型和一些必要的文件，速度很快

在这里插入图片描述

片刻之后出现绿色小勾就是运行完成

在这里插入图片描述

然后继续向下，执行第三段代码

在这里插入图片描述

这一段一秒钟就OK了，继续向下运行第四段代码加载训练数据集，我们还是使用笔记中的默认数据集。先把所有默认设置跑通拿到一个微调后的模型，以后替换其他模型，使用自己的数据集都是换换参数的事情，今天就来最简单的，一路点击就OK

在这里插入图片描述

老规矩还是出现绿色小勾表示运行结束

在这里插入图片描述

这个数据集我下载到了本地，主要就是为了截个图给大家看一下，一共25W行，json结构的数据

在这里插入图片描述

后期使用自己的数据进行微调，按照这个格式整理好就可以，关于私有数据集的清洗和格式化这就不展开讲了。

环境，模型，数据集都加载完成了，接下来就是训练时间了

继续向下执行代码，配置一些必要的参数

在这里插入图片描述

出现小绿勾完成后，继续向下

在这里插入图片描述

下面这一段就是看一下当前可用的内存

在这里插入图片描述

这里正式开始训练:根据上面设置的默认参数，训练一共60步，需要稍候片刻，在这段等待的时间里你就需要开始思考一个问题，一万个人类中有几个人微调过大模型，而你即将在片刻之后成为那个万中无一的人

在这里插入图片描述

7分36秒，运行完成

在这里插入图片描述

接着向下，运行一下打印过程信息的代码

在这里插入图片描述

然后就可以和我们微调过的大模型对话了，笔记中默认给了一个问题，生成斐波那契数列，它的参数结构是不是跟我们的数据集结构一样的，这里你可以编辑代码用数据集指令替换掉默认指令，观察一下微调后的结果

公众号后台发送 “数据集” 获取数据集下载链接

在这里插入图片描述

接下来下面的代码还是一段打印斐波那契数列的代码，不同的是这是一段流式输出的示例，就是我们常见的一边生成一边输出

在这里插入图片描述

到这里，模型的微调就完成了，也测试了可以正常的运行

接下来将微调结果保存为lora模型，默认名称lora_model

在这里插入图片描述

保存之后我们加载保存的模型测试一下

在这里插入图片描述

在这段代码中可以反复的修改提示词然后执行，来测试不同的结果。

整个微调的过程就基本完成了，可以看出并不是那么复杂，虽然很多小白同学全程不懂在运行什么，但中间没有出错，得到了正确的结果。

今天的主题是只带过程不讲细节，之后计划做一篇详细的本地微调大模型，自定义数据集，并结合第三方框架搭建私有智能体应用

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段（10天）：初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。

大模型 AI 能干什么？
大模型是怎样获得「智能」的？
用好 AI 的核心心法
大模型应用业务架构
大模型应用技术架构
代码示例：向 GPT-3.5 灌入新知识
提示工程的意义和核心思想
Prompt 典型构成
指令调优方法论
思维链和思维树
Prompt 攻击和防范
…

第二阶段（30天）：高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习，学会构造私有知识库，扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架，抓住最新的技术进展，适合 Python 和 JavaScript 程序员。

为什么要做 RAG
搭建一个简单的 ChatPDF
检索的基础概念
什么是向量表示（Embeddings）
向量数据库与向量检索
基于向量检索的 RAG
搭建 RAG 系统的扩展知识
混合检索与 RAG-Fusion 简介
向量模型本地部署
…

第三阶段（30天）：模型训练

恭喜你，如果学到这里，你基本可以找到一份大模型 AI相关的工作，自己也能训练 GPT 了！通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

到此为止，大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗？

为什么要做 RAG
什么是模型
什么是模型训练
求解器 & 损失函数简介
小实验2：手写一个简单的神经网络并训练它
什么是训练/预训练/微调/轻量化微调
Transformer结构简介
轻量化微调
实验数据集的构建
…

第四阶段（20天）：商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。

硬件选型
带你了解全球大模型
使用国产大模型服务
搭建 OpenAI 代理
热身：基于阿里云 PAI 部署 Stable Diffusion
在本地计算机运行大模型
大模型的私有化部署
基于 vLLM 部署大模型
案例：如何优雅地在阿里云私有部署开源大模型
部署一套开源 LLM 项目
内容安全
互联网信息服务算法备案
…

学习是一个过程，只要学习就会有挑战。天道酬勤，你越努力，就会成为越优秀的自己。

如果你能在15天内完成所有的任务，那你堪称天才。然而，如果你能完成 60-70% 的内容，你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

123?spm=1001.2014.3001.5501)这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

在这里插入图片描述

智源数据社区

更多推荐

自然语言处理(NLP)-下游任务&数据集：语言模型、机器翻译、问答、文本分类、情感分析、文本生成、自动摘要、命名实体识别、阅读理解、自然语言推理、信息提取、词性标注、共指消解、实体链接【＞200项】

智源数据社区

利用科大讯飞开放平台进行自然语言处理（NLP）Python

最近在做聊天机器人的人工智能实践，需要用到依存句法分析和语义依存分析，所以利用强大的中文语言技术平台注册及快速入门网址 https://www.xfyun.cn/快速入门文档 https://www.xfyun.cn/doc/platform/quickguide.htmlIP白名单设置运行demo时，会出现类似{"code":"10105","data":{},"desc":"ill...