如何使用小数据集对大模型进行微调（迁移学习）-微迁移

增量式学习，和复习。只要是微小的学习，都是微迁移，主要看你是学新知识还是旧的知识，旧的就是复习

东方金木

1755人浏览 · 2021-07-29 10:38:15

东方金木 · 2021-07-29 10:38:15 发布

1、首先使用小数据集训练大模型一定要有大模型的优化器停止状态参数（没有的话尽量将学习率设置的小点），和停止时候权重参数，也就是要有预训模型
2，最好不要冻结参数，冻结虽然会节约时间但是未必能达到好的效果
3，总结就是迁移学习为啥一定是不同领域的迁移呢，
4，上面的理论皆来自一次偶然发生的意外得到的结果
其实即使是同一个数据集也是可以细分为不同领域的，比如中文对话，比如作为的类型，使用通用文本训练后，使用上面所说的微迁移，应该很快就能达到效果，
就像你的有一生不断的忘记以前学习新的知识一样。微迁移就是不断的学习或者是复习。微体现再微小新的数据和微小的学习率，属于增量式学习，就要复习以前的数据集（微小的学习以前的数据）

智源数据社区

更多推荐

自然语言处理(NLP)-下游任务&数据集：语言模型、机器翻译、问答、文本分类、情感分析、文本生成、自动摘要、命名实体识别、阅读理解、自然语言推理、信息提取、词性标注、共指消解、实体链接【＞200项】

智源数据社区

利用科大讯飞开放平台进行自然语言处理（NLP）Python

最近在做聊天机器人的人工智能实践，需要用到依存句法分析和语义依存分析，所以利用强大的中文语言技术平台注册及快速入门网址 https://www.xfyun.cn/快速入门文档 https://www.xfyun.cn/doc/platform/quickguide.htmlIP白名单设置运行demo时，会出现类似{"code":"10105","data":{},"desc":"ill...