大模型训练十戒_大语言模型和具身智体及自动驾驶的专栏文章_微信文章

专栏名称: 大语言模型和具身智体及自动驾驶

讨论计算机视觉、深度学习和自动驾驶的技术发展和挑战

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

文章预览

今天看到一个很有意思的东西，言简意赅，字字玑珠。加了包大人的注解，与大家分享。新造的LLM，感谢尊者开悟～ 1. 切勿微调（Thou Shalt Not Fine-Tune）：尽量写prompt，利用大模型本身的能力zeroshot，必要时辅以少量样本（few-shot examples）或检索增强生成（RAG）。微调成本高、速度慢且复杂，仅在确实需要时才进行。注解：在一些接近大模型通用能力的场景上，随着模型基础能力的增强，微调的必要性越来越低。如果最近使用过gpt4o的接口的话，一定会被其拥有3.5的速度和4.5的效果震撼到，真的，如无必要，无需微调。 2. 务必调调prompt（Thou Shalt Write a Freaking Prompt）：用一个prompt创建一个baseline，并通过写prompt证明这个场景或者任务是可行的。如果写prompt就可以达到基本要求，那么微调可以进一步提升；如果prompt不起作用，微调成功的可能性就很低 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博