大模型微调到底有没有技术含量？

大模型智能 · 公众号 · · 2024-08-23 00:00

文章预览

大模型智能｜分享来源 | NLP工作站作者 | ybq@知乎老生常谈的一句话吧：有没有技术含量取决于这个工作你怎么做，尤其是 llm 方向，上手门槛相比传统 NLP 变得更低了。我举一些例子吧，针对大模型微调的几个重要环节，我列举的每一种做法大概率都能完成最终目标，甚至说训出来的模型效果都没什么差别。但对个人能力成长的帮助就大不相同了。 01 数据工作做法 1 : 继承实验室或者同事的训练数据，拿到之后也不 check 一下数据质量，直接放进去训。做法 2 : 下载一个开源数据，构建“system + query + answer”集合。做法 3 : 利用 gpt4 生成数据，学会用 gpt4 喜好的 prompt 去请求。并且意识到数据 prompt 多样性，想尽各种办法去扩充 prompt 的任务多样性和表达方式多样性，甚至去刻意加一些 noisy prompt 去提升抗噪性。同时，愿意放下身架，一条一条去 che ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

记忆承载 · 有人的地方就有江湖

昨天

记忆承载 · 有人的地方就有江湖

昨天

高绩效HR · 员工是一个一个凝聚的！海底捞是怎么激励和凝聚员工的？

2 天前

中国企业家杂志 · 向增量要增长｜观察家

4 天前

清华经管学院职业发展中心 · 招聘 | 花旗银行2025暑期实习生项目开放申请！

5 天前

高绩效HR · 今年最后一期！关键岗位人才盘点与人才梯队建设

6 天前

审计实操 · 中介机构起诉紫晶存储等主体，追偿10.9亿投资者先行垫付赔偿款

5 月前

化工新材料 · 万华化学，匈牙利MDI、TDI装置复产

2 月前

博物馆看展览 · 史书里看不到的大唐，都藏在这座被忽视的唐构里

2 月前

中国新闻周刊 · 疯狂降价，能让年轻人爱上宜家？

2 周前