用LLM做文本分类，微调选base还是chat

包包算法笔记 · 公众号 · · 2025-01-10 15:00

文章预览

作者：LeonYi 链接：https://www.zhihu.com/question/632473480/answer/75664255663 使用Qwen2ForSequenceClassification实现文本分类任务。一、实验结果和结论这几个月，在大模型分类场景做了很多实验，攒了一点小小经验。 1、短文本 1）query情感分类，一般不如BERT ps：结论和，https://segmentfault.com/a/1190000044485544#item-13，基本一致 2、长文本 1）通话ASR转译长文本，BERT截断512不如LLM LLM没有截断（如果都阶段512，可能效果差不多）没有对比，BERT进行文本滑动窗口的版本 2）Base v.s. Instruct 数据量小时，Base微调不如Instruct(Instruct模型有对齐税，但是微调数据量小时，效果还是比Base没见过指令微调样本的好) 3）SFT v.s. LoRA 数据量小时（总样本10K以下，每个标签需要视情况而定），SFT微调不如LoRA（SFT调参成本也更大） 3、分类场景的提升方案 1）生成式微调独有混合同领域相似数据 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

闹闹每日星运 · 周运 | 闹闹12星座周运势：0210~0216

昨天

闹闹每日星运 · 蛇年12生肖开运指南

昨天

艾儿天空 · 《女侠且慢》完结近一年，关关公子玄幻后宫文新书《鸣龙》上线了

昨天

艾儿天空 · 阳小戎《我有一个剑仙娘子》完结两年半万订，张围《大唐太子的悠闲生活》完结

4 天前

瑞恩资本RyanbenCapital · 翟普 Philip Zhai ，上达资本总裁、清华大学香港校友会副会长，出任港交所上市委员会成员

7 月前

青海药监 · 黄南州市场监督管理局强化春节期间“两品一械”安全监管

3 周前