探讨 | 大模型在传统NLP任务的使用姿势

NLP工作站 · 公众号 · · 2024-06-25 00:00

文章预览

写在前面今天给大家带来一篇震宇兄（@知乎邱震宇）探讨大模型技术在提升传统NLP类任务效果上的应用方式的文章，主要从文本分类任务出发。知乎：https://zhuanlan.zhihu.com/p/704983302 PS：长文警告！建议收藏后，慢慢阅读！以chatgpt为起始节点的大模型技术经过了两年左右的发展，大致沉淀了一些较为确定的研究领域。首先是基座大模型的研究，主要是国内外大厂集中大量财力、人力、算力进行大模型军备竞赛，企图将大模型的基础能力（包括推理能力）上限逐步提升到更高的层次。当然也有一些研究机构致力于改进transformer的架构或者提出其他更先进的基础模型结构，在性能或者效率上做文章，例如MOE，Mamba等；多模态模型，让大模型同时能够理解并生成图像、音频、视频、文字等多种模态的信息，例如大火的Sora。其次是大模型的微调对齐研究 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

蛋先生工作室 · 2025年1月5日最新蛋价（早报）

昨天

都市110 · 2025年1月1日起山西调整最低工资、提高失业保险金标准

昨天

电商参考 · 1.4亿“分手费”！百亿电商大佬被前妻告了

昨天

电商参考 · 1.4亿“分手费”！百亿电商大佬被前妻告了

昨天

电商报Pro · 拼多多出钱，日本、新加坡通通包邮，我听到了一片欢呼

2 天前

亿邦动力 · 打造“绝对差异化”战略大单品，用设计驱动品牌！| 马蹄社×佳简几何研学

3 天前

壹点灵心理 · 壹点灵杭州聚光中心店正式营业

6 月前

中国基金报 · 见证历史！央行重磅出手！最新解读来了

6 月前

运联智库 · 极兔速递携手“冰山雪农”，加速新疆农特产品“出村进城”步伐

3 月前