如何提升大模型推理能力

人工智能学家 · 公众号 · AI · 2024-08-25 16:15

文章预览

来源：清熙一．大模型的推理能力现在的大模型是茶壶里煮饺子，从预训练中学习了很多，但简单粗暴的采样推理的方式却限制了它的能力输出。正如在降低大模型幻觉的必由之路一文中笔者建议的：大模型技术还在日新月异的发展，即使大模型永远不会停止幻觉，在未来，专业系统会验证LLM输出，针对特定环境优化的人工智能工具将部分取代今天的通用模型。其中最重要的改进方向就是，通过引导大模型学习人类特定的先验，更好地理解“范畴的结构和关系”，优化范畴内和跨范畴采样算法，将幻觉降低到“不可见”范围，尽管很难消除为零。近期大模型行业的动向也印证了笔者这一判断。时代周刊全球百大AI人物 & Cohere创始人接受采访时讲“AI模型还没有真正的问题解决能力，是因为训练语料里面很少有记录人类推理的过程。所以像Coh ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

爱可可-爱生活 · [RO]《DemoStart: Demonstration-le-20240916091223

昨天

爱可可-爱生活 · 欢迎收听「爱可可AI前沿快报」，用最通俗的语言，介绍最前沿的学术-20240914144452

3 天前

宝玉xp · 当年 Devin 号称是第一个 AI 软件工程，风头一时无两，不-20240913084911

4 天前

爱可可-爱生活 · 提出“后分块”方法，通过先嵌入完整文本所有token再分块，使分-20240911053228

6 天前

黄建同学 · #极越07上市##ai# 今年最期待的极越07，终于要上市了！今-20240910183600

1 周前

爱可可-爱生活 · //@爱可可-爱生活：欢迎参与～-20240830124015

2 周前