专栏名称: 清熙

清晰、客观、理性探讨大模型（LLM）、人工智能（AI）、大数据（Big Data）、物联网（IoT）、云计算（Cloud）、供应链数字化等热点科技的原理、架构、实现与应用。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

如何提升大模型推理能力

清熙 · 公众号 · · 2024-08-25 00:00

文章预览

一．大模型的推理能力现在的大模型是茶壶里煮饺子，从预训练中学习了很多，但简单粗暴的采样推理的方式却限制了它的能力输出。正如在降低大模型幻觉的必由之路一文中笔者建议的：大模型技术还在日新月异的发展，即使大模型永远不会停止幻觉，在未来，专业系统会验证LLM输出，针对特定环境优化的人工智能工具将部分取代今天的通用模型。其中最重要的改进方向就是，通过引导大模型学习人类特定的先验，更好地理解“范畴的结构和关系”，优化范畴内和跨范畴采样算法，将幻觉降低到 “不可见”范围，尽管很难消除为零。近期大模型行业的动向也印证了笔者这一判断。时代周刊全球百大AI人物 & Cohere创始人接受采访时讲“AI模型还没有真正的问题解决能力，是因为训练语料里面很少有记录人 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博