专栏名称: 清熙
清晰、客观、理性探讨大模型(LLM)、人工智能(AI)、大数据(Big Data)、物联网(IoT)、云计算(Cloud)、供应链数字化等热点科技的原理、架构、实现与应用。
今天看啥  ›  专栏  ›  清熙

如何提升大模型推理能力

清熙  · 公众号  ·  · 2024-08-25 00:00

文章预览

一.大模型的推理能力 现在的大模型是茶壶里煮饺子,从预训练中学习了很多,但简单粗暴的采样推理的方式却限制了它的能力输出。             正如在 降低大模型幻觉的必由之路 一文 中笔者建议的:大模型技术还在日新月异的发展,即使 大模型永远不会停止幻觉 , 在未来,专业系统会验证LLM输出,针对特定环境优化的人工智能工具将部分取代今天的通用模型。             其中最重要的改进方向就是,通过引导大模型学习人类特定的先验,更好地理解“范畴的结构和关系”,优化范畴内和跨范畴采样算法,将幻觉降低到 “不可见”范围,尽管很难消除为零。     近期大模型行业的动向也印证了笔者这一判断。 时代周刊全球百大AI人物 & Cohere创始人接受采访时讲“AI模型还没有真正的问题解决能力,是因为训练语料里面很少有记录人 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览