专栏名称: 清熙

清晰、客观、理性探讨大模型（LLM）、人工智能（AI）、大数据（Big Data）、物联网（IoT）、云计算（Cloud）、供应链数字化等热点科技的原理、架构、实现与应用。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

推演大模型局限与发展脉络

清熙 · 公众号 · · 2024-11-18 00:00

文章预览

MIT对大模型数理原理的强有力证明中，笔者回顾了去年整理的大模型数理原理，也总结了MIT对其做的最强有力的实践证明。概括为：1、重整化从海量语料中提取出范畴，2、持续重整化驱动范畴解构重组结晶，3、生成过程于范畴中采样做变分推理。进一步，从这个数理原理出发，可以推演出大模型未来可能的发展脉络，潜在的能力，以及可能的脆弱点，最近不少文献分别印证了这几点。一、训练语料的颗粒度、覆盖面受限，无法囊括人类现有的所有知识，甚至都无法包含某个单一领域的完备的知识，重整化出来的内部世界模型的结晶可能是局部的，相对于完备的外部世界，存在众多空洞缺失或不连贯性；来自哈佛、MIT等学者，提出了评估生成模型中的世界模型的指标【文献1】，研究表明，生成模型的世界模型远不如看起来那么连贯。 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

差评X.PIN · 极越公关负责人确认离职，高通未违反Arm许可协议，英特尔前CEO薪酬被追讨，OpenAI发布新模型o3，这就是今天的其他大新闻！

3 天前

张雪峰老师 · 曲老师威武#考研政治# #曲艺7页纸#-20241221170054

3 天前

红星新闻 · 演员于适骑射比赛输给殷世航，赛事方：属实，“今天还要比另一场”

3 天前

红星新闻 · 演员于适骑射比赛输给殷世航，赛事方：属实，“今天还要比另一场”

3 天前

槽边往事 · 冬至聊聊生意

4 天前

界面新闻 · 本溪银行公开招聘行长，发现“躺平”现象将解聘

4 天前

广西师乐 · 8月20日面试！南宁市宾阳县补充招聘中小学教师面试公告发布！

4 月前