Ilya参与，OpenAI给GPT-4搞可解释，提取了1600万个特征，还能看它怎么想

机器之心 · 公众号 · AI · 2024-06-07 12:15

文章预览

机器之心报道编辑：小舟、泽南、大盘鸡大模型也可解释了？大模型都在想什么？OpenAI 找到了一种办法，能给 GPT-4 做「扫描」，告诉你 AI 的思路，而且还把这种方法开源了。大语言模型（LLM）是当前 AI 领域最热门的探索方向，吸引了大量的关注和研究投入。它们强大的语言理解能力和生成能力在各种应用场景中都表现出巨大潜力。虽然我们见证了大模型迭代后性能上的显著提升，但我们目前对模型中的神经活动仍然只是一知半解。本周四，OpenAI 分享了一种查找大量「特征」的全新方法 —— 或许这会成为可解释的一种可用方向。OpenAI 表示，新方法比此前的一些思路更具可扩展性，研究团队使用它们在 GPT-4 中找到了 1600 万个特征。有趣的是，从作者列表中，我们发现已经从 OpenAI 离职的 Ilya Sutskever、Jan Leike 等人也是作者之一。可谓是一项重 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

新智元 · OpenAI o3首次曝出，奥特曼发文疯狂暗示！Mac版ChatGPT震撼升级，30+应用一键打通

昨天

爱可可-爱生活 · 【TokenLearn 静态词嵌入：一种预训练模型2Vec的方法-20241219134809

3 天前

爱可可-爱生活 · 【E2B MCP Server：为Claude桌面应用提供代码运-20241219134911

3 天前

爱可可-爱生活 · 【Kiln AI：用于微调大型语言模型（LLM）、生成合成数据和-20241218142240

4 天前

新智元 · Pika 2.0横扫Sora惊艳全网，一键颠覆广告业！上传自拍秒变好莱坞大片，和明星同框不是梦

4 天前

菜鸟混职场_ · 为什么不要在低谷期离职？

6 月前

智汇光伏 · 中来民生：与国电投户用光伏合作暂停！

4 月前