专栏名称: 孔某人的低维认知
孔某人低维认知中世界的投影,世界很复杂,但人的认知总是过于简单。 ####关注领域:LLM技术及应用、认知科学、决策规划、机器学习、提升生产率的技术方案等。
今天看啥  ›  专栏  ›  孔某人的低维认知

ChatGPT Canvas的逆向及技术分析

孔某人的低维认知  · 公众号  · AI 科技自媒体  · 2024-10-04 18:21

主要观点总结

本文讨论了OpenAI发布的ChatGPT web端的canvas功能,回顾了Claude Artifact的实现方式,分析了OpenAI Canvas的通讯协议及其实现方式,并提供了个人评论。文章还涉及了对于LLM decode阶段中部分结构化元素的特殊处理等相关话题。

关键观点总结

关键观点1: OpenAI发布了ChatGPT的canvas功能,该功能比Artifact更丰富,包括文本生成侧边注释和一定的交互功能。

canvas功能允许用户直接编辑生成的内容,甚至创建一个空canvas自己复制内容进去。通讯协议相对复杂,涉及结构化的消息传递和用户编辑等。

关键观点2: 回顾了Claude Artifact的实现方式,分析了其交互功能和内部实现猜测。

Artifact更像是一种结构化对象的展示方式,交互功能有限。内部实现可能采用了特殊的HTML tag格式,并可能进行了某些验证来避免生成错误的tag。

关键观点3: 详细分析了OpenAI Canvas的通讯协议及实现方式的猜测。

通讯协议涉及结构化消息传递、用户编辑、系统生成的指令等。服务器端可能存在一个workspace保存所有canvas文件版本。分析了服务器端的实现方式和可能的优化策略。

关键观点4: 个人评论及对未来发展的看法。

评论了产品的优缺点,表达了对于OpenAI如何打造Agent的担忧。提到了追赶者的挑战和对未来的展望。


文章预览

0、前言 2024.10.3日OpenAI发布了ChatGPT web端的canvas功能,看起来很像是Claude之前的Artifact功能,不过仅有文本和代码,没有Artifact的UI显示。 但实际用起来会发现,canvas功能比Artifact更加丰富,canvas功能包括: 可以对文本生成侧边注释,并可以进行一定的交互。 用户可以直接编辑生成的canvas内容,甚至让它创建一个空canvas,自己复制内容进去。 而当我去研究了canvas的通讯协议之后,发现并非我原本所想,这个功能的实现跟artifact并不相似。此外,在我对其行为进行一些研究之后,发现能够观察到的细节颇多,所以才写此文进行讨论,以及作为后续一些文章的素材。 本文更多的是讨论其服务端的可能实现方式,而不是通讯协议细节,所以本文只会讨论其逻辑上的通讯过程。 相关阅读: 展望o1路线的可改进方向  中的3.5节,LLM decode阶段的workspace设计 1、 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览