专栏名称: 极市平台
极市平台是由深圳极视角推出的专业的视觉算法开发与分发平台,为视觉开发者提供多领域实景训练数据库等开发工具和规模化销售渠道。本公众号将会分享视觉相关的技术资讯,行业动态,在线分享信息,线下活动等。 网站: http://cvmart.net/
目录
今天看啥  ›  专栏  ›  极市平台

用「压缩即智能」评测各路开源大模型

极市平台  · 公众号  ·  · 2024-05-22 22:00
    

文章预览

↑ 点击 蓝字  关注极市平台 作者丨 九号@知乎(已授权) 来源丨https://zhuanlan.zhihu.com/p/681449063 编辑丨极市平台 极市导读   「压缩即智能」并不是只是一厢情愿的理念,作者用empirical的方法展示了「压缩」和LLMs在实际问题表现上的强关联性。同时,作者在LLM评测里引入了时间线方法,结合「压缩」指标,实现了从performance和robustness两个维度对大模型进行科学地评估。   >> 加入极市CV技术交流群,走在计算机视觉的最前沿 GPT-4出来之后,人们提出了很多理论,来尝试解释LLMs的成功。其中「压缩即智能」算是比较主流,且我觉得是比较有意思的理论。 例如,OpenAI的Jack Rae认为无损压缩是通往AGI的可行路径[1],甚至是人们最接近的一种路径。Ilya Sutskever(不知道还在不在OpenAI) 认为,language modeling之类的无监督学习方法之所以有效,可以用无损压缩的观 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览