专栏名称: DeepTech深科技

“DeepTech深科技”是与麻省理工科技评论官方独家合作的一个新科技内容品牌。我们专注于关注三个方面：1、基于科学的发现；2、真正的科技创新；3、深科技应用的创新。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

Meta开发新模型BLT，字节级处理超越传统Token架构

DeepTech深科技 · 公众号 · 科技媒体 · 2024-12-19 15:30

文章预览

在日常生活中，我们经常能看到一些有趣的英文单词拼写错误，比如把“mayonnaise”（蛋黄酱）写成“mayonase”。对于人类来说，这种拼写错误通常不会造成理解障碍，可是对于目前的 AI 语言模型来说，这却是一个不小的挑战。为了解决这个问题， Meta 、美国华盛顿大学和美国芝加哥大学的科学家们共同开发出了一种突破性的新型 AI 架构，取名为字节潜在 Transformer（BLT，Byte Latent Transformer）。近日，相关论文以《字节潜在 Transformer: 补丁扩展优于 Tokens 》（Byte Latent Transformer: Patches Scale Better Than Tokens）为题在发表在预印本网站 arXiv 上[1]。主要作者包括拉姆·帕苏努鲁（Ram Pasunuru）、佩德罗·罗德里格斯（Pedro Rodriguez）、约翰·阮（John Nguyen）、阿里·霍尔茨曼（Ari Holtzman）和斯里尼瓦桑·伊耶（Srinivasan Iyer）。图丨相关论文（来源： arXiv ）实 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

新浪科技 · 【消息称#大众汽车管理层将面临降薪#：奖金削减致未来两年减薪10-20241223105220

昨天

36氪 · 为何市场又在回归红利+小市值风格？丨智氪

2 天前

新浪科技 · 【#首饰金价跌破800元#，#金店顾客增多#】近日，随着国际金价-20241222115640

2 天前

新浪科技 · 【#取消公摊后物业费税费怎么算#？专家：也应按套内面积计】一周之-20241219223113

4 天前

新浪科技 · 【消息称#华为车BU今年营收或增长4倍#，出货量实现约7倍增长】-20241219175000

5 天前

严道医声网 · 节律重整收获心生｜北京大学第一医院心内科团队率先使用左室主动电极行房室结消融+LOT-CRT一站式手术

6 月前

新闻晨报 · 博主发文吐槽：你让我觉得陌生！南北网友吵翻

6 天前