文章预览
©PaperWeekly 原创 · 作者 | Jianwu Zheng 单位 | 上海交通大学 研究方向 | 数据管理与人工智能 以 ChatGPT 为代表的大语言模型(LLM)正引发新一轮人工智能技术发展浪潮,并受到全球的广泛关注。LLM 不光具有出色的文本理解与生成能力,还能领悟丰富的物理世界知识,从而有效解决各类复杂任务。因此,LLM 常常被认为是迈向通用人工智能的基础。 然而,LLM 面对现实世界的海量数据,其应用将带来难以承受的成本开销。上图展示了各种数据类型的增长趋势及其对应的 LLM token 开销。我们可以明显看到,LLM 所带来的开销是我们无法承担的(例如,2025 年 LLM 的总体开销接近 5000 万亿美元,是美国 2023 年国内生产总值 27.37 万亿美元的 214 倍)。另一个有趣的现象是,处理文本和结构化数据将占据主要开销,尽管这类数据的体量没有多媒体数据大。 由于关
………………………………