专栏名称: 将门创投
将门是一家专注于发掘及加速技术创新激活商业价值的创业公司的创投机构。将门旗下设有将门创新服务、将门技术社群以及将门投资基金。关注领域包括机器智能、物联网、自然人机交互、企业计算。
今天看啥  ›  专栏  ›  将门创投

Talk预告|UW-Madison蔡沐:图像可编码为任意数量Token,俄罗斯套娃式多模态大模型

将门创投  · 公众号  · 科技创业  · 2024-07-17 08:22

文章预览

本期为 TechBeat人工智能社区 第 610 期 线上Talk。 北京时间 7 月18日 (周四)20:00, 威斯康星大学麦迪逊分校博士生 蔡沐 的Talk将准时在TechBeat人工智能社区开播! 他与大家分享的主题是:  “  图像可编码为任意数量Token,俄罗斯套娃式多模态大模型 ” , 届时他将向大家介绍 一种俄罗斯套娃技术,可以自由地选择将一个图像encode为1, 9, 36, 144, 576个token中的任意一种。 Talk·信息 ▼ 主题:‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍图像可编码为任意数量Token,俄罗斯套娃式多模态大模型 嘉宾:威斯康星大学麦迪逊分校 · 博士生 - 蔡沐 时间:北京时间  7 月18日(周四)20:00 地点:TechBeat人工智能社区 ttp://www.techbeat.net/  长按识别二维码,一键预约TALK! Talk·介绍 ▼ LLaVA的多模态大模型总是把图像编码为固定数量的token(576个)。但这不是最优的。我们提出了一种俄 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览