专栏名称: 吃果冻不吐果冻皮

专注于AI工程化（LLM、MLOps、LLMOps、RAG、Agent）落地。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

相关文章推荐

上游新闻 · 重庆“老队长”雨中挥别绿茵场 ... · 3 小时前

北京日报 · 首个主场，没赢，遗憾吗？ · 17 小时前

天下泉城 · 让三追四！山东泰山4比3大逆转梅州客家 · 18 小时前

津云 · 津门虎主场首胜！萨尔瓦多伤势，让人揪心…… · 22 小时前

天津广播 · 战报 | 西班牙三人组连线建功，拿下主场首胜！ · 22 小时前

今天看啥 › 专栏 › 吃果冻不吐果冻皮

多模态模型(VLM)部署方法抛砖引玉

吃果冻不吐果冻皮 · 公众号 · · 2024-07-10 11:50

文章预览

【点击】加入大模型技术交流群去年年初LLM刚起步的时候，大模型的部署方案还不是很成熟，如今仅仅过了一年多，LLM部署方案已经遍地都是了。而多模态模型相比大语言模型来说，发展的还没有很“特别”成熟，不过由于两者结构很相似，LLMs的经验还是可以很好地利用到VLMs中。本篇文章中提到的多模态指的是视觉多模态，即VLM（Vision Language Models）。以下用一张图展示下简单多模态模型的运行流程： Text Embeddings即文本输入，就是常见LLM中的输入；而Multomode projector则是多模态模型额外一个模态的输入，这里指的是视觉输入信息，当然是转换维度之后的；将这个转换维度之后的视觉特征和Text Embeddings执行concat操作合并起来，输入decoder中（例如llama）就完成推理流程了； Multomode projector负责将原始的图像特征转换下维度，输出转换后的图像特征 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

上游新闻 · 重庆“老队长”雨中挥别绿茵场铜梁龙小兄弟将赛季首胜献给他

3 小时前

上游新闻 · 重庆“老队长”雨中挥别绿茵场铜梁龙小兄弟将赛季首胜献给他

3 小时前

北京日报 · 首个主场，没赢，遗憾吗？

17 小时前

北京日报 · 首个主场，没赢，遗憾吗？

17 小时前

天下泉城 · 让三追四！山东泰山4比3大逆转梅州客家

18 小时前

天下泉城 · 让三追四！山东泰山4比3大逆转梅州客家

18 小时前

津云 · 津门虎主场首胜！萨尔瓦多伤势，让人揪心……

22 小时前

津云 · 津门虎主场首胜！萨尔瓦多伤势，让人揪心……

22 小时前

天津广播 · 战报 | 西班牙三人组连线建功，拿下主场首胜！

22 小时前

天津广播 · 战报 | 西班牙三人组连线建功，拿下主场首胜！

22 小时前

中文投资网 · 还将继续飙升的大牛股，其中一只拥有52%的上涨空间

9 月前

自动驾驶之心 · 从小鹏、理想、蔚来布局看自动驾驶发展趋势

5 月前

大庆晚报 · 扔烟头烧了自家的车？夫妻俩6000元买的砂糖橘全被“烤焦”

2 月前

938重庆私家车广播 · 明日12时起沙坪坝区天梨路上跨高架桥（岩口立交至红糟房立交段）施工封闭

1 月前

体育大生意 · 打卡人生清单海岛，塞班马拉松背后是华人家族百年奋斗史

2 周前