多模态预训练模型在 OPPO 端云场景的落地实践

NewBeeNLP · 公众号 · · 2024-05-22 11:05

文章预览

大家好，这里是 NewBeeNLP。今天分享 OPPO 多模态预训练模型在端云场景的落地实践。具体内容分成三个主题： 1. 端侧图文检索技术研究 2. 文图生成 & 理解态模型的应用优化 3. 文图生成模型的端侧轻量化分享嘉宾｜陈宸博士 OPPO 高级算法工程师出品社区｜ DataFun 01 端侧图文检索技术研究 1. 解决了什么问题？首先来介绍图文检索技术。以前在手机端相册搜索照片，都是基于标签来搜索。从 CLIP 模型出现后开始做自然语言搜索。目前正在解决端侧性能、搜索效果、安全等问题。技术难度并不大，重点在于提高搜索速度。并且要保持与云侧模型相同的精度，供断网时使用。 2. 算法优化算法优化集中在压缩算法。用 CLIP 模型做图文匹配，算法简单，训练支持大规模并行，但对细粒度理解有问题。采用 ALBEF 单流场景，最后需要把图片和 Query ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博