注册
登录
专栏名称:
自动驾驶之心
自动驾驶开发者社区,关注计算机视觉、多维感知融合、部署落地、定位规控、领域方案等,坚持为领域输出最前沿的技术方向!
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
雪球动态RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
三峡小微
·
三峡船闸:一线巡检护航春运
·
18 小时前
今天看啥
›
专栏
›
自动驾驶之心
LongCLIP:解锁CLIP的长文本能力
自动驾驶之心
·
公众号
· · 2024-10-21 07:30
文章预览
作者 | 迪西 编辑 | 自动驾驶之心 原文链接:https://zhuanlan.zhihu.com/p/1640361503 点击下方 卡片 ,关注“ 自动驾驶之心 ”公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 >> 点击进入→ 自动驾驶之心 『 大语言模型 』 技术交流群 本文只做学术分享,如有侵权,联系删文 研究背景 研究问题 :这篇文章要解决的问题是CLIP模型在处理长文本输入时的局限性。CLIP模型的文本输入长度被限制在77个标记以内,实际有效长度甚至小于20个标记,这限制了其在处理详细描述时的能力,特别是在图像检索和文本到图像生成任务中。 研究难点 :该问题的研究难点包括:简单地微调CLIP会导致其性能显著下降;用支持更长上下文的语言模型替换文本编码器需要大量数据预训练,成本高昂。 相关工作 :CLIP模型基于对比学习,广泛应用于零样本分类、文本图像检 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
三峡小微
·
三峡船闸:一线巡检护航春运
18 小时前
医药魔方Invest
·
“专精特新小巨人”赛诺威盛终止IPO
7 月前
锂电江湖
·
【JH-7647】2024年中国乘用车轮胎市场分析白皮书(61页)
4 月前
给思考留点时间
·
现在的大环境下,普通人搞钱最快的方式
4 月前
北师英协
·
活动总结丨《哈利·波特》“三强争霸赛”活动圆满落幕
2 月前