|
ICML 2024|华为诺亚提出SLAB:从BN和注意力角度改进Transformer CV技术指南 · 公众号 · · 5 月前 · 访问文章快照 |
|
Is Scaling All You Need? LLM收益递减,AI小厂难活命 CV技术指南 · 公众号 · · 5 月前 · 访问文章快照 |
|
Multi-Head RAG:多头注意力的激活层作为嵌入进行文档检索 CV技术指南 · 公众号 · · 5 月前 · 访问文章快照 |
|
从 MaxViT 到 ACC-ViT:视觉 Transformer 的紧凑型网络实现参数与性能的双重优化 ! CV技术指南 · 公众号 · · 5 月前 · 访问文章快照 |
|
视觉大模型、多模态、与图像/视频生成的最新研究方向汇总 CV技术指南 · 公众号 · · 5 月前 · 访问文章快照 |
|
ICML 2024 | 清华提出DecisionNCE,用多模态表征预训练加速具身智能 CV技术指南 · 公众号 · · 5 月前 · 访问文章快照 |
|
华中科技 & 地平线 提出通用视觉 Backbone 网络 , FLOPs减少 5.2倍,速度提高4.8倍 ! CV技术指南 · 公众号 · · 5 月前 · 访问文章快照 |
|
超越CVPR 2024方法,DynRefer在区域级多模态识别任务上,多项SOTA CV技术指南 · 公众号 · · 5 月前 · 访问文章快照 |
|
PointMamba迎来更新!Mamba在点云分析中是否能替代Transformer? CV技术指南 · 公众号 · · 5 月前 · 访问文章快照 |
|
CVPR 2024全程满分+最佳论文候选!上交&港中文等提出神经场网格模型三大定理 CV技术指南 · 公众号 · · 5 月前 · 访问文章快照 |
|
清华 & 上交大等开源 PIIP,在目标检测和分割任务上的突破,计算成本减半,性能提升 ! CV技术指南 · 公众号 · · 5 月前 · 访问文章快照 |
|
商汤披露:50篇论文入选CVPR 2024 CV技术指南 · 公众号 · · 5 月前 · 访问文章快照 |
|
TPAMI 2024|DeepM2CDL:基于层级式多尺度卷积字典的多模态图像修复与融合网络 CV技术指南 · 公众号 · · 5 月前 · 访问文章快照 |
|
CVPR'24 | 4D编辑哪家强?浙大首次提出通用指导4D编辑框架:Instruct 4D-to-4D CV技术指南 · 公众号 · · 5 月前 · 访问文章快照 |
|
超越传统 UNet ,GCtx-UNet 结合全局与局部特征,实现高效图像分割 ! CV技术指南 · 公众号 · · 5 月前 · 访问文章快照 |
|
ICML'24|LayerNorm OUT!华为诺亚提出SLAB:渐进重参数化 BN 的视觉Transformer CV技术指南 · 公众号 · · 5 月前 · 访问文章快照 |
|
CVPR 2024 | RobustSAM:在低质量图像上鲁棒地分割一切 CV技术指南 · 公众号 · · 5 月前 · 访问文章快照 |
|
升级扩散模型无需更新插件!新国立提出通用的适配器X-Adapter! CV技术指南 · 公众号 · · 5 月前 · 访问文章快照 |
|
单镜头16秒720p高清视频一键生成,开源版Sora又有新惊喜了 CV技术指南 · 公众号 · · 5 月前 · 访问文章快照 |
|
全新注意力范式!清华黄高团队提出Agent Attention:无缝集成Softmax和Linear的注意力机制 CV技术指南 · 公众号 · · 5 月前 · 访问文章快照 |