|
文末赠书 | 作者硬核,内容透彻接地气的多模态大模型通识读本!国家队大模型紫东太初负责人王金桥力作 我爱计算机视觉 · 公众号 · · 5 月前 · 访问文章快照 |
|
视频生成game-changer来了!贾佳亚团队提出下一代 ControlNet 我爱计算机视觉 · 公众号 · · 5 月前 · 访问文章快照 |
|
顶刊IJCV2024 | 北大、哈工大、清华联合提出无需GT的自监督图像重建网络学习方法,代码已开源! 我爱计算机视觉 · 公众号 · · 5 月前 · 访问文章快照 |
|
SC4D: 基于稀疏控制点的单视角视频到4D生成及运动迁移框架 我爱计算机视觉 · 公众号 · · 5 月前 · 访问文章快照 |
|
第四届中国移动“梧桐杯”大赛火热报名中!高额奖金、校招直通…等你来战! 我爱计算机视觉 · 公众号 · · 5 月前 · 访问文章快照 |
|
迈向多图长序列理解,阿里开源多模态大模型 mPLUG-Owl3 我爱计算机视觉 · 公众号 · · 5 月前 · 访问文章快照 |
|
港科大联手思谋新作:Defect Spectrum数据集重新定义AI工业质检 我爱计算机视觉 · 公众号 · · 5 月前 · 访问文章快照 |
|
独自一人,怒发顶会! 我爱计算机视觉 · 公众号 · · 5 月前 · 访问文章快照 |
|
ECCV 2024 | 南洋理工三维数字人生成新范式:结构扩散模型 我爱计算机视觉 · 公众号 · · 5 月前 · 访问文章快照 |
|
ACL 2024 | 剑桥大学团队开源:赋能多模态大模型RAG应用,首个预训练通用多模态后期交互知识检索器 我爱计算机视觉 · 公众号 · 互联网短视频 科技自媒体 · 5 月前 · 访问文章快照 |
|
延续SAM-Adapter的成功,魔芯科技、科大等提出SAM2-Adapter,让SAM2实现下游任务SOTA! 我爱计算机视觉 · 公众号 · · 5 月前 · 访问文章快照 |
|
MSU世界视频编码器大赛成绩出炉,国产编码器包揽全部指标第一名 我爱计算机视觉 · 公众号 · 互联网短视频 科技自媒体 · 5 月前 · 访问文章快照 |
|
今年,请马上入局AI大模型! 我爱计算机视觉 · 公众号 · · 5 月前 · 访问文章快照 |
|
ICML 2024 | 人物交互图像,现在更懂你的提示词了,北大推出基于语义感知的人物交互图像生成框架 我爱计算机视觉 · 公众号 · · 5 月前 · 访问文章快照 |
|
多模态杀疯了,ChatGPT版「Her」炸裂登场 我爱计算机视觉 · 公众号 · · 5 月前 · 访问文章快照 |
|
阿里提出轨迹可控的 DiT 视频生成模型 Tora 我爱计算机视觉 · 公众号 · · 5 月前 · 访问文章快照 |
|
中大和美团联合提出语言感知的开放域检测方法OV-DINO!开源性能最强! 我爱计算机视觉 · 公众号 · · 5 月前 · 访问文章快照 |
|
字节联合复旦重磅推出 LayTextLLM!交错融合布局信息,文档理解能力再创新 SOTA! 我爱计算机视觉 · 公众号 · · 5 月前 · 访问文章快照 |
|
Diffusion反馈强势助力CLIP秒变火眼金睛:北京智源研究院、中科院自动化所联合推出DIVA 我爱计算机视觉 · 公众号 · · 5 月前 · 访问文章快照 |