|
NeurIPS2024 | OCR-Omni来了,字节&华师提出统一的多模态文字理解与生成大模型 我爱计算机视觉 · 公众号 · · 2 月前 · 访问文章快照 |
|
MonST3R | UC伯克利、DeepMind等提出的运动状态下估算几何图形的先进方法 我爱计算机视觉 · 公众号 · · 2 月前 · 访问文章快照 |
|
TPAMI 2024 无监督盲超分算法 MLMC,代码已开源! 我爱计算机视觉 · 公众号 · · 3 月前 · 访问文章快照 |
|
综述|Drones 2024 基于视觉的反无人机综述 我爱计算机视觉 · 公众号 · 科技自媒体 · 3 月前 · 访问文章快照 |
|
“左脚踩右脚”提升文生图模型综合能力!清北牛津普林斯顿联合发布 IterComp 我爱计算机视觉 · 公众号 · · 3 月前 · 访问文章快照 |
|
开源了!阿里轨迹控制版视频生成 Tora 开源发布 我爱计算机视觉 · 公众号 · 互联网短视频 科技自媒体 · 3 月前 · 访问文章快照 |
|
已开放!!!黑色素瘤组织和细胞核全景分割挑战赛 (PUMA challenge) 我爱计算机视觉 · 公众号 · · 3 月前 · 访问文章快照 |
|
今年顶会这情况。。。大家提前做准备吧! 我爱计算机视觉 · 公众号 · · 3 月前 · 访问文章快照 |
|
项目合作 | 孔隙结构分析与生成 我爱计算机视觉 · 公众号 · · 3 月前 · 访问文章快照 |
|
[通用的视觉Backbone] TransXNet: 全局动态性+局部动态性=性能强大,代码已开源! 我爱计算机视觉 · 公众号 · · 3 月前 · 访问文章快照 |
|
华科&华为发布首款基于国产芯片适配的多模态大模型“PDF悟空”,解析长文档多模态数据能力 SOTA 我爱计算机视觉 · 公众号 · · 3 月前 · 访问文章快照 |
|
EMNLP 2024 | 阿里通义实验室提出MLLM多图能力评估基准MIBench 我爱计算机视觉 · 公众号 · AI 科技自媒体 · 3 月前 · 访问文章快照 |
|
北京大学 | 提出基于多模态大语言模型的可解释图像篡改检测定位 我爱计算机视觉 · 公众号 · · 3 月前 · 访问文章快照 |
|
行人重识别与人群计数数据集大盘点:推动智能监控研究的利器 我爱计算机视觉 · 公众号 · · 3 月前 · 访问文章快照 |
|
又中稿一篇顶刊论文!后悔没早点发现这个方法 我爱计算机视觉 · 公众号 · · 3 月前 · 访问文章快照 |
|
探索VIOBOT:机器人的三维视觉感知技术🤖 我爱计算机视觉 · 公众号 · · 3 月前 · 访问文章快照 |
|
YOLOv1-v11系列全记录 我爱计算机视觉 · 公众号 · · 3 月前 · 访问文章快照 |
|
ECCV 2024奖项公布,哥大摘得最佳论文奖桂冠 我爱计算机视觉 · 公众号 · · 3 月前 · 访问文章快照 |