|
【综述专栏】大模型如何做视频理解?最新《多模态大语言模型在全面长视频理解》综述 人工智能前沿讲习 · 公众号 · · 2 月前 · 访问文章快照 |
|
【他山之石】stable diffusion原理解读通俗易懂,史诗级万字爆肝长文,喂到你嘴里 人工智能前沿讲习 · 公众号 · · 2 月前 · 访问文章快照 |
|
【学术人生】CCBR 2024 | 面部生物特征识别论坛 人工智能前沿讲习 · 公众号 · · 2 月前 · 访问文章快照 |
|
【他山之石】ECCV 2024|跨域小样本物体检测CD-FSOD新数据集、CD-ViTO新方法(数据代码均已开源) 人工智能前沿讲习 · 公众号 · · 2 月前 · 访问文章快照 |
|
【他山之石】RICAU-Net 与加权焦点对数 Dice 损失,提高分割的精度和召回率! 人工智能前沿讲习 · 公众号 · · 2 月前 · 访问文章快照 |
|
【源头活水】小白也可以清晰理解diffusion原理: DDPM 人工智能前沿讲习 · 公众号 · · 2 月前 · 访问文章快照 |
|
【他山之石】ECCV'24|WTConv:小参数大感受野,基于小波变换的新型卷积 人工智能前沿讲习 · 公众号 · · 2 月前 · 访问文章快照 |
|
【他山之石】Big Model Weekly | 每周最新大论文汇总 人工智能前沿讲习 · 公众号 · · 2 月前 · 访问文章快照 |
|
【他山之石】MSVM-UNet 用于图像分割的多尺度视觉Mamba UNet ! 人工智能前沿讲习 · 公众号 · · 2 月前 · 访问文章快照 |
|
如何用Deep-Fusion实现完美图文对齐?Playground v3:实现超越人类的图形设计能力 人工智能前沿讲习 · 公众号 · · 2 月前 · 访问文章快照 |
|
【他山之石】RotCAtt-TransUNet++ 用于精细分割的新型深度神经网络 ! 人工智能前沿讲习 · 公众号 · · 2 月前 · 访问文章快照 |
|
【源头活水】又一个音频驱动的数字人项目LOOPY:字节提出更高质量的端到端的说话人视频生成 人工智能前沿讲习 · 公众号 · · 2 月前 · 访问文章快照 |
|
【学术人生】2024身份识别大会日程发布 人工智能前沿讲习 · 公众号 · · 2 月前 · 访问文章快照 |
|
【他山之石】TPAMI 2024!北理等提出FreqFusion,让CVPR投稿轻松涨点 人工智能前沿讲习 · 公众号 · · 2 月前 · 访问文章快照 |
|
【源头活水】Mamba 策略利用混合选择状态模型实现高效的三维扩散策略 ! 人工智能前沿讲习 · 公众号 · · 2 月前 · 访问文章快照 |
|
【他山之石】首个Mamba+Transformer混合架构多模态大模型来了,实现单卡千图推理 人工智能前沿讲习 · 公众号 · · 2 月前 · 访问文章快照 |
|
【他山之石】Big Model Weekly | 每周最新大模型论文精读分享! 人工智能前沿讲习 · 公众号 · · 2 月前 · 访问文章快照 |
|
CCBR 2024 | 声纹识别论坛 人工智能前沿讲习 · 公众号 · · 2 月前 · 访问文章快照 |