|
轻松掌控图像处理新纪元——探秘含5大Manba技术的超强82组快速接口缝合模块! AIWalker · 公众号 · · 3 月前 · 访问文章快照 |
|
图像文本擦除无痕迹!复旦提出EAFormer:最新场景文本分割新SOTA!(ECCV`24) AIWalker · 公众号 · · 3 月前 · 访问文章快照 |
|
ECCV 2024 | DepictQA: 图像质量感知多模态语言模型 AIWalker · 公众号 · · 3 月前 · 访问文章快照 |
|
图像去雨开源数据集资源汇总 ! AIWalker · 公众号 · · 3 月前 · 访问文章快照 |
|
图像生成别止步于扩散模型,自回归模型也很好用!LlamaGen:实现414%推理加速! AIWalker · 公众号 · · 3 月前 · 访问文章快照 |
|
恺明团队新作MAR(Masked AutoRegressive): 破除封建迷信——谁说自回归图像生成一定需要 VQ的! AIWalker · 公众号 · · 3 月前 · 访问文章快照 |
|
嵌入式设备上的高性能目标检测 Octave-YOLO | 自注意力模块与 CFPNe t架构的高效融合 ! AIWalker · 公众号 · · 3 月前 · 访问文章快照 |
|
干翻一众 FPN,成就特征融合新巅峰,专为目标检测而设计 ! AIWalker · 公众号 · · 3 月前 · 访问文章快照 |
|
视觉全能!自回归要反超扩散?Lumina-mGPT:任意分辨率丝滑逼真图像生成(上海AI Lab) AIWalker · 公众号 · · 3 月前 · 访问文章快照 |
|
最轻最快 ViT ,让你知道 Transformer 可以轻量化到什么程度 ? AIWalker · 公众号 · · 3 月前 · 访问文章快照 |
|
科研论文投稿?真心累了。。。 AIWalker · 公众号 · · 3 月前 · 访问文章快照 |
|
寥寥数笔,动画自成!阿里Tora: 首个轨迹引导的DiT创新实现精确运动控制视频生成 AIWalker · 公众号 · · 3 月前 · 访问文章快照 |
|
中科院 & 华为 & 中科大提出 SAM-CP1,刷新分割 SOTA 榜 ! AIWalker · 公众号 · · 3 月前 · 访问文章快照 |
|
武大 & 加州大学提出 FairViT | 自适应Mask策略,提高视觉Transformer的公平性与准确度 ! AIWalker · 公众号 · · 3 月前 · 访问文章快照 |
|
Diffusion反馈强势助力CLIP秒变火眼金睛:北京智源研究院、中科院自动化所联合推出DIVA AIWalker · 公众号 · · 3 月前 · 访问文章快照 |
|
ICML 2024|SLAB:华为开源,通过线性注意力和PRepBN提升Transformer效率 AIWalker · 公众号 · · 3 月前 · 访问文章快照 |
|
DALL-E 3不到50%,SDXL仅24.92%!各大SOTA文生图模型为啥这么难符合常识? AIWalker · 公众号 · · 4 月前 · 访问文章快照 |
|
LSTM又火了!最新52个创新思路+全部开源代码! AIWalker · 公众号 · 科技自媒体 · 4 月前 · 访问文章快照 |
|
LSTM又火了!最新52个创新思路+全部开源代码! AIWalker · 公众号 · · 4 月前 · 访问文章快照 |
|
用ViT取代Encoder!VIM:使用 ViT 改进的 VQGAN 进行矢量量化图像生成(ICLR 2022) AIWalker · 公众号 · · 4 月前 · 访问文章快照 |