|
Infinity-MM:利用大规模高质量指令数据扩展多模态性能 FightingCV · 公众号 · · 3 周前 · 访问文章快照 |
|
跨模态3D目标检测SOTA!易复现! FightingCV · 公众号 · · 3 周前 · 访问文章快照 |
|
审核中 FightingCV · 公众号 · · 3 周前 · 访问文章快照 |
|
审核中 FightingCV · 公众号 · · 4 周前 · 访问文章快照 |
|
审核中 FightingCV · 公众号 · · 4 周前 · 访问文章快照 |
|
开源模型突破原生多模态大模型性能瓶颈,上海AI Lab代季峰团队出品 FightingCV · 公众号 · · 4 周前 · 访问文章快照 |
|
ECCV24 | ControlNet++: 通过高效一致性反馈改进条件控制 FightingCV · 公众号 · · 1 月前 · 访问文章快照 |
|
审核中 FightingCV · 公众号 · · 1 月前 · 访问文章快照 |
|
审核中 FightingCV · 公众号 · · 1 月前 · 访问文章快照 |
|
MMIU: 用于评估大型视觉语言模型的多模态多图像理解 FightingCV · 公众号 · · 1 月前 · 访问文章快照 |
|
Arena Learning : 通过模拟聊天机器人竞技场为 LLM 后训练构建数据飞轮 FightingCV · 公众号 · · 1 月前 · 访问文章快照 |
|
MMEvol:赋能多模态大型语言模型的 Evol-Instruct FightingCV · 公众号 · · 1 月前 · 访问文章快照 |
|
NTU提出Text4Seg: 重塑图像分割为文本生成 FightingCV · 公众号 · · 1 月前 · 访问文章快照 |
|
BLIP-2作者新作Aria : 一个开放的多模态原生专家混合模型 FightingCV · 公众号 · · 1 月前 · 访问文章快照 |
|
华为天才少年面试大厂被怼:怎么连Attention都不会? FightingCV · 公众号 · · 1 月前 · 访问文章快照 |
|
Mistral发布了其首款多模态模型Pixtral 12B FightingCV · 公众号 · · 1 月前 · 访问文章快照 |
|
EMNLP 2024 | 阿里通义实验室提出MLLM多图能力评估基准MIBench FightingCV · 公众号 · 科技自媒体 · 1 月前 · 访问文章快照 |
|
堪比理科博士生的最强AI大模型:GPT-o1技术解析 FightingCV · 公众号 · · 1 月前 · 访问文章快照 |
|
Google Deepmind提出SigLIP,用于语言图像预训练的 Sigmoid 损失 FightingCV · 公众号 · · 1 月前 · 访问文章快照 |
|
Apple提出MM1.5:多模态大型语言模型微调的方法、分析和见解 FightingCV · 公众号 · · 1 月前 · 访问文章快照 |