|
207-B2|频域中加速网络推理,UNet数学解释,SAM变体综述;视觉皮层语义选择性,脑启发正则化提高对抗鲁棒性;深度伪造检测 AIGC Research · 公众号 · · 1 月前 · 访问文章快照 |
|
207-B3|LLM三维情境理解,基于多视图可微渲染的单目深度图精细化|Tue AIGC Research · 公众号 · · 1 月前 · 访问文章快照 |
|
207-A1.2|RLHF系列(半策略偏好优化,在线反馈微调),解耦图像生成内部层中区域原语特征组件,使用一对多知识蒸馏加速扩散 AIGC Research · 公众号 · · 1 月前 · 访问文章快照 |
|
207-A2.2|语言驱动视频着色,共语手势视频生成,视频生成质量评估指标,视频摘要综述|Tue AIGC Research · 公众号 · · 1 月前 · 访问文章快照 |
|
207-A1.1|结合LoRA与CFG引导,视觉文本生成;可控自回归视觉生成,语义掩码可控图像生成,后验采样高效图像编辑|Tue AIGC Research · 公众号 · · 1 月前 · 访问文章快照 |
|
207-A2.1|结合自回归与扩散的长序列生成;类Sora模型的初步探索;提高视频生成质量(利用视频扩散来引导、图像扩散来增强) AIGC Research · 公众号 · · 1 月前 · 访问文章快照 |
|
207-A3.1|文本引导3D人脸编辑,可控3D虚拟试衣;统一文本、音乐与运动生成,基于扩散的自回归模型用于文本驱动运动控制 AIGC Research · 公众号 · · 1 月前 · 访问文章快照 |
|
207-A1.4|多模态引导现实世界人脸修复,虚拟试衣伪影问题的条件修复;调查文生图模型中的概念关联,逐步越狱攻击与内容安全问题 AIGC Research · 公众号 · · 1 月前 · 访问文章快照 |
|
206-A1.2|生成式边缘检测器,脑电信号生成图像,评估文生图模型创建易读图文的能力|Mon AIGC Research · 公众号 · · 1 月前 · 访问文章快照 |
|
206-A1.1|整合基于文本与拖拽的编辑,PSO微调时间步长蒸馏扩散,个性化训练数据泄露与版权;加速视觉自回归,高效动态DiT AIGC Research · 公众号 · · 1 月前 · 访问文章快照 |
|
206-B|弥合文本、音频、图像及任何序列之间的gap,视频LLM;扩散模型用于判别任务,离散扩散用于学习有限对称群上概率分布 AIGC Research · 公众号 · · 1 月前 · 访问文章快照 |
|
206-A3|单图生CAD;变分贝叶斯GS用于连续数据流;指令引导角色场景交互合成,大运动模型与数据集,多任务角色控制;光学动捕 AIGC Research · 公众号 · · 1 月前 · 访问文章快照 |
|
186-B1|多模态图表形式几何问题求解,多模态文本生成的幻觉问题;多视角驾驶场景视频生成;运动想象脑电分类|Mon AIGC Research · 公众号 · 科技创业 科技自媒体 · 2 月前 · 访问文章快照 |