|
211-B2|网格表示+3DGS,高斯NVS,结合常识、视觉与触觉的稀疏重建;数字人手;推断物体内在动态,三维粒子动力学|Mon AIGC Research · 公众号 · · 1 月前 · 访问文章快照 |
|
210-A1.2|DiT的Scaling Laws;扩散(精确反演编辑,蒸馏,离散);Rectified扩散,快速流模型|Fri AIGC Research · 公众号 · · 1 月前 · 访问文章快照 |
|
210-B2|具身表征学习,3D视觉语言GS;GS系列(漏洞、效率等);室内重建,服装人类;运动系列(动捕,网络视频,物理合理) AIGC Research · 公众号 · · 1 月前 · 访问文章快照 |
|
210-A2.1|视频生成(利用文生图模型,渐进式自回归,基于离散扩散);高分辨音频驱动肖像动画化,语言引导音视频编辑|Fri AIGC Research · 公众号 · · 1 月前 · 访问文章快照 |
|
210-A1.1|自回归、整流“变换器”;主体个性化,基于文本的编辑,少样本图像生成;改善平面设计,中文书法生成;概念复苏/遗忘 AIGC Research · 公众号 · · 1 月前 · 访问文章快照 |
|
209-B1 B2|LVM;长PDF,音频、视频描述,视频LLM;StyleGAN,编辑,内容偏移,合成检测,漫画检测;持续学习 AIGC Research · 公众号 · · 1 月前 · 访问文章快照 |
|
210-B1|GUI智能体,LLM数学推理;多模态视觉语言系列;文档RAG,视频摘要;基于感兴趣区域的视频编辑 AIGC Research · 公众号 · · 1 月前 · 访问文章快照 |
|
审核失败 AIGC Research · 公众号 · · 1 月前 · 访问文章快照 |
|
209-A补+B3|前沿模型空间认知能力,大型多种族人脸视频数据集,动态外观纹理;相机轨迹生成,XRVR相关;说话头,NVS系列 AIGC Research · 公众号 · · 1 月前 · 访问文章快照 |
|
209-A1.2|中文字体合成,图像像素艺术化,文生SVG;多样性与数据重现问题,优化VQ-VAE训练重建,扩散盲图像动态恢复 AIGC Research · 公众号 · · 1 月前 · 访问文章快照 |
|
209-A3.1|高斯-网格混合表示的视频到4D,组合式文生4D交互,人-物交互生成;PBR纹理生成,文本驱动实时视频到卡通头像 AIGC Research · 公众号 · · 1 月前 · 访问文章快照 |
|
209-A1.1|长篇故事可视化;HR图像生成,公共资源训练文生图;迭代反馈组合多种模型优势互补,从多模态属性图生成图像|Thu AIGC Research · 公众号 · · 1 月前 · 访问文章快照 |
|
209-A2.2|金字塔流匹配用于高效视频生成,评估视频生成物理常识基准;为长视频生成预告片,双向扩散采样策略的视频插值|Thu AIGC Research · 公众号 · · 1 月前 · 访问文章快照 |
|
209-A1.3|DiT训练加速、推理加速;扩散模型偏好对齐、训练效率提高、离散数据生成;抵御扩散恶意编辑,评估文生图扩散去学习 AIGC Research · 公众号 · · 1 月前 · 访问文章快照 |
|
209-A3.2|生成式可重打光LRM,3D表示方法研究综述;多奖励RL人类偏好文生动作,语言运动预训练用于运动生成、检索与描述 AIGC Research · 公众号 · · 1 月前 · 访问文章快照 |
|
209-A2.1|多概念视频定制化,结合数据、奖励与指导以增强视频生成,分析时间注意力以提高一致性,噪声结晶化与液体噪声|Thu AIGC Research · 公众号 · · 1 月前 · 访问文章快照 |
|
Day 208|已顺延至Day 209|Wed AIGC Research · 公众号 · · 1 月前 · 访问文章快照 |
|
207-B1|GUI智能体,MLLM的输入输出一致性,大型视觉-语言模型视觉感知系列|Tue AIGC Research · 公众号 · · 1 月前 · 访问文章快照 |
|
论文简读|FakeShield:基于多模态大语言模型的可解释图像篡改检测定位|北京大学 AIGC Research · 公众号 · · 1 月前 · 访问文章快照 |