专栏名称: 数据派THU
本订阅号是“THU数据派”的姊妹账号,致力于传播大数据价值、培养数据思维。
今天看啥  ›  专栏  ›  数据派THU

【MIT博士论文】合成数据的视觉表示学习

数据派THU  · 公众号  · 大数据  · 2024-08-29 17:00

文章预览

来源:专知 本文 约1700字 ,建议阅读 5 分钟 在本论文中,我们展示了我们最近为缩小这一差距并利用合成数据训练最先进的表示模型所做的努力。 表示学习对于开发健壮的视觉系统至关重要。这一学习过程的有效性在很大程度上取决于数据的质量和数量。合成数据在灵活性、可扩展性和可控性方面具有独特的优势。最近生成式模型的进展使得合成逼真的图像和高质量文本成为可能,大大提高了合成数据的可行性。尽管有这些进展,合成数据在表示学习和视觉识别任务中的应用仍然落后,使用合成数据训练的模型与使用真实数据训练的模型之间存在明显的性能差距。在本论文中,我们展示了我们最近为缩小这一差距并利用合成数据训练最先进的表示模型所做的努力。我们首先利用来自大型语言模型的合成文本来增强视觉-语言模型的训练。接着,我 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览