专栏名称: 新智元
智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。
今天看啥  ›  专栏  ›  新智元

耗资数百万,六年磨一剑!上交开源首创图像合成神器libcom,下载量破万

新智元  · 公众号  · AI  · 2024-10-12 12:25

主要观点总结

新智元报道,上海交通大学牛力团队首创图像合成工具箱libcom,论文、代码、数据集全开源。该工具箱涵盖图像合成的多方面功能,包括增、删、改等原子操作,以及解决前景和背景之间的不一致性问题。历经六年研发,数据集严格质量管控,模型代码经过多人检查以确保无严重错误。libcom集成了图像合成的十几项功能,并提供了在线demo、论文等资源。未来展望包括数据集扩充、模型调优等。

关键观点总结

关键观点1: 牛力团队首创图像合成工具箱libcom并开源

该工具箱包含论文、代码和数据集。

关键观点2: 图像合成中的原子操作

包括增、删、改,分别对应图像合成、图像填充和属性编辑。

关键观点3: 图像合成中的不一致性问题

包括外观不一致性、几何不一致性、语义不一致性,可以分解为若干子问题。

关键观点4: libcom的功能涵盖

包括合成图像、前景物体放置合理性判断、热力图输出等十二大功能。

关键观点5: 数据集和模型的质量管控

数据集每张图片经过2~3人检查,模型代码也经过多人检查以确保无严重错误。

关键观点6: 未来展望

包括数据集扩充、模型调优、添加新功能等。


文章预览

   新智元报道   编辑:编辑部 HYZ 【新智元导读】 研发6年,耗资数百万,六届学霸接力,上交牛力团队首创的图像合成工具箱libcom,论文、代码、数据集全开源。团队欢迎各位大佬共铸libcom,贡献突出者可享冠名权。 在AIGC 的浪潮中,对已有图片做编辑的图像编辑(image editing)技术受到了越来越多的关注。图像编辑(image editing)的原子操作包括增、删、改。 「增」 是指在图像中添加元素,该研究方向叫做图像合成(image composition) 「删」 是指从图像中擦除元素,该研究方向叫做图像填充(image inpainting) 「改」 是指改变图像中元素的属性,该研究方向叫做属性编辑(attribute manipulation) 其余复杂的图像编辑操作皆可转化为「增」、 「删」、「改」这三个原子操作的组合,通过按照一定顺序执行这些原子操作完成。 因此, 图像合成(image comp ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览