今天看啥  ›  专栏  ›  AGI Hunt

你知道吗?Qwen2VL可以一键重标注百万图片数据集

AGI Hunt  · 公众号  ·  · 2024-11-24 23:55
    

文章预览

AI图像重标注领域迎来重量级更新! Hugging Face的ML专家Sayak Paul 宣布了一个激动人心的消息: Qwen2VL模型已成功整合进他的图像重标注工具 ,而且效果出人意料地好! 这可能将改变图像重新标注领域! 要知道,高质量的图像描述对于训练AI模型来说可是 价值连城的黄金数据 。特别是在当前AI大模型竞争激烈的环境下, 优质的训练数据 更是成为了兵家必争之地。 强大的技术内核 这个名为「simple-image-recaptioning」的工具可一点都不简单。 它采用了 vllm引擎 作为核心,这意味着它能够充分利用多GPU资源,实现高效的并行推理。 在数据处理方面,它选择了 webdataset 作为数据格式。这个选择可不是随意的——webdataset专门为大规模数据集优化,是目前业界处理海量数据的首选方案。 更令人惊喜的是,这个工具还内置了 水印检测功能 。它在数据加载阶段就 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览