专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
目录
相关文章推荐
宝玉xp  ·  Google 的新玩具 ... ·  8 小时前  
黄建同学  ·  Meta ... ·  2 天前  
宝玉xp  ·  转发微博-20241212155621 ·  4 天前  
黄建同学  ·  Replit Agent ... ·  5 天前  
今天看啥  ›  专栏  ›  爱可可-爱生活

[CV] MINT-1T: Scaling Open-Sourc-20240619060346

爱可可-爱生活  · 微博  · AI  · 2024-06-19 06:03
    

文章预览

2024-06-19 06:03 本条微博链接 [CV] MINT-1T: Scaling Open-Source Multimodal Data by 10x: A Multimodal Dataset with One Trillion Tokens 网页链接 构建了迄今最大最多样的开源多模态交织预训练数据集MINT-1T,包含1万亿文本标记和30亿图像,来自HTML、PDF和ArXiv三个不同源,实验证明相比于以往数据集,它能训练出性能更优的多模态模型。 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览