注册
登录
专栏名称:
机器之心
专业的人工智能媒体和产业服务平台
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
雪球动态RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
爱可可-爱生活
·
【[42星]llama.vscode:一款为 ...
·
16 小时前
爱可可-爱生活
·
【[217星]UI-TARS:一款能像人类一 ...
·
17 小时前
爱可可-爱生活
·
【[37星]Madrona ...
·
17 小时前
黄建同学
·
免费的编程、计算机和AI电子书大集合🔥🔥🔥3 ...
·
2 天前
爱可可-爱生活
·
【[828星]TilingShell:为Gn ...
·
2 天前
今天看啥
›
专栏
›
机器之心
给大模型制作图文并茂的教科书: 从2.5年的教学视频里挖掘多模态语料
机器之心
·
公众号
·
AI
· 2025-01-20 16:06
文章预览
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。 投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com 近期关于 scaling law 的讨论甚嚣尘上,很多观点认为 scale law is dead. 然而,我们认为,高质量的 “无监督” 数据才是 scaling law 的关键,尤其是教科书级别的高质量的知识语料。此外,尽管传统的语料快枯竭了,但是互联网上还有海量的视频并没有被利用起来,它们囊括了丰富的多种模态的知识,可以帮助 VLMs 更好好地理解世界。 浙大和阿里巴巴达摩院联合提出一个图文交织的多模态知识语料:他们收集互联网上超过 22000 课时 (两年半) 的教学视频,提取关键步骤的画面 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
爱可可-爱生活
·
【[42星]llama.vscode:一款为VS Code开发的-20250122211612
16 小时前
爱可可-爱生活
·
【[217星]UI-TARS:一款能像人类一样与图形界面交互的A-20250122201605
17 小时前
爱可可-爱生活
·
【[37星]Madrona MJX:一个强大的物理引擎与渲染技术-20250122201730
17 小时前
黄建同学
·
免费的编程、计算机和AI电子书大集合🔥🔥🔥34.5K⭐访问-20250120192043
2 天前
爱可可-爱生活
·
【[828星]TilingShell:为Gnome Shell扩-20250120185027
2 天前
大淘宝技术
·
一个淘宝服务端工程师的年度总结
8 月前
海油发展微讯
·
中国海油溢油应急中心助力乌石23-5油田完成“湛江产”原油外输
4 月前
锂电池回收 小樱快讯
·
负债超80亿!锂电巨头一公司宣布破产
3 月前