别再拿架构说事儿了!OpenAI工程师实锤: 数据即模型

AI寒武纪 · 公众号 · · 2024-05-27 11:56

文章预览

jbetker在OpenAI 工作近一年，观察到生成模型的训练过程显示模型行为主要由数据集决定 ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ jbetker一线观察 - 作者训练了大量生成模型，观察到所有训练运行之间存在相似性 - 模型高度逼近其数据集 - 模型行为不由架构、超参数或优化器选择决定，而是由数据集决定，其他因素只是有效地将计算交付给逼近数据集的手段详细信息 ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ 这哥们在过去一年的OpenAI工作经历中,不断地训练各种生成式AI模型,规模之大令人咂舌。在这个过程中,渐渐发现了一个惊人的现象: 无论你采取何种模型架构、超参数设置或优化方法,只要基于同一训练数据集进行充分的训练,最终模型的行为输出都将收敛到一个相近的结果这就意味着,影响AI模型行为的决定性因素,并非其架构或配置参数,而是作为模 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

煮娱星球 · 三月份煮娱最受欢迎明星

8 小时前

封面新闻 · 时隔3年半，孙俪传来喜讯，本人连发12个“终于”

11 小时前

海峡导报 · 71岁成龙白发亮相好莱坞功夫新作，比出中国传统“抱拳礼”

昨天

海峡导报 · 71岁成龙白发亮相好莱坞功夫新作，比出中国传统“抱拳礼”

昨天

读嘉新闻 · 知名歌手官宣离婚！

2 天前

读嘉新闻 · 知名歌手官宣离婚！

2 天前

指尖新闻沈阳晚报 · 演员韩庚、卢靖姗夫妇发声明！

2 天前

指尖新闻沈阳晚报 · 演员韩庚、卢靖姗夫妇发声明！

2 天前

半月谈 · 中国政府就黄岩岛领海基线发表声明

4 月前

校长邦 · 教育周报｜高瓴资本拟对教育类资产再出手；学前教育法草案提请三审

4 月前