文章预览
夕小瑶科技说 分享
来源 | 新智元 首个AI Kaggle特级大师诞生了! 刚刚,OpenAI发布了智能体基准MLE-bench,专为评估AI智能体在机器学习工程任务中的表现而打造。 为此,团队从Kaggle上精选了75个真实世界数据科学比赛,并创建出一系列多样化、具有挑战性任务。 比如,训练模型、数据集准备、运行实验等环节,均有涉及。 要知道,OpenAI内部一直都在致力于做出超级AI智能体,o1推理模型发布已经让他们实现了二级AGI。 在最新MLE-bench论文中,作者还揭示了实现AGI的关键所在—— AI智能体能够解决MLE-bench所有问题,可能会带来奇点。 论文地址: https://arxiv.org/abs/2410.07095 实验结果表明,最强o1-preview联手AIDE,在16.9%的比赛中达到了Kaggle铜牌级别的水平。 这说明,在某些任务中,AI已经能够与专业人类数据科学家相媲美。 不过,研究也揭示了AI与人类
………………………………