专栏名称: 夕小瑶科技说
这里有自然语言处理、机器学习、算法的入门指导、科普与深度干货,有小夕的回忆与日常,还有最重要的:萌!气!
今天看啥  ›  专栏  ›  夕小瑶科技说

NEO发布第一位自主机器学习工程师,MLE-bench秒杀了OpenAI o1

夕小瑶科技说  · 公众号  ·  · 2024-11-19 21:23

文章预览

夕小瑶科技说 原创 作者 | 海野 今天刚刷到一家初创AI公司——NEO AI,一出手就是王炸! 他们是这样介绍第一个项目的: 首个自主机器学习AI工程师。 官方还晒出一波跑分:NEO在MLE基准测试上进行了全面评估。在50场Kaggle比赛的测试中,NEO在26%的比赛中赢得了奖牌,超过了搭配AIDE框架的OpenAI o1(16.9%)。 MLE-bench是OpenAI推出的新测试基准,由75个Kaggle机器学习工程任务构成,包括自然语言处理、计算机视觉、信号处理等一系列机器学习工程师日常使用的核心技能测试。获得奖牌的要求是: 在所有参赛队伍中,得分占前10%。 ) 作为一个机器学习工程师,工作主要包括几个环节: 数据获取、清洗、处理加工 模型选择、训练、验证 部署监控 但纯人工解决起来费时费力费资源,而这就是NEO希望能解决的问题。 怎么解决? NEO用多个智能体同时驱动多个专 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览