专栏名称: 歸藏的AI工具箱
互联网科技博主 产品设计师、模型设计师、 不会代码的独立开发者。 关注人工智能、LLM 、 Stable Diffusion 和设计。
今天看啥  ›  专栏  ›  歸藏的AI工具箱

Scale AI 推出了一个对领先前沿模型进行私密专家评估的平台-20240530151439

歸藏的AI工具箱  · 微博  ·  · 2024-05-30 15:14
    

文章预览

2024-05-30 15:14 本条微博链接 Scale AI 推出了一个对领先前沿模型进行私密专家评估的平台。 #ai# 评估的原则是: 私密且不可被利用,评估不会被过拟合。 领域专家评估 。 不断更新新的数据和模型。 评估维度有:编程、数学、指令跟随和多语言。 评估结果: 编程-GPT-4 Turbo 数学- Claude3 Opus 指令跟随- GPT-4o 西班牙语- GPT-4o 榜单地址: 网页链接 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览