【Mistral AI Evals：一个用于运行Mistral -20241119140759

爱可可-爱生活 · 微博 · AI · 2024-11-19 14:07

文章预览

2024-11-19 14:07 本条微博链接【Mistral AI Evals：一个用于运行Mistral AI发布的评估以及为流行学术基准测试提供标准化提示、解析和度量计算的代码库，支持多轮LLM-as-a-judge评估任务】'Mistral Evals - This repository contains code to run evals released by Mistral AI as well as standardized prompts, parsing and metrics computation for popular academic benchmarks.' GitHub: github.com/mistralai/mistral-evals #AI评估# #学术基准测试# #代码库# ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

金色旋风 · 什么功能都有的超强大AI工具，关键是免费！

4 天前

金色旋风 · 什么功能都有的超强大AI工具，关键是免费！

4 天前

黄建同学 · 值得关注的#ai##ai视频# 新论文：利用RLT实现更快的视频-20241118073807

4 天前

爱可可-爱生活 · [LG]《Score-based generative diff-20241117070839

5 天前

宝玉xp · //@油基岩屑:Yi-Lightning和GPT-4效果一致吗？-20241117020406

5 天前

爱可可-爱生活 · 【Am I Isolated：用于验证容器环境隔离姿态的安全姿态-20241116152539

6 天前

钱塘廉潮 · 【学党纪明规矩】《中国共产党纪律处分条例》解读微视频丨本次《条例》修订体现了哪些特点

3 月前

海通研究 · 海通大宗商品产业链精品报告系列（19）| 燃气行业研究框架：供需格局趋稳，顺价机制推进

2 月前

DevOps实战派 · 关于运维的七个真相

1 月前