专栏名称: DatabriAI

创始人刘强出版过专著「推荐系统：算法、案例与大模型」、「构建企业级推荐系统」等。Databri AI聚焦金融、传统行业的数智化转型，提供咨询、培训、项目实施解决方案。过去3年服务过中国银联、中国移动、中盐、招商银行、广发银行等大客户。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

「大模型智能体」13｜智能体的能力评估

DatabriAI · 公众号 · · 2024-07-16 16:14

文章预览

你好，我是刘强。本课程是关于大模型智能体的实战课程，包括原理、算法、应用场景、代码实战案例等，下表是本次课程的大纲。本课是第13节，讲解智能体的能力评估。本课约5000字，阅读时长20min。以下是本次课程的正文：智能体作为人类创造的工具，它是否足够智能、是否能够解决业务问题是我们在使用之前必须思考的问题。如果能够在使用之前评估智能体的能力水平，那么我们在使用过程中能获得什么结果就有一个初步的预期，这对于我们评估智能体投入的ROI是一个科学的参考。本节课我们就聚焦在评估智能体能力这一主题上，系统地讲解从哪些维度、有哪些方法评估智能体的能力。目前大模型有很多榜单都可以评估LLM的能力，不同的榜单从不同维度（逻辑推理、多轮对话、数学能力等）进行评估，智能体也是类似的，可以从各种维 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博