专栏名称: DatabriAI
创始人刘强出版过专著「推荐系统:算法、案例与大模型」、「构建企业级推荐系统」等。Databri AI聚焦金融、传统行业的数智化转型,提供咨询、培训、项目实施解决方案。过去3年服务过中国银联、中国移动、中盐、招商银行、广发银行等大客户。
今天看啥  ›  专栏  ›  DatabriAI

「大模型智能体」13|智能体的能力评估

DatabriAI  · 公众号  ·  · 2024-07-16 16:14

文章预览

你好,我是刘强。 本课程是关于大模型智能体的实战课程,包括原理、算法、应用场景、代码实战案例等,下表是本次课程的大纲。本课是第13节,讲解智能体的能力评估。本课约5000字,阅读时长20min。 以下是本次课程的正文: 智能体作为人类创造的工具,它是否足够智能、是否能够解决业务问题是我们在使用之前必须思考的问题。如果能够在使用之前评估智能体的能力水平,那么我们在使用过程中能获得什么结果就有一个初步的预期,这对于我们评估智能体投入的ROI是一个科学的参考。本节课我们就聚焦在评估智能体能力这一主题上,系统地讲解从哪些维度、有哪些方法评估智能体的能力。   目前大模型有很多榜单都可以评估LLM的能力,不同的榜单从不同维度(逻辑推理、多轮对话、数学能力等)进行评估,智能体也是类似的,可以从各种维 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览