专栏名称: 深度学习自然语言处理

一个从大三就接触NLP的小小NLPer，本公众号每天记录自己的一点一滴，每篇文章最后也有托福单词等新知识，学技术同时，也一点一滴积累额外的知识。期待与你在知识的殿堂与你相遇！

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

EMNLP2024 | 解锁Apple Intelligence：用AppBench一键评测你的手机智能

深度学习自然语言处理 · 公众号 · · 2024-10-29 23:53

文章预览

这篇论文介绍了AppBench，一个评估大型语言模型在复杂用户指令下规划和执行来自多个应用的多项API的新基准。论文: AppBench: Planning of Multiple APIs from Various APPs for Complex User Instruction - EMNLP2024 链接: https://arxiv.org/pdf/2410.19743 作者：王鸿儒港中文在读PhD 主页： https://rulegreen.github.io 研究背景研究问题：这篇文章要解决的问题是如何评估大型语言模型（LLMs）在复杂用户指令下规划和执行来自不同来源的多个API的能力。具体来说，研究了两个主要挑战：图结构和权限约束。研究难点：该问题的研究难点包括：图结构：一些API可以独立执行，而另一些则需要依次执行，形成类似图的执行顺序。权限约束：需要确定每个API调用的授权来源。相关工作：该问题的研究相关工作有： API调用评估：如API-Bank和ToolBench等，主要关注单次或有限参数的API调用。语 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

旁门左道PPT · 小米年报发布！PPT图表上这根曲线，价值不菲...

9 小时前

旁门左道PPT · 蜜雪冰城又爆丑闻！但这PPT设计，真不输喜茶！

2 天前

秋叶PPT · WPS这4个超赞小技巧，Excel用户看了都眼红！

2 天前

旁门左道PPT · AI是帮你提效的，不是张张嘴，就能帮你完成工作的。昨天，我做了一场Deepseek实战专题直播课，跟很多朋友分享了，我们公司是如何借助AI工具，来提效的。下周会剪辑上线，所有旁友圈全阶PPT会员们，都可以免费看。另外，还有件事儿，我们去年上新的150页逻辑框架汇报PPT模板，从150页更新到了200页，如果你之前订阅了这份模板，新增部分依旧可以免费获取。当然，会员朋友们，也可以免费下载。点此了解这份超6000人订阅的爆款汇报模板，职场人必备!

3 天前

芋道源码 · 企业级消息推送架构设计，太强了！

9 月前

壹心理 · 遇到有这1个特征的人，不管什么关系，真心建议你：当断则断！

3 周前