专栏名称: AI大模型学习基地
人工智能AIGC行业探索分享,包括相关技术分享和资讯分享,以及相关商务洽谈合作。
今天看啥  ›  专栏  ›  AI大模型学习基地

如何让语言模型自己学会使用工具

AI大模型学习基地  · 公众号  ·  · 2024-07-13 00:32

文章预览

大型语言模型在 NLP 任务中表现优异,但在算术和事实查找等功能上不如小型专用模型。为此,论文提出了 Toolformer 模型,它能自学使用外部工具,如计算器、问答系统等,以提升在零样本或少量样本设置下的性能。 Toolformer 通过自我监督学习工具使用,无需大量标注,显著提升了零样本性能,同时保持语言建模能力,实现了动态工具调用以补充其功能不足。 1 Toolformer的构建 (1)模型训练:     Toolformer基于预训练的GPT-J模型,通过微调使得模型学会何时、如何及为何调用特定的API,并且如何将API返回的结果融入到未来的预测中。这个过程是自我监督的,仅需少量的API调用示例进行学习。 (2)API调用学习:     Toolformer被设计为能判断应该调用哪个API,何时调用,传递哪些参数,以及如何利用API返回的信息来改善后续的token预测。模型在训练过程 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览