专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
今天看啥  ›  专栏  ›  爱可可-爱生活

【[43星]ComplexFuncBench:复杂函数调用的终极-20250126140002

爱可可-爱生活  · 微博  · AI  · 2025-01-26 14:00
    

文章预览

2025-01-26 14:00 本条微博链接 【[43星]ComplexFuncBench:复杂函数调用的终极测试基准!它能解决复杂场景下函数调用的评估难题,帮助开发者优化模型性能。亮点:1. 包含1000个复杂函数调用样本,覆盖多步调用、参数推理等场景;2. 支持长参数(超500 tokens)和128k长文本上下文;3. 提供自动化评估框架,快速验证模型效果】 'Complex Function Calling Benchmark: Exploring Multi-Step and Constrained Function Calling under Long-Context Scenario' GitHub: githu ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览