专栏名称: dotNET跨平台
专注于.NET Core的技术传播。在这里你可以谈微软.NET,Mono的跨平台开发技术。在这里可以让你的.NET项目有新的思路,不局限于微软的技术栈,横跨Windows,Linux 主流平台
今天看啥  ›  专栏  ›  dotNET跨平台

让我们用大模型们继续做题看他们能做对多少

dotNET跨平台  · 公众号  ·  · 2024-08-26 08:00

文章预览

对于小白来说,面对“如何让大语言模型做题”这一话题,脑海中呈现出的便是用户自己一题一题地输入给LLMs。然而,对于程序员来说,该如何让它自动地读取题库、进而测评呢?谭亲怡同学借这篇稿子具体介绍了如何将LLMs、Azure OpenAI服务和GaoKao-Bench项目配合使用,以测评不同大语言模型针对不同学科的做题能力。这里的题是指高考题,高考题啊,评测结果说老实话让我大吃一惊! 以下为评测方式的说明: 调用Azure OpenAI服务 完整流程可至Tutorial.pdf中查看 我们需要使用以下命令安装 OpenAI Python 客户端库 pip install openai 注册Azure AI Studio账号,转到Azure AI Studio中的 资源和密钥 ,检索 api key 以及 endpoint (两个必要参数),使得后续能成功调用Azure OpenAI 代码修改 以下将逐步展示本项目修改原代码的部分,完整流程可至Tutorial.pdf中查看 在vscode中打开GaoKa ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览