专栏名称: 黄建同学
数码博主 超话主持人(ChatGPT超话) 头条文章作者 我的学习笔记,关注AI+新能源
今天看啥  ›  专栏  ›  黄建同学

看这个视频之前我直观上以为应该让LLM帮忙打1-100的分数,但-20250224235650

黄建同学  · 微博  · AI  · 2025-02-24 23:56
    

文章预览

2025-02-24 23:56 本条微博链接 看这个视频之前我直观上以为应该让LLM帮忙打1-100的分数,但实际上LLM更适合做分类的事情,比如评估的答案"对"或者"不对"。LLM很难理解1-100的分数值代表什么,特别是每次的评估过程还是单独执行的。上一次LLM打出的58分,和下一次LLM打出的59分,很难说谁更好。 吴恩达的《评估AI ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览