专栏名称: 财联社AI daily
财联社及科创板日报旗下产品 ,聚焦TMT领域,更独家、更深度。
今天看啥  ›  专栏  ›  财联社AI daily

热搜!大模型翻车《歌手》排名

财联社AI daily  · 公众号  ·  · 2024-07-16 18:46

文章预览

记者发现,不少大模型也坚定相信13.11%大于13.8% 文|黄心怡 近日,在最新一期的《歌手》节目中,孙楠与外国歌手的微小分数差异,引发了网友关于13.8%和13.11%谁大谁小的争论。 有网友竟给出“13.11%大于13.8%”的错误答案,而记者发现,不少大模型也与部分网友一样,弄不清这个小学四年级的知识点 。 在《科创板日报》记者的测试中,Kimi、智谱清言、通义等大模型应用纷纷翻车,而百度文心一言、字节豆包则守住了大模型的尊严。 记者提问后,Kimi称: 13.11大于13.8。 在进行了一番引导后,包括询问13.11减去13.8的答案为负数,如何解答其意义,Kimi才给出了正确回答。 记者又多次询问Kimi 13.11和13.8谁大,Kimi有时能回答正确。从错误的回答来看,Kimi与部分网友一样,把13.8误以为13.08,所以得出了13.11更大的结果。 记者询问了Kimi是否知道湖南卫视《歌 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览