文章预览
研究机构LAION的几位作者以「爱丽丝梦游仙境」为启发涉及了一系列简单的推理问题,揭示了LLM基准测试的盲区。正常人看起来再明显不过的漏洞问题,却是大模型们过不去的坎。 ———— / BEGIN / ——— — “写遗嘱的时候错过了deadline怎么办?” “怀念过去是不是在时间的长河里刻舟求剑?” “英语听力考试总是听到两个人在广播里唠嗑,怎么把那两个干扰我做题的人赶走?” 以上这些饱含哲学但好像又莫名其妙的问题,出自百度贴吧“弱智吧”2023年年度精选,看似毫无逻辑,但仔细一想好像确实又有点道理。 就像天才吧里没有天才,弱智吧也不收真弱智。 然后,它就成为了训练AI中文能力的最佳素材。 前几天看到一篇中科院牵头的论文,简单来说就是精选了一些中文互联网的语料库喂给各种零一万物的Yi大模型,让它们更加熟悉中文语境
………………………………