文章预览
今天分享一篇来自南洋理工的一篇文章《Large Language Models for Automated Open-domain Scientific Hypotheses Discovery》。本研究的目标是探索如何使用大型语言模型,尤其是GPT-4, 来自动发现科学假设 。目前假设性归纳研究的局限性在于使用的数据不是原始网络语料库,而是手动选择后的句子,导致了来源较为封闭;同时,现有的假设标注大多是常识性知识,任务挑战性不足。本文提 出了首个针对社会科学学术假设发现的自然语言处理(NLP)数据集 ,该数据集包含了50篇最新发布于顶级社会科学期刊的论文,以及发展这些论文中假设所必需的原始网络语料库。 同时提出了一个MooSE框架,验证了利用GPT4构建的多Agent系统直接从web raw corpus自动发现科学假设的可行性。 • Title: Large Language Models for Automated Open-domain Scientific Hypotheses Discovery • URL: https://arxiv.org/abs/
………………………………