今天看啥  ›  专栏  ›  开放知识图谱

论文浅尝 | CABINET: 基于内容相关性的表格问答降噪(ICLR2024)

开放知识图谱  · 公众号  ·  · 2024-07-31 19:40

文章预览

笔记整理:曲晏林,天津大学硕士,研究方向为大模型 论文链接:https://arxiv.org/html/2402.01155 发表会议:ICLR2024 1. 动机 通常,只有少数单元格包含所需的信息, 不相关的表格数据充当分散的信息或噪声,导致性能次优。在大型表中,由于存在更多的数据,性能下降会进一步放大。 DATER 是最先进的表格 QA 方法之一, 其 将表格分解为更简单的子表格,其中包含通过向基于 GPT-3 的 Codex 提供上下文示例来回答问题所需的信息。这种以问题为条件的表格分解是次优的,因为如果没有选择相关信息,后续的 QA 模型无法纠正分解过程中产生的错误。为了减轻这种情况, 本文 提出了 CABINET( 基于内容相关性的表问答噪声降低 ) ,根据与问题的相关性对不同表部分进行加权,而不明确删除任何内容。 2. 贡献 (1) 提出了一种无监督方法,评估表格内容与输入问题 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览