专栏名称: 专知
专知,为人工智能从业者服务,提供专业可信的人工智能知识与技术服务,让认知协作更快更好!
目录
相关文章推荐
今天看啥  ›  专栏  ›  专知

【CMU博士论文】通过可解释的层级操作实现基础自然语言生成

专知  · 公众号  ·  · 2024-07-25 14:00
    

文章预览

近年来,自然语言生成的许多工作依赖于深度学习,通常使用带有软注意机制的神经网络从数据中选择显著方面,然后构建流畅的自然语言文本。然而,在对数据的自然描述中,人类通常会提到更高级别的模式,这可能需要对数据进行复杂的计算。在许多情况下,仅使用软注意机制的神经模型难以提取这些模式。此外,用户可能会发现这些模型难以解释和控制。在本论文中,我提出了一种通过在数据和文本上引入某些类型的离散层级操作的方法,以实现基础自然语言生成。与仅使用注意力机制相比,这种层级操作可以更好地对数据中的复杂模式建模,揭示可解释的中间计算,并实现可控的生成。 在论文的前半部分,我将讨论在不同的基础自然语言生成任务中向神经模型添加特定的离散层级操作,如图像和表格标题生成、对话响应生成以及构建多跳 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览