专栏名称: 专知
专知,为人工智能从业者服务,提供专业可信的人工智能知识与技术服务,让认知协作更快更好!
今天看啥  ›  专栏  ›  专知

【NeurIPS 2024】基于大型语言模型的三层学习用于时间序列OOD泛化

专知  · 公众号  ·  · 2024-10-14 12:00
    

文章预览

在机器学习中,分布外(Out-of-Distribution, OOD)泛化是一个快速发展的研究领域。其主要目标是增强机器学习模型在面对新的、未见过的、甚至是具有潜在对抗性的数据时的适应性和韧性,这些数据与模型的原始训练数据集存在显著差异。本文通过预训练的大型语言模型(LLMs)研究时间序列的OOD泛化。我们首先提出了一个用于时间序列OOD泛化的新颖三层学习框架,称为TTSO(Tri-level learning framework for Time Series OOD generalization),该框架同时考虑样本级和组级的不确定性。该框架为构建和分析OOD泛化问题提供了一种新的理论视角。此外,我们还进行了理论分析,以证明该方法的合理性。随后,我们开发了一种分层定位算法,以适应这一三层优化问题,并从理论上证明了所提出算法的收敛性保证。我们的分析还揭示了获得ϵ-驻点的迭代复杂度被限制在O(1/ϵ² ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览