文章预览
1. 引言 在数据科学领域,处理表格数据的任务通常面临着复杂的挑战,这些挑战需要采用精细化的问题解决方法。随着大型语言模型(LLMs)的快速发展,自动化数据科学逐渐成为可能。现有的研究表明,基于LLM的代理在数据领域展现出了巨大的潜力,能够自动理解、分析和处理数据,从而促进数据科学的民主化和广泛应用。然而,当前的研究在解决复杂数据科学问题方面仍存在显著不足。 许多研究仅限于简单的单步数据分析任务,远未达到数据科学实际应用场景的复杂性。此外,其他研究依赖于预构建的知识库,这提高了使用门槛,并限制了解决方案的灵活性和适应性。更重要的是,当前的研究过于关注提高任务完成率和优化性能指标,而忽视了在逻辑复杂的数据科学任务中,决策过程的可解释性和透明性。这种忽视不仅影响了用户对解决方案
………………………………