专栏名称: 机器学习社区
公众号后台回复:加群,参与技术讨论,专注前沿人工智能、机器学习、Python开发
今天看啥  ›  专栏  ›  机器学习社区

行业落地分享:大模型 RAG 难点与创新应用

机器学习社区  · 公众号  ·  · 2024-09-12 08:12
    

文章预览

↓ 推荐关注↓ 与常规的系统化内容分享不同,我们今天将聚焦于那些在实践中发现的难点和创新应用。我们相信,这些真实的案例和经验,能够给大家带来不同角度的思考和启发。 难点:文件解析 在落地实施中,我们遇到的第一个难点是文件解析。我们从今年年初开始,在许多企业的落地实施中发现,尽管我们自信能够解析大多数文件,但在实践中,我们遇到了很多我们甚至从未见过的文件类型。 在文件解析的挑战中,老旧文件的解析尤其突出。我们发现,尽管市面上的许多软件声称支持DOC格式,但它们往往不支持DOCX,这在国企和一些特定场景中非常常见。我们遇到了一些不完整的文件,这些文件的解析对我们来说是一个必须大力解决的问题。 难点:PDF 表格解析 另一个挑战是PDF表格的解析,这在金融行业、标准化工业领域等是非常刚需的。 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览