专栏名称: 数据派THU
本订阅号是“THU数据派”的姊妹账号,致力于传播大数据价值、培养数据思维。
今天看啥  ›  专栏  ›  数据派THU

干货 | 石化政策分析模型开发

数据派THU  · 公众号  · 大数据  · 2024-09-22 17:00
    

主要观点总结

该文章介绍了中国石化工程建设有限公司与清华大学软件学院共建的研究生专业实践基地的同学们在2024年夏季所做的期末答辩汇报。他们展示了在石化政策分析模型开发方面的成果,包括项目背景、任务、计划、技术路线、系统展示和参考文献等方面。文章详细阐述了他们如何综合数据收集、模型构建和可视化输出等多个模块开发政策分析模型,以及如何运用大模型进行政策分析,包括关键词提取、政策解读文件的生成等。此外,文章还介绍了他们如何解决政策文件的层级多、数量多、更新快等问题,并展示了他们的工作成果和未来的工作展望。

关键观点总结

关键观点1: 政策分析的重要性和应用场景

国家政策对石化及新能源领域项目发展具有重要影响,企业需要及时掌握国家、地方和行业政策的最新动态。政策分析有助于企业在政策投资前进行全面的风险评估和收益预测。

关键观点2: 项目背景和目标

当前业务痛点包括政策层级多、数量多、更新快,内容中指标多、要求高,人工检索效率低,企业当前对政策的分析实力不足。项目旨在开发一个石化政策分析模型,以提供准确、及时的信息支持决策制定和规划。

关键观点3: 项目任务和计划

任务包括关键词提取、关键内容提取、生成政策解读文件、政策分析等。项目计划包括部署大模型、统计分析政策文件数量、设计提示词处理政策文件、使用Fast GPT搭建工作流和最终交付的系统等。

关键观点4: 技术路线和组织分工

技术路线包括政策文件转化为政策文本、提取关键词、设计提示词、大模型生成总结文本和分析报告等。组织分工包括代码编写、系统架构设计与部署、方法调研、提示词调研和设计、关键词提取和生成框架设计等。

关键观点5: 解决方案和创新点

使用Paddle OCR处理复杂的政策文件结构,包括文字块、表格、图片等。设计迭代式的提示词设计方法,通过不断询问大模型的改进方法和评分来提升最终结果。将问答生成的结果转成思维导图,使结果更容易读懂。

关键观点6: 未来工作展望

对表格进行更细分的处理,使用图片输入模型生成描述性文本,增加效果。探索更多大模型的使用方法。将提示词与需求更紧密地结合,提升总结文件与实际政策分析需求的效果。使用政策文本构建知识库,回答更多元化的问题。


文章预览

以下内容整理自2024年夏季学期《大数据实践课》中国石化工程建设有限公司与清华大学软件学院共建的研究生专业实践基地的同学们所做的期末答辩汇报。   大家好,我们是石化政策模分析模型开发小组,我们的分享将会从项目背景、项目任务、项目计划、技术路线和系统展示、参考文献展开。   因为国家地方和行业政策对石化及新能源领域的项目发展具有重要影响。所以,中国石化建设有工程建设有限公司工程咨询部组建了政策分析小组。政策会影响到市场准入的标准和监管要求,政策也可以促进石化及新能源产业链的协同发展,通过优化产业布局,推动产业集聚和整合能源。政策还会对其鼓励发展的领域提供一些优惠措施。在环保和可持续发展方面,政策对石化及新能源项目的影响也尤为显著,会制定严格的环保和环保标准和要求,推动企 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览