主要观点总结
本文主要介绍了两个工作:一是大模型的进展回顾,包括具身智能、大模型用于数据工程、多模态进展等;二是知识图谱与RAG结合用于代码生成。文章详细描述了这两个工作的核心内容和关键点,包括大模型的开源进展、知识图谱的构建过程以及其在代码生成中的应用等。
关键观点总结
关键观点1: 大模型的进展回顾
文章回顾了大模型的进展,包括具身智能、大模型用于数据工程、多模态进展等方面,介绍了相关的开源项目和前沿论文。
关键观点2: 知识图谱与RAG结合用于代码生成
文章介绍了知识图谱与RAG结合在代码生成中的应用,详细描述了知识图谱的构建过程,包括编程知识图(PKG)的生成、检索阶段、AST分析和语义相似性检查等。同时,也介绍了代码生成过程中的树修剪和重排序机制。
文章预览
转载公众号 | 老刘说NLP 本文主要讲两个工作,一 个是大模型进展回顾,还是可以看到,很多应用端的多模态大模型、一些总结性的报告陆续还在推进 ; 此外,另一个是知识图谱与RAG结合用于代码生成,核心在于知识图谱的构建。 一、大模型进展回顾 我们先来看看一些关于大模型的进展回顾,主要跟进开源进展以及一些前沿性的论文思路。 1、 关于具身智能进展 ,具身智能入门指南: https://github.com/TianxingChen/Embodied-AI-Guide 2、 关于大模型用于数据工程 ,DataExpert 数据工程资料库: https://github.com/DataExpert-io/llm-driven-data-engineering 3、 大模型开源进展 ,Meta发布适用于移动设备的量化Llama 3.2 1B和3B模型,https://ai.meta.com/blog/meta-llama-quantized-lightweight-models/,https://huggingface.co/meta-llama 4、 多模态进展 ,https://github.com/THUDM/GLM-4-Voice,多模态端到端,直接理解和
………………………………