文章预览
SMART-SLIC框架:旨在将 RAG 结合 向量存储 (Vector Stores)、 知识图谱 (Knowledge Graphs)和 张量分解 (Tensor Factorization)来增强 特定领域 的大型语言模型(LLMs)的性能。 SMART-SLIC系统框架 SMART-SLIC框架的关键组成部分和操作流程:包括构建特定领域的数据集、知识图谱本体论、向量存储以及检索增强生成(RAG)过程: A. 特定领域的数据集: 项目从由主题专家(SMEs)选定的核心文档开始,这些文档代表了想要构建数据集的特定领域。 利用SCOPUS、Semantic Scholar和OSTI等授权API,通过引用和参考文献网络扩展数据集。 为了保持核心数据集的中心质量和主题一致性,采用了几种修剪策略来删除与核心文档无关的文档。 B. 降维: 通过非负张量分解从数据集中提取潜在结构,使用T-ELF工具进行文档聚类,并自动确定最佳聚类数量。 C. 知识图谱本体论: 将T-ELF提
………………………………