|
非Transformer架构站起来了!首个纯无注意力大模型,超越开源巨头Llama 3.1 深度图学习与大模型LLM · 公众号 · · 2 月前 · 访问文章快照 |
|
WWW2024 || 探讨通过软提示提升大模型在图学习任务中的表现 深度图学习与大模型LLM · 公众号 · · 3 月前 · 访问文章快照 |
|
矩阵很难理解,但换个视角或许会不一样! 深度图学习与大模型LLM · 公众号 · · 3 月前 · 访问文章快照 |
|
大模型对语言有自己的理解!MIT论文揭示大模型“思维过程” | ICML 24 深度图学习与大模型LLM · 公众号 · · 3 月前 · 访问文章快照 |
|
KDD2024 | PolygonGNN: 多边形几何形状的表征学习 深度图学习与大模型LLM · 公众号 · · 3 月前 · 访问文章快照 |
|
SIGIR 2024 || GraphGPT: 将大模型与图结构数据对齐,以提高图学习模型的泛化能力 深度图学习与大模型LLM · 公众号 · · 3 月前 · 访问文章快照 |
|
ICML 2024 || FLEXTRON: 嵌套弹性结构的MOE 深度图学习与大模型LLM · 公众号 · · 3 月前 · 访问文章快照 |
|
EACL || 通过自然语言描述图结构并对大模型进行指令微调,来解决图机器学习任务 深度图学习与大模型LLM · 公众号 · · 3 月前 · 访问文章快照 |
|
ICML 2024 || COFT: 减少大模型对长文本的知识幻觉 深度图学习与大模型LLM · 公众号 · · 3 月前 · 访问文章快照 |
|
2024 || Q-GaLore: 16G内存训练LLaMA 7B! 深度图学习与大模型LLM · 公众号 · · 3 月前 · 访问文章快照 |
|
ICML 2024: LLaGA-解决图数据向LLM可理解格式转换的挑战,同时保持了LLM的通用性 深度图学习与大模型LLM · 公众号 · · 3 月前 · 访问文章快照 |
|
ICML 2024 || 图外部注意力机制捕捉图之间的关系 深度图学习与大模型LLM · 公众号 · · 3 月前 · 访问文章快照 |
|
一种树状结构状态空间模型GrootVL: 突破序列约束,实现了更强的表示能力 深度图学习与大模型LLM · 公众号 · 科技自媒体 · 3 月前 · 访问文章快照 |
|
ICML 2024 || qGOFT: 基于Givens旋转的正交微调 深度图学习与大模型LLM · 公众号 · · 3 月前 · 访问文章快照 |
|
经过多轮”自学”的AI在面对这些新问题时,表现反而更差! 深度图学习与大模型LLM · 公众号 · · 3 月前 · 访问文章快照 |
|
无需人工标注:SELF-GUIDE技术让语言模型自主微调 深度图学习与大模型LLM · 公众号 · · 3 月前 · 访问文章快照 |
|
KDD24 通用的多源空间点数据预测:以PM2.5预测为例 深度图学习与大模型LLM · 公众号 · · 3 月前 · 访问文章快照 |
|
深入探讨SSM模型在各种自然语言任务中的表现 深度图学习与大模型LLM · 公众号 · · 3 月前 · 访问文章快照 |
|
2024 || LOPA: Prompt调整卷土重来! 深度图学习与大模型LLM · 公众号 · · 3 月前 · 访问文章快照 |
|
Meta Llama 3.1 405B 正式发布 深度图学习与大模型LLM · 公众号 · · 3 月前 · 访问文章快照 |