|
对话AI科学家何晓冬老师:大模型时代的业务探索和个人发展 深度学习自然语言处理 · 公众号 · · 4 月前 · 访问文章快照 |
|
从零预训练LLAMA3的完整指南:一个文件,探索Scaling Law 深度学习自然语言处理 · 公众号 · · 4 月前 · 访问文章快照 |
|
为视觉语言多模态模型进行偏好优化 深度学习自然语言处理 · 公众号 · · 4 月前 · 访问文章快照 |
|
脆弱的不确定性:大模型的可信度如何被操控 深度学习自然语言处理 · 公众号 · · 4 月前 · 访问文章快照 |
|
谷歌重磅:告别RAG,长上下文的大语言模型无需检索增强! 深度学习自然语言处理 · 公众号 · · 4 月前 · 访问文章快照 |
|
NICE分享 | 知识斗地主:解析RAG大模型中复杂的知识冲突综述 深度学习自然语言处理 · 公众号 · · 4 月前 · 访问文章快照 |
|
不是H100租不起,而GPU混布更有性价比! 深度学习自然语言处理 · 公众号 · · 4 月前 · 访问文章快照 |
|
审核失败 深度学习自然语言处理 · 公众号 · · 4 月前 · 访问文章快照 |
|
深度解析RAG大模型知识冲突,清华西湖大学港中文联合发布 深度学习自然语言处理 · 公众号 · · 4 月前 · 访问文章快照 |
|
具身大模型研究综述 深度学习自然语言处理 · 公众号 · · 4 月前 · 访问文章快照 |
|
解决问题而非制造问题!GLM-4-AllTools API革新大模型使用体验 深度学习自然语言处理 · 公众号 · · 4 月前 · 访问文章快照 |
|
2024年6月118篇代码大模型论文最全整理 深度学习自然语言处理 · 公众号 · · 4 月前 · 访问文章快照 |
|
大模型上下文长度扩展中的检索增强技术简述 深度学习自然语言处理 · 公众号 · · 4 月前 · 访问文章快照 |
|
留言送书 | 清华汪玉教授团队:首部高效模型压缩与设计专著重磅上市 深度学习自然语言处理 · 公众号 · · 4 月前 · 访问文章快照 |
|
一步生成超过10个Tokens!! 无损模型解码加速最新工作 深度学习自然语言处理 · 公众号 · · 4 月前 · 访问文章快照 |
|
ACL 2024 |“我的回答是C": 在指令微调语言模型中,第一个token概率与文本答案不匹配 深度学习自然语言处理 · 公众号 · · 4 月前 · 访问文章快照 |
|
审核失败 深度学习自然语言处理 · 公众号 · · 4 月前 · 访问文章快照 |
|
NICE分享 | Transformer模型能否进行隐式的推理?一个关于Grokking和泛化的深入探索 深度学习自然语言处理 · 公众号 · · 4 月前 · 访问文章快照 |
|
从零训练的 1B 以下小模型汇总 深度学习自然语言处理 · 公众号 · · 4 月前 · 访问文章快照 |
|
NICE分享 | 如何加速大语言模型推理?万字长文综述大语言模型高效推理技术 深度学习自然语言处理 · 公众号 · · 4 月前 · 访问文章快照 |