|
无矩阵乘法LLM - 一个来自线性Transformer的视角 深度学习自然语言处理 · 公众号 · · 3 月前 · 访问文章快照 |
|
从ACL 2024录用论文看混合专家模型(MoE)最新研究进展 深度学习自然语言处理 · 公众号 · · 3 月前 · 访问文章快照 |
|
一文搞懂SFT、RLHF、DPO、IFT 深度学习自然语言处理 · 公众号 · · 3 月前 · 访问文章快照 |
|
百篇代码大模型论文最全整理之7月篇 深度学习自然语言处理 · 公众号 · · 3 月前 · 访问文章快照 |
|
大模型分不清 9.9 与 9.11 谁大,那 Embedding 模型呢? 深度学习自然语言处理 · 公众号 · · 3 月前 · 访问文章快照 |
|
一个半月的LLM预训练、微调(SFT/RW/RLHF/DPO)、推理和部署优化、RAG/Agent等最高效路线图 深度学习自然语言处理 · 公众号 · · 3 月前 · 访问文章快照 |
|
大模型Infra发展路径盘点 深度学习自然语言处理 · 公众号 · · 3 月前 · 访问文章快照 |
|
大模型Infra发展路径盘点 深度学习自然语言处理 · 公众号 · · 3 月前 · 访问文章快照 |
|
语言模型如何确保无害性?通过推理过程中的隐状态解析越狱和安全对齐 深度学习自然语言处理 · 公众号 · · 3 月前 · 访问文章快照 |
|
可信大模型 Reliable LLM(一):生成大模型的置信度估计与评测 深度学习自然语言处理 · 公众号 · · 3 月前 · 访问文章快照 |
|
如何将阿里千问大模型Qwen部署到手机上?实战演示(下篇) 深度学习自然语言处理 · 公众号 · · 4 月前 · 访问文章快照 |
|
如何将阿里千问大模型Qwen部署到手机上?环境安装及其配置(上篇) 深度学习自然语言处理 · 公众号 · · 4 月前 · 访问文章快照 |
|
RNN卷土重来:基于门控记忆槽的线性注意力机制 深度学习自然语言处理 · 公众号 · · 4 月前 · 访问文章快照 |
|
本科生0基础1.5个月拿到LLM高薪岗位近40w学习路径图 深度学习自然语言处理 · 公众号 · · 4 月前 · 访问文章快照 |
|
大语言模型越狱攻击综述 深度学习自然语言处理 · 公众号 · · 4 月前 · 访问文章快照 |
|
检索增强生成(RAG)技术方法流程最佳实践实验探索 深度学习自然语言处理 · 公众号 · · 4 月前 · 访问文章快照 |
|
论文速递 | 2024 ACL 句子级别的结构化情感分析 深度学习自然语言处理 · 公众号 · · 4 月前 · 访问文章快照 |
|
各位,请入局AI大模型,现在!立刻!马上!! 深度学习自然语言处理 · 公众号 · · 4 月前 · 访问文章快照 |
|
大型视觉语言模型攻击综述:资源、进展与未来趋势 深度学习自然语言处理 · 公众号 · · 4 月前 · 访问文章快照 |
|
大模型+小模型协同处理跨文档理解任务,成本更低,性能更高 深度学习自然语言处理 · 公众号 · · 4 月前 · 访问文章快照 |