|
关注者推荐:当模型在胡说的时候知道自己在胡说吗? SparksofAGI · 公众号 · · 1 月前 · 访问文章快照 |
|
微调真的导致了模型幻象吗? SparksofAGI · 公众号 · · 1 月前 · 访问文章快照 |
|
AGI 的最终挑战(一):AI for Math SparksofAGI · 公众号 · · 2 月前 · 访问文章快照 |
|
LayerSkip——新的训练与推理范式:层Dropout,早期退出机制与自投机解码结合 SparksofAGI · 公众号 · · 2 月前 · 访问文章快照 |
|
仿照计算机系统的权限概念,指令层级帮助大模型防范多种攻击 SparksofAGI · 公众号 · · 2 月前 · 访问文章快照 |
|
训练数据洗来洗去还是脏,能救吗?试试选择性语言建模,极大提高效率与性能 SparksofAGI · 公众号 · · 2 月前 · 访问文章快照 |
|
超强阵容!七大机构联合举办ACL 2024知识驱动自然语言处理研讨会征稿 SparksofAGI · 公众号 · · 2 月前 · 访问文章快照 |
|
长上下文语言模型实际有效的上下文到底有多长? SparksofAGI · 公众号 · · 2 月前 · 访问文章快照 |
|
大佬云集!ICML 2024 AI for Math Workshop 征稿和挑战赛启动~ SparksofAGI · 公众号 · · 2 月前 · 访问文章快照 |
|
涌现在连续度量下也会发生:从损失视角理解语言模型的涌现能力 SparksofAGI · 公众号 · · 2 月前 · 访问文章快照 |
|
LLM参数比你想象的更冗余:砍掉四分之一参数还能保持95%的性能 SparksofAGI · 公众号 · · 3 月前 · 访问文章快照 |
|
[ICLR2024]DQ-LoRe:一种选择上下文学习示例的简单有效方法(没有收Dairy Queen的钱) SparksofAGI · 公众号 · · 4 月前 · 访问文章快照 |
|
ARKS:利用主动检索策略增强大型语言模型 SparksofAGI · 公众号 · · 4 月前 · 访问文章快照 |
|
LLM研究实习机会:模型结构优化与创新,MoE, 模型剪枝与压缩,高效长序列建模等方向 SparksofAGI · 公众号 · · 4 月前 · 访问文章快照 |
|
大语言模型潜在地执行了多跳推理吗? SparksofAGI · 公众号 · · 4 月前 · 访问文章快照 |
|
无需prompting技巧,CoT在解码路径之中自然地显现出来 SparksofAGI · 公众号 · · 4 月前 · 访问文章快照 |
|
作者投稿|PROMST:一种自动化优化大语言模型在解决多步骤任务中的提示词框架 SparksofAGI · 公众号 · · 4 月前 · 访问文章快照 |
|
实习生招聘,新增大模型解决决策优化问题方向 SparksofAGI · 公众号 · · 4 月前 · 访问文章快照 |
|
BitDelta:你的微调可能只值一比特 SparksofAGI · 公众号 · · 4 月前 · 访问文章快照 |
|
大语言模型研究实习生招聘,启动!! SparksofAGI · 公众号 · · 5 月前 · 访问文章快照 |