|
单一目标足够!没有奖励示范的情况下,对比性强化学习能够产生涌现能力 | 智普发布CogVideoX,更大更强! AI for Research · 公众号 · · 3 月前 · 访问文章快照 |
|
理解大模型微调性能并估算成本 | 多衣装定制模型生成 | 代码嵌入中的预训练模型选择问题... AI for Research · 公众号 · 设计 科技媒体 · 3 月前 · 访问文章快照 |
|
本周大模型Top热门论文精选 —— 24年第32期 AI for Research · 公众号 · · 3 月前 · 访问文章快照 |
|
基于指令翻译的大模型对齐方法研究 | 让模型学会更精确地学习 | 大模型的开放域隐式格式控制 ... AI for Research · 公众号 · · 3 月前 · 访问文章快照 |
|
9天即完成预训练并超越sota,1.5-Pints 技术报告发布!关于直接偏好优化下模型泛化能力的研究 AI for Research · 公众号 · · 3 月前 · 访问文章快照 |
|
大模型中数据污染问题的缩放定律!全自动人体机器人初步研究 ... AI for Research · 公众号 · · 3 月前 · 访问文章快照 |
|
模型可以边听边说了!字节发布全双工建模LSLM!港科大发布突破1位限制的二进制大模型研究! AI for Research · 公众号 · · 3 月前 · 访问文章快照 |
|
只需预训练一次,获取各个尺寸的模型!Mamba综述来啦! AI for Research · 公众号 · · 3 月前 · 访问文章快照 |
|
Gemma 2B 技术报告上线,效果超越10倍尺寸模型!使用最小量的合成数据,超越传统大型数据集预训练效果! AI for Research · 公众号 · · 3 月前 · 访问文章快照 |
|
苹果发布手机基础模型报告!LLM生成代码在Leetcode上的性能研究 | 近一年来大模型在低资源语言上的性能 AI for Research · 公众号 · · 3 月前 · 访问文章快照 |
|
缓解大模型微调中的遗忘问题 | 小学数学和隐藏的推理过程研究 | 多模态大模型联合指令微调 AI for Research · 公众号 · · 3 月前 · 访问文章快照 |
|
英伟达发布AutoScale:自动预测大模型训练的最优计算数据组合 | 哪些预训练因素影响LLM在因果发现任务中的性能? AI for Research · 公众号 · · 3 月前 · 访问文章快照 |
|
如何通过继续训练及合成数据有效提升大模型在特定领域能力同时维持其通用性能?通过历史一致性提高泛化能力.... AI for Research · 公众号 · · 3 月前 · 访问文章快照 |
|
本周大模型Top热门论文精选 —— 24年第30期 AI for Research · 公众号 · · 3 月前 · 访问文章快照 |
|
大模型超长文本KV-Cache存储消费级优化方法综述!解密大模型中的逐字记忆现象.... AI for Research · 公众号 · · 4 月前 · 访问文章快照 |
|
持续预训练关键混合比例预测:CMR缩放定律!揭秘in-context学习:理解其工作机制的坐标系统... AI for Research · 公众号 · · 4 月前 · 访问文章快照 |
|
Llama3发布405B技术报告!大模型对齐技术全调研:RLHF、RLAIF、PPO、DPO | 通过分词器间接了解预训练数据 AI for Research · 公众号 · · 4 月前 · 访问文章快照 |
|
模型记忆力减少是模型能力涌现的前提?40万Token上下文!无需长度外推技术也能解决上下文长度限制问题了 AI for Research · 公众号 · · 4 月前 · 访问文章快照 |
|
Phi-3 发布最新后训练安全对齐研究 | 大模型在医学领域特定任务预训练与通用对比 | 英伟达发布Llama3-ChatQA2 AI for Research · 公众号 · · 4 月前 · 访问文章快照 |
|
本周大模型Top热门论文精选 —— 24年第29期 AI for Research · 公众号 · · 4 月前 · 访问文章快照 |