|
审核中 AI for Research · 公众号 · · 1 月前 · 访问文章快照 |
|
审核中 AI for Research · 公众号 · · 1 月前 · 访问文章快照 |
|
HiFiVFS:高保真度视频换脸技术!2位层判别KV缓存实现大模型推理的极限 | 基于蒙特卡洛树搜索的高级自动化推理范式.... AI for Research · 公众号 · · 1 月前 · 访问文章快照 |
|
审核中 AI for Research · 公众号 · · 1 月前 · 访问文章快照 |
|
艾伦研究所发布最新TULU3:推动开放语言模型后训练前沿!反馈驱动的小型语言模型的数学推理能力提升研究.... AI for Research · 公众号 · · 1 月前 · 访问文章快照 |
|
Marco-O1:面向开放式解决方案的开放推理模型 | 从“愚蠢”问题中学习提高大模型性能,但效果有限.... AI for Research · 公众号 · · 2 月前 · 访问文章快照 |
|
模型剪枝后的训练规模定律研究 | LLaVA-o1:让视觉语言模型逐步推理 | Xmodel-1.5:一种百亿参数的多语种大模型 AI for Research · 公众号 · · 2 月前 · 访问文章快照 |
|
模型预测:幻觉与模态崩溃之间的权衡 | 腾讯发布Spider:任意到多模态大模型 | 有限数据下的微调语言模型的实用指南.... AI for Research · 公众号 · · 2 月前 · 访问文章快照 |
|
MikuDance: 混合动力动画系统 | FP8与BF16训练在大模型中的权衡 | 利用强化学习微调大模型突破限制... AI for Research · 公众号 · · 2 月前 · 访问文章快照 |
|
通过学习动态揭示LLM推理中的泛化能力 | 大模型训练数据的调查报告 | 有效且精确的提示优化:记忆中例子的好处.... AI for Research · 公众号 · · 2 月前 · 访问文章快照 |
|
GPT4o商业微调真的融入了新知识?Wikipedia的质量如何?Fox-1技术报告.... AI for Research · 公众号 · · 2 月前 · 访问文章快照 |
|
实现Kaggle大师级水平的自动数据科学代理Agent来了!RuAG:规则增强生成在大模型中的应用.... AI for Research · 公众号 · · 2 月前 · 访问文章快照 |
|
大模型训练的改进条件和预训练策略!自Logits进化解码法:提高大模型的事实性... AI for Research · 公众号 · · 2 月前 · 访问文章快照 |
|
腾讯混元宣布开源2个大模型!Meta发布带隐藏结构的规模定律研究.... AI for Research · 公众号 · · 2 月前 · 访问文章快照 |
|
字节发布最新AR研究:随机自回归视觉生成技术!GameGen-X:互动式开放世界游戏视频生成 .... AI for Research · 公众号 · · 2 月前 · 访问文章快照 |
|
大模型在逻辑推理中是否依赖记忆力?SciPIP: 基于大模型的科学论文创意生成器.... AI for Research · 公众号 · · 2 月前 · 访问文章快照 |