|
本周大模型Top热门论文精选 —— 24年第34期 AI for Research · 公众号 · · 8 月前 · 访问文章快照 |
|
字节发布统一多模态模型Show-o!苹果发布PDS复杂算术任务精度爆涨近20%!Jamba-1.5无损支持256K上下文长度 AI for Research · 公众号 · · 8 月前 · 访问文章快照 |
|
微软发布自动数据集构建方法!大模型性的能突变分析!通过并行解码扩展大模型的上下文长度 AI for Research · 公众号 · · 8 月前 · 访问文章快照 |
|
大模型在代码评估方面如何成为好裁判? 代码预训练的影响因素:编码或非编码? 大模型能否遵循系统消息? AI for Research · 公众号 · · 8 月前 · 访问文章快照 |
|
信息论揭示“涌现”能力是一种突现的相变!大模型的性能定律研究,可直接预测LLMs的MMLU得分! AI for Research · 公众号 · · 8 月前 · 访问文章快照 |
|
国科大发布自动小说创作方法Ex3!BLIP-3 多模态大模型家族公布!大模型可能并不关心你说的是什么:提示格式胜过描述.... AI for Research · 公众号 · · 8 月前 · 访问文章快照 |
|
AI for Research · 公众号 · · 8 月前 · 访问文章快照 |
|
谷歌Imagen-3论文发布!最强智能体Agent Q发布技术报告!大模型预训练与微调关系的分析.... AI for Research · 公众号 · · 8 月前 · 访问文章快照 |
|
单一目标足够!没有奖励示范的情况下,对比性强化学习能够产生涌现能力 | 智普发布CogVideoX,更大更强! AI for Research · 公众号 · · 8 月前 · 访问文章快照 |
|
理解大模型微调性能并估算成本 | 多衣装定制模型生成 | 代码嵌入中的预训练模型选择问题... AI for Research · 公众号 · 设计 科技媒体 · 8 月前 · 访问文章快照 |
|
本周大模型Top热门论文精选 —— 24年第32期 AI for Research · 公众号 · · 8 月前 · 访问文章快照 |
|
基于指令翻译的大模型对齐方法研究 | 让模型学会更精确地学习 | 大模型的开放域隐式格式控制 ... AI for Research · 公众号 · · 8 月前 · 访问文章快照 |
|
9天即完成预训练并超越sota,1.5-Pints 技术报告发布!关于直接偏好优化下模型泛化能力的研究 AI for Research · 公众号 · · 8 月前 · 访问文章快照 |
|
大模型中数据污染问题的缩放定律!全自动人体机器人初步研究 ... AI for Research · 公众号 · · 8 月前 · 访问文章快照 |
|
模型可以边听边说了!字节发布全双工建模LSLM!港科大发布突破1位限制的二进制大模型研究! AI for Research · 公众号 · · 8 月前 · 访问文章快照 |
|
只需预训练一次,获取各个尺寸的模型!Mamba综述来啦! AI for Research · 公众号 · · 8 月前 · 访问文章快照 |
|
Gemma 2B 技术报告上线,效果超越10倍尺寸模型!使用最小量的合成数据,超越传统大型数据集预训练效果! AI for Research · 公众号 · · 9 月前 · 访问文章快照 |
|
苹果发布手机基础模型报告!LLM生成代码在Leetcode上的性能研究 | 近一年来大模型在低资源语言上的性能 AI for Research · 公众号 · · 9 月前 · 访问文章快照 |
|
缓解大模型微调中的遗忘问题 | 小学数学和隐藏的推理过程研究 | 多模态大模型联合指令微调 AI for Research · 公众号 · · 9 月前 · 访问文章快照 |