|
复旦发布“弱到强的推理方法”:AI能够自学,比人类更好推理! 词汇缩放定律:模型越大词汇量也应越大! AI for Research · 公众号 · · 4 月前 · 访问文章快照 |
|
撸羊毛的机会来了!上海AI实验室发布书生大模型免费学习实战计划,A100免费用~ AI for Research · 公众号 · · 4 月前 · 访问文章快照 |
|
8卡实现100万长度7B模型高效训练!Transformer什么情况下能够进行组合泛化? AI for Research · 公众号 · · 4 月前 · 访问文章快照 |
|
阿里同时发布Qwen2 、Qwen2-Audio技术报告!WildVidFit:虚拟试穿视频生成... AI for Research · 公众号 · · 4 月前 · 访问文章快照 |
|
复旦发布Bora:生物医学通用视频生成模型 | H2O-Danube 3 发布技术报告.... AI for Research · 公众号 · · 4 月前 · 访问文章快照 |
|
本周大模型Top热门论文精选 —— 24年第28期 AI for Research · 公众号 · · 4 月前 · 访问文章快照 |
|
大模型中数学推理的数据缩放定律!Flash-Attention升级至V3版,H100 GPU 速度提升2倍 AI for Research · 公众号 · · 4 月前 · 访问文章快照 |
|
大模型预训练加速:桶预训练就是你所需的一切!模型能力涌现本质是因为训练时的数据差异造成的?英伟达发布大模型持续预训练攻略 AI for Research · 公众号 · · 4 月前 · 访问文章快照 |
|
数据无处不在:预训练数据集构建指南 | 熵定律:数据压缩与大模型性能的关系.... AI for Research · 公众号 · · 4 月前 · 访问文章快照 |
|
代码大模型的内部工作原理探索:早期的层更像在“思考”?大模型训练后的自我改进反转现象研究... AI for Research · 公众号 · · 4 月前 · 访问文章快照 |
|
阿里发布FunAudioLLM:语音理解与生成基础模型!Anthropic发布最新研究:语言模型迭代自优化过程的“奖励欺骗”现象 AI for Research · 公众号 · · 4 月前 · 访问文章快照 |
|
本周大模型Top热门论文精选 —— 24年第27期 AI for Research · 公众号 · · 4 月前 · 访问文章快照 |
|
1万亿参数!Tele-FLM系列模型中学到的经验分享... AI for Research · 公众号 · · 4 月前 · 访问文章快照 |
|
大模型是否真的有自我意识?|规模定律再探索:最优的模型和数据大小之间关系应该是线性?如何在几分钟内移除Llama 3的安全锁? AI for Research · 公众号 · · 4 月前 · 访问文章快照 |
|
苹果发布RLAIF最新研究:改进轻量级LLM代码生成能力 | 大模型的顺序指令跟随能力..... AI for Research · 公众号 · · 4 月前 · 访问文章快照 |
|
本周大模型Top热门论文精选 —— 24年第26期 AI for Research · 公众号 · · 4 月前 · 访问文章快照 |
|
从模型训练时间预估最终模型loss, DeepMind 发布最新时间规模定律!适用于任何预算! AI for Research · 公众号 · · 4 月前 · 访问文章快照 |
|
具有几乎无限上下文长度的LLM可以实现AGI ? AI for Research · 公众号 · · 5 月前 · 访问文章快照 |
|
AI考上一本了!文心一言理科第一、文科第二!2024年河南卷(地狱级)AI高考挑战赛结果出来了! AI for Research · 公众号 · · 5 月前 · 访问文章快照 |