|
仅需100条样本即可实现LLM在未知数据分布上的泛化?数据规模对语言模型表现的影响:以微调翻译大模型为例... AI for Research · 公众号 · · 2 月前 · 访问文章快照 |
|
代码预训练数据的秘密:高质量数据的定义和作用.... AI for Research · 公众号 · · 2 月前 · 访问文章快照 |
|
下一个词预测并不是最佳?港城大提出NDP(下一个分布预测)| 大模型中迁移学习的缩放规律研究 | 训练超高长度上下文语言模型 AI for Research · 公众号 · · 2 月前 · 访问文章快照 |
|
本周大模型Top热门论文精选 —— 24年第35期 AI for Research · 公众号 · · 2 月前 · 访问文章快照 |
|
Mini-Omni 发布!语言模型能听、说也能实时思考!通过批判链式思维提升大模型的推理能力 | 大模型在代码生成任务评估综述 AI for Research · 公众号 · · 2 月前 · 访问文章快照 |
|
统一RLHF、PPO、DPO和KTO方法:广义隐式奖励函数 | Hand1000: 仅使用1000张图片生成逼真的手图像.. AI for Research · 公众号 · 科技自媒体 科技媒体 · 2 月前 · 访问文章快照 |
|
突发!Anthropic官宣公开Claude系统提示词,透明新纪元开启! AI for Research · 公众号 · · 2 月前 · 访问文章快照 |
|
探索合成数据替代真实数据潜力 | 链式思维提示方法的统计基础揭秘 | 大模型无偏好对齐中的逆Q*,超越PPO! AI for Research · 公众号 · · 2 月前 · 访问文章快照 |
|
大模型微调的终极指南:从基础到突破综述 | 1-Bit FQT:将全量化训练极限推到极致 | 百度发布最新DPO方法.. AI for Research · 公众号 · · 2 月前 · 访问文章快照 |
|
Less for More:通过自动化自我整理训练语料库增强偏好学习!基于提示工程的LLM路径规划是否可行? AI for Research · 公众号 · · 3 月前 · 访问文章快照 |
|
本周大模型Top热门论文精选 —— 24年第34期 AI for Research · 公众号 · · 3 月前 · 访问文章快照 |
|
字节发布统一多模态模型Show-o!苹果发布PDS复杂算术任务精度爆涨近20%!Jamba-1.5无损支持256K上下文长度 AI for Research · 公众号 · · 3 月前 · 访问文章快照 |
|
微软发布自动数据集构建方法!大模型性的能突变分析!通过并行解码扩展大模型的上下文长度 AI for Research · 公众号 · · 3 月前 · 访问文章快照 |
|
大模型在代码评估方面如何成为好裁判? 代码预训练的影响因素:编码或非编码? 大模型能否遵循系统消息? AI for Research · 公众号 · · 3 月前 · 访问文章快照 |
|
信息论揭示“涌现”能力是一种突现的相变!大模型的性能定律研究,可直接预测LLMs的MMLU得分! AI for Research · 公众号 · · 3 月前 · 访问文章快照 |
|
国科大发布自动小说创作方法Ex3!BLIP-3 多模态大模型家族公布!大模型可能并不关心你说的是什么:提示格式胜过描述.... AI for Research · 公众号 · · 3 月前 · 访问文章快照 |
|
审核失败 AI for Research · 公众号 · · 3 月前 · 访问文章快照 |
|
谷歌Imagen-3论文发布!最强智能体Agent Q发布技术报告!大模型预训练与微调关系的分析.... AI for Research · 公众号 · · 3 月前 · 访问文章快照 |