AI for Research - 公众号 - 文章列表 - 历史文章

注册登录

专栏 RSS订阅（公众号）

温馨提示：订阅专栏后它将会自动更新，无人订阅的专栏有可能不会更新。

我也要提交微信公众号

专栏二维码

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

他们也喜欢这个专栏

文章总数 425 •

今天看啥 › 专栏 › AI for Research

每天分享最新最热的Arxiv论文、一起来关注大模型、AIGC、AGI

最新

开通 RSS极速订阅可分钟级获得文章

仅需100条样本即可实现LLM在未知数据分布上的泛化？数据规模对语言模型表现的影响：以微调翻译大模型为例...

AI for Research · 公众号 · · 2 月前 · 访问文章快照

代码预训练数据的秘密：高质量数据的定义和作用....

AI for Research · 公众号 · · 2 月前 · 访问文章快照

语言模型操作系统的压缩机检索器架构研究 | OLMoE：开放专家混合语言模型 | 统一端到端模型实现OCR 2.0

AI for Research · 公众号 · · 2 月前 · 访问文章快照

下一个词预测并不是最佳？港城大提出NDP（下一个分布预测）| 大模型中迁移学习的缩放规律研究 | 训练超高长度上下文语言模型

AI for Research · 公众号 · · 2 月前 · 访问文章快照

本周大模型Top热门论文精选 —— 24年第35期

AI for Research · 公众号 · · 2 月前 · 访问文章快照

Mini-Omni 发布！语言模型能听、说也能实时思考！通过批判链式思维提升大模型的推理能力 | 大模型在代码生成任务评估综述

AI for Research · 公众号 · · 2 月前 · 访问文章快照

统一RLHF、PPO、DPO和KTO方法：广义隐式奖励函数 | Hand1000: 仅使用1000张图片生成逼真的手图像..

AI for Research · 公众号 · 科技自媒体科技媒体 · 2 月前 · 访问文章快照

突发！Anthropic官宣公开Claude系统提示词，透明新纪元开启！

AI for Research · 公众号 · · 2 月前 · 访问文章快照

探索合成数据替代真实数据潜力 | 链式思维提示方法的统计基础揭秘 | 大模型无偏好对齐中的逆Q*，超越PPO！

AI for Research · 公众号 · · 2 月前 · 访问文章快照

大模型微调的终极指南：从基础到突破综述 | 1-Bit FQT：将全量化训练极限推到极致 | 百度发布最新DPO方法..

AI for Research · 公众号 · · 2 月前 · 访问文章快照

Less for More：通过自动化自我整理训练语料库增强偏好学习！基于提示工程的LLM路径规划是否可行？

AI for Research · 公众号 · · 2 月前 · 访问文章快照

本周大模型Top热门论文精选 —— 24年第34期

AI for Research · 公众号 · · 2 月前 · 访问文章快照

字节发布统一多模态模型Show-o！苹果发布PDS复杂算术任务精度爆涨近20%！Jamba-1.5无损支持256K上下文长度

AI for Research · 公众号 · · 2 月前 · 访问文章快照

微软发布自动数据集构建方法！大模型性的能突变分析！通过并行解码扩展大模型的上下文长度

AI for Research · 公众号 · · 3 月前 · 访问文章快照

大模型在代码评估方面如何成为好裁判？代码预训练的影响因素：编码或非编码？大模型能否遵循系统消息？

AI for Research · 公众号 · · 3 月前 · 访问文章快照

信息论揭示“涌现”能力是一种突现的相变！大模型的性能定律研究，可直接预测LLMs的MMLU得分！

AI for Research · 公众号 · · 3 月前 · 访问文章快照

国科大发布自动小说创作方法Ex3！BLIP-3 多模态大模型家族公布！大模型可能并不关心你说的是什么：提示格式胜过描述....

AI for Research · 公众号 · · 3 月前 · 访问文章快照

openAI发布“人类身份认证”计划论文！ScalingFilter：逆向利用缩放定律评估数据质量... 审核失败

AI for Research · 公众号 · · 3 月前 · 访问文章快照

5%的数据超越全量预训练的高效样本选择方法！Aquila2 技术报告发布！大模型长时知识编辑失效的深层次原因研究...

AI for Research · 公众号 · · 3 月前 · 访问文章快照

谷歌Imagen-3论文发布！最强智能体Agent Q发布技术报告！大模型预训练与微调关系的分析....

AI for Research · 公众号 · · 3 月前 · 访问文章快照

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号