专栏 RSS订阅(公众号)
温馨提示:订阅专栏后它将会自动更新,无人订阅的专栏有可能不会更新。
专栏 二维码
他们也喜欢这个专栏
文章总数 86  • 
RSS订阅
今天看啥  ›  专栏  ›  SparksofAGI
人工智能前沿论文解读
开通 RSS极速订阅 可分钟级获得文章
微调语言模型学到的知识是权重空间里的一块区域(建议阅读) 审核中
SparksofAGI  ·  公众号  ·  ·  11 月前  ·  访问文章快照
USC:通用自一致性解决Self-Consistency无法在自由形式答案上使用的缺陷 审核中
SparksofAGI  ·  公众号  ·  ·  12 月前  ·  访问文章快照
只需这样问ChatGPT就可以让它泄漏训练数据 审核中
SparksofAGI  ·  公众号  ·  ·  12 月前  ·  访问文章快照
GAIA:据说解决了这个基准,AI研究又会达到一个里程碑(作者自己说的 审核中
SparksofAGI  ·  公众号  ·  ·  1 年前  ·  访问文章快照
Orca 2:利用提示擦除技术让模型知道如何选择回复策略 审核中
SparksofAGI  ·  公众号  ·  ·  1 年前  ·  访问文章快照
GPT4答案的概率分布不可见?那就用开源的代理模型估计闭源模型的置信度 审核中
SparksofAGI  ·  公众号  ·  ·  1 年前  ·  访问文章快照
你是否发现ChatGPT甚至不能按字数要求回复问题?有人做了评测并讨论了可能的原因 审核中
SparksofAGI  ·  公众号  ·  ·  1 年前  ·  访问文章快照
作者投稿 | 适合LLM时代的in-context PVI测量方法 - 理解数据集或单个实例的难度 审核中
SparksofAGI  ·  公众号  ·  ·  1 年前  ·  访问文章快照
重用提示词的状态加速推理 审核中
SparksofAGI  ·  公众号  ·  ·  1 年前  ·  访问文章快照
Transformer不能在分布数据外泛化?不如说模型受限于训练数据中见过的任务族 审核中
SparksofAGI  ·  公众号  ·  ·  1 年前  ·  访问文章快照
近期值得关注的两个模型:Grok与DeepSeekCoder 审核中
SparksofAGI  ·  公众号  ·  ·  1 年前  ·  访问文章快照
迭代式合成小模型训练数据:用LLM外推数据误差来逼近真实数据分布 审核中
SparksofAGI  ·  公众号  ·  ·  1 年前  ·  访问文章快照
微软将扩散模型用在代码生成任务,还透露了ChatGPT参数量 审核中
SparksofAGI  ·  公众号  ·  ·  1 年前  ·  访问文章快照
如何知道某条数据是否在黑盒大语言模型中预训练过 审核中
SparksofAGI  ·  公众号  ·  ·  1 年前  ·  访问文章快照
ICL底层机理再探:先转换成任务向量再调整模型行为 审核中
SparksofAGI  ·  公众号  ·  ·  1 年前  ·  访问文章快照
SELF-RAG: 结合检索并反思检索片段再融合的生成模型 审核中
SparksofAGI  ·  公众号  ·  ·  1 年前  ·  访问文章快照
类比提示:简单却有效的提示技巧,增强模型复杂任务能力 审核中
SparksofAGI  ·  公众号  ·  ·  1 年前  ·  访问文章快照
将训练数据按相关性排序可以增强模型效果 审核中
SparksofAGI  ·  公众号  ·  ·  1 年前  ·  访问文章快照
符尧老师向你发起了关于Compression Theory的自由讨论邀请 审核中
SparksofAGI  ·  公众号  ·  ·  1 年前  ·  访问文章快照
欧洲对标OpenAI的公司发布Mistral系列,多规模超越Llama 审核中
SparksofAGI  ·  公众号  ·  ·  1 年前  ·  访问文章快照