|
AAAI 2025 | 大模型会组合关系推理吗?打开黑盒,窥探Transformer脑回路 数据派THU · 公众号 · 大数据 · 7 小时前 · 访问文章快照 |
|
EvalPlanner:基于“计划-执行”双阶段的大语言模型评估框架 数据派THU · 公众号 · 大数据 · 7 小时前 · 访问文章快照 |
|
【ICLR2025】SAMREFINER:驯化“Segment Anything Model”进行通用掩码优化 数据派THU · 公众号 · 大数据 · 7 小时前 · 访问文章快照 |
|
数据派志愿者招募 | 寻找最志同道合的你! 数据派THU · 公众号 · 大数据 · 7 小时前 · 访问文章快照 |
|
DeepSeek革命性NSA注意力机制问世!梁文锋上阵,长文本推理能力飙升 数据派THU · 公众号 · 大数据 · 2 天前 · 访问文章快照 |
|
DeepSeek背后的技术基石:DeepSeekMoE基于专家混合系统的大规模语言模型架构 数据派THU · 公众号 · 大数据 · 2 天前 · 访问文章快照 |
|
【ICLR2025】LLMS能否识别您的偏好?评估LLMS中的个性化偏好遵循能力 数据派THU · 公众号 · 大数据 · 2 天前 · 访问文章快照 |
|
【博士论文】朝向大规模语言模型的原则性训练与服务 数据派THU · 公众号 · 大数据 · 4 天前 · 访问文章快照 |
|
面向长文本的多模型协作摘要架构:多LLM文本摘要方法 数据派THU · 公众号 · 大数据 · 4 天前 · 访问文章快照 |