|
个人从零预训练1B LLM心路历程 极市平台 · 公众号 · · 6 天前 · 访问文章快照 |
|
多个中国团队斩获EMNLP'24最佳论文!UCLA华人学者中三篇杰出论文,明年顶会落户苏州 极市平台 · 公众号 · · 6 天前 · 访问文章快照 |
|
Make U-Nets Great Again!北大 & 华为提出扩散架构U-DiT,六分之一算力即可超越DiT 极市平台 · 公众号 · · 6 天前 · 访问文章快照 |
|
北大新作:让大模型来做peer-review结果会怎样? 极市平台 · 公众号 · · 6 天前 · 访问文章快照 |
|
所有数据集上给神经网络刷分的通用方法 极市平台 · 公众号 · · 1 周前 · 访问文章快照 |
|
OpenAI总裁出走3月终于归来!Greg结束「最长假期」专注重大技术挑战,每周狂肝100小时代码 极市平台 · 公众号 · · 1 周前 · 访问文章快照 |
|
Scaling Laws终结,量化无用? 极市平台 · 公众号 · · 1 周前 · 访问文章快照 |
|
ECCV 2024|VL4AD:让语义分割认识未知类别,无需额外数据和训练的OOD语义分割 极市平台 · 公众号 · · 1 周前 · 访问文章快照 |
|
梳理下Flash Attention的dispatch逻辑 极市平台 · 公众号 · · 1 周前 · 访问文章快照 |
|
Self-Attention & Transformer完全指南:像Transformer的创作者一样思考 极市平台 · 公众号 · 设计 科技媒体 · 1 周前 · 访问文章快照 |
|
NeurIPS'24|MaskLLM:英伟达出品,用于大模型的可学习`N:M`稀疏化 极市平台 · 公众号 · · 1 周前 · 访问文章快照 |
|
万字长文串烧LLM大模型技术原理 极市平台 · 公众号 · · 1 周前 · 访问文章快照 |
|
陶哲轩联手60多位数学家出题,世界顶尖模型通过率仅2%!专家级数学基准,让AI再苦战数年 极市平台 · 公众号 · 科技自媒体 · 1 周前 · 访问文章快照 |
|
武大提出 PlaneSAM 使用分割任意模型的多模态平面实例分割 ! 极市平台 · 公众号 · 科技媒体 · 1 周前 · 访问文章快照 |
|
NeurIPS 2024 (Oral)|如何量化与提升思维链的推理能力边界? 极市平台 · 公众号 · · 1 周前 · 访问文章快照 |
|
CUDA开发总结笔记 极市平台 · 公众号 · · 1 周前 · 访问文章快照 |
|
教授何恺明在MIT的第二门课——《深度生成模型》,讲座PPT陆续已出 极市平台 · 公众号 · · 1 周前 · 访问文章快照 |
|
揭示Transformer重要缺陷!北大提出傅里叶分析神经网络FAN,填补周期性特征建模缺陷 极市平台 · 公众号 · · 1 周前 · 访问文章快照 |
|
空间智能版ImageNet来了!李飞飞吴佳俊团队出品 极市平台 · 公众号 · · 1 周前 · 访问文章快照 |