|
如何从头训练大语言模型: A simple technical report 极市平台 · 公众号 · · 1 月前 · 访问文章快照 |
|
ICLR 2025钦定AI参审,11000篇总投稿数暴增61%! 极市平台 · 公众号 · · 1 月前 · 访问文章快照 |
|
解锁视觉语言模型新高度!微信提出多模态大模型 POINTS: 简单高效又不失性能 极市平台 · 公众号 · · 1 月前 · 访问文章快照 |
|
ICML 2024|牛津提出合作图神经网络Co-GNNs,更灵活的消息传递新范式 极市平台 · 公众号 · · 1 月前 · 访问文章快照 |
|
vLLM vs TensorRT-LLM 性能对比测试二(Towards Optimal Batching),基于最新版本 极市平台 · 公众号 · · 1 月前 · 访问文章快照 |
|
ChatGPT竟会「看人下菜」! OpenAI 53页研究曝惊人结果:「你的名字」能操控AI回答 极市平台 · 公众号 · · 1 月前 · 访问文章快照 |
|
视频深度估计大幅升级!Depth Any Video:开启视频深度估计新纪元 极市平台 · 公众号 · · 1 月前 · 访问文章快照 |
|
TPMAI'24|即插即用的解决方案!无监督盲超分算法MLMC开源! 极市平台 · 公众号 · · 1 月前 · 访问文章快照 |
|
大模型推理加速技术的学习路线是什么? 极市平台 · 公众号 · 科技自媒体 · 1 月前 · 访问文章快照 |
|
25年前,英伟达改变了世界 极市平台 · 公众号 · · 1 月前 · 访问文章快照 |
|
通用的视觉Backbone,TransXNet: 全局动态性+局部动态性=性能强大,代码已开源! 极市平台 · 公众号 · · 1 月前 · 访问文章快照 |
|
北大林宙辰团队全新混合序列建模架构MixCon:性能远超Mamba 极市平台 · 公众号 · · 1 月前 · 访问文章快照 |
|
揭秘视觉表征学习中的骨干网络-优化器耦合偏好 极市平台 · 公众号 · · 1 月前 · 访问文章快照 |
|
扩散模型训练方法一直错了!谢赛宁:Representation matters 极市平台 · 公众号 · · 1 月前 · 访问文章快照 |
|
NeurIPS 2024|Mamba杀入异常检测!MambaAD:第一个使用Mamba进行多类无监督异常检测 极市平台 · 公众号 · · 1 月前 · 访问文章快照 |
|
全面系统解读高效SAM变体:各种加速策略和核心技术展示 极市平台 · 公众号 · · 1 月前 · 访问文章快照 |
|
两万字长文详解:如何用C++从零实现神经网络 极市平台 · 公众号 · · 1 月前 · 访问文章快照 |
|
大模型「强崩溃」!Meta新作:合成数据有「剧毒」,1%即成LLM杀手 极市平台 · 公众号 · · 1 月前 · 访问文章快照 |
|
自回归视觉生成里程碑!比ControlNet和T2I-Adapter 快五倍!北大 & 腾讯等重磅发布CAR 极市平台 · 公众号 · · 1 月前 · 访问文章快照 |
|
双目立体开源数据集资源汇总 极市平台 · 公众号 · · 1 月前 · 访问文章快照 |