|
o3-mini 碾压DeepSeek R1?一条python程序引发近400万围观 极市平台 · 公众号 · · 1 周前 · 访问文章快照 |
|
一文详尽之Scaling Law 极市平台 · 公众号 · AI 科技媒体 · 1 周前 · 访问文章快照 |
|
Linear Attention的cuda kernel实现解析 极市平台 · 公众号 · · 1 周前 · 访问文章快照 |
|
为什么说DeepSeek的R1-Zero比R1更值得关注? 极市平台 · 公众号 · · 2 周前 · 访问文章快照 |
|
完整解读:从DeepSeek Janus到Janus-Pro! 极市平台 · 公众号 · · 2 周前 · 访问文章快照 |
|
ICLR 2025 | 超越YOLOv10/11、RT-DETRv2/3!中科大D-FINE重新定义边界框回归任务 极市平台 · 公众号 · · 2 周前 · 访问文章快照 |
|
原来,这些顶级大模型都是蒸馏的 极市平台 · 公众号 · · 2 周前 · 访问文章快照 |
|
DeepSeek V3论文细节:如何绕开CUDA的垄断! 极市平台 · 公众号 · · 2 周前 · 访问文章快照 |
|
图像生成迎来CoT时刻!港中文首次提出文生图的o1推理和inference scaling新范式! 极市平台 · 公众号 · · 2 周前 · 访问文章快照 |
|
大模型LLM-微调经验分享 & 总结 极市平台 · 公众号 · · 3 周前 · 访问文章快照 |
|
CS本科就业寒冬来袭!名校24届就业率被曝不足50%,企业宁用AI不招应届生 极市平台 · 公众号 · · 3 周前 · 访问文章快照 |
|
TNNLS'25|东北大学贾同教授团队提出SOTA模型AO-DETR,解决X-ray图像违禁品检测领域难题! 极市平台 · 公众号 · · 3 周前 · 访问文章快照 |
|
ICLR 2025|4K分辨率拿下!超强杀器SANA:线性扩散模型+文生图+高分辨率+从头训练的极佳范本! 极市平台 · 公众号 · · 3 周前 · 访问文章快照 |
|
一文详尽之LLM-Based Agent 极市平台 · 公众号 · · 3 周前 · 访问文章快照 |
|
ICLR 2025 | Ross: 多模态大模型的 MAE 时刻? 极市平台 · 公众号 · · 3 周前 · 访问文章快照 |
|
大模型轻量化系列解读 (六):SpinQuant:采用可学习旋转矩阵的 LLM 量化 极市平台 · 公众号 · · 3 周前 · 访问文章快照 |
|
谈谈对DeepSeek-R1的一些理解 极市平台 · 公众号 · · 3 周前 · 访问文章快照 |
|
ICLR 2025超万篇论文厮杀,录用率32.08%!首个满分论文或预定best paper? 极市平台 · 公众号 · · 3 周前 · 访问文章快照 |
|
高呼「GAN 万岁!」的 R3GAN 做了哪些科研改进? 极市平台 · 公众号 · 科技自媒体 · 3 周前 · 访问文章快照 |