|
如何用一个统一的视角,分析RLHF下的各种算法? 极市平台 · 公众号 · · 1 月前 · 访问文章快照 |
|
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了 极市平台 · 公众号 · · 1 月前 · 访问文章快照 |
|
课程升级、资源加码!万人共学的书生大模型实战营第4期正式起航! 极市平台 · 公众号 · · 1 月前 · 访问文章快照 |
|
Janus: 解耦视觉编码,引领多模态理解与生成统一的新范式 极市平台 · 公众号 · 科技自媒体 · 1 月前 · 访问文章快照 |
|
Linear Attention的cuda kernel实现解析 极市平台 · 公众号 · 算法 科技媒体 · 1 月前 · 访问文章快照 |
|
Ilya预言成真,下一个token预测直达AGI!智源首发原生多模态世界模型Emu3,不用扩散 极市平台 · 公众号 · · 1 月前 · 访问文章快照 |
|
极市直播预告|ACM Multimedia 2024 Oral-自动驾驶场景下面向真实世界布局的转变 极市平台 · 公众号 · · 1 月前 · 访问文章快照 |
|
ECCV'24|ClearCLIP:倒反天罡,删除两个组件反而可以提升密集预测性能 极市平台 · 公众号 · · 1 月前 · 访问文章快照 |
|
实践教程|兼顾灵活性和性能以及调试的手搓TensorRT网络! 极市平台 · 公众号 · · 1 月前 · 访问文章快照 |
|
英伟达nGPT重塑Transformer,AI训练速度暴增20倍!文本越长,加速越快 极市平台 · 公众号 · · 1 月前 · 访问文章快照 |
|
4K分辨率拿下!超强杀器SANA:线性扩散模型+文生图+高分辨率+从头训练的极佳范本! 极市平台 · 公众号 · · 1 月前 · 访问文章快照 |
|
NeurIPS 2024 Oral|小参数,大作为!揭秘非对称 LoRA 架构的高效性能 极市平台 · 公众号 · · 1 月前 · 访问文章快照 |
|
使用PyTorch进行小样本学习的图像分类 极市平台 · 公众号 · · 1 月前 · 访问文章快照 |
|
苹果一篇论文得罪大模型圈?Transformer不会推理,只是高级模式匹配器!所有LLM都判死刑 极市平台 · 公众号 · · 1 月前 · 访问文章快照 |
|
来自非自回归模型的反击?全新文生图基座模型Meissonic:1B文生图Non-AR新范式,专为消费级显卡设计 极市平台 · 公众号 · 科技自媒体 · 1 月前 · 访问文章快照 |
|
又快又准,即插即用!清华8比特量化Attention,两倍加速于FlashAttention2,各端到端任务均不掉点! 极市平台 · 公众号 · · 1 月前 · 访问文章快照 |
|
NeurIPS 2024|刷新SOTA!TopoFR:人脸识别新工作 极市平台 · 公众号 · · 1 月前 · 访问文章快照 |
|
DenseNet共一作者刘壮官宣新去向,将任普林斯顿大学助理教授 极市平台 · 公众号 · · 1 月前 · 访问文章快照 |
|
现阶段的多模态大模型做不了医疗 极市平台 · 公众号 · · 1 月前 · 访问文章快照 |
|
ECCV'24|Plain-Det:同时支持多数据集训练的新目标检测 极市平台 · 公众号 · · 1 月前 · 访问文章快照 |