|
零基础万字长文实践diffusion模型 极市平台 · 公众号 · · 3 周前 · 访问文章快照 |
|
AI「长脑子」了?LLM惊现「人类脑叶」结构并有数学代码分区,MIT大牛新作震惊学界! 极市平台 · 公众号 · · 3 周前 · 访问文章快照 |
|
一文看完多模态:从视觉表征到多模态大模型 极市平台 · 公众号 · 算法 科技媒体 · 3 周前 · 访问文章快照 |
|
NeurIPS 2024|字节联合华师提出统一的多模态文字理解与生成大模型 极市平台 · 公众号 · · 3 周前 · 访问文章快照 |
|
三种Transformer模型中的注意力机制介绍及Pytorch实现:从自注意力到因果自注意力 极市平台 · 公众号 · 科技媒体 · 3 周前 · 访问文章快照 |
|
Grok图像理解功能上线,单挑ChatGPT结果惊人!无地标照片秒定位,18世纪手稿一眼识别 极市平台 · 公众号 · · 3 周前 · 访问文章快照 |
|
超越YOLOv10/11、RT-DETRv2/3!中科大D-FINE重新定义边界框回归任务 极市平台 · 公众号 · · 3 周前 · 访问文章快照 |
|
NeurlPS 2024 Oral|多模态融合检测端到端算法E2E-MFD来了! 极市平台 · 公众号 · · 3 周前 · 访问文章快照 |
|
全面解读高效Segment Anything模型变体:各种图像分割加速策略和核心技术展示 极市平台 · 公众号 · · 3 周前 · 访问文章快照 |
|
陶哲轩神预言!Transformer破解百年三体难题,凭数学直觉找到李雅普诺夫函数 极市平台 · 公众号 · · 3 周前 · 访问文章快照 |
|
ECCV 2024|SegVG:刷新视觉定位新SOTA!将视觉定位的目标边界框转化为分割信号 极市平台 · 公众号 · · 3 周前 · 访问文章快照 |
|
NeurIPS 2024|TextHarmony: 基于统一架构的视觉文本理解与生成模型 极市平台 · 公众号 · · 3 周前 · 访问文章快照 |
|
全面总结机器学习超参数调优(附代码) 极市平台 · 公众号 · · 3 周前 · 访问文章快照 |
|
田渊栋团队新作祭出Agent-as-a-Judge!AI智能体自我审判,成本暴跌97% 极市平台 · 公众号 · · 3 周前 · 访问文章快照 |
|
一文看尽occupancy 极市平台 · 公众号 · · 3 周前 · 访问文章快照 |
|
NeurIPS 2024|如何防御对抗性提示攻击?AdvUnlearn让图片生成风险骤降 极市平台 · 公众号 · · 3 周前 · 访问文章快照 |
|
极市直播回放第136期丨ACM Multimedia 2024 Oral-自动驾驶场景下面向真实世界布局的转变 极市平台 · 公众号 · · 3 周前 · 访问文章快照 |
|
人类已知最大素数诞生:2¹³⁶²⁷⁹⁸⁴¹−1!前英伟达员工数千GPU爆肝算出,高达4100万位 极市平台 · 公众号 · · 3 周前 · 访问文章快照 |
|
RNN回归!Bengio新作大道至简与Transformer一较高下 极市平台 · 公众号 · · 3 周前 · 访问文章快照 |
|
浅谈后向传递的计算量大约是前向传递的两倍 极市平台 · 公众号 · · 3 周前 · 访问文章快照 |