专栏 RSS订阅(公众号)
温馨提示:订阅专栏后它将会自动更新,无人订阅的专栏有可能不会更新。
专栏 二维码
他们也喜欢这个专栏
文章总数 929  • 
RSS订阅
今天看啥  ›  专栏  ›  GiantPandaCV
专注于机器学习、深度学习、计算机视觉、图像处理等多个方向技术分享。团队由一群热爱技术且热衷于分享的小伙伴组成。我们坚持原创,每天一到两篇原创技术分享。希望在传播知识、分享知识的同时能够启发你,大家一起共同进步(・ω<)☆
开通 RSS极速订阅 可分钟级获得文章
LLM PTQ量化经典研究解析
GiantPandaCV  ·  公众号  · 3D  ·  6 月前  ·  访问文章快照
硬件高效的线性注意力机制Gated Linear Attention论文阅读 审核中
GiantPandaCV  ·  公众号  · 3D  ·  6 月前  ·  访问文章快照
原理&图解vLLM Automatic Prefix Cache(RadixAttention)首Token时延优化 审核中
GiantPandaCV  ·  公众号  · 3D  ·  6 月前  ·  访问文章快照
[Decoding优化]原理&图解FlashDecoding/FlashDecoding++ 审核中
GiantPandaCV  ·  公众号  · 3D  ·  6 月前  ·  访问文章快照
[Attention优化][2w字]原理&图解: 从Online-Softmax到FlashAttention V1/V2/V3 审核中
GiantPandaCV  ·  公众号  · 3D  ·  6 月前  ·  访问文章快照
[LLaVA系列]CLIP/LLaVA/LLaVA1.5/VILA笔记 审核中
GiantPandaCV  ·  公众号  · 3D  ·  6 月前  ·  访问文章快照
[LLM推理优化] 100+篇: 大模型推理各方向新发展整理 审核中
GiantPandaCV  ·  公众号  · 3D  ·  6 月前  ·  访问文章快照
发paper必备的65个即插即用缝合模块!附下载 审核中
GiantPandaCV  ·  公众号  · 3D  ·  6 月前  ·  访问文章快照
[并行训练]Context Parallelism的原理与代码浅析 审核中
GiantPandaCV  ·  公众号  · 3D  ·  6 月前  ·  访问文章快照
flash-linear-attention中的Chunkwise并行算法的理解 审核中
GiantPandaCV  ·  公众号  · 3D  ·  7 月前  ·  访问文章快照
大模型训练:Megatron-Core中的通信优化 审核中
GiantPandaCV  ·  公众号  · 3D  ·  7 月前  ·  访问文章快照
​OverlapMamba 具备超强泛化能力的定位方法 审核中
GiantPandaCV  ·  公众号  · 3D  ·  7 月前  ·  访问文章快照
如何看待 DeepSeek 发布的 MoE 大模型 DeepSeek-V2?(从推理角度分析) 审核中
GiantPandaCV  ·  公众号  · 3D  ·  7 月前  ·  访问文章快照
整理了2000篇2024年顶会论文合集【附下载】 审核失败
GiantPandaCV  ·  公众号  · 3D  ·  7 月前  ·  访问文章快照
NEON做色域变化_ 用单核性能无限逼近八核并行OpenCV 审核中
GiantPandaCV  ·  公众号  · 3D  ·  7 月前  ·  访问文章快照
A100算力加持,理论结合实践!大模型实战营“初夏专场”火热来袭 审核中
GiantPandaCV  ·  公众号  · 3D  ·  7 月前  ·  访问文章快照
flash-linear-attention的fused_recurrent_rwkv6 Triton实现精读 审核中
GiantPandaCV  ·  公众号  · 3D  ·  7 月前  ·  访问文章快照
序列并行做大模型训练,你需要知道的六件事 审核中
GiantPandaCV  ·  公众号  · 3D  ·  7 月前  ·  访问文章快照