专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
今天看啥  ›  专栏  ›  爱可可-爱生活

【Savanna:为卷积多混合模型(StripedHyena 2-20250221141645

爱可可-爱生活  · 微博  · AI  · 2025-02-21 14:16
    

文章预览

2025-02-21 14:16 本条微博链接 【Savanna:为卷积多混合模型(StripedHyena 2)预训练提供强大基础设施。亮点:1. 支持大规模分布式训练,优化千卡集群性能;2. 提供多种优化技术,如a2a和p2p上下文并行化;3. 已成功训练多个模型,如StripedHyena 7B和Evo 2 40B,覆盖超9T tokens】 'Savanna: Pretraining infrastructure for research and application of convolutional multi-hybrid models (StripedHyena 2).' GitHub: github.com/Zymrael/savanna #深度学习# #预训练模型# #大规 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览