今天看啥  ›  专栏  ›  InfoQ

基于 JuiceFS 构建高校 AI 存储方案:高并发、系统稳定、运维简单

InfoQ  · 公众号  · 科技媒体  · 2024-07-26 11:04
    

文章预览

作者 | 徐国昊 中山大学的 iSEE 实验室(Intelligence Science and System) Lab)在进行深度学习任务时,需要处理大量小文件读取。 在高并发读写场景下,原先使用的 NFS 性能较低,常在高峰期导致数据节点卡死。此外,NFS 系统的单点故障问题也导致一旦数据节点宕机 ,该机器上的数据将完全不可用。扩容问题同样棘手,每增加一台数据节点,就需要在所有计算节点上进行多次挂载。而新增的数据节点由于数据量较小,并不能有效分担读写压力。 为解决这些问题, 经过初步评估,实验室选择了 JuiceFS 作为替代的存储方案。当前,结合 TiKV 的 JuiceFS 已成功管理超过 5 亿个文件。新方案显著提升了在高并发场景下的性能和系统稳定性,确保了深度学习训练过程中计算节点的连续运行,同时基本解决了单点故障的问题 。 此外,JuiceFS 的操作简便易学,甚至不需 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览