今天看啥  ›  专栏  ›  小小牛财经

DeepSeek突然开启YouTube全球直播

小小牛财经  · 公众号  ·  · 2025-01-31 17:00
    

主要观点总结

本文报道了DeepSeek在马斯克推文发布后的行动,包括开启YouTube直播展示拆解三台训练服务器,显示每台机器搭载8块A100显卡。直播中,计数器显示894块显卡全数在线,并展示了分布式训练日志。首席科学家现场证明了MoE模型在2023年7月15日已能进行单任务千卡并行训练。DeepSeek公开透明地邀请马斯克派审计团队入驻,弹幕评论活跃。

关键观点总结

关键观点1: DeepSeek直播拆解训练服务器

DeepSeek在马斯克推文发布后通过YouTube直播展示了拆解三台训练服务器的过程,展示了每台机器搭载的8块A100显卡。

关键观点2: 直播展示显卡全数在线及分布式训练日志

在直播中,DeepSeek展示了实时跳动的计数器,最终显示894块显卡全数在线,并展示了首席科学家调出的分布式训练日志,证明了MoE模型的单任务千卡并行训练能力。

关键观点3: 公开透明邀请马斯克派审计团队入驻

DeepSeek在直播中表示欢迎马斯克派审计团队入驻,甚至公开表示连咖啡机的预算都可以公开,展现了其公开透明的态度。


文章预览

在马斯克推文发布111分钟后 DeepSeek突然开启YouTube全球直播: 六名工程师当众拆解三台训练服务器,高清镜头下清晰显示每台机器搭载8块A100显卡。直播间计数器实时跳动,最终定格在“894块显卡全数在线。 更令人瞠目的是,首席科学家王某某在直播中现场调出分布式训练日志,时间戳显示其 MoE模型在2023年7月15日就实现单任务千卡并行训练。 欢迎马斯克先生派审计团队入驻,我们连咖啡机预算都可以公开。这句话引发弹幕疯狂刷屏。 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览