文章预览
中生代大白 读完需要 3 分钟 速读仅需 1 分钟 据美国 CNBC 电视台报道,中国的 DeepSeek 模型在关键基准测试中击败了 OpenAI 和 Meta 的最新模型,这意味着 OpenAI 等行业领袖的护城河正在缩小; 12月26日发布的DeepSeek-V3 在多个关键基准测试中脱颖而出,成功击败了包括 Qwen2.5-72B 和 Llama-3.1-405B 等在内的众多开源模型,其性能甚至能够与顶尖闭源模型 GPT-4O 和 Claude-3.5-Sonnet 相媲美。无论是在知识类任务、长文本处理,还是代码编写和数学竞赛等方面,DeepSeek-V3 都展现出卓越的能力。例如,在密文解码任务中,它是唯一能够给出正确答案的大模型;在代码生成任务中,它所提供的代码注释、算法原理解释以及开发流程的指引也是最为全面的。 更为引人注目的是 DeepSeek-V3 的训练成本优势。它的训练成本极低,共计266.4万个GPU小时,仅花费了大约557.6万美金(约4
………………………………