文章预览
天天财经独家,速关注 科技圈和资管行业同时沸腾。 近日,国内全新大模型DeepSeek-V3首个版本上线,并同步开源。 DeepSeek-V3背后并非互联网大厂,而是国内头部量化机构幻方量化。 量化“大佬”进军AI大模型,引发关注。 前沿大模型“刷屏” 上一代模型DeepSeek-V2.5发布三个多月后,杭州深度求索人工智能基础技术研究有限公司(DeepSeek) 近日 发布公告, DeepSeek-V3正式上线。 其迭代速度和性能表现令行业震惊,训练成本仅为557.6万美元,整个训练只需要280万个GPU小时。 DeepSeek-V3的更新上线,其模型API服务定价调整为每百万输入tokens0.5元(缓存命中)或百万输入tokens2元(缓存未命中),每百万输出tokens8元。其超低的定价引发科技圈轰动。 从性能来看,DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,在性能上和世界顶尖的闭源模
………………………………