今天看啥  ›  专栏  ›  人工智能与大数据技术

奥特曼阴阳“国产之光”DeepSeek?把训练成本打下来99%,表现还优于GPT-4o,国产开源大模型火爆全球

人工智能与大数据技术  · 公众号  · 大数据  · 2025-01-11 11:30
    

文章预览

来自公众号:InfoQ 整理 | 华卫、核子可乐 一家中国 AI 初创公司创建出被用户称作 “真正的‘Open’AI ”的人工智能模型。 12月26日,有“AI界的拼多多”之称的DeepSeek 发布了最新系列模型 DeepSeek-V3 首个版本并同步开源。该模型可以处理一系列基于文本的工作负载和任务,如编码、翻译以及根据描述性提示撰写论文和电子邮件。根据 DeepSeek 的内部基准测试,DeepSeek V3 的性能优于可下载的 “公开 ”可用模型和只能通过 API 访问的 “封闭 ”人工智能模型。 在编程竞赛平台 Codeforces 主办的编码竞赛子集中,DeepSeek 的表现优于 Meta 的 Llama 3.1 405B、OpenAI 的 GPT-4o 和阿里巴巴的 Qwen 2.5 72B 等模型。DeepSeek V3 还在 Aider Polyglot 测试中击败了竞争对手,该测试旨在衡量模型是否能成功编写新代码,并将其整合到现有代码中。 “综合评估表明,DeepSeek-V3 已成为目前可 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览