文章预览
最近,一家来自中国杭州的初创公司 深度求索 (DeepSeek) 凭借发布的两款 大语言模型 (LLM) ,在全世界科技界掀起波澜, 这两款模型的性能可与美国科技巨头开发的主流工具相媲美,但研发成本和所需算力却只是其一小部分。 2025 年 1 月 20 日 ,DeepSeek 发布了 DeepSeek-R1 ,这是一个部分开源 (训练数据未公开,因此并非完全开源) 的“推理”模型,能够以与 OpenAI 于 2024 年年底发布的最先进的专注于“推理”的大语言模型 GPT-o1 相近的水平解决一些科学问题。 几天后的 1 月 28 日,DeepSeek 推出了另一款模型—— Janus-Pro-7B ,能够根据文本提示生成图像,也就是所谓的“文生图”,其性能与 OpenAI 的 DALL-E 3 以及 Stability AI 的 Stable Diffusion 相当。 国际顶尖学术期刊 Nature 在其官网连续发布了 3 篇文章报道 DeepSeek。 美东时间1 月 30 日,
………………………………