专栏名称: AI前线
InfoQ十年沉淀,为千万技术人打造的专属AI公众号。追踪技术新趋势,跟踪头部科技企业发展和传统产业技术升级落地案例。囊括网站和近万人的机器学习知识交流社群。
今天看啥  ›  专栏  ›  AI前线

一群顶尖搜索人才如何2个月出货,还把GPU利用率干到60%!揭秘百川智能研发大模型这一年

AI前线  · 公众号  · AI  · 2024-06-25 13:30
    

文章预览

作者|褚杏娟 采访嘉宾|陈炜鹏   去年的大模型之战讲究一个“快”字:入场快、发布快、迭代快。 王小川在去年 4 月份宣布成立“百川智能”的两个月后,就迅速对外推出了 70 亿参数量的中英文预训练大模型 Baichuan 7B。一年多后的今天,百川智能已经将大模型迭代到了 Baichuan 4。 曾担任搜狗搜索研发总经理的陈炜鹏如今在百川智能负责模型研发,这对他来讲也是一次挑战。“搜索与模型研发有很大的不同,研发经验不一定能完全复刻,比如两者对数据的定义可能完全不一样。” 但陈炜鹏也表示,做搜索和大模型也有共性,就是它们都是系统性工程。“在大模型之前,被认为系统性工程的算法问题只有三个:搜索系统、推荐系统和广告系统。以前的搜索经验让我知道怎么样解决一个系统性的问题。” 实际上,百川智能的技术团队可以分为 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览