今天看啥  ›  专栏  ›  InfoQ

一群顶尖搜索人才如何 2 个月出货,还把 GPU 利用率干到 60%!揭秘百川智能研发大模型这一年

InfoQ  · 公众号  · 科技媒体  · 2024-06-27 14:55
    

文章预览

作者|褚杏娟 采访嘉宾|陈炜鹏   去年的大模型之战讲究一个“快”字:入场快、发布快、迭代快。 王小川在去年 4 月份宣布成立“百川智能”的两个月后,就迅速对外推出了 70 亿参数量的中英文预训练大模型 Baichuan 7B。一年多后的今天,百川智能已经将大模型迭代到了 Baichuan 4。 曾担任搜狗搜索研发总经理的陈炜鹏如今在百川智能负责模型研发,这对他来讲也是一次挑战。“搜索与模型研发有很大的不同,研发经验不一定能完全复刻,比如两者对数据的定义可能完全不一样。” 但陈炜鹏也表示,做搜索和大模型也有共性,就是它们都是系统性工程。“在大模型之前,被认为系统性工程的算法问题只有三个:搜索系统、推荐系统和广告系统。以前的搜索经验让我知道怎么样解决一个系统性的问题。” 实际上,百川智能的技术团队可以分为两部 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览