专栏名称: 吃果冻不吐果冻皮
专注于AI工程化(LLM、MLOps、LLMOps、RAG、Agent)落地。
今天看啥  ›  专栏  ›  吃果冻不吐果冻皮

大模型训练方法论及Yi-Large的实践

吃果冻不吐果冻皮  · 公众号  ·  · 2024-07-26 23:14

文章预览

【点击】 加入大模型技术交流群 原文:https://zhuanlan.zhihu.com/p/709900395 智源大会之后,一直想把当时的分享以文字的形式放到知乎上。但因为拖延症一直耽搁了(起初是去CVPR开会并且在硅谷待了一段时间,后面就纯粹是拖延症了)。好不容易有时间,就把这个债先还上。整个talk主要在high-level层面讨论方法论,没有太多的技术细节,大家就当看个乐子吧。在B站上看到一个录屏,不愿意看文字版的可以看视频哈: https://www.bilibili.com/video/BV1W1421C7Uy 夸夸Yi-Large 第一个part肯定是要夸一夸自己的模型,这里用了LMSYS的成绩。现在处于各个benchmark都被刷爆的状态,LMSYS似乎成为了相对客观的一个评价标准。它会更接近大多数用户的真实体感评测(可能有人会觉得它和自己的体感不一致,所以这里是大多数,肯定很难和每个人的体感是一致的): 1. 由用户自己 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览