大模型训练方法论及Yi-Large的实践

吃果冻不吐果冻皮 · 公众号 · · 2024-07-26 23:14

文章预览

【点击】加入大模型技术交流群原文：https://zhuanlan.zhihu.com/p/709900395 智源大会之后，一直想把当时的分享以文字的形式放到知乎上。但因为拖延症一直耽搁了（起初是去CVPR开会并且在硅谷待了一段时间，后面就纯粹是拖延症了）。好不容易有时间，就把这个债先还上。整个talk主要在high-level层面讨论方法论，没有太多的技术细节，大家就当看个乐子吧。在B站上看到一个录屏，不愿意看文字版的可以看视频哈： https://www.bilibili.com/video/BV1W1421C7Uy 夸夸Yi-Large 第一个part肯定是要夸一夸自己的模型，这里用了LMSYS的成绩。现在处于各个benchmark都被刷爆的状态，LMSYS似乎成为了相对客观的一个评价标准。它会更接近大多数用户的真实体感评测（可能有人会觉得它和自己的体感不一致，所以这里是大多数，肯定很难和每个人的体感是一致的）： 1. 由用户自己 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博