专栏名称: NVIDIA企业开发者社区

NVIDIA 英伟达开发者社区是NVIDIA GPU开发者交流平台，通过此平台可第一时间获取NVIDIA GPU 开发相关的新产品、新工具、线上/线下活动的资讯。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

开发者新闻 | 利用基于专家的混合 DBRX 在不同任务上实现卓越的 LLM 性能

NVIDIA企业开发者社区 · 公众号 · · 2024-05-20 15:19

文章预览

利用基于专家的混合 DBRX 在不同任务上实现卓越 LLM 性能本周发布的模型以 DBRX 为特色，这是由 Databricks 开发的最先进的大型语言模型 (LLM)。凭借在编程和编码任务方面的实力，DBRX 擅长处理专门的主题和用 Python 等语言编写特定的算法。它还可以用于文本完成任务和少回合交互。DBRX 长上下文能力可用于 RAG 系统，以提高准确性和保真度。该模型使用细粒度混合专家 (MoE) 架构是将其与其他模型区分开来的一个关键特征。MoE 架构通过利用一组专门的 “专家” 网络，擅长处理复杂的任务。在推理过程中，MoE 根据输入数据动态选择和组合这些专家网络的输出，使用学习的门控机制。这种门控机制将输入数据的不同部分路由到最相关的专家网络，使 MoE 能够有效地利用他们的集体专业知识并产生卓越的预测或输出。通过自适应协调其组成网络的贡献 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

艾儿天空 · 桔子不黄《火影教书变强，改变悲剧》300多万字完结，起点火影万订文20多本（含综漫）

14 小时前

库斯卡娅的朋友们 · “她会成为一个好人的，如果每分钟都有人朝她开枪的话。”《好人难寻》是奥康纳的一篇短篇小说，故事里里面充满各色伪善的人，那些人表面行「善」，但是又无法掩饰内心的恶。你可能也遇到过这么一个难题，如何向别人证明：你是一个好人。这就像，如果你在某个领域写了几百万字，你写的文章可以很容易引起广泛讨论，你推动了很多可见的变革，但是还是会有“人”会问你：你到底做了什么？或者总有“人”会跟你说：你能不能少说几句，多做点事。之所以给“人”加上引号，是因为在我看来，那些有脑子不用的谁谁谁，距离成为一个有良知的人，还有很长的一

2 天前

桂林广播电视台飞扬883 · 春节出游！在桂林山水间踏出新春“第一步”

4 天前

桂林广播电视台飞扬883 · 春节出游！在桂林山水间踏出新春“第一步”

4 天前

36氪 · 新方向在何方？动力又该从何而来？看WAVES新浪潮2024嘉宾给出答案

7 月前