专栏名称: 学姐带你玩AI

这里有人工智能前沿信息、算法技术交流、机器学习/深度学习经验分享、AI大赛解析、大厂大咖算法面试分享、人工智能论文技巧、AI环境工具库教程等……学姐带你玩转AI！

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

阿里达摩院大模型算法岗一面面经

学姐带你玩AI · 公众号 · · 2024-12-12 18:30

文章预览

来源：投稿作者：寒武纪编辑：学姐今天分享一些阿里达摩院大模型算法岗一面面经。 1、对大模型有什么了解？简单说了大致的流程，预训练、有监督微调，RLHF 在训练大语言模型时，通常会采用几个关键的步骤，包括预训练、有监督微调（Supervised Fine-Tuning）和基于人类反馈的强化学习（RLHF，Reinforcement Learning from Human Feedback）。以下是这些步骤的简要流程：预训练 (Pre-training)是大语言模型的基础阶段，目的是让模型学习语言的基本结构、语法、语义、常识等。这个过程不依赖于特定任务，而是通过大量的无标注数据来训练模型。预训练阶段后，模型虽然能够理解语言的基础规律，但它可能并未针对特定任务优化。在有监督微调阶段 (Supervised Fine-Tuning)，模型会通过有标签的数据进一步调整，以提高在某些特定任务上的表现。在有监督 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

听玛玛的话 · 修复 2

3 天前

听玛玛的话 · 修复 2

3 天前

东呈金润 · 2024.12.18涨停分析

4 天前

东呈金润 · 2024.12.18涨停分析

4 天前

超红可乐 · 冰山一角z：4个跌停

4 天前

超红可乐 · 冰山一角z：4个跌停

4 天前

子弹财经 · 兴业消金求变，昔日“黑马”如何跨过寒冬？

4 天前

子弹财经 · 兴业消金求变，昔日“黑马”如何跨过寒冬？

4 天前

金融早实习 · 花旗银行2025暑期校招！12月22日截止

4 天前

七公片区开发 · 【片区开发实施方案模板】新机制下《片区开发项目实施方案模板》

1 月前