专栏名称: 学姐带你玩AI

这里有人工智能前沿信息、算法技术交流、机器学习/深度学习经验分享、AI大赛解析、大厂大咖算法面试分享、人工智能论文技巧、AI环境工具库教程等……学姐带你玩转AI！

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

Transformer从菜鸟到新手(七)

学姐带你玩AI · 公众号 · 算法科技媒体 · 2024-06-19 18:09

主要观点总结

本文介绍了如何通过使用束搜索（Beam Search）技术提高BLEU分数，束搜索是一种在生成翻译结果时使用的搜索策略，它能维护多条概率最大的搜索路径，并选择最终的输出。文章还解释了束搜索的工作原理，并通过示例展示了如何使用束搜索和KV缓存来计算BLEU分数，并展示了训练过程以及在测试集上的表现。

关键观点总结

关键观点1: 束搜索介绍

束搜索是一种在生成翻译结果时使用的搜索策略，能维护多条概率最大的搜索路径，并选择最终的输出。

关键观点2: 束搜索工作原理

束搜索通过维护K条概率最大的搜索路径，每次生成时选择概率最大的路径，直到达到结束标记或路径数量达到K。

关键观点3: 束搜索与KV缓存

在训练时使用KV缓存可以提高生成效率，并在生成时通过批量内束搜索实现解码。

关键观点4: 训练与测试表现

在训练过程中，通过计算BLEU分数来评估模型的性能，并在测试集上测试模型的表现。

关键观点5: 注意力机制与掩码

在推理时，需要关注注意力机制的使用和掩码的作用，确保模型生成正确的输出。

免责声明

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
推荐产品: 推荐产品
文章地址：访问文章快照

分享到微博

推荐文章

新郑发布 · 名单公布！河南这些学校具有高招资格→

13 小时前

科技每日推送 · 清华姚班学霸怒斥富豪父亲，强行控制我的升学志愿！

16 小时前

钛媒体 · AI编程“真相”：硬核测试全部0分，AI写代码到底行不行？ | 深读

16 小时前

智东西 · 黄仁勋直聘！清华“天才少年”任英伟达首席研究科学家

昨天

网信内蒙古 · 57款APP（SDK）被通报

2 天前

看雪学苑 · 为逃避抚养费，一黑客黑进死亡登记系统，将自己登记为已故人员

10 月前

3D视觉之心 · SIGGRAPH近几年让人眼前一亮的论文有哪些？

8 月前

MTI及CATTI日语考试 · 瑞译学苑｜考研考证交流群等你！

7 月前

广东民生DV现场 · 网友称不是自己的脸，已报警！腾讯回应

5 月前