文章预览
选自苹果期刊 作者:Siri Team 机器之心编译 参与:Nurhachu Null、李泽南 作为第一种流行语音助手 Siri 的开发者,苹果在自然语言处理方面的研究有哪些心得?最近,苹果在其机器学习期刊上发表了一篇文章,详解了将逆文本化(ITN)转为标签问题的方法,这些技术已经成为 Siri 为人们提供便捷服务的基础。 Siri 使用标准的格式化方式来展示日期、时间、地址和金额等对象。这是由于在语音识别的核心组件的输出上应用了一个被称之为逆转文本标准化(ITN,Inverse Text Normalization)的过程。可以通过下面这个案例来理解 ITN 所起的重要作用,如果没有 ITN,Siri 会把「October 23, 2016」显示成「October twenty third twenty sixteen」。在本文的工作中,考虑到对相对简单、紧凑、能够
………………………………