文章预览
近两年大预言模型很火,大预言模型可以视为是自然语言处理领域的一大应用。自然语言处理(Natural Language Processing, NLP)其核心目标是使计算机能够理解、生成和处理人类语言。语言的基础是词语,那么如何让机器来理解词语呢?这就关系到词的表示,也就是词向量。 在NLP中, 词向量(word vector)是非常重要的概念,它通过将词语表示为多维向量来捕捉词语的语义信息 。构造词向量的的方法有很多,比如通过神经网络进行构建,不过本文将介绍一种直观的构建词向量的方法,并通过数学模型和具体案例进行分析和说明。 词向量的基本概念 词向量是用于表示词语在语义空间中位置的向量。通过将词语转换为向量,我们可以在数学上处理词语的相似性和关系。 词向量的核心思想是“可以通过它周围的词语了解一个单词” ("You shall know a word by the com
………………………………