词嵌入维基百科,自由的 encyclopedia 词嵌入(英语:Word embedding)是自然语言处理(NLP)中语言模型与表征学习技术的统称。概念上而言,它是指把一个维数为所有词的数量的高维空间嵌入到一个维数低得多的连续向量空间中,每个单词或词组被映射为实数域上的向量。 词嵌入的方法包括人工神经网络[1]、对词语同现矩阵(英语:co-occurrence matrix)降维[2][3][4]、机率模型[5]以及单词所在上下文的显式表示等。[6] 在底层输入中,使用词嵌入来表示词组的方法极大提升了NLP中语法分析器[7]和文本情感分析等的效果。[8]
词嵌入(英语:Word embedding)是自然语言处理(NLP)中语言模型与表征学习技术的统称。概念上而言,它是指把一个维数为所有词的数量的高维空间嵌入到一个维数低得多的连续向量空间中,每个单词或词组被映射为实数域上的向量。 词嵌入的方法包括人工神经网络[1]、对词语同现矩阵(英语:co-occurrence matrix)降维[2][3][4]、机率模型[5]以及单词所在上下文的显式表示等。[6] 在底层输入中,使用词嵌入来表示词组的方法极大提升了NLP中语法分析器[7]和文本情感分析等的效果。[8]