热门问题
时间线
聊天
视角

n元语法

文本中连续出现的n个语词 来自维基百科,自由的百科全书

Remove ads

n元语法(英语:n-gram)指文本中连续出现的n个语词。n元语法模型是基于(n-1)阶马尔可夫链的一种概率语言模型,通过n个语词出现的概率来推断语句的结构。[1][2]这一模型被广泛应用于概率论、通信理论、计算语言学(如基于统计的自然语言处理)、计算生物学(如序列分析)、数据压缩等领域。

当n分别为1、2、3时,又分别称为一元语法(unigram)、二元语法bigram)与三元语法(trigram)。[2]

示例

更多信息 领域, 单位 ...
Remove ads

参考文献

Loading content...
Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads