潜在语义索引是一种搜索方法,也是一种索引。通过奇异值分解来识别非结构化的文本集合中的具有联系关系的模式。一般认为,在同样的语境中使用的词语一般具有相似的含义,LSI就是基于这一规则的搜索方法。LSI的一个重要特征就是,通过建立那些出现在相同语境中的词语之间的联系,它能够提取出一个文本的具体内容是什么,而不像以前的搜索方法只是检索具体的关键词。之所以叫潜在语义索引是因为它能够把一组文档中具有隐含的语义联系的词语联系起来。
| 本条目存在以下问题,请协助 改善本条目或在 讨论页针对议题发表看法。
| 此条目没有列出任何参考或来源。 (2015年9月6日) |
| 此条目需要精通或熟悉计算机科学的编者参与及协助编辑。 (2010年3月31日) |
|