资讯抽取
维基百科,自由的 encyclopedia
资讯抽取(Information Extraction,简称IE,又译资讯截取技术)主要是从大量文字资料中自动抽取特定消息(Particular Information),以作为数据库存取(Database Access)之用的技术。
此条目含有过多、重复或不必要的内部链接。 (2021年12月18日) |
资讯抽取的一个广泛目标是允许对以往非结构化的资料去做计算,具体来说就是要允许逻辑推理能对输入资料的逻辑内容可以举一反三。其意义在于决定了例如在互联网上其非结构化(例:不包含元数据)形式中有用资讯数量的成长。在这方面的技术上是透过转换到关系形式或是经由XML标签的标记来达到更多的可存取性──一个智慧代理程序,监督一新闻资料馈流,需要资讯截取技术来转换非结构化资料到某种可推论的方式。