資訊抽取
維基百科,自由的 encyclopedia
資訊抽取(Information Extraction,簡稱IE,又譯資訊擷取技術)主要是從大量文字資料中自動抽取特定訊息(Particular Information),以作為資料庫存取(Database Access)之用的技術。
此條目含有過多、重複或不必要的內部連結。 (2021年12月18日) |
資訊抽取的一個廣泛目標是允許對以往非結構化的資料去做計算,具體來說就是要允許邏輯推理能對輸入資料的邏輯內容可以舉一反三。其意義在於決定了例如在互聯網上其非結構化(例:不包含元數據)形式中有用資訊數量的成長。在這方面的技術上是透過轉換到關係形式或是經由XML標籤的標記來達到更多的可存取性──一個智能代理程式,監督一新聞資料饋流,需要資訊擷取技術來轉換非結構化資料到某種可推論的方式。