Rozpoznávání pojmenovaných entit

From Wikipedia, the free encyclopedia

Remove ads

Rozpoznávání pojmenovaných entit (RPE), v angličtině Named-entity recognition (NER), známé také jako identifikace (pojmenovaných) entit či extrakce entit, je dílčí úloha extrakce informací, která se snaží najít a zařadit pojmenované entity uvedené v nestrukturovaném textu do předem definovaných kategorií, jako jsou jména osob, organizace, místa, lékařské kódy, časové výrazy, množství, peněžní hodnoty, procenta atd.[1]

Výše popsaná definice děli RPE/NER na dvě části: lokalizace entit v textu (named entity identification) a jejich klasifikaci (named entity classification). RPE je často používáno pro automatický strojový překlad, vyhledávání informací a dalších klasické úlohy počítačového zpracování přirozeného jazyka.[2]

Remove ads

Princip fungování

RPE systém má fungovat tak, že z neanotovaného textu udělá text anotovaný. RPE pro možnost takového anotování potřebuje mít znalosti z již předem kompletně anotovaných datasetů (učení s učitelem), nebo datasety, kde je alespoň část anotovaná (poloviční učení s učitelem / semisupervised learning).[3]

Odkazy

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads