Ugrađivanje reči

From Wikipedia, the free encyclopedia

Remove ads
Remove ads

U obradi prirodnog jezika (NLP), ugrađivanje reči je reprezentacija reči. Ugrađivanje se koristi u analizi teksta. Tipično, reprezentacija je vektor realne vrednosti koji kodira značenje reči na takav način da se očekuje da su reči koje su bliže u vektorskom prostoru slične po značenju.[1] Ugrađivanje reči se može dobiti korišćenjem jezičkog modelovanja i tehnika učenja karakteristika, gde se reči ili fraze iz rečnika mapiraju u vektore realnih brojeva.

Metode za generisanje ovog mapiranja uključuju neuronske mreže,[2] smanjenje dimenzionalnosti na matrici pojavljivanja reči,[3][4][5] modele verovatnoće,[6] objašnjivu metodu baze znanja,[7] i eksplicitno predstavljanje u smislu konteksta u kome se reči pojavljuju.[8]

Pokazalo se da ugrađivanje reči i fraza, kada se koristi kao osnovna ulazna reprezentacija, poboljšava performanse u NLP zadacima kao što su sintaksičko raščlanjivanje[9] i analiza osećanja.[10]

Remove ads

Reference

Loading content...
Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads