Ugrađivanje reči
From Wikipedia, the free encyclopedia
Remove ads
Remove ads
U obradi prirodnog jezika (NLP), ugrađivanje reči je reprezentacija reči. Ugrađivanje se koristi u analizi teksta. Tipično, reprezentacija je vektor realne vrednosti koji kodira značenje reči na takav način da se očekuje da su reči koje su bliže u vektorskom prostoru slične po značenju.[1] Ugrađivanje reči se može dobiti korišćenjem jezičkog modelovanja i tehnika učenja karakteristika, gde se reči ili fraze iz rečnika mapiraju u vektore realnih brojeva.
Metode za generisanje ovog mapiranja uključuju neuronske mreže,[2] smanjenje dimenzionalnosti na matrici pojavljivanja reči,[3][4][5] modele verovatnoće,[6] objašnjivu metodu baze znanja,[7] i eksplicitno predstavljanje u smislu konteksta u kome se reči pojavljuju.[8]
Pokazalo se da ugrađivanje reči i fraza, kada se koristi kao osnovna ulazna reprezentacija, poboljšava performanse u NLP zadacima kao što su sintaksičko raščlanjivanje[9] i analiza osećanja.[10]
Remove ads
Reference
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads