Паралелни текст
From Wikipedia, the free encyclopedia
Remove ads
Паралелни текст је текст постављен упоредо са (бар једним) својим преводом. Поравнавање паралелног текста је успостављање кореспонденције између одговарајућих реченица у две половине паралелног текста. Примери збирки двојезичних паралелних текстова су Лебова класична библиотека и Клејова Санскрит библиотека. Издања Библије могу да садрже и оригинални текст и превод (или неколико превода), са циљем да се поједностави упоређивање, односно проучавање; Оригенова Хексапла ("шестострука“ на грчком) садржи једну уз другу шест верзија Старог завета. Најстарији познати пример паралелних текстова је Камен из Розете.
Паралелни корпус је велика колекција паралелних текстова (видети језички корпус). Поравнавање паралелних корпуса на нивоу реченице предуслов је за истраживања у многим областима лингвистике. У току превођења преводилац може да раставља, саставља, умеће или премешта реченице; због тога поравнавање паралелних текстова није једноставно.
Remove ads
Битекст
У области превођења битекст је документ који садржи упоредо оригинал и превод датог текста.
Битекстови се добијају програмом који се зове , који аутоматски поравнава (упарује) оригинал и превод истог текста. Програм начелно упарује два текста реченицу по реченицу. Колекција битекстова зове се , односно , и обично се користи уз помоћ претраживача.
Историја
Идеја битекста приписује се Брајану Харису, који је написао рад о овом концепту 1988. године. Идеју је разрадила група RALI односно , група истраживача из области рачунарства и лингвистике, који се баве обрадом природних језика.
Битекст и преводилачка меморија
Појам битекста има сличности са појмом преводилачке меморије. Најбитнија разлика између битекста и преводилачке меморије је у томе да је преводилачка меморија база података у којој су њени делови (упарене реченице) смештене потпуно независно од оригиналног контекста; оригинални редослед реченица је изгубљен. Насупрот томе, битекст задржава оригинални редослед реченица. Међутим, неке реализације преводилачке меморије, као што је () (стандардни XML формат за размену преводилачких меморија између програма за машинско превођење) омогућује очување оригиналног редоследа реченица.
Намена битекстова је да их користе преводиоци – људи, а не рачунари. Због тога мале грешке у поравнавању или мала неслагања која би била проблем за преводилачку меморију, овде нису битне.
Remove ads
Види још
- Обрада природних језика
- Машинско превођење
- Упоређивање помоћу рачунара
- Камен из Розете
- Преводилачка меморија
Спољашње везе
Паралелни корпуси
Документација
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads