Горњолужичкосрпски текстуални корпус

From Wikipedia, the free encyclopedia

Горњолужичкосрпски текстуални корпус
Remove ads

Горњолужичкосрпски текстуални корпус (глсрп. ; скраћ. )[1] дигитални је текстуални корпус горњолужичкосрпског језика.

Укратко Горњолужичкосрпски текстуални корпус, Веб-адреса ...
Remove ads

Историја

Историја горњолужичкосрпског текстуалног корпуса је повезана са пројектом Лужичкосрпског института за стварање електронског једнојезичног горњолужичкосрпског речника у првој половини 1990-их година. Међутим, овај пројекат није реализован. Године 1996, почео је рад на стварању електронског горњолужичкосрпског текстуалног корпуса. Оснивач корпуса био је радник Лужичкосрпског института Едвард Ворнар. Након што се 2003. године Ворнар преселио у Лајпциг, одговорност је прешла на руководиоца Лужичкосрпке централне библиотеке Франца Шена.[2] Године 2001, корпус је почео да ради на сајту Лужичкосрпског института. Онда је био двојезичан — лужичкосрпско-енглески.[3] У одабирању актуелних текстова (књига, новина и часописа) учествовали су Народно издавачко предузеће „Домовина” у Бауцену и Језички центар . Већина текстова је скенирана од стране научно-техничког персонала Лужичкосрпског института.[4] Горњолужичкосрпски текстуални корпус ради у сарадњи са Институтом чешког националног корпуса на Филозофском факултету Карловог универзитета у Прагу.[1]

Remove ads

Садржај корпуса

Мали део текстова корпуса, који се углавном односе на 19. век, чува историјску орфографију. Тако, на пример, уместо савременог користи се историјско , уместо савремених , уместо савремених . Текстови 20. века до 1945. године користе за савремено на почетку морфема и меке .[5]

Већина текстова је публицистика (57%), затим — белетристика (23%), верски текстови (4%), научни текстови (4%), речници и књиге за терминологију за поједине школске предмете (12%). Најстарији текстови припадају првој половини 19. века (дела Х. Зејлера и Р. Мења, бројеви „Часописа Матице лужичкосрпске” од 1848. године), најновији текстови су новине „Сербске новини[5] и часопис . Већина текстова односи на период након 1989/1990. година (54%). Текстови 19. века чине 10% корпуса, прве половине 20. века до 1945. године — 18%, за период између 1945. и 1990. година — 19%.[6] Резултати претраге према корпусу дају информације о извору (аутору, наслову, месту и времену публикације).[1]

Remove ads

Референце

Спољашње везе

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads