Горњолужичкосрпски текстуални корпус
From Wikipedia, the free encyclopedia
Remove ads
Горњолужичкосрпски текстуални корпус (глсрп. ; скраћ. )[1] дигитални је текстуални корпус горњолужичкосрпског језика.
Remove ads
Историја
Историја горњолужичкосрпског текстуалног корпуса је повезана са пројектом Лужичкосрпског института за стварање електронског једнојезичног горњолужичкосрпског речника у првој половини 1990-их година. Међутим, овај пројекат није реализован. Године 1996, почео је рад на стварању електронског горњолужичкосрпског текстуалног корпуса. Оснивач корпуса био је радник Лужичкосрпског института Едвард Ворнар. Након што се 2003. године Ворнар преселио у Лајпциг, одговорност је прешла на руководиоца Лужичкосрпке централне библиотеке Франца Шена.[2] Године 2001, корпус је почео да ради на сајту Лужичкосрпског института. Онда је био двојезичан — лужичкосрпско-енглески.[3] У одабирању актуелних текстова (књига, новина и часописа) учествовали су Народно издавачко предузеће „Домовина” у Бауцену и Језички центар . Већина текстова је скенирана од стране научно-техничког персонала Лужичкосрпског института.[4] Горњолужичкосрпски текстуални корпус ради у сарадњи са Институтом чешког националног корпуса на Филозофском факултету Карловог универзитета у Прагу.[1]
Remove ads
Садржај корпуса
Мали део текстова корпуса, који се углавном односе на 19. век, чува историјску орфографију. Тако, на пример, уместо савременог користи се историјско , уместо савремених — , уместо савремених — . Текстови 20. века до 1945. године користе за савремено на почетку морфема и меке .[5]
Већина текстова је публицистика (57%), затим — белетристика (23%), верски текстови (4%), научни текстови (4%), речници и књиге за терминологију за поједине школске предмете (12%). Најстарији текстови припадају првој половини 19. века (дела Х. Зејлера и Р. Мења, бројеви „Часописа Матице лужичкосрпске” од 1848. године), најновији текстови су новине „Сербске новини”[5] и часопис . Већина текстова односи на период након 1989/1990. година (54%). Текстови 19. века чине 10% корпуса, прве половине 20. века до 1945. године — 18%, за период између 1945. и 1990. година — 19%.[6] Резултати претраге према корпусу дају информације о извору (аутору, наслову, месту и времену публикације).[1]
Remove ads
Референце
Спољашње везе
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads