Loading AI tools
rodzina językowa z największą liczbą użytkowników Z Wikipedii, wolnej encyklopedii
Języki indoeuropejskie – rodzina językowa, największa pod względem liczby mówiących. Współcześnie występuje na wszystkich zamieszkałych kontynentach, a już od czasów starożytnych obecna w Indiach, Europie (stąd przymiotnik „indoeuropejskie”) oraz Azji Zachodniej. Obejmuje kilkaset spokrewnionych ze sobą języków (a precyzyjniej – etnolektów[uwaga 1]), którymi jako ojczystymi posługuje się łącznie ok. 3,3 miliarda osób (ponad 40% ludności świata).
Obszar |
(▾) cały świat |
---|---|
Liczba mówiących |
(▾) ok. 3,3 mld |
Prajęzyk | |
Podział |
(▾) 13 grup językowych |
Kody rodziny językowej | |
ISO 639-5 | ine |
Glottolog | indo1319 |
Występowanie | |
Gałęzie języków indoeuropejskich w Eurazji | |
Ta strona zawiera symbole fonetyczne MAF. Bez właściwego wsparcia renderowania wyświetlane mogą być puste prostokąty lub inne symbole zamiast znaków Unicode. |
Do rodziny indoeuropejskiej należy m.in. zdecydowana większość rdzennych języków Europy (w tym polski) oraz liczne języki subkontynentu indyjskiego i Wyżyny Irańskiej. Wskutek wielkich odkryć geograficznych, kolonializmu i globalizacji rozprzestrzeniła się ona poza Eurazję – w większości państw świata co najmniej jeden indoeuropejski język ma status języka urzędowego. Z dziesięciu najczęściej używanych języków świata osiem to języki indoeuropejskie: angielski (razem – jako ojczysty i obcy – prawie 1,5 miliarda użytkowników), hindi, hiszpański (oba powyżej 500 milionów), francuski, bengalski, portugalski, rosyjski i urdu (każdy ponad 200 milionów). Na nieco dalszych miejscach znajdują się niemiecki, marathi, perski i włoski; spośród zaś wielu małych języków rodziny część jest zagrożona wymarciem.
Druga, po afroazjatyckiej, najstarsza pod względem źródeł historycznych istniejąca do dziś rodzina językowa. Pierwszym zaświadczonym w piśmie (od XVII w. p.n.e.) językiem indoeuropejskim był hetycki z Azji Mniejszej, natomiast w Europie najwcześniejsze zapiski (z przełomu XV i XIV w. p.n.e.) pochodzą ze starogreckiego języka mykeńskiego. Prawdopodobnie również już w połowie II tysiąclecia p.n.e. powstały najstarsze hymny staroindyjskiej Rygwedy (język wedyjski) – spisano ją jednak dopiero wiele wieków później na podstawie długiej tradycji ustnej, podobnie jak młodszą, staroirańską Awestę (awestyjski). Niektóre z dawnych języków, jak klasyczna greka, łacina czy sanskryt, znane są z tysięcy obszernych tekstów; inne tylko z pojedynczych inskrypcji, nazw miejscowych, a czasem wyłącznie z imion występujących w obcych źrodłach.
W wewnętrznej klasyfikacji języków indoeuropejskich wyróżnianych jest trzynaście grup językowych – albańska, bałtycka, celtycka, germańska, helleńska, indoaryjska, irańska, nuristańska, ormiańska, romańska (kontynuująca dawną grupę italską), słowiańska oraz wymarłe anatolijska i tocharska – a także pewna liczba języków dokładniej niesklasyfikowanych. Bliżej spokrewnione grupy są łączone w kategorie wyższego rzędu – podrodziny, np. bałtosłowiańską (skupiającą języki bałtyckie i słowiańskie) czy indoirańską (indoaryjskie, irańskie i nuristańskie); niektórzy językoznawcy proponują również inne – choć szczegółowe związki między pozostałymi współczesnymi gałęziami rozwojowymi nie zostały dotychczas jednoznacznie ustalone.
Rodzina indoeuropejska jest zróżnicowana typologicznie. Jej większość stanowią języki syntetyczne typu fleksyjnego, w których koniugacja oraz deklinacja odpowiednich części mowy są tworzone zazwyczaj przy użyciu pojedynczych, wielofunkcyjnych końcówek. Mniejszość zaś to języki analityczne – choć widoczna jest ogólna tendencja do upraszczania odmiany słów i rozwoju analitycznych (z wykorzystaniem słów posiłkowych, m.in. niektórych czasowników, przyimków lub przysłówków) konstrukcji, jak np. w różnych językach germańskich, romańskich bądź indoirańskich. Na początku zdania najczęściej znajduje się podmiot (w celtyckich – orzeczenie), jednak przy prawidłowym stosowaniu odpowiednich form wiele języków rodziny pozwala na dość dużą swobodę szyku wyrazów. Wyjątkiem są języki typu pozycyjnego, takie jak angielski czy francuski, które wymagają określonej kolejności elementów wypowiedzi.
Ostatnim wspólnym przodkiem wszystkich języków indoeuropejskich był język praindoeuropejski. Choć nie został on zaświadczony bezpośrednio (nie są znane żadne źródła praindoeuropejskiego), to jego istnienie jest przyjmowane jako pewne. Liczne zbieżności w fonetyce, gramatyce oraz leksyce wielu dawnych i współczesnych języków kontynentu są według badaczy zbyt regularne, by powstały wskutek wzajemnego oddziaływania – uważa się więc, że zostały odziedziczone z owego postulowanego prajęzyka. Według najpopularniejszej hipotezy, zwanej teorią stepową lub kurhanową, posługująca się nim ok. 4–3 tysięcy lat p.n.e. ludność zamieszkiwała obszar Stepu Pontyjskiego i współtworzyła prehistoryczną kulturę grobów jamowych. Za pomocą metody porównawczej w znacznym stopniu zrekonstruowano i odtworzono jego przybliżone brzmienie, budowę i słownictwo.
Badaniem pochodzenia, rozwoju i struktury rodziny indoeuropejskiej oraz porównywaniem jej języków zajmuje się nauka zwana indoeuropeistyką, która jest w dużej mierze dziedziną interdyscyplinarną, wykraczającą poza ramy językoznawstwa. Przedmiotem spekulacji archeologicznych, genetycznych i kulturoznawczych jest m.in. lokalizacja indoeuropejskiej praojczyzny. Nie jest znane pokrewieństwo rodziny indoeuropejskiej z innymi, choć niektórzy specjaliści poszukują takich związków i wysuwają różne propozycje – jako najbliższa sugerowana bywa przede wszystkim rodzina języków uralskich.
Do indoeuropejskich zaliczane są wyłącznie te języki, które wywodzą się – najczęściej poprzez wiele etapów rozwoju – ze wspólnego, nieistniejącego już prajęzyka zwanego praindoeuropejskim† [1] [uwaga 2]. Są więc one językami pokrewnymi; a zatem, zgodnie z definicją, tworzą rodzinę językową [2]. Wykształciły się i zróżnicowały w wyniku rozmaitych językowych zmian, powoli, lecz nieustannie zachodzących na całym indoeuropejskim obszarze. Zmiany te były efektem ubocznym kolejnych migracji Indoeuropejczyków, w trakcie których przemieszczająca się ludność traciła kontakt ze swoją pierwotną społecznością, a wspólna uprzednio mowa stopniowo ewoluowała w odrębnych kierunkach [3].
Swoją nazwę rodzina indoeuropejska zawdzięcza Thomasowi Youngowi, który w 1813 r. jako pierwszy użył owego określenia [4]. Termin ten został utworzony od geograficznych nazw Indii i Europy, gdzie już w starożytności mówiono należącymi do niej językami [5]. Nie oznacza to jednak, że w jej skład wchodzą wszystkie języki zarówno w Europie [uwaga 3], jak i w Indiach [uwaga 4] – o przynależności decyduje jedynie ściśle określone, wskazane wyżej pochodzenie i wynikające z niego pokrewieństwo [6]. Mimo że w czasach nowożytnych rozprzestrzeniła się ona po całym świecie, przymiotnik „indoeuropejskie” pozostaje w użyciu jako element tradycji językoznawczej[5].
Dokładna liczba języków indoeuropejskich jest trudna do ustalenia. Ethnologue w wydaniu z r. 2023 wymienia ich 455 [7], natomiast w bazie Glottolog z następnego roku wyszczególnionych zostało 586 języków rodziny [8] (stanowią więc ok. 6–7% języków świata [uwaga 5]). Główną przyczyną rozbieżności jest brak precyzyjnych kryteriów pozwalających jednoznacznie stwierdzić, czy dana mowa jest odrębnym językiem, czy tylko jakąś odmianą (np. dialektem) innego [9]. Ponadto w rozmaitych klasyfikacjach różnie są traktowane makrojęzyki [10] i języki kreolskie [11] [12], a w niektórych świadomie zostały pominięte (w rozmaitym zakresie) języki martwe [uwaga 6]. Niemniej jednak indoeuropejska rodzina językowa należy pod tym względem do kilku najliczniejszych[7] [13]:
Lp. | Rodzina językowa | Liczba języków | |
---|---|---|---|
wg Ethnologue | wg Glottolog | ||
1 | nigero-kongijska [uwaga 7] | 1554 | 1410 |
2 | austronezyjska | 1256 | 1274 |
3 | transnowogwinejska | 481 | 316 |
4 | chińsko-tybetańska | 458 | 514 |
5 | indoeuropejska | 455 | 586 |
6 | australijska | 384 | — [uwaga 8] |
7 | afroazjatycka | 382 | 381 |
Rodzina indoeuropejska wyróżnia się wśród języków świata największą liczbą mówiących, aczkolwiek również tę wartość ciężko dokładniej określić. Według Ethnologue indoeuropejskimi jako językami ojczystymi mówi łącznie ok. 3,3 miliarda ludzi [14] (czyli ponad 40% ludności świata [uwaga 9]), a ponadto co najmniej 2 miliardy osób posługuje się kilkunastoma najczęściej używanymi językami rodziny jako językami obcymi [15]. Zgodnie z cytowaną publikacją do pięciu rodzin o największej liczbie rdzennych użytkowników zaliczają się[14]:
Lp. | Rodzina językowa | Liczba mówiących | Odsetek ludności świata |
---|---|---|---|
1 | indoeuropejska | 3,32 mld | 44,9% |
2 | chińsko-tybetańska | 1,43 mld | 19,3% |
3 | nigero-kongijska | 620 mln | 8,4% |
4 | afroazjatycka | 604 mln | 8,2% |
5 | austronezyjska | 327 mln | 4,4% |
(wyłącznie języki ojczyste) |
Językami indoeuropejskimi – zarówno jako ojczystymi, jak i obcymi – mówi ludność na wszystkich zamieszkałych kontynentach[8]. Pod koniec średniowiecza posługiwano się nimi prawie wyłącznie w Eurazji [16]; w czasach nowożytnych, wskutek ekspansji kolonialnej, niektóre z nich rozprzestrzeniły się na pozostałe lądy [17]. Współcześnie indoeuropejskie jako języki rodzime są głównymi językami w następujących rejonach poszczególnych części świata [18]:
Na terenie Eurazji występują setki rodzimych języków indoeuropejskich[8], a począwszy od XVIII stulecia prawie całą Amerykę Północną, Australię, Nową Zelandię oraz wiele mniejszych obszarów na całym świecie opanował angielski[17]. Z kolei Amerykę Środkową i Południową zajął głównie hiszpański – z wyjątkiem Brazylii, która stała się domeną portugalskiego. W Ameryce powstały również obszary francuskojęzyczne (w Kanadzie i na Haiti), natomiast w Południowej Afryce wykształcił się język afrikaans[17]. Oprócz tego w większości krajów świata co najmniej jeden indoeuropejski język jest używany jako język urzędowy [19], sam angielski zaś wykorzystywany jest w wielu dziedzinach jako język globalnej komunikacji [20].
Poszczególne języki indoeuropejskie różnią się stopniem wzajemnego pokrewieństwa. Zgodnie z tym kryterium są one grupowane wewnątrz rodziny w odpowiednie zespoły języków spokrewnionych bliżej [21], wyróżniane na podstawie współdzielonych przez nie istotnych innowacji językowych [22]. Tego rodzaju kategoryzacja nosi miano klasyfikacji genetycznej lub genealogicznej[21] [uwaga 12]. W niniejszym artykule za jej podstawową jednostkę wewnętrznego podziału przyjęto grupę językową [uwaga 13]. Pozostałe wykorzystane kategorie, zgodne z taksonomią filogenetyczną zaproponowaną przez Alfreda Majewicza, to podrodzina – łącząca ściślej spokrewnione grupy w obrębie rodziny oraz podgrupa – obejmująca ściślej spokrewnione języki w obrębie grupy [23].
W literaturze z XXI w. jest wyróżnianych trzynaście indoeuropejskich grup językowych [uwaga 14], często łączonych dla uproszczenia w dziesięć linii rozwojowych o różnych rangach [24] [25]. Rodzinę tę tworzą zatem następujące gałęzie[24][25] – grupy (jeśli nie podano inaczej) i podrodziny języków:
Ponadto do rodziny indoeuropejskiej należy pewna liczba słabo zaświadczonych, a w konsekwencji dokładniej niesklasyfikowanych języków starożytnych [27]. Wśród nich znajdują się m.in. rozmaite języki paleobałkańskie, zgrupowane na podstawie kryterium geograficznego (używane na Bałkanach i niektórych sąsiednich obszarach) [28], w tym dwa kompleksy językowe [29]:
Według jednej z hipotez właśnie z ilirskiego wywodzi się gałąź albańska [30]. Natomiast niektóre z pozostałych indoeuropejskich grup filogenetycznych są często, na podstawie sugerowanego bliższego pokrewieństwa, łączone w kategorie wyższego rzędu – podrodziny (co zostało już uwzględnione w zaprezentowanym wyżej podziale) [31]:
część językoznawców proponuje także [32]:
Niekwestionowany status ma podrodzina indoirańska – bliskie pokrewieństwo grup wchodzących w jej skład jest bardzo dobrze udokumentowane, także dzięki niektórym źródłom historycznym [33]. Niewiele mniejszą akceptacją cieszy się klasa języków bałtosłowiańskich[31] [34], choć dawniej łączenie ich w jeden klad bywało czasem uważane za kontrowersyjne [35]. Dużo sporów wywoływała proponowana gałąź italoceltycka [36], ale w XXI w. wiele publikacji głównego nurtu uznaje istnienie wspólnego etapu rozwojowego języków celtyckich i italskich [37] [38]. Z nieco większą rezerwą traktowana jest kategoria helleno-ormiańska, ale i ona ma swoich zwolenników [39] [40].
Wreszcie sama grupa języków anatolijskich jest przeciwstawiana wszystkim pozostałym, ujętym łącznie (określanym jako indoeuropejskie właściwe [41], jądrowe [42], klasyczne[8] lub indo-tocharskie [43]) – stanowi ona bowiem najbardziej odrębną gałąź całego drzewa filogenetycznego rodziny [44]. Dawniej za najważniejszy i pierwotny podział indoeuropejskich uznawany był ich podział na języki kentum i satem, związany z różnicami w rozwoju niektórych głosek tylnojęzykowych [45]. W późniejszych latach jednak, po zakwestionowaniu jego kladystycznego charakteru, a tym samym nienależnej wagi, stracił na znaczeniu [46].
Poniższa klasyfikacja języków rodziny, z uwzględnieniem szczegółowego podziału na podgrupy, została oparta na dwóch publikacjach z końca XX w.:
Jako podstawę owej klasyfikacji wykorzystano systematykę filogenetyczną Ruhlena, którą następnie rozbudowano w odpowiednich miejscach o alternatywne propozycje Majewicza i uzupełniono o wybrane etnolekty figurujące w bazie Glottolog[8]. Przyjęto następujące zasady:
Niektóre byty językowe w rodzinie indoeuropejskiej mają charakter kontinuum dialektalnego – tak jak m.in. języki zachodnioromańskie (obejmujące języki romańskie bez podgrupy wschodniej) [49] czy w zasadzie cała grupa indoaryjska [50] [uwaga 23]. Zmiany językowe na obejmowanych przez nie terenach następują nie skokowo, lecz płynnie narastając; ciężko jest zatem określić, gdzie kończy się jeden język, a zaczyna inny [51]. W nowszych klasyfikacjach grupa romańska jest dzielona na trzy podgrupy, w tym italo-zachodnią, która obejmuje na niższych poziomach podziału większość gałęzi przedstawionych wyżej (z uwzględnieniem nowo wyróżnionej klasy języków gallo-italskich – z lombardzkim czy piemonckim – oraz odrębnie językiem aragońskim) [52] [53]:
Gałąź językowa (nowszy podział) | Wybrane języki współczesne | |
---|---|---|
grupa | podgrupa | |
romańska | południowa | korsykański, sardyński |
wschodnia | arumuński, istrorumuński, meglenorumuński, rumuński | |
italo-zachodnia | francuski, hiszpański, kataloński, oksytański, portugalski, sycylijski, włoski |
Natomiast dużo bardziej skomplikowane podziały są proponowane współcześnie dla grup podrodziny indoirańskiej (w szczególności indoaryjskiej oraz irańskiej) [54] [55]. W grupie anatolijskiej zaś, w miejsce dawniejszych hetycko-lidyjskiej i luwijskiej, bywają wyróżniane podgrupy hetycka oraz luwijsko-lidyjska [56]. Istnieją więc znaczące różnice w szczegółach klasyfikacji rodziny indoeuropejskiej [57] oraz w liczbie wyróżnianych języków [58]. Zauważalna jest ogólna tendencja do uznawania za pełnoprawne języki coraz większej liczby etnolektów [59].
Klasyfikacja | Liczba wyróżnianych języków | Suma | |||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
alb. | anat. | bałt. | celt. | germ. | helleń. | indoar. | irań. | ital. | nurist. | orm. | słow. | toch. | inne | ||
A. Majewicz (1989) [60] [uwaga 24] | 1 | 8 | 8 | 10 | 23 | 4 | 40 | 50 | 42 | 23 | 8 | 19 | 2 | 42 | 280 |
M. Ruhlen (1991)[47] | 1 | 5 | 3 | 7 | 16 | 3 | 49 | 49 | 23 | 5 | 2 | 15 | 2 | — | 180 |
Ethnologue 26 (2023)[61] [uwaga 25] | 4 | — | 7 | 6 | 49 | 6 | 220 | 85 | 45 | 6 | 2 | 24 | — | 1 | 455 |
Glottolog 5.0 (2024)[8] [uwaga 26] | 4 | 10 | 2 | 15 | 106 | 13 | 220 | 96 | 86 | 5 | 3 | 20 | 2 | 4 | 586 |
W niektórych źródłach można spotkać się z innego typu podziałem języków indoaryjskich, opartym na okresach ich rozwoju historycznego. Na podstawie owego kryterium wyróżniane są języki [62] [63]:
Podobnie ma to miejsce w przypadku języków irańskich, dzielonych czasem diachronicznie na [64]:
Natomiast w geografii językowej bywa stosowana klasyfikacja geograficzna, grupująca języki – niekoniecznie blisko spokrewnione – w ligi językowe. Te zaś są wyróżniane na podstawie podobieństw cech nie odziedziczonych z prajęzyka, lecz wykształconych wtórnie wskutek długotrwałych, wzajemnych kontaktów na określonych obszarach [65]. Najczęściej opisywaną w literaturze jest liga bałkańska [66], do której należą przede wszystkim takie języki jak albański, grecki, bułgarski, macedoński, rumuński, arumuński oraz południowe dialekty sztokawskie języka serbsko-chorwackiego [67]; w trakcie wielu wieków współistnienia wytworzyły one nowe, wspólne struktury gramatyczne [68] [uwaga 27]. W latach 70. XX w. Gyula Décsy opracował tego typu geograficzny podział języków Europy, a wśród zaproponowanych przez niego kategorii, obejmujących m.in. rozmaite języki indoeuropejskie, oprócz bałkańskiej znalazły się ligi: dunajska, pejpuska, pobrzeżna, rokytnicka, wielkich języków Europy i wikingijska [69].
W skład indoeuropejskich wchodzą również pewne bliżej niesklasyfikowane języki dawne. W większości znane są jedynie z niewielkiej liczby źródeł pisanych, a w niektórych przypadkach wyłącznie z nazw miejscowych lub imion; ich pozycja w obrębie rodziny jest więc przedmiotem wielu spekulacji oraz kontrowersji[27].
Do tych, których stanowiska filogenetyczne nie zostały sprecyzowane należą przede wszystkim rozmaite języki paleobałkańskie. Terminem tym określany jest zbiór różnorodnych etnolektów, używanych w starożytności głównie na terenach Bałkanów, a częściowo także w Azji Mniejszej oraz Italii[28]. Zaliczały się do nich m.in. [70]:
Dacki i tracki wchodzą w skład kompleksu trackiego, będącego zespołem dialektów jednego lub większej liczby języków [71]. Dacki bywa uważany za bliski trackiemu [72] lub za jego odmianę [73], choć Glottolog klasyfikuje oba jako odrębne języki o nieustalonej pozycji [74]. Sam tracki dawniej łączono z ormiańskim w kategorię języków tracko-ormiańskich [75], do której zaliczano również frygijski [76]. Ten ostatni jest w nowszych publikacjach przypisywany do gałęzi greckiej [77] lub do większej klasy grecko-frygijskiej [78], jako jego dialekt zaś sklasyfikowano myzyjski [79].
Z kolei ilirski, mesapijski, panoński i (z reguły) peoński są zaliczane do kompleksu ilirskiego; także w tym przypadku nie wiadomo, czy był on tworzony przez dialekty jednego języka, czy większej ich liczby [80]. Osobnym językiem mógł być panoński, aczkolwiek utożsamiano go też z samym ilirskim [81]. Również mesapijski jest uważany albo za samodzielny, odrębny od ilirskich język[76], albo za ich dialekt [82]. Natomiast z samej mowy Ilirów według jednej z hipotez wywodzi się albański[30]. Wreszcie wenetyjski, który bywa umieszczany w grupie italskiej jako jej odrębna gałąź [83], a dodatkowo proponowane jest jego pokrewieństwo z liburnijskim[81].
Paleobałkański obszar językowy dopełniały dawne stadia rozwojowe greckiego, a ponadto staromacedoński† [uwaga 29] oraz pelazgijski† [84]. Dwa pierwsze nie sprawiają jednak trudności w klasyfikacji i umieszczane są w grupie helleńskiej – bądź jako języki siostrzane, bądź też staromacedoński bywa uznawany za dialekt starożytnej greki† [85]. Rozważano również miejsce przedgreckiego języka pelazgijskiego [86] [87], lecz dotychczasowe próby udowodnienia jego indoeuropejskiego charakteru kończyły się porażką [88].
Do indoeuropejskich zaliczane są również takie dawne języki spoza obszaru paleobałkańskiego jak:
a czasami także te, których przynależność do rodziny bywa kwestionowana, choć niewykluczona:
Sporną kwestię w systematyce filogenetycznej rodziny stanowią byty językowe, które norma ISO 639-3 określa jako makrojęzyki. Termin ten oznacza jednostkę klasyfikacyjną owego standardu, obejmującą grupy etnolektów, które ze względów etnicznych, religijnych czy politycznych są uznawane za odrębne warianty tej samej mowy [97]. W klasyfikacji Ethnologue poszczególne odmiany tego rodzaju mają rangę osobnych, pełnoprawnych języków[10]. Do makrojęzyków indoeuropejskich zaliczono w ISO [98]:
Zupełnie inny charakter mają natomiast języki kreolskie. Są to języki mieszane, powstałe – w tym przypadku – na bazie mowy indoeuropejskich kolonizatorów, z dużym udziałem języków lokalnych [99]. Zostały zaliczone w poczet rodziny indoeuropejskiej przez Majewicza (jako osobny zbiór w jej obrębie)[12], a także w klasyfikacji Glottolog, gdzie przypisano je do poszczególnych grup filogenetycznych w zależności od języka[8].
Do kreoli należą m.in.[11]:
Niektóre z nich mają oficjalny status – kreolski haitański jest jednym z języków urzędowych na Haiti, a kreolski seszelski na Seszelach, podobnie jak tok pisin w Papui-Nowej Gwinei i bislama na Vanuatu. Z kolei papiamento należy do oficjalnych języków na terytoriach Aruby, Bonaire i Curaçao, a pitkarnyjski (formalnie: norfolski) – na terytorium Norfolku [100].
Liczba osób posługujących się poszczególnymi językami rodziny jest trudna do sprecyzowania. Piętnaście – pod względem łącznej liczby mówiących – najczęściej używanych w początkach lat dwudziestych XXI w. języków indoeuropejskich przedstawiono w poniższej tabeli; zawarte w niej dane opublikowane zostały w Ethnologue w 2023 r.[15]
Lp. | Język indoeuropejski |
Grupa językowa |
Liczba mówiących | |
---|---|---|---|---|
rodzima | łączna | |||
1 | angielski | germańska | 380 | 1456 |
2 | hindi | indoaryjska | 345 | 609,5 |
3 | hiszpański | romańska | 485 | 559,1 |
4 | francuski | romańska | 81 | 309,8 |
5 | bengalski | indoaryjska | 234 | 272,8 |
6 | portugalski | romańska | 236 | 263,6 |
7 | rosyjski | słowiańska | 147 | 255,0 |
8 | urdu | indoaryjska | 71 | 231,7 |
9 | niemiecki (standardowy [uwaga 31]) | germańska | 75 | 133,2 |
10 | marathi | indoaryjska | 83 | 99,2 |
11 | perski (irański [uwaga 32]) | irańska | 57 | 78,6 |
12 | włoski | romańska | 65 | 67,9 |
13 | zachodniopendżabski | indoaryjska | ? [uwaga 33] | 66,7 |
14 | gudźarati | indoaryjska | 57 | 62,1 |
15 | bhodźpuri | indoaryjska | 52 | 52,5 |
(w milionach) |
Do pozostałych indoeuropejskich języków, z których każdym mówi łącznie co najmniej 10 mln osób, zgodnie z tym samym źródłem należą (uwzględniono również – zapisane kursywą – języki typu kreolskiego)[15]:
Natomiast według szacunków Jamesa Clacksona co najmniej siedemdziesiąt indoeuropejskich etnolektów miało w 2003 r. milion lub więcej rodzimych użytkowników [101].
Co najmniej jeden indoeuropejski język jest językiem urzędowym w większości krajów świata[19]. Poniższa lista języków o takim statusie została oparta na Urzędowym wykazie nazw państw i terytoriów niesamodzielnych z 2023 r. [uwaga 34]
Języki indoeuropejskie urzędowe w co najmniej jednym kraju[19]:
Wyłącznie na terytoriach zależnych urzędowymi językami są [102]:
Oprócz tego niektóre języki rodziny są też oficjalnymi językami dużych międzynarodowych organizacji, m.in.:
Podane niżej wartości określające łączną liczbę osób mówiących językami poszczególnych grup mają charakter szacunkowy i odnoszą się wyłącznie do języków ojczystych (problemem jest nieustannie zmieniająca się liczebność populacji ich użytkowników, brakuje więc szczegółowych opracowań). Zostały one oparte na danych z następujących źródeł, odpowiednio oznaczonych w treści:
Natomiast przedstawione informacje dotyczące obszarów występowania poszczególnych gałęzi, a także należących do nich języków oraz używanych przez nie rodzajów pisma stanowią wiedzę ogólną, weryfikowalną w licznych publikacjach [uwaga 35].
Języki albańskie
Według podręcznikowego ujęcia należy do nich jedynie język albański, występujący w dwóch zróżnicowanych odmianach: gegijskiej i toskijskiej [108]. W nowszych klasyfikacjach, traktujących jego odmiany i dialekty jako odrębne mowy, wyróżniane są cztery języki albańskie [109] [110]. Są one używane przez ok. 6–7 mln osób [ᴄ 6,5 mln; ᴋ 7 mln] głównie w Albanii, Kosowie i zachodniej Macedonii. Albańskojęzyczne enklawy istnieją też w południowej części Włoch (etnolekt arbaryjski) i w Grecji (arwanicki) [111]. Jedna z najmłodszych grup indoeuropejskich pod względem źródeł historycznych, zaświadczona w piśmie dopiero od XV w. [112] Przedmiotem spekulacji są jej związki ze starożytnymi językami bądź dialektami ilirskimi – według niektórych badaczy właśnie z mowy Ilirów wywodzi się późniejszy albański[30] [113]. Uległ on znaczącym wpływom języków sąsiednich, z którymi tworzy bałkańską ligę językową[67]. Albańska gramatyka wyróżnia się rozbudowanym systemem czasownikowym, na który składa się m.in. osiem czasów i sześć trybów – w tym optativus (tryb życzący – „oby…”, „niech…”) czy admirativus (tryb wyrażający czynność nagłą i nieoczekiwaną) [114].
Języki anatolijskie
Wymarła grupa starożytnych języków używanych w Anatolii na terenach dzisiejszej Turcji, bardzo archaiczna i najbardziej odrębna filogenetycznie gałąź indoeuropejska [115]. Należał do niej m.in. hetycki†, najstarszy znany w piśmie indoeuropejski język – odkryte zostały teksty hetyckojęzyczne datowane na XVII w. p.n.e., a nazwy własne znaleziono nawet w zapiskach staroasyryjskich z XX w. p.n.e. [116] [uwaga 36] Ma on istotne znaczenie dla badań nad rozwojem rodziny, gdyż zachował ślady dwóch praindoeuropejskich głosek krtaniowych [117]. Podobnie jak inne starsze języki tej grupy – luwijski† i palajski† – do zapisu stosował pismo klinowe [118]. Nowsze języki anatolijskie, jak licyjski† czy lidyjski†, znane są jeszcze z początków naszej ery[118]. Gramatyczna kategoria rodzaju była oparta na żywotności – wyróżniano rodzaj żywotny (osobowy) i nieżywotny (przedmiotowy); w sferze fonetycznej zaś gałąź anatolijską cechował stosunkowo ubogi zasób samogłosek [119].
Języki bałtyckie
Współcześnie należą do nich dwa blisko spokrewnione języki z podgrupy wschodniobałtyckiej – litewski i łotewski – w tym ich pewne dosyć zróżnicowane dialekty, czasem uznawane nawet za odrębne mowy [120]. Używane łącznie przez kilka milionów osób [ʙ ok. 4,9 mln; ᴄ ok. 4,4 mln; ᴋ 6,2 mln] na obszarach położonych nad południowo-wschodnią częścią Morza Bałtyckiego. Oba znane w piśmie dopiero od XVI w., najstarszy zaś bałtojęzyczny tekst (z XIV w.) pochodzi z wymarłego języka pruskiego† [121] – należącego do innej podgrupy, zachodniobałtyckiej†[120]. Język litewski ma bardzo konserwatywny charakter, mniej archaicznych cech występuje natomiast w łotewskim [122]. Zarówno ten pierwszy, jak i drugi utrzymały siedem przypadków gramatycznych (identycznych jak w polszczyźnie), utraciły natomiast rodzaj nijaki. Ta ostatnia kategoria istniała w pruskim, który zachował jeszcze więcej archaizmów niż litewski [123]. W okresie bałtosłowiańskiej wspólnoty językowej bałtyckie wraz ze słowiańskimi wykształciły podobny system akcentu wyrazowego oraz złożoną odmianę przymiotnika [124].
Języki celtyckie
W starożytności szeroko rozpowszechnione w Europie, a dotarły nawet do Azji Mniejszej (język galatyjski†) [125]. Współcześnie w zaniku, kilkoma należącymi do nich językami mówi około miliona osób [ᴄ ok. 1 mln; ᴋ 1,2 mln] na Wyspach Brytyjskich i w Bretanii. Najstarszym zaświadczonym w piśmie językiem gałęzi celtyckiej (od VI w. p.n.e.) jest lepontyjski† [126]. Ich wewnętrzna klasyfikacja filogenetyczna budzi spory językoznawców; często dzielone są pseudogeograficznie [uwaga 37] na kontynentalne† (np. galijski† czy celtyberyjski†) i wyspiarskie [127]. Do tych ostatnich należą wszystkie istniejące w XXI w. języki grupy, takie jak bretoński, irlandzki, szkocki czy walijski. Alternatywnym podziałem jest podział fonetyczny na języki P-celtyckie i Q-celtyckie – oparty na różnej ewolucji praceltyckiej† głoski *kʷ [uwaga 38] – który nie pokrywa się z klasyfikacją geograficzną [128]. Z reguły używają rzadkiego jak na rodzinę indoeuropejską szyku wyrazów typu VSO, z orzeczeniem na początku zdania [129]. Charakterystycznymi zjawiskami fonetycznymi w nowożytnych językach celtyckich są, w szczególności na początku słów, lenicja (osłabienie głoski) i nazalizacja (unosowienie). Postępuje także zanik deklinacji – wymarłe języki kontynentalne (zwłaszcza celtyberyjski) były pod tym względem dużo bardziej archaiczne [130].
Języki germańskie
Liczna ludnościowo grupa w Europie Zachodniej, Północnej i Środkowej, wielu krajach Ameryki, w Australii oraz Oceanii, ok. 500–600 mln mówiących [ᴄ pow. 550 mln; ᴋ 500 mln]. Do germańskich należą m.in. angielski (język o zasięgu ogólnoświatowym), niemiecki, języki skandynawskie, niderlandzki czy wywodzący się z tego ostatniego jedyny w rodzinie rdzenny nowożytny język Afryki – afrikaans. Najstarsza znana inskrypcja germańska, zapisana runami, pochodzi z II w. n.e. [131] Charakterystycznymi zmianami fonetycznymi we wczesnym okresie rozwojowym gałęzi były przesuwki spółgłoskowe, zmieniające wymowę niektórych głosek (prawo Grimma) [132]. Języki germańskie wykształciły rodzajnik oraz dwa typy czasowników: mocne (z zachowanym przegłosem indoeuropejskim, tzw. ablautem) i słabe (odmieniające się regularnie); występuje również specyficzny dla tej grupy przegłos zwany umlautem [133]. Wyróżnia się ona ponadprzeciętnym odsetkiem wyrazów o nieustalonym, przedindoeuropejskim pochodzeniu [134].
Języki helleńskie
W podręcznikowym ujęciu jest do nich zaliczany jedynie język grecki (ogólny termin obejmujący różne odmiany i stadia rozwojowe)[108], którym mówi kilkanaście milionów osób [ᴄ ok. 14 mln; ᴋ 12,3 mln] w Grecji i na Cyprze. Nowsze klasyfikacje wyróżniają od kilku do kilkunastu odrębnych (w tym martwych) języków helleńskich[78] [135]. Druga najstarsza grupa indoeuropejska pod względem zabytków językowych – najwcześniejsze teksty w języku mykeńskim†, zapisane pismem linearnym B, są datowane na ok. 1400 r. p.n.e. [136] Współczesna greka – zwana językiem nowogreckim – wywodzi się ze starożytnego standardu koine†, który różnił się od greki klasycznej† [137]. Nowogrecki utracił bezokolicznik oraz wykształcił czas przyszły z wykorzystaniem czasownika „chcieć”[119]. W użyciu alfabet grecki.
Języki indoaryjskie
Największa grupa zarówno pod względem liczby języków [138], jak i liczby mówiących (być może nawet powyżej miliarda użytkowników [ʙ pow. 800 mln; ᴄ pow. 700 mln; ᴋ 1350 mln]), używana głównie na subkontynencie indyjskim. Do indoaryjskich należą m.in. hindi i urdu[uwaga 19], bengalski, marathi czy lahnda. Zaliczają się do nich również używane w Europie języki romskie, a także hindi fidżyjskie na Fidżi[138]. Najstarsze fragmenty indyjskich tekstów literackich w sanskrycie wedyjskim, choć spisane wiele wieków później, mogły powstać nawet 1500 lat p.n.e. [139] W wielu językach nowoindyjskich istnieją jedynie dwa przypadki gramatyczne – używany wraz z poimkami przypadek zależny (niemianownikowy) oraz niezależny, samodzielny; natomiast w skład zasobów fonetycznych bardzo często wchodzą spółgłoski retrofleksyjne oraz zwarte dźwięczne przydechowe [140]. Indoaryjskie posługują się dużą liczbą indyjskich alfabetów sylabicznych, z których najpowszechniej używanym jest dewanagari [141]. Ponadto niektóre z nich, jak np. urdu, sindhi czy czasami język pendżabski, stosują pismo arabskie [142].
Języki irańskie
Grupa z terenów głównie Bliskiego Wschodu, a także Afganistanu, Tadżykistanu oraz zachodniego Pakistanu; należącymi do niej językami mówi ok. 150–200 mln osób [ʙ 150–200 mln; ᴋ 150 mln]. Największym językiem gałęzi irańskiej jest perski[15], mniejsze to m.in. paszto, kurdyjski czy beludżi. Irańskojęzyczna enklawa istnieje też na pograniczu Rosji i Gruzji (język osetyjski) [143]. Współcześnie wiele języków tej grupy do zapisu używa alfabetu perskiego [144]. Fragmenty najstarszego irańskiego tekstu literackiego, Awesty, są datowane na ok. 1000–800 lat p.n.e. [145] Użyty w nim język (zwany awestyjskim) miał bardzo archaiczny charakter, zbliżony do języka indoaryjskiej Rygwedy [146]. W niektórych językach irańskich istnieje wykładnik dołączany do obiektu posiadania w konstrukcjach dzierżawczych – tzw. izafet [147] [uwaga 39]. Zauważalna jest tendencja do zaniku rodzaju nijakiego oraz dawnej deklinacji, a w części języków – podobnie jak w pozostałych grupach podrodziny indoirańskiej – wykształciły się pewne konstrukcje ergatywne[64].
Języki italskie (wraz z romańskimi)
Starożytna grupa wymarłych języków z terenów historycznej Italii; najstarsza italskojęzyczna inskrypcja pochodzi z ok. I połowy VII w. p.n.e. [148] Z wyjątkiem łacińskiego(†) języki italskie – wśród nich m.in. faliskijski†, oskijski† czy umbryjski† – wyszły z użycia w początkach n.e. Cechowały się archaiczną fleksją oraz postpozycyjnym (po określanym wyrazie) występowaniem przymiotnika[130]. Używana w mowie potoczna odmiana łaciny – zwana łaciną ludową† – dała początek całej grupie języków współczesnych, którą tworzą języki romańskie [149]. Mówi nimi ok. 800–900 mln osób [ʙ 920 mln; ᴋ 800 mln] głównie w Europie Zachodniej, Południowej oraz w obu Amerykach. Należą do nich przede wszystkim takie zachodnie języki jak hiszpański, francuski, portugalski i włoski, a także wschodnioeuropejski język rumuński. Romańskie charakteryzują się analityczną strukturą zdania (i związanym z tym występowaniem rodzajnika), zanikiem rodzaju nijakiego, a w sferze fonetycznej bogatym zasobem samogłosek[130].
Języki nuristańskie
Niewielka grupa kilku języków używanych łącznie przez kilkadziesiąt do stu tysięcy osób [ʙ pow. 100 tys.; ᴋ 30 tys.] w regionie Hindukuszu na pograniczu Afganistanu i Pakistanu, stanowiąca odrębną gałąź podrodziny indoirańskiej [150]. Nie mają formy pisanej [151]; w językoznawstwie znane dopiero od dziewiętnastego stulecia [152]. Specyfiką języków nuristańskich jest ich nietypowy i wyrafinowany system wyrażania orientacji w przestrzeni oraz określania kierunków ruchu, pod względem fonetycznym zaś cechują się mnogością spółgłosek retrofleksyjnych [153].
Języki ormiańskie
Zgodnie z podręcznikowym ujęciem jedyny istniejący do dziś język, ormiański [154]. Nowsze klasyfikacje traktują jego odmianę zachodnioormiańską jako język odrębny [155] [156]. Mówi nimi niecałe 7 mln osób [ʙ, ᴋ 6,7 mln] głównie w Armenii i Górskim Karabachu. Zaświadczone w piśmie od V w. n.e. (język ormiański klasyczny(†)), ich system fonetyczny uległ silnym przekształceniom i nawet rdzennie indoeuropejskie wyrazy często nie przypominają swoich odpowiedników w innych gałęziach rodziny [157]. Brak rodzaju gramatycznego, odmiana przymiotnika stopniowo ulega zanikowi, natomiast posiadanie jest wyrażane z użyciem przyrostków dzierżawczych[119]. W starszej literaturze językoznawczej z ormiańskim wiązane bywały wymarłe języki bądź dialekty trackie (jako grupa tracko-ormiańska)[75]. W użyciu alfabet ormiański.
Języki słowiańskie
Występują na terenach Europy Środkowej i Wschodniej, na Bałkanach oraz w Azji Północnej, mają ponad 300 mln użytkowników [ʙ 315 mln; ᴋ 325 mln]. Najstarsze teksty pochodzą z IX w. z języka staro-cerkiewno-słowiańskiego† [158]. Największym językiem grupy jest rosyjski[15], wśród mniejszych znajdują się m.in. polski, ukraiński, serbsko-chorwacki (starszy termin [159][uwaga 22]) czy czeski. Języki słowiańskie do zapisu używają alfabetu łacińskiego (zachodniosłowiańskie), cyrylicy (wschodniosłowiańskie) lub też obu (południowosłowiańskie). Wiele z nich zachowało bardzo rozbudowaną odmianę wyrazów – np. siedem (lub sześć, bez wołacza) przypadków gramatycznych [160] – wyjątkiem jest gałąź bułgarsko-macedońska, gdzie pod wpływem bałkańskiej ligi językowej nastąpił praktycznie całkowity zanik deklinacji [161]. Charakterystyczne dla słowiańszczyzny jest leksykalne rozróżnianie aspektu za pomocą odrębnych czasowników niedokonanych i dokonanych [162] [uwaga 40]. W wielu językach tej grupy występują sonanty (spółgłoski tworzące sylabę), liczne są różne konstrukcje z użyciem imiesłowów, a czas teraźniejszy bywa często wykorzystywany także do opisywania przyszłości[124].
Języki tocharskie
Dwa (określane jako A oraz B), a być może trzy (analogicznie: C) wymarłe języki z zachodniego pogranicza współczesnych Chin; najstarsze zabytki piśmiennictwa pochodzą z ok. V w. z tocharskiego B [163]. Znane głównie z manuskryptów odkrytych na przełomie XIX i XX w., zapisanych w jednym z indyjskich systemów pisma, i datowanych na VI–VIII w. n.e.[152] Pod względem fonologicznym należały do języków kentum, co było wyjątkiem we wschodniej części indoeuropejskiego obszaru językowego [164]. Charakteryzowały się całkowitym brakiem spółgłosek dźwięcznych, brakiem czasownika „mieć”, występowaniem przyrostków dzierżawczych (wyrażających posiadanie) oraz rozbudowanym systemem liczby gramatycznej, w którym znajdowały się m.in. liczba podwójna oraz liczba parzysta (paralis) i zbiorowa (plurativus) [165].
Języki indoeuropejskie są, z niewielkimi wyjątkami, językami fleksyjnymi [166]. Wyrazy podlegające odmianie składają się z tematu wyrazowego, który niesie znaczenie ogólne, oraz – najczęściej – pojedynczej końcówki fleksyjnej, która kumuluje w sobie różne funkcje. Fleksyjność jest charakterystyczna dla rodziny indoeuropejskiej – poza nią występuje rzadko[166]. Najbardziej rozbudowaną deklinację mają języki bałtosłowiańskie, starsze indoirańskie, a ponadto dawne celtyberyjski, łaciński i mykeński [167]. W części pozostałych uległa ona znacznemu uproszczeniu, w szczególności we współczesnych celtyckich, germańskich, romańskich czy wielu indoirańskich [168]. W dużej liczbie języków tej ostatniej gałęzi (prawdopodobnie wskutek obcych wpływów [169]) wykształcił się nowy, aglutynacyjny typ odmiany przez przypadki [170].
W większości języki rodziny indoeuropejskiej należą do języków syntetycznych [171], czyli takich, w których przeważają jednowyrazowe formy gramatyczne, tworzone przy pomocy różnych przyrostków i przedrostków [172]. Mniejsza część z kolei to języki analityczne[171], charakteryzujące się występowaniem licznych form wielowyrazowych, w których gramatyczną funkcję pełnią słowa posiłkowe – np. niektóre czasowniki, przyimki czy przysłówki [173]. W praktyce jest to jednak skala ciągła [174], gdyż w poszczególnych językach często pojawiają się oba typy form [175]. Silnie syntetyczny jest m.in. litewski, a jeszcze silniej starożytny wedyjski; najbardziej zaś analityczną strukturę mają afrikaans i bengalski[168]. Analityczne cechy przeważają też w angielskim, duńskim, francuskim czy perskim [176], a także w bułgarskim i macedońskim [177].
Pod względem stosunków morfosyntaktycznych języki indoeuropejskie należą zasadniczo do nominatywno-akuzatywnych – podmiot zdania zarówno przechodniego, jak i nieprzechodniego jest z reguły wyrażany mianownikiem, a dopełnienie bliższe za pomocą biernika [178]. Wyjątkiem są te, w których – w wyniku kontaktów z innymi rodzinami[169] – występują pewne konstrukcje ergatywne (podmiot zdań przechodnich przyjmuje wówczas formę przypadka zwanego ergatywem, a podmiot nieprzechodnich oraz dopełnienie – absolutywu [179]). Należą do nich przede wszystkim niektóre języki indoirańskie, np. hindi, urdu, marathi, większość dardyjskich i nuristańskich, paszto czy średnioperski [180]; quasi-ergatywna konstrukcja istniała też w języku hetyckim [181].
Typowymi szykami zdania w językach rodziny indoeuropejskiej są te, w których na początku występuje podmiot: SVO (podmiot—orzeczenie—dopełnienie) i SOV (podmiot—dopełnienie—orzeczenie)[129]. Podział między nimi ma w dużej mierze geograficzny charakter: szyku SVO, z dopełnieniem na końcu, używają prawie wszystkie nowożytne języki indoeuropejskie w Europie, z kolei szyk SOV, w którym zdanie kończy się orzeczeniem, jest typowy dla języków rodziny z terenów Azji [182]. Językiem SOV była ponadto łacina[129]; oba zaś są równorzędne w ormiańskim[182]. Specyficzny wariant V2 – w którym orzeczenie znajduje się na drugim miejscu niezależnie od tego, która część mowy jest pierwsza – dominuje w językach germańskich (z wyjątkiem angielskiego), a także w bretońskim i kaszmirskim[182]. Natomiast zupełnie inny typ, VSO (orzeczenie—podmiot—dopełnienie), charakteryzuje większość współczesnych języków grupy celtyckiej (wymarły galijski należał do kategorii SVO)[129].
Niemniej jednak w rozmaitych językach indoeuropejskich, zwanych przypadkowymi, stosunki składniowe realizowane są za pomocą form wyrazowych (np. odpowiednimi przypadkami czy miejscem akcentu), zatem szyk zdania nie pełni w nich aż tak dużej roli i w sporym zakresie jest ruchomy [183]. Jedynie w językach pozycyjnych, gdzie o sensie wypowiedzi decyduje pozycja wyrazów w zdaniu, zmiana szyku jest bardzo mocno ograniczona – w szczególności, gdy chodzi o kolejność podmiotu i dopełnienia bliższego (zamiana miejscami powoduje zmianę znaczenia na przeciwne). Językami tego typu są np. angielski i francuski [184].
Do ogólnych tendencji rozwojowych rodziny indoeuropejskiej należą m.in. ograniczanie syntetycznej fleksji (zwłaszcza odmiany przez przypadki) na rzecz konstrukcji analitycznych (a w konsekwencji rozwój przyimków i rodzajników), upraszczanie kategorii rodzaju (przede wszystkim zanik rodzaju nijakiego), zmniejszanie się roli przyrostków i wzrost znaczenia przedrostków czy zamiana form nieregularnych na regularne [185]. Skrajnie uproszczoną, jak na indoeuropejskie, morfologię ma język afrikaans – nie tylko nie występują w nim gramatyczne kategorie rodzaju i przypadka, lecz także odmiana czasownika przez osoby i liczby[168]. Ponadto w językach rodziny jest widoczna redukcja konstrukcji z użyciem imiesłowów i bezokolicznika na rzecz hipotaksy (zdań podrzędnie złożonych) oraz utrwalanie się szyku zdania SVO wraz z tendencją do ograniczania jego ruchomości[185].
System kategorii gramatycznych rodziny indoeuropejskiej jest w dużej mierze pochodną struktury jej prajęzyka – aczkolwiek wiele języków późniejszych zmniejszyło liczbę form morfologicznych. Z drugiej strony zaś wykształcały się nowe, nieistniejące wcześniej formy, jak np. odrębny czas przyszły [186]. Do kategorii odziedziczonych przez nominalne części mowy należą zatem rodzaj, przypadek i liczba, natomiast przez czasowniki – liczba, osoba, strona, czas, aspekt i tryb [187].
Indoeuropejska kategoria rodzaju obejmuje rodzaj męski, żeński i nijaki (z wyjątkiem grupy anatolijskiej, w której istniał wyłącznie rodzaj żywotny i nieżywotny) [188]. Wszystkie trzy zostały zachowane m.in. w językach słowiańskich, zachodnioskandynawskich, a także w niemieckim, greckim, gudźarati czy marathi [189]. W innych z kolei ich liczba zredukowana została do dwóch: bez nijakiego, jak w zachodnioromańskich, wschodniobałtyckich, celtyckich, albańskim, kurmandżi czy niektórych indoaryjskich (m.in. hindi, urdu, pendżabskim i sindhi) lub z nijakim i wspólnym (tzw. utrum), jak w duńskim, szwedzkim czy niderlandzkim[189]. Rzadziej wśród indoeuropejskich zdarzają się języki bezrodzajowe – należą do nich afrikaans [190], niektóre indoirańskie (m.in. beludżi, perski, szugnański, nepalski i orija), ormiański, a także angielski[189] (w tym ostatnim rodzaj został ograniczony wyłącznie do zaimków osobowych). Czasem pojawiają się dodatkowe podklasy tej kategorii, np. rodzaj męskożywotny w liczbie mnogiej polskiego i rosyjskiego[160].
Zróżnicowana w nowożytnych językach rodziny jest liczba gramatycznych przypadków: do siedmiu w bałtosłowiańskich, do czterech w germańskich, a do trzech – w celtyckich[168]; po cztery zaś występują w albańskim [191] i nowogreckim [192]. Języki nowoindyjskie charakteryzują się zasadniczo dwoma przypadkami (niezależnym i zależnym) [193], podobnie jak nowoirańskie (analogicznie, z rzadka trzema) – z wyjątkiem osetyjskiego, który wtórnie wykształcił ich aż dziewięć [194]. Deklinacja zupełnie zanikła z kolei w afrikaans[190] oraz w gałęzi bułgarsko-macedońskiej[161]. Przypadki tworzone syntetycznie wyszły też z użycia w językach zachodnioromańskich [195], zamiast tego są one formowane analitycznie, poprzez odpowiednie przyimki [uwaga 42]. Na początku I tysiąclecia p.n.e. liczba indoeuropejskich form przypadka mieściła się w zakresie od sześciu do ośmiu[168] (np. sanskryt(†) dysponował siedmioma jak w polskim i dodatkowo ablatywem [196]). Natomiast wymarłe języki tocharskie A i B miały ich odpowiednio dziesięć i jedenaście[165].
Kategoria liczby we współczesnych językach indoeuropejskich z reguły obejmuje dwie formy: pojedynczą i mnogą. Istniejąca dawniej (np. w wedyjskim, staroawestyjskim†, greckim czy staro-cerkiewno-słowiańskim [197]) liczba podwójna praktycznie uległa zanikowi – wyjątkiem są języki łużyckie i słoweński [198]. W niektórych pozostałych można dostrzec ślady jej wcześniejszej obecności – jak np. w czeskim[198] lub irlandzkim [199]. Bardziej rozbudowany, pięcioliczbowy system – poszerzony o liczbę parzystą (paralis) i zbiorową (plurativus) – istniał w grupie języków tocharskich[165]. Kategorię osoby zaś tworzą trzy powszechnie używane: pierwsza, druga i trzecia osoba gramatyczna [200]. W kreolskim języku tok pisin istnieje dodatkowo rozróżnienie zaimków pierwszej osoby liczby mnogiej na inkluzywny (my = ja i ty) i ekskluzywny (my = ja i ktoś inny) [201].
W językach rodziny tradycyjnie są wyróżniane trzy strony gramatyczne: czynna, bierna i zwrotna [202]. Nie wszędzie jednak występują one w jednakowym zakresie – np. w językach słowiańskich formy różnych stron mogą być przyjmowane wyłącznie przez czasowniki przechodnie, a w romańskich stronę zwrotną można też utworzyć od niektórych czasowników nieprzechodnich. W angielskim wiele z tych drugich ma również formy bierne, w klasycznej grece zaś nie istniały żadne ograniczenia[202]. Tylko dwie strony – czynna i bierna – dostępne są w albańskim (ta druga, o różnym zastosowaniu, w praktyce nie-czynna) oraz w dawnych językach grupy italskiej [203], natomiast w ormiańskim oraz w językach gałęzi anatolijskiej i tocharskiej obok czynnej istnieje lub istniała jedynie strona medialna (bierno-zwrotna) [204].
Kategoria czasu w powszechnym rozumieniu obejmuje czas przeszły, teraźniejszy i przyszły [205]. Według nowszego ujęcia ten ostatni występuje wśród indoeuropejskich jedynie w językach gałęzi bałtyckiej, celtyckiej i italskiej; w pozostałych natomiast istnieje jakoby wyłącznie czas przeszły i nieprzeszły, a formy przyszłe mają charakter nie czasowy, lecz aspektowy [206]. Samo wyrażanie przyszłości bywa realizowane w różny sposób (w sycylijskim i sorani odrębne konstrukcje przyszłe w ogóle nie są używane) [207]. W językach grup takich jak germańska [208] czy słowiańska[124] przyszłe czynności mogą być przedstawiane również za pomocą czasu teraźniejszego. Złożony system czasowo-aspektowy jest charakterystyczny m.in. dla języków romańskich i ligi bałkańskiej[208]. Sześć takich form, tradycyjnie określanych jako czasy, istniało w łacinie – teraźniejsza (niedokonana), perfectum (stan), imperfekt (przeszła niedokonana), zaprzeszła, przyszła i przyszła dokonana [209], w albańskim zaś jest ich osiem – dodatkowo druga zaprzeszła i aoryst [210].
Istota wspomnianego gramatycznego aspektu nie jest jednoznacznie ustalona – w niektórych publikacjach bywa do niego zaliczany również tzw. rodzaj czynności (Aktionsart); w najściślejszym zaś znaczeniu aspekt w nowożytnych językach rodziny obejmuje formy niedokonaną i dokonaną [211]. Widoczny kontrast między obiema występuje w wielu językach indoirańskich (w tym w hindi i perskim), romańskich, słowiańskich oraz w nowogreckim [212]. W niektórych z nich są możliwe różne konstrukcje – jak np. w hiszpańskim, w którym istnieją dwie formy dokonane, różniące się kontekstem [213]. W językach słowiańskich aspekt jest wyrażany wyłącznie leksykalnie – używane są odrębne czasowniki o wbudowanym znaczeniu niezakończonej lub zakończonej czynności[162][uwaga 40]. Natomiast brak jego rozróżnienia charakteryzuje m.in. rozmaite języki germańskie, wschodnioindoaryjskie (jak bengalski i maithili), a także beludżi i łotewski[212]. Trzy różne aspekty – w tym aoryst i perfectum zamiast jednej formy dokonanej – miała greka klasyczna [214].
Wreszcie zróżnicowana kategoria trybu, do której w rodzinie indoeuropejskiej należą przede wszystkim tryby oznajmujący i rozkazujący [215]. W poszczególnych językach pojawiają się też inne, jak warunkowy (w różnych językach gałęzi germańskiej, romańskiej i słowiańskiej), życzący (w sanksrycie i klasycznej grece, a współcześnie w albańskim) czy łączący (w romańskich oraz, marginesowo, w angielskim) [216]. Sam język albański dysponuje aż sześcioma odrębnymi trybami, wśród których znajduje się m.in. admirativus (wyrażający czynność nagłą i niespodziewaną)[114], a w bułgarskim i macedońskim występuje tryb nieświadka (przekazujący informację zasłyszaną od kogoś lub taką, której mówiący nie jest pewien) [217]. Natomiast w wedyjskim i awestyjskim istniał również tzw. iniunctivus [218].
W indoeuropejskich językach stosowanych jest wiele zróżnicowanych systemów pisma. Żaden z języków tej rodziny nie wykształcił jednak systemu całkowicie oryginalnego – wszystkie używane w nich metody zapisu są pożyczkami, przekształceniami lub adaptacjami tych istniejących już wcześniej [219]. Do najstarszych rodzajów pism w rodzinie indoeuropejskiej należały [220]:
Wszystkie pozostałe systemy zapisu spotykane w językach rodziny wywodzą się – pośrednio lub bezpośrednio – z zachodniosemickich odmian pisma typu abdżad (pismo spółgłoskowe)[219]. I tak z pisma aramejskiego wykształciły się inne abdżady, a także pisma alfabetyczno-sylabiczne (zaadaptowane do notacji również samogłosek, tzw. abugidy) oraz alfabet awestyjski. Natomiast pozostałe alfabety w ścisłym znaczeniu (czyli pisma, w którym spółgłoski i samogłoski są odrębnymi, równoprawnymi znakami) mają u źródła pismo fenickie [221]. Do bezpośrednich następców aramejskiej i fenickiej odmiany pism spółgłoskowych należą [222]:
W toku dalszej ewolucji z brahmi, średnioperskiego i greckiego wykształciły się kolejne generacje pism [223]:
Z greckiego wykształcił się również nieindoeuropejski alfabet etruski [224], który w późniejszym czasie został zaadaptowany przez ludność italskojęzyczną i przekształcony w kolejne odmiany pism [225]:
z samego łacińskiego zaś wykształciły się następnie [226]:
W kolejnych tabelach zostały zaprezentowane przykłady słownictwa w wybranych nowożytnych językach rodziny indoeuropejskiej, przedstawiające różnorodność i podobieństwo form [uwaga 43]. Tabele opracowano na podstawie różnych ogólnodostępnych słowników [uwaga 44].
Odmiana czasu teraźniejszego czasownika „być”; odrębne źródło wykorzystano dla języka paszto [228] (transkrypcja podana w oryginalnej wersji):
Forma czasownika |
albański | łotewski | walijski | angielski | duński | grecki | hindi | paszto | ormiański | rumuński | włoski | chorwacki |
---|---|---|---|---|---|---|---|---|---|---|---|---|
alb. | bałt. | celt. | germ. | helleń. | indoar. | irań. | orm. | rom. | słow. | |||
być | qenë | būt | bod | be | være | — [uwaga 45] | होना [hona] | — [uwaga 46] | լինել [linel] | fi | essere | biti |
jestem | jam | esmu | wyf | am | er | είμαι [eímai] | हूँ [hun] | یم [yəm] | եմ [em] | sunt | sono | sam |
jesteś | je | esi | wyt | are | είσαι [eísai] |
है [hai] |
یې [ye] | ես [es] | ești | sei | si | |
jest | është | ir | yf | is | είναι [eínai] |
ده / دی [uwaga 47] [da] / [da] |
է [e] | este | è | je | ||
jesteśmy | jemi | esam | ŷm | are | είμαστε [eímaste] | हैं [hai] | یو [yu] | ենք [enk] | suntem | siamo | smo | |
jesteście | jeni | esat | ŷch | είσαστε [eísaste] | हैं / हो [uwaga 48] [hai] / [ho] |
یاست [yā́stəy] | եք [ek] | sunteți | siete | ste | ||
są | janë | ir | ŷnt | είναι [eínai] | हैं [hai] |
دي [di] | են [en] | sunt | sono | su |
Liczebniki główne z zakresu od jednego do dziesięciu [uwaga 49]; w sporej części wykorzystano odrębne źródło [229]:
Liczebnik | albański | angielski | czeski | grecki | hindi | irlandzki | litewski | ormiański | perski | włoski |
---|---|---|---|---|---|---|---|---|---|---|
alb. | germ. | słow. | helleń. | indoar. | celt. | bałt. | orm. | irań. | rom. | |
jeden | një | one | jeden | ένα [éna] | एक [ek] | aon | vienas | մեկ [mek] | یک [jek] | uno |
dwa | dy | two | dva | δύο [dío] | दो [do] | dó | du | երկու [jerku] | دو [do] | due |
trzy | tre | three | tři | τρία [tría] | तीन [tin] | trí | trys | երեք [jerek] | سه [se] | tre |
cztery | katër | four | čtyři | τέσσερα [téssera] | चार [ćhar] | ceathair | keturi | չորս [czors] | چهار [czar] | quattro |
pięć | pesë | five | pět | πέντε [pénte] | पांच [panćh] | cúig | penki | հինգ [hing] | پنج [pandż] | cinque |
sześć | gjashtë | six | šest | έξι [éksi] | छह [ćhah] | sé | šeši | վեց [wec] | شش [szesz] | sei |
siedem | shtatë | seven | sedm | εφτά [eftá] | सात [sat] | seacht | septyni | յոթ [jot] | هفت [haft] | sette |
osiem | tetë | eight | osm | οχτώ [ochtó] | आठ [ath] | ocht | aštuoni | ութ [ut] | هشت [haszt] | otto |
dziewięć | nëntë | nine | devět | εννέα [ennéa] | नौ [nau] | naoi | devyni | ինը [iny] | نه [no] | nove |
dziesięć | dhjetë | ten | deset | δέκα [déka] | दस [das] | deich | dešimt | տաս [tas] | ده [da] | dieci |
Podstawowe rzeczowniki oznaczające członków najbliższej rodziny:
Rzeczownik | albański | angielski | czeski | grecki | hindi | irlandzki | litewski | ormiański | perski | włoski |
---|---|---|---|---|---|---|---|---|---|---|
alb. | germ. | słow. | helleń. | indoar. | celt. | bałt. | orm. | irań. | rom. | |
matka | ëma | mother | matka | μητέρα [mitéra] | माता [mata] | máthair | motina | մայր [majr] | مادر [madr] | madre |
ojciec | atë | father | otec | πατέρας [patéras] | पिता [pita] | athair | tėvas | հայր [hajr] | پدر [pedr] | padre |
siostra | motër | sister | sestra | αδελφή [adelfí] | बहन [bahan] | deirfiúr | sesuo | քույր [kujr] | خواهر [choar] | sorella |
brat | vëlla | brother | bratr | αδελφός [adelfós] | भाई [bhai] | deartháir | brolis | եղբայր [jechpajr] | برادر [bradr] | fratello |
Języki indoeuropejskie wykazują ogromną liczbę zbieżności, regularności i analogii we wszystkich możliwych aspektach [230]. Podobieństwo można dostrzec m.in. wśród wielu słów i rdzeni wyrazowych o tym samym lub zbliżonym znaczeniu [231]:
Przyczyny podobieństw językowych mogą być różne – jedną z nich jest pochodzenie danych form z tego samego praźródła, określanego jako prajęzyk [232]. Hipotezę o istnieniu takiego wspólnego przodka języków indoeuropejskich można wysunąć na podstawie wielu zaobserwowanych analogii w ich systemie semantycznym i składniowym (m.in. podstawowe słownictwo, końcówki fleksyjne czy alternacje samogłosek) [233]. Podobne do siebie bywają nie tylko odpowiadające sobie w poszczególnych językach domniemanej rodziny leksemy, lecz także ich całe paradygmaty fleksyjne (wzory odmiany) [234] – jak w przypadku koniugacji czasownika „być” [235] (w szczególności widać to w językach starszych[uwaga 51]):
Język | ‘jestem’ | ‘jesteś’ | ‘jest’ | ‘jesteśmy’ | ‘jesteście’ | ‘są’ |
---|---|---|---|---|---|---|
hetycki | esmi | — | eszi | — | — | asanzi |
wedyjski | ásmi | ási | ásti | smás | sthá | sánti |
greka klas. | eimí | essí | estí | eimés | esté | eisí |
łacina | sum | es | est | sumus | estis | sunt |
gocki | im | is | ist | sijum | sijuth | sind |
staro-cerk.-słow. | jesmь | jesi | jest~ь/ъ | jesmъ | jeste | sǫtъ |
litewski | esmí | esí | ẽstí | ẽsme | ẽste | ẽsti |
ormiański | em | es | ē | emkh | ēkh | en |
Innym przykładem mogą być odpowiadające sobie etymologicznie formy czasownika o pierwotnym znaczeniu „nieść” [236]:
Język | Liczba pojedyncza | Liczba podwójna | Liczba mnoga | ||||||
---|---|---|---|---|---|---|---|---|---|
1.os. | 2.os. | 3.os. | 1.os. | 2.os. | 3.os. | 1.os. | 2.os. | 3.os. | |
wedyjski | bhárāmi | bhárasi | bhárati | bhárāvas | bhárathas | bháratas | bhárāmas(i) | bháratha | bháranti |
greka klas. | ϕέρω [phérō] | ϕέρεις [phéreis] | ϕέρει [phérei] |
— | ϕέρετον [phéreton] | ϕέρετον [phéreton] |
ϕέρομεν [phéromen] | ϕέρετε [phérete] | ϕέρουσι(ν) [phérousi(n)] |
łacina | ferō | fers | fert | — | — | — | ferimus | fertis | ferunt |
staroirlandzki | biru | biri | berid | — | — | — | berm(a)i | *beirthe[uwaga 38] | ber(a)it |
staro-wys.-niem. | biru | biris | birit | — | — | — | berumēs | beret | berand |
staro-cerk.-słow. [uwaga 52] | berǫ | bereši | beretŭ | berevě | bereta | beret~e/a | beremŭ | berete | berǫtŭ |
ormiański | berem | beres | berē | — | — | — | beremkՙ | berēkՙ | beren |
Tego typu regularności w paradygmatach odmiany są bardzo mocnym argumentem na rzecz teorii, że dane wyrazy zostały nie zapożyczone, a odziedziczone po językowym przodku [237]. Michael Meier-Brügger wskazał, że wiele zaobserwowanych indoeuropejskich analogii [238]:
Jedynym logicznym wyjaśnieniem tak licznych zbieżnych cech języków indoeuropejskich w zakresie fonetyki, morfologii i słownictwa jest ich pochodzenie z hipotetycznej, wspólnej fazy rozwojowej, nazwanej praindoeuropejską [239]. Odziedziczone z niej formy ewoluowały następnie w poszczególnych językach w różny sposób[239], choć niektóre grupy słownictwa zmieniają się na tyle wolno, że ich podobieństwo bywa widoczne nawet po kilku tysiącleciach od rozpadu owego prajęzyka [240]. W XXI w. wyróżnianie indoeuropejskiej rodziny nie budzi żadnych wątpliwości, a spośród wszystkich jest ona najlepiej i najdokładniej zbadaną przez językoznawców – w czym pomogło wiele zachowanych do dzisiaj źródeł pisanych, pochodzących nawet sprzed dwóch lub więcej tysięcy lat [241]. Badania porównawcze pozwoliły udowodnić ponadto przynależność do niej różnych nowo odkrytych języków – tak stało się w przypadku anatolijskich czy wenetyjskiego [242]. Umożliwiły też odrzucenie innych – jak np. używanego w Europie baskijskiego [243]. Otwartą kwestią pozostaje pytanie gdzie, kiedy i kto posługiwał się praindoeuropejską mową [244].
Wśród badaczy nie ma pełnej zgodności co do tego, gdzie znajdowała się praojczyzna rodziny indoeuropejskiej – inaczej mówiąc, gdzie zamieszkiwała ludność mówiąca językiem praindoeuropejskim. Od końca XX w. rywalizują ze sobą dwie główne hipotezy[244]:
Według dominującego w XXI w. poglądu wszystkie współczesne gałęzie rodziny wywodzą się z prajęzyka, którego późna postać była używana na obszarze Stepu Pontyjskiego przez ludność tworzącą prehistoryczną kulturę grobów jamowych [245]. Ponadto niektóre badania paleogenetyczne spowodowały wzrost zainteresowania inną teorią głoszącą, że jeszcze przed migracją na step oraz przed odłączeniem się grupy anatolijskiej – pierwszej odrębnej linii rozwojowej – najwcześniejsza indoeuropejska wspólnota zamieszkiwała wyżyny po południowej stronie Kaukazu [246].
Hipoteza stepowa została przedstawiona przez Mariję Gimbutas w 1956 r. na podstawie porównania wyników badań archeologicznych i językoznawczych [247]. Badaczka umieściła indoeuropejską praojczyznę na Stepie Pontyjskim, nadając swojej teorii nazwę kurhanowej (od kurhanów – neolitycznych mogił w kształcie kopca, występujących na tym obszarze) i powiązała Praindoeuropejczyków ze wspomnianą wyżej kulturą grobów jamowych. Według Gimbutas ekspansja języków indoeuropejskich była spowodowana najazdami ludów pasterskich, tworzących ową kulturę [248]. Pomiędzy 4400 a 2800 r. p.n.e. konni wojownicy mieli zająć niektóre obszary Europy oraz Azji, wypierając lub podbijając miejscową ludność i narzucając jej swój język [249].
Pierwotna mowa najeźdźców – wraz ze zdobywaniem przez nich nowych terenów, na których się osiedlali – ewoluowała, dając podstawy późniejszej rodzinie indoeuropejskiej[249]. Wyniki badań z 2021 r. pokazały jednak, że początki wędrówek współczesnych ras konia ze stepów miały miejsce ok. 2200 lat p.n.e. – pierwsze indoeuropejskie migracje nie mogły więc odbywać się konno, natomiast użycie rydwanów mogło mieć związek z ekspansją Indoirańczyków [250]. Nowsza wersja teorii kurhanowej głosi, że posługująca się wczesną praindoeuropejską mową ludność zamieszkiwała stepy południowej Ukrainy i Rosji; identyfikuje się ją z kulturą archeologiczną Sredniego Stogu (4500–3500 p.n.e.). Kultura jamowa zaś, która rozwinęła się z niej w późniejszym czasie, miała stanowić ostatni etap wspólnoty indoeuropejskiej[245].
Z kolei w r. 1987 Colin Renfrew zasugerował związki pomiędzy rozprzestrzenianiem się języków indoeuropejskich a rewolucją neolityczną. Według niego praojczyzna Indoeuropejczyków znajdowała się na terenie Anatolii do 6500 r. p.n.e. [251] W przeciwieństwie do teorii kurhanowej hipoteza anatolijska zakłada pokojowe rozprzestrzenianie się języka i kultury indoeuropejskiej. Renfrew twierdził, że najwcześniejszą wersją praindoeuropejskiego posługiwali się anatolijscy rolnicy ok. 7000 lat p.n.e. [252] 500 lat później, wskutek rolniczych migracji, język ów miał zostać zaniesiony na tereny dzisiejszej Grecji, a następnie wzdłuż Dunaju do Europy Środkowej. Podczas jego rozpowszechniania powstawały różne dialekty, które dały początek poszczególnym indoeuropejskim grupom językowym[252].
W 2003 r. biolodzy ewolucyjni Russell Gray i Quentin Atkinson na podstawie glottochronologicznych badań 87 języków indoeuropejskich ustalili, że języki anatolijskie faktycznie stanowią najstarszą grupę w rodzinie, zarazem najbardziej zbliżoną do języka praindoeuropejskiego. Wiek indoeuropejskiej pramowy został określony przez nich na 7800 do 9800 lat (czyli w przedziale ok. 7800–5800 p.n.e.), opowiedzieli się tym samym za hipotezą anatolijską [253]. Jednak konkluzje Graya i Atkinsona podważone zostały kilkanaście lat później przez badania, które przeprowadziła grupa językoznawców z Uniwersytetu Kalifornijskiego. W 2015 r. Amerykanie dokonali filogenetycznej analizy statystycznej, która wykazała znacznie późniejsze wydzielenie się najwcześniejszej, anatolijskiej gałęzi. Tym samym istotnie przesunięto datowanie praindoeuropejskiego – na zgodne z hipotezą stepową, wspieraną przez dane archeologiczne (4500–3500 p.n.e.) [254].
Pomocne w lokalizowaniu praojczyzny może być zidentyfikowanie jej sąsiedztwa językowego – w odpowiednich prajęzykach poszukiwane są więc zapożyczenia słownikowe oraz gramatyczne [255]. Wytypowano wyrazy, które prawdopodobnie bardzo wcześnie trafiły z praindoeuropejskiego do prauralskiego†; miało także dochodzić do kontaktów tego pierwszego z kaukaskim językiem prakartwelskim†. Na tej podstawie David Anthony wysnuł wniosek o zamieszkiwaniu ludności praindoeuropejskiej na bliżej nieokreślonych obszarach między Uralem a Kaukazem [256]. Zwracana jest również uwaga na możliwe pożyczki z języka prasemickiego† (np. liczebniki „sześć” i „siedem”) oraz w odwrotnym kierunku [257].
Analizując domniemane zapożyczenia semickie, kartwelskie i huryckie†, Tamaz Gamkrelidze i Wiaczesław Iwanow przedstawili inną propozycję – według nich indoeuropejska praojczyzna znajdowała się po południowej stronie Kaukazu, na północ od Mezopotamii [258]. Niektóre badania paleogenetyczne z drugiej i trzeciej dekady XXI w. wzbudziły ponowne zainteresowanie tą teorią. Zgodnie z wynikami owych badań pierwsze siedziby Praindoeuropejczyków, jeszcze przed ich migracją na step i do Anatolii, mogły leżeć na terenach dzisiejszej Armenii bądź Iranu [259]. Dopiero stamtąd, poprzez góry kaukaskie, część ludności miała wyruszyć na Step Pontyjski – a wraz z nią język, który później stał się protoplastą wszystkich nieanatolijskich gałęzi rodziny [260].
Do innych, mniej popularnych hipotez dotyczących miejsca pochodzenia języków indoeuropejskich należą m.in. [261]:
Natomiast na marginesie nauki znajduje się teoria indyjskich badaczy, łącząca Praindoeuropejczyków z cywilizacją doliny Indusu [262], a także teoria autochtoniczna (PCT – ang. Paleolithic Continuity Theory) zespołu Maria Alineiego, według której Indoeuropejczycy zamieszkują Europę od okresu paleolitu górnego [263] (czyli od minimum kilkunastu tysięcy lat). Jedna zaś z XIX-wiecznych hipotez przypisywała Praindoeuropejczykom, mającym jakoby zamieszkiwać południe Szwecji, określone cechy antropologiczne (blond włosy i niebieskie oczy). Tę fałszywą koncepcję wykorzystywano później w rasistowskich teoriach nazizmu (błędne pojęcie „Aryjczyka”) [264].
Nie istnieją żadne bezpośrednie powiązania między językiem a genami [265], jednak na podstawie badań genetycznych można w pewnym ograniczonym zakresie odzwierciedlić jego prehistorię [266]. Drzewo filogenetyczne gatunku ludzkiego, zbudowane na podstawie genealogii chromosomu Y (Y-DNA) populacji eurazjatyckich, wskazuje na istnienie populacji z męską (czyli dziedziczoną wyłącznie w męskiej linii rodowej) haplogrupą R1 [267]. Ok. 25 tys. lat temu, wskutek przypadkowych mutacji, wykształciły się z niej dwa klady (subhaplogrupy) – R1a i R1b – często występujące u mieszkańców zachodniej i południowej Eurazji [268].
Haplogrupa R1a pojawia się częściej w Europie Środkowej i Wschodniej oraz w Azji Południowej, R1b zaś przeważa w Europie Zachodniej [269]. Oprócz tego na indoeuropejskich obszarach językowych występuje znaczący odsetek różnych kladów haplogrup I (prawie cała Europa, w szczególności Skandynawia) oraz J (Europa Południowa, Wschodnia, Bliski Wschód i subkontynent indyjski), a w mniejszym stopniu także H (ludność romska), E, G, L czy N[270]. Choć pochodzenie etniczne Indoeuropejczyków bywa różne – co można m.in. zaobserwować na przykładzie populacji anglojęzycznych [271] – najpowszechniejszymi w wielu nowożytnych populacjach europejskich są klady R1a i R1b [272]. Poszukuje się więc prehistorycznych społeczności o tych samych haplotypach, co może pomóc w prześledzeniu migracji ludności hipotetycznie niosącej ze sobą wczesne języki indoeuropejskie, a w konsekwencji w zlokalizowaniu praojczyzny rodziny [273].
Jako czynnik ekspansji indoeuropejskich języków w Europie bywają wskazywane masowe migracje ludności kultury grobów jamowych i późniejszej kultury ceramiki sznurowej [274]. W 2015 r. przeprowadzono badania materiału genetycznego 69 Europejczyków żyjących między 6000 a 1000 lat p.n.e. – analiza ich DNA wykazała, że ok. 75% mieszkańców terenów tej drugiej kultury miało przodków wśród ludności kultury jamowej. Wyniki owych badań sugerują zatem, że populacje R1a i R1b przybyły do Europy ze wschodnioeuropejskich stepów[273]. Wspiera to tezę o stepowym pochodzeniu przynajmniej części indoeuropejskich języków; pokazuje również, że nie wszystkie (o ile jakiekolwiek) języki rodziny mogły trafić do Europy wraz z pierwszymi migracjami anatolijskich rolników kilka tysięcy lat wcześniej – co jest postulowane przez teorię anatolijską [275]. Populacja R1a bywa również rozpatrywana jako ta, która przyniosła języki indoeuropejskie do Indii [276].
W 2022 r. inne badania paleogenetyczne ujawniły, że sama ludność kultury grobów jamowych była genetycznie mieszana i składała się przede wszystkim ze społeczności zbieracko-łowieckich z Europy Wschodniej (marker genetyczny EHG – ang. Eastern Hunter-Gatherers) i Kaukazu (CHG – ang. Caucasian Hunter-Gatherers), z niewielką domieszką populacji typu anatolijsko-lewantyńskiego [277] (te ostatnie mogły być związane z europejską kulturą trypolską [278]). Otwartą kwestią pozostaje to, jaka ludność była źródłem wspomnianego kaukaskiego markeru na stepach. Jako potencjalna populacja typu CHG często rozważana jest ludność kultury majkopskiej – według Davida Anthony’ego jej przedstawiciele posługiwali się prajęzykiem abchasko-adygejskim† [279]. Allan Bomhard sugeruje, że język praindoeuropejski wykształcił się, gdy na ów abchasko-adygejski substrat nasunął się dominujący język przeduralski (być może wschodnioeuropejski język ludności EHG kultury samarskiej) [280].
Innego zdania jest Aleksander Kozincew – według niego marker CHG mógł trafić na stepy wraz z pierwszą falą migracji praindoeuropejskiej, która przybyła od południa wzdłuż zachodnich wybrzeży Morza Kaspijskiego. Przyniosła ona również swoją własną mowę, rozpowszechniając ją wśród miejscowych społeczności, posługujących się wówczas nieznanymi językami [281]. Dalsza indoeuropeizacja stepów (tradycje kurhanowe, ale już bez wpływów genetycznych) miała zajść za sprawą ludności majkopskiej, która według rosyjskiego badacza stanowiła drugą falę migracji z południa [282]. Również David Reich opowiada się za południowokaukaską siedzibą najstarszej populacji praindoeuropejskiej. Jego zdaniem musiała ona zamieszkiwać dokładnie po tej samej stronie Kaukazu, co jej anatolijscy potomkowie[260]. Dowodem na to ma być brak odnalezionego w genomie starożytnych Anatolijczyków markeru EHG[246][259], występującego u prawie połowy ludności stepowej z okresu kultury grobów jamowych[246].
Nie da się jednak w pełni i ze stuprocentową pewnością zidentyfikować ludności mówiącej danym językiem i powiązać jej z określoną kulturą archeologiczną, stąd wszystkie propozycje pozostają jedynie mniej lub bardziej prawdopodobnymi hipotezami[245]. Według Olega Bałanowskiego Praindoeuropejczycy stanowili przede wszystkim wspólnotę językową, nie zaś etniczną czy genetyczną. Ich pierwsza populacja charakteryzowała się całym spektrum haplogrup, dzielonych z populacjami sąsiednimi lub siostrzanymi [283]. Nie istnieją do tej pory również żadne dowody na jedność kulturową przodków Indoeuropejczyków – dopiero w Europie ich potomkowie zbudowali wspólną cywilizację [284]. Rasmus Bjørn z Uniwersytetu Kopenhaskiego zaproponował hipotetyczne kombinacje języków, genów i kultur, które mogły występować razem w okresie praindoeuropejskiej wspólnoty językowej na terenach Stepu Pontyjskiego i okolic [285]:
• | • | • | • | • | • | • | |
---|---|---|---|---|---|---|---|
prajęzyk | płn.kaukaski | indoeuropejski | uralski | ||||
haplogrupa | R1b | R1a | G1 | ||||
kultura | majkopska | grobów jamowych | samarska |
Pokrewieństwo rodziny indoeuropejskiej z innymi nie jest bliżej znane. W literaturze językoznawczej pojawiają się m.in. następujące propozycje najbliższych krewnych języków indoeuropejskich, wysuwane na podstawie różnych zaobserwowanych zbieżności:
Ponadto indoeuropejskie łączono z językami rodziny kartwelskiej (południowokaukaskiej) lub semickimi (współcześnie klasyfikowanymi w ramach rodziny afroazjatyckiej). Obie te koncepcje zostały jednak porzucone, a indoeuropejsko-kartwelskie oraz indoeuropejsko-semickie podobieństwa słownikowe tłumaczone są z reguły dawnymi kontaktami, których efektem były pożyczki owych wyrazów [289].
W XXI w. zainteresowanie badaczy budzi przede wszystkim wspomniana hipoteza indo-uralska, której zwolennikami są m.in. Mate Kapović [290], Frederik Kortlandt [291] czy Aleksander Kozincew [292]. Zwracana jest uwaga na podobieństwa indoeuropejskich i uralskich końcówek osobowych czasownika, a także na pewne zbieżności leksykalne[290]. Według Kortlandta Praindouralczycy zamieszkiwali tereny na południe od Uralu w VII tysiącleciu p.n.e. Ich część miała przemieścić się bardziej na zachód, nad Morze Czarne, gdzie doszło do jej kontaktów językowych z ludnością kultury majkopskiej i gdzie wykształcił się język praindoeuropejski[291]. Z kolei Kozincew twierdzi, że ojczyzną ludności praindouralskiej były wschodnie wybrzeża Morza Kaspijskiego. Jej południowy odłam, który utworzył najwcześniejszą wspólnotę indoeuropejską, według badacza przesuwał się stopniowo wzdłuż gór Elburs ku południu Kaukazu. Stamtąd indoeuropejski prajęzyk trafił – w odrębnych falach migracji – do Anatolii oraz na Step Pontyjski[292].
Autorami bardziej rozbudowanych koncepcji są Joseph Greenberg oraz Władysław Illicz-Switycz i Aron Dołgopolski (ci drudzy rozpowszechnili dawniejszą hipotezę Holgera Pedersena [293]), postulujący istnienie makrorodzin językowych o dużym zasięgu:
Greenberg zidentyfikował 72 wspólne formanty gramatyczne, powszechnie spotykane w językach domniemanej makrorodziny eurazjatyckiej [295] (np. formant -n-, tworzący przeczenia czy -k-, występujący w formach pytajnych [296]). W wielu pracach innych autorów stanowi ona w zasadzie podzbiór w obrębie makrorodziny nostratycznej; ponadto w późniejszych publikacjach ze ściśle nostratycznych wyłączana bywa rodzina afroazjatycka, która jest traktowana raczej jako ich gałąź siostrzana [297]. Prace nad rekonstrukcją języka pranostratycznego† kontynuuje Allan Bomhard[293]. Według Siergieja Jachontowa ów prajęzyk miał być używany nieco ponad 15 tys. lat temu [298]. Niemniej jednak przedstawione propozycje obu makrorodzin budzą kontrowersje wśród głównego nurtu językoznawców, gdyż zostały zbudowane wyłącznie na podstawie podobieństw słownikowych – bez uwzględnienia zbieżności gramatycznych, które są trwalsze niż słownictwo i stanowią znacznie pewniejszy dowód pokrewieństwa [299].
Niektórzy posunęli się jeszcze dalej – Harold Fleming postulował istnienie ogromnej fyli językowej, której nadał nazwę boreańskiej [300]. Miałaby ona obejmować makrorodziny nostratyczną (oraz osobno rodzinę afroazjatycką), amerindiańską i dene-kaukaską – według Fleminga są one spokrewnione ze sobą bardziej niż z pozostałymi językami świata, wiek zaś hipotetycznego prajęzyka boreańskiego† amerykański antropolog szacował na 45 tys. lat[300]. Wreszcie można postawić tezę o istnieniu prajęzyka całej ludzkości†, z którego wywodziłyby się wszystkie istniejące kiedykolwiek rodziny językowe i języki [301]. Badacze uważają jednak, że udowodnienie powszechnego pokrewieństwa języków jest obecnie niemożliwe [302].
Ostatnim wspólnym przodkiem wszystkich języków indoeuropejskich był język praindoeuropejski. Nie został on zaświadczony bezpośrednio (nie są znane żadne źródła historyczne praindoeuropejskiego)[1], jednak za jego istnieniem przemawiają rozliczne wspólne cechy języków rodziny w zakresie struktur gramatycznych, słownictwa oraz fonetyki[233]. Są one na tyle regularne, że współczesna nauka odrzuca tezy o ich zapożyczeniach z zewnątrz, przypadkowym podobieństwie lub upodobnieniu się wyłącznie wskutek wzajemnego oddziaływania. Jedynym właściwym wyjaśnieniem tak licznych zbieżności wydaje się więc istnienie owego postulowanego prajęzyka, z którego zostały odziedziczone [303]. Jego przybliżona wersja została w znacznym stopniu zrekonstruowana przez językoznawców [304]. Przyjmuje się obecność praindoeuropejskiego kilka tysięcy lat p.n.e. na dokładniej nieokreślonych terenach w zachodniej Eurazji[244] – według najpowszechniej uznawanej hipotezy mówiono nim na obszarze Stepu Pontyjskiego [305], a zgodnie z nowszymi szacunkami jego główna faza rozwoju przypadała na okres 4000–3000 lat p.n.e. [306]
Według Donalda Ringe’a w języku praindoeuropejskim występowały następujące głoski [307][uwaga 38]:
Spółgłoski | warg. | przjęz. | palat. | welar. | labial. | krtan. | |
---|---|---|---|---|---|---|---|
zwarte | bezdźwięczne | *p | *t | *ḱ | *k | *kʷ | |
dźwięczne | *b | *d | *ǵ | *g | *gʷ | ||
dźw. przydechowe | *bʰ | *dʰ | *ǵʰ | *gʰ | *gʷʰ | ||
szczelinowe | *s | *h₂ | *h₃ | *h₁ | |||
nosowe | *m | *n | |||||
płynne | *r; *l | ||||||
półsamogłoski | *i̯ | *u̯ | |||||
Samogłoski | niskie | półprzymkn. | wysokie | ||||
krótkie | *a | *e | *o | *i | *u | ||
długie | *ā | *ē | *ō | *ī | *ū |
Istniało również sześć dyftongów (dwugłosek) z samogłoskami krótkimi *a, *e oraz *o (*ai̯, *au̯, *ei̯, *eu̯, *oi̯, *ou̯) [308], a dodatkowo z rzadka mogły pojawiać się dyftongi z długimi samogłoskami *ē lub *ō (*ēi̯, *ēu̯, *ōi̯, *ōu̯) [309]. System fonetyczny prajęzyka uzupełniały cztery sonanty – zgłoskotwórcze (czyli tworzące sylabę) warianty spółgłosek nosowych i płynnych, oznaczane jako *l̥, *m̥, *n̥ oraz *r̥ [310].
Według zapisu podanego w powyższej tabeli spółgłoski *ḱ oraz *ǵ oznaczają – zgodnie z ich palatalnym charakterem – głoski miękkie [311]. Głoski *kʷ oraz *gʷ to spółgłoski labializowane, wymawiane z zaokrąglonymi wargami [312]. Spółgłoski *bʰ, *dʰ, *ǵʰ, *gʰ oraz *gʷʰ były głoskami wymawianymi z przydechem [313]. Głoski *i̯ (czasem zapisywana w literaturze jako *y) oraz *u̯ (czasem zapisywana jako *w) oznaczają spółgłoski półotwarte [314], równoznaczne polskim /j/ oraz /ł/ [uwaga 55]. Natomiast trzy głoski zapisywane jako *hₓ (z dolnym indeksem) miały wymowę dokładniej nieznaną. Są one związane z teorią laryngalną, która opiera się na hipotezie Ferdinanda de Saussure’a z 1878 r. o istnieniu w języku praindoeuropejskim „koeficjentów sonantycznych” (nazwanych później głoskami laryngalnymi, czyli laryngałami – gdyż podejrzewano, że miały one wymowę gardłową lub krtaniową) [315]. Przyjmuje się, że były to spółgłoski [316]:
Teza de Saussure’a pozwalała wyjaśnić pewne anomalie fonetyczne w starożytnej grece [317]. Jedna z głosek laryngalnych została odkryta w 1927 r. przez Jerzego Kuryłowicza w języku hetyckim z grupy anatolijskiej [318]. W trakcie wykształcania się rodziny laryngały zaniknęły, najczęściej powodując przy tym przekształcenie sąsiadujących z nimi w wyrazach innych głosek – w tym charakterystyczne nadanie odpowiedniej barwy (wymowy) samogłosce *e (kolejno: przy *h₁ – /e/, przy *h₂ – /a/ oraz przy *h₃ – /o/, czyli np. *h₃e > *o[uwaga 53]), a dodatkowo jej wzdłużenie zastępcze (przekształcenie w długą samogłoskę), jeśli następująca po niej laryngalna była położona przed spółgłoską lub na końcu wyrazu (np. *eh₂- > *ā-) [319]. W językach bałtosłowiańskich głoski laryngalne pozostawiły ślad w postaci specyficznego systemu akcentowego [320].
Większość praindoeuropejskich rdzeni wyrazowych składała się z dwóch spółgłosek (lub grup spółgłosek), między którymi pojawiała się samogłoska (najczęściej *e) lub dyftong [321]. Charakterystycznym zjawiskiem była nieumotywowana fonetycznie wymiana samogłosek (przegłos, inaczej apofonia) w morfemach słowotwórczych (rdzeniach i przyrostkach) [322]. W zależności od budowy wyrazu i jego formy gramatycznej morfem tego typu mógł wystąpić w następujących wariantach, nazywanych stopniami[186] [323]:
Rdzenie (zwane również pierwiastkami[323]) były jedynie formami bazowymi o ogólnym znaczeniu – same w sobie nie stanowiły konkretnych form gramatycznych [324].
Dopiero od nich można było – za pomocą odpowiednich afiksów – utworzyć właściwe formy wyrazów [327]. Czasami na początku słowa miała też miejsce reduplikacja – podwajana była wtedy pierwsza spółgłoska (lub dwie pierwsze, gdy rdzeń zaczynał się od *s- albo od dowolnego laryngału *hₓ-), po której pojawiało się dodatkowe -e- lub -i- [328].
Echa apofonii praindoeuropejskiej można usłyszeć w niektórych językach potomnych [330].
Charakterystyczną cechą praindoeuropejskiego było również występowanie tzw. ruchomego s- [334]. Początkowe *s- w słowach rozpoczynających się co najmniej dwiema spółgłoskami było głoską bardzo niestabilną, znikającą w różnych formach z niewyjaśnionych powodów. Według jednej z hipotez dwie sąsiadujące głoski /s/ na styku wyrazów (w drugim kolejną musiała być również spółgłoska) zlewały się w mowie w pojedynczą (odmiana zjawiska typu sandhi), a użytkownicy języka mogli błędnie odbierać ów drugi wyraz bez s-[334]. Ślady tego fenomenu zachowały się w słownictwie języków indoeuropejskich, co pokazują zaprezentowane niżej przykłady, wybrane ze słownika Juliusa Pokorny’ego [335] [uwaga 57].
Praindoeuropejski był językiem fleksyjnym. Deklinacja uwzględniała osiem przypadków (siedem jak w polskim oraz ablatyw, odpowiadający na pytania: „skąd?”, „od kogo/czego?”) oraz trzy liczby (pojedynczą, podwójną i mnogą) [336]. Odmianie takiej podlegały rzeczowniki, przymiotniki, zaimki oraz (szczątkowo – tylko te od 1 do 4) liczebniki [337]. Istniały trzy rodzaje gramatyczne (męski, żeński i nijaki), choć według jednej z hipotez rozwinęły się one tylko poza językami anatolijskimi – teoria ta zakłada, że dawniejszy system zawierał dwie klasy nominalne (wspólną męsko-żeńską oraz nijaką) [338].
Przykładowa odmiana przez przypadki rzeczownika „wilk” w rekonstrukcji Ranka Matasovicia [339]:
Forma | Mianownik | Dopełniacz | Celownik | Biernik | Narzędnik | Miejscownik | Ablatyw | Wołacz |
---|---|---|---|---|---|---|---|---|
L.poj. | *wlkʷos | *wlkʷosyo | *wlkʷōy | *wlkʷom | *wlkʷoh₁ | *wlkʷoy | *wlkʷōd | *wlkʷe |
L.podw. | *wlkʷoh₁ | *wlkʷows | ? [uwaga 58] | *wlkʷoh₁ | ?[uwaga 58] | *wlkʷows | ?[uwaga 58] | *wlkʷoh₁ |
L.mn. | *wlkʷōs | *wlkʷōm | *wlkʷobʰos | *wlkʷons | *wlkʷōys | *wlkʷoysu | *wlkʷobʰos | *wlkʷōs |
Czasowniki podlegały odmianie przez liczbę, osobę, stronę, tryb oraz aspekt (ten ostatni bywa również interpretowany jako czas) [340]. Sam czas gramatyczny, jaki znany jest z języka polskiego, miał w praindoeuropejskim zupełnie inny charakter i był ściśle powiązany z aspektem. Morfologiczne rozróżnienie form teraźniejszych i przeszłych odbywało się wyłącznie w trybie oznajmującym aspektu niedokonanego [341], nie istniał też odrębny czas przyszły [342]. Praindoeuropejski system czasowo-aspektowy obejmował zatem następujące formy [343] [344]:
aczkolwiek nie każdy czasownik mógł występować we wszystkich trzech aspektach[342].
Trybów czasownika z kolei było cztery: oznajmujący, przypuszczający (wyrażający również zamiary i czynności przyszłe [345]), życzący i rozkazujący[340]. Ten ostatni miał również specjalną formę przyszłą, oznaczającą opóźnione polecenie (np. „idź później!”) [346]. Natomiast kategoria strony obejmowała stronę czynną i stronę medialną. Ta druga odpowiadała polskiej stronie zwrotnej, biernej (jeśli wykonawca czynności nie był podmiotem) lub formie bezosobowej (jeśli podmiot nie był wyrażony, np. „idzie się”) [347]. W perfectum strona medialna nie występowała[341].
Przykładowa odmiana strony czynnej praindoeuropejskiego czasownika „być” w różnych trybach aspektu niedokonanego według Donalda Ringe’a [348][uwaga 56]:
Forma | Tryb oznajmujący | Tryb przypuszczający |
Tryb życzący |
Tryb rozkazujący | ||
---|---|---|---|---|---|---|
teraźniejszy | przeszły | |||||
L.poj. | 1.os. | *h₁ésmi | *h₁ésm̥ | *h₁ésoh₂ | *h₁siḗm | — |
2.os. | *h₁ési | *h₁és | *h₁ésesi | *h₁siéh₁s | *h₁és; *h₁sdʰí | |
3.os. | *h₁ésti | *h₁ést | *h₁éseti | *h₁siéh₁t | *h₁éstu | |
L.podw. | 1.os. | *h₁suós | *h₁sué | *h₁ésowos | *h₁sih₁wé | — |
2.os. | *h₁stés | *h₁stóm | *h₁ésetes | *h₁sih₁tóm | *h₁stóm | |
3.os. | *h₁stés | *h₁stā́m | *h₁ésetes | *h₁sih₁tā́m | *h₁stā́m | |
L.mn. | 1.os. | *h₁sm̥ós | *h₁sm̥é | *h₁ésomos | *h₁sih₁mé | — |
2.os. | *h₁sté | *h₁sté | *h₁ésete | *h₁sih₁té | *h₁sté | |
3.os. | *h₁sénti | *h₁sénd | *h₁ésonti | *h₁sih₁énd | *h₁séntu |
Podstawowym narzędziem badawczym wykorzystywanym w rekonstrukcji praindoeuropejskiego jest metoda porównawcza. Polega ona na porównywaniu analogicznych elementów poszczególnych form wyrazów w różnych językach, a następnie wyborze z każdego analizowanego segmentu tych najstarszych, które razem składają się na odtworzone praformy. Dokonuje się tego na podstawie pewnych wypracowanych w językoznawstwie zasad [349]. Aby było to możliwe, w językach domniemanej rodziny muszą występować regularne odpowiedniości fonetyczne – czyli takie kombinacje odpowiadających sobie w kolejnych językach fonemów, które systematycznie powtarzają się w wielu słowach [350] [uwaga 59].
Brane są pod uwagę głównie języki starsze; zachowały one bowiem najwięcej archaizmów, a tym samym są najbardziej zbliżone do ich hipotetycznego przodka [351]. Zaliczają się do nich m.in. hetycki, mykeński, a w szczególności te dysponujące obszernym korpusem starożytnych tekstów – sanskryt wedyjski i klasyczna greka. W drugiej kolejności uwzględniane są takie języki późniejsze i współczesne, które charakteryzują się istotnymi dla celów rekonstrukcji właściwościami, niewystępującymi poza daną gałęzią rodziny – przede wszystkim tocharskie, łacina, staroirlandzki, staro-cerkiewno-słowiański, ormiański, litewski czy albański [352]. Owocem prac porównawczych był indoeuropejski słownik etymologiczny Juliusa Pokorny’ego z 1959 r., zawierający m.in. odtworzone rdzenie prajęzyka. Jego treść, z poprawkami redakcyjnymi Andriesa Brouwera i Aleksandra Lubockiego (aktualizowana w 2015), jest udostępniona publicznie[335].
Przykłady zrekonstruowanych praindoeuropejskich rdzeni i wyrazów za Robertem Beekesem [353] [uwaga 60]:
czynności |
|
---|---|
pożywienie |
|
rodzina |
|
technika |
|
zwierzęta |
|
Różne rekonstrukcje liczebników (w wersji Sihlera z możliwych opcji podano wyrazy w stopniu pełnym)[uwaga 60]:
W 1868 r. August Schleicher napisał w hipotetycznym języku praindoeuropejskim (odtworzonym głównie na podstawie sanskrytu) krótkie opowiadanie „Owca i konie” [356]. Jego tekst w późniejszych latach był wielokrotnie poprawiany i aktualizowany zgodnie z wizją prajęzyka poszczególnych badaczy [357]. Poniżej przedstawione zostały oryginalna wersja Schleichera (jeszcze bez laryngałów), wersja Andrew Byrda z r. 2013 oraz dosłowne tłumaczenie na polski – wszystkie podzielono na odpowiadające sobie wersy w celu łatwego porównania form. Tekst Byrda został również nagrany przez niego samego i jest publicznie dostępny do odsłuchu [358].
Avis akvāsas ka
wersja Schleichera (1868)[356]
Avis, jasmin
varnā na ā ast,
dadarka akvams,
tam, vāgham garum vaghantam,
tam, bhāram magham,
tam, manum āku bharantam.
Avis akvabhjams ā vavakat:
kard aghnutai mai
vidanti manum
akvams agantam.
Akvāsas ā vavakant:
krudhi avai,
kard aghnutai vividvant-svas:
manus patis
varnām avisāms karnauti
svabhjam gharmam vastram
avibhjams ka varnā na asti.
Tat kukruvants
avis agram ā bhugat.
H₂óu̯is h₁éḱu̯ōs-kʷe
wersja Byrda (2013)[359][uwaga 56]
h₂áu̯ei̯ h₁i̯osméi̯
h₂u̯l̥h₁náh₂ né h₁ést,
só h₁éḱu̯oms derḱt.
só gʷr̥hₓúm u̯óǵʰom u̯eǵʰed;
só méǵh₂m̥ bʰórom;
só dʰǵʰémonm̥ h₂ṓḱu bʰered.
h₂óu̯is h₁ékʷoi̯bʰi̯os u̯eu̯ked:
“dʰǵʰémonm̥ spéḱi̯oh₂ [uwaga 61]
h₁éḱu̯oms-kʷe h₂áǵeti,
ḱḗr moi̯ agʰnutor”.
h₁éḱu̯ōs tu u̯eu̯kond:
“ḱludʰí, h₂ou̯ei̯!
tód spéḱi̯omes, n̥sméi̯ agʰnutór ḱḗr:
dʰǵʰémō, pótis,
sē h₂áu̯i̯es h₂u̯l̥h₁náh₂
gʷʰérmom u̯éstrom u̯ept,
h₂áu̯ibʰi̯os tu h₂u̯l̥h₁náh₂ né h₁esti”.
tód ḱeḱluu̯ṓs
h₂óu̯is h₂aǵróm bʰuged.
Owca i konie
tłumaczenie dosłowne [360]
Owca, która
wełny nie miała,
zobaczyła konie;
jeden wóz ciężki ciągnął,
jeden ładunek wielki,
jeden człowieka szybko wiózł.
Owca do koni zawołała:
„Serce boli mnie,
widząc człowieka
konie poganiającego”.
Konie zawołały:
„Słuchaj, owco,
serce boli, ujrzawszy:
człowiek, pan,
wełnę owcom ścina
sobie na ciepłą odzież
i owce wełny nie mają”.
To usłyszawszy,
owca na pole pobiegła.
Innym utworem tego typu jest opowiadanie „Król i bóg”. Pochodzi ono ze starego indyjskiego tekstu znanego jako Aitareya Brāhmana i zostało przetłumaczone z sanskrytu na praindoeuropejski przez kilku językoznawców w latach dziewięćdziesiątych XX w. (w niezależnych od siebie wersjach) [361].
Zrekonstruowany prajęzyk różni się jednak w swojej istocie od realnego – choć nieznanego – mówionego praindoeuropejskiego. Ten drugi bowiem w naturalny sposób ewoluował i na różnych etapach swojego rozwoju mógł przyjmować różne postaci [362]. Oznacza to, że język odtworzony przez badaczy jest w praktyce sztucznym tworem i zawiera formy mogące pochodzić z różnych okresów języka realnego. Niektórzy próbują rekonstruować jedynie wczesny, środkowy lub późny praindoeuropejski – jest to jednak rozwiązanie problematyczne i trudne metodologicznie [363]. Język ten prawdopodobnie był też zróżnicowany dialektalnie; odtworzone warianty pewnych form mogły być więc używane tylko w obrębie określonych dialektów, a być może nawet płci lub klas społecznych – nie wiadomo jednak, jak je interpretować. Ponadto mogły istnieć elementy prajęzyka, po których nie zachował się żaden ślad, zatem niemożliwa jest ich rekonstrukcja [364].
Przejście od języka praindoeuropejskiego do rodziny indoeuropejskiej w jej obecnym kształcie zaczęło się od narastającego zróżnicowania dialektalnego tego pierwszego; w późniejszym czasie z jego dialektów wykształciły się nowe, odrębne języki. Kilkanaście z nich w identyczny sposób samo następnie stało się prajęzykami pośrednimi kolejnych grup (np. z pragermańskiego† rozwinęły się języki grupy germańskiej, z prasłowiańskiego† – słowiańskiej itd.)[235]. W praktyce ten trwający tysiąclecia proces był jednak dużo bardziej skomplikowany, wieloetapowy i nieregularny oraz wiązał się z licznymi zmianami w całym indoeuropejskim systemie językowym [365].
Według podręcznikowego modelu Tadeusza Milewskiego z drugiej połowy XX w. rozpad indoeuropejskiego prajęzyka, a tym samym początkowy rozwój rodziny, był zdeterminowany postępującą rozbudową praindoeuropejskiego systemu językowego oraz ekspansją wczesnych społeczności indoeuropejskich [366]. Obszary centralne, na których zachodził szereg językowych innowacji, traciły łączność z powiększającymi się wskutek owej ekspansji obszarami peryferyjnymi – do których zmiany te już nie docierały[366]. Proces ten miał przebiegać w następującej kolejności [367]:
W ten sposób ukształtował się zasadniczy kształt rodziny, stanowiący (z wyłączeniem porzuconej w XXI w. hipotezy tracko-ormiańskiej[74]) podstawę jej klasyfikacji filogenetycznej. Milewski szacował, że koniec wspólnoty praindoeuropejskiej nastąpił nie później niż 2000 lat p.n.e., a ugrupowanie indoeuropejskich dialektów wyglądało wówczas następująco [368]:
Podział geograficzny |
południowe | wschodnie | zachodnie | północne |
---|---|---|---|---|
peryferyjne | anatolijskie; helleńskie |
tocharskie | italoceltyckie | germańskie |
centralne | tracko-ormiańskie | indoirańskie | albańskie | bałtosłowiańskie |
Nowszy model rozprzestrzeniania się języków indoeuropejskich autorstwa Davida Anthony’ego z początków XXI w. zakłada, że zasadnicza wspólnota językowa istniała na Stepie Pontyjskim między 4000 a 3000 lat p.n.e., z ewentualną fazą wczesną, sięgającą 4500 p.n.e. oraz fazą późną, maksymalnie 2500 p.n.e.[306] Według amerykańskiego antropologa kolejnymi ruchami ludności były [369]:
Natomiast badania paleogenetyczne z drugiej i trzeciej dekady XXI w. sugerują, że inaczej niż w powyższym modelu mógł wyglądać początkowy etap rozpadu prajęzyka[246][259]. Zgodnie z ich wynikami najwcześniejsza praindoeuropejska („praindoanatolijska”) populacja zamieszkiwała południową stronę Kaukazu. Stamtąd miała wyruszyć pierwsza fala migracji, posuwająca się ku Anatolii – czego konsekwencją było wykształcenie się odrębnego języka praanatolijskiego. Część zaś pozostałych Praindoeuropejczyków przemieściła się poprzez góry kaukaskie na północ, ostatecznie osiadając na terenach stepowych – tam też doszło do zainicjowania głównego procesu kształtowania się i ekspansji rodziny indoeuropejskiej[246][259].
Część badaczy utożsamia ludność niektórych starożytnych kultur archeologicznych z użytkownikami różnych gałęzi języków indoeuropejskich we wczesnych okresach rozwojowych tych ostatnich [370]. I tak tereny kultury afanasjewskiej (3500–2500 p.n.e.) miały być zamieszkiwane przez przodków Tocharów, kultura Sintaszta (2100–1800 p.n.e.) często bywa przypisywana Indoirańczykom, a rozmaite kultury naddunajskie (z okresu 3100–2800 p.n.e.) kojarzone bywają z wczesnymi społecznościami północno-zachodnioindoeuropejskimi (germańsko-italsko-celtyckimi)[370]. Same ludy germańskie wiązane są z kulturą jastorfską (600–300 p.n.e.), a celtyckie – z halsztacką (750–450 p.n.e.). Natomiast wspólnota bałtosłowiańska jest łączona z kulturą komarowską (1500 p.n.e.), a późniejsze ludy słowiańskie – z czarnoleską (725–200 p.n.e.) [371].
Ewolucja i rozpad praindoeuropejskiej mowy wiązały się z wieloma zmianami w jej strukturze. Możliwe, że dopiero w późniejszej fazie prajęzyka – po wyodrębnieniu się grupy anatolijskiej – powstał rodzaj żeński, w językach owej gałęzi nieobecny[338]. Deklinacja liczb podwójnej i mnogiej, wcześniej dysponujących jedynie mianownikiem, prawdopodobnie została ukończona po odejściu grupy tocharskiej. Natomiast po odłączeniu się gałęzi italoceltyckiej w pozostałych dialektach praindoeuropejskich rozbudowano odmianę strony medialnej[366]. Ewoluował również pierwotny system fonetyczny – m.in. zanikowi uległy głoski laryngalne[319], szczątkowo zachowując się jedynie w gałęzi anatolijskiej [372]. Jednak przede wszystkim doszło do istotnych zmian w wymowie niektórych spółgłosek, czego efektem było wykształcenie się dwóch typów języków: kentum i satem [373].
Charakterystycznymi dla rodziny indoeuropejskiej procesami fonetycznymi były zmiany artykulacji (sposobu wymowy) następujących szeregów głosek tylnojęzykowych prajęzyka[373]:
Ponadto istniał trzeci szereg: czystych (niezmiękczonych i niezaokrąglonych) *k — *g — *gʰ[373]. W bliżej nieokreślonym czasie doszło do uproszczenia owego skomplikowanego systemu na całym indoeuropejskim obszarze językowym. Zmiany dokonały się na dwa różne sposoby[373] [374]:
Sytuację fonologiczną po utrwaleniu się owych innowacji przedstawia poniższa tabela[373]:
Zakres językowy |
Głoski bezdźwięczne |
Głoski dźwięczne |
Głoski dźw. przydechowe | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
język praindoeuropejski |
*ḱ | *k | *kʷ | *ǵ | *g | *gʷ | *ǵʰ | *gʰ | *gʷʰ | |||
dialekty peryferyjne („kentum”) |
*k | *kʷ | *g | *gʷ | *gʰ | *gʷʰ | ||||||
dialekty centralne („satem”) |
*s | *k | *z | *g | *z | *gʰ |
Odmienna ewolucja głosek tylnojęzykowych stała się podstawą dawnego głównego podziału w wewnętrznej klasyfikacji rodziny[45]. Języki peryferyjne, w których nastąpiła depalatalizacja, nazwano językami kentum (od wymowy liczby „100” w łacinie), a języki centralne, w których dokonał się drugi rodzaj innowacji – językami satem (analogicznie od wymowy w awestyjskim)[333]. Sam proces zmiany wymowy głosek palatalnych *ḱ (*ḱ > *č > *s), *ǵ (*ǵ > *z) i *ǵʰ (*ǵʰ > *z) w centralnych dialektach indoeuropejskich zwany jest palatalizacją indoeuropejską[373]. Ostateczne ugrupowanie fonologiczne poszczególnych gałęzi rodziny (z zastrzeżeniami poniżej) ukształtowało się następująco[374]:
Ponadto przypuszcza się, że satemowy charakter miały języki trackie [375], a ilirskie[375] oraz frygijski [376] były językami kentumowymi. Sama satemizacja przebiegała w różnym stopniu: najmocniej w podrodzinie indoirańskiej, znacząco, lecz nieco słabiej w bałtosłowiańskiej (w której zauważalne są pewne pozostałości kentumowe [uwaga 62]), a najsłabiej w gałęzi albańskiej [377] – gdzie albański zawiera znaczną liczbę form typu kentum [378]. Zwracana jest uwaga na pewną odrębność tego ostatniego języka, w którym omawiane trzy szeregi głosek przekształciły się w dużej mierze na trzy odmienne sposoby; niezależny rozwój dokonał się również w luwijskim z grupy anatolijskiej [379]. Natomiast w gałęzi nuristańskiej proces zatrzymał się na zmianie głosek tylnojęzykowych w zwarto-szczelinowe, bez dalszego przejścia w szczelinowe (jak w pozostałych językach indoirańskich)[64].
W części grup lub poszczególnych języków nastąpiły później jeszcze dalsze przekształcenia [380] – np. w pragermańskim doszło do serii przesuwek spółgłoskowych (prawo Grimma – m.in. sekwencja *g⁽ʷ⁾ʰ > *g⁽ʷ⁾ > *k⁽ʷ⁾ > *x⁽ʷ⁾ [uwaga 63]), a podobnego typu proces, choć różniący się szczegółami, zaszedł w gałęzi ormiańskiej[132] (przesuwki ormiańskie). Mylnie bywa czasem interpretowany stan współczesny: np. „sto” w języku francuskim to cent (wymawiane w przybliżeniu /są/), co w wymowie przypomina języki satemowe – jest to jednak efektem późniejszej ewolucji niektórych języków romańskich i odrębnej palatalizacji już po ich wyodrębnieniu się z kentumowej łaciny [381]. Zasadniczo jednak kentumowy lub satemowy charakter wielu indoeuropejskich języków współczesnych i dawnych słychać w wymowie, a co najmniej widać jego ślady w zapisie różnych wyrazów[335] [uwaga 64]:
Pierwotne znaczenie |
praindo- europejski |
łaciński | angielski | polski | litewski | |
---|---|---|---|---|---|---|
języki kentum | języki satem | |||||
kto | *kʷo- | > | quī | who | kto | kas |
serce | *ḱerd- | cor(dis) [uwaga 65] | heart | serce | širdis | |
znać | *ǵnō- | gnōscō (‘znam’) |
know [uwaga 66] (‘znać, wiedzieć’) |
znać | žinoti (‘wiedzieć’) |
W trakcie rozwoju rodziny indoeuropejskiej doszło również do wielu innych zmian w artykulacji[380]. Regularne odpowiedniości zachodzące między dźwiękami w jej różnych gałęziach językowych, będące efektem rozmaitych procesów fonetycznych, opisywane są jako poszczególne prawa głosowe [382]. Należą do nich m.in. wspomniane wyżej prawo Grimma i przesuwki ormiańskie, a ponadto takie jak [383]:
i wiele innych.
Po wykształceniu się indoeuropejskich dialektów – stanowiących zalążki głównych gałęzi językowych rodziny – postępowało ich dalsze różnicowanie, związane z kolejnymi migracjami Indoeuropejczyków [384]. Ok. XX w. p.n.e. Anatolijczycy opanowali Azję Mniejszą [385], gdzie kilka wieków później nastąpił szczyt rozwoju języków anatolijskich, w tym najstarszych zaświadczonych w piśmie języków rodziny: hetyckiego, luwijskiego i palajskiego [386]. W II tysiącleciu p.n.e. doszło również do ekspansji Indoariów i ludów irańskojęzycznych na subkontynencie indyjskim i Wyżynie Irańskiej, ludów helleńskich na południu Bałkanów oraz Italików na Półwyspie Apenińskim [387]; także te społeczności pozostawiły po sobie starożytne zabytki językowe [388].
Najstarsze zachowane ślady piśmiennictwa w językach indoeuropejskich pochodzą z XVII w. p.n.e.[157] Do połowy I tysiąclecia p.n.e. istnieją zapiski w co najmniej kilkunastu językach rodziny – poniższą listę tych ostatnich uszeregowano według pierwszych znanych inskrypcji lub tekstów. Do najwcześniejszych indoeuropejskich zabytków pisma i ich języków należą więc:
Ponadto został odkryty anatolijski język z regionu Kalašma, zapisany pismem klinowym i datowany na XIII w. p.n.e. Publikację jego analizy zaplanowano na 2024 r. [396] Wczesnymi, niematerialnymi zabytkami językowymi są też starożytne indyjskie oraz irańskie teksty religijne – fizycznie spisane wiele wieków później, ale na podstawie bardzo długiej tradycji ustnej:
Kolejnymi etapami ekspansji i rozwoju rodziny indeuropejskiej w czasach starożytnych były [397]:
Dalszy rozwój trwał sukcesywnie przez całe średniowiecze [398]:
W ten sposób do ok. XV w. uformował się zasadniczy kształt mapy językowej rodziny w Eurazji, uwarunkowany ruchami etnicznymi głównie drogą lądową[17]. Kolejne zmiany zaszły już w erze nowożytnej – m.in. wykształciły się literackie odmiany języków albańskiego, bułgarskiego, macedońskiego, litewskiego i łotewskiego, dalsza marginalizacja zaś dotknęła języki celtyckie [399]. Z kolei wymarciu uległy pruski (a wraz z nim gałąź zachodniobałtycka), gocki na Krymie (a tym samym gałąź wschodniogermańska†), słowiański język połabski† oraz romański język dalmatyński† [400].
Zupełnie nowe formy przybrała natomiast zasadnicza część nowożytnej ekspansji indoeuropejskiej, która – począwszy od XVI w. – powodowała osiedlanie się, przede wszystkim drogą morską, niektórych języków rodziny na innych zamieszkałych kontynentach. W jej konsekwencji najbardziej swój zasięg terytorialny powiększyły[17]:
Trudno ocenić, jak w różnych okresach historycznych zmieniała się liczba mówiących – dane takie są w literaturze rzadkie. Otto Jespersen następująco szacował wartości dotyczące sześciu dużych języków pod koniec XVI i na początku XX w. [401]:
Samego angielskiego jako drugiego bądź kolejnego języka uczy się wiele osób na całym świecie – według instytucji British Council pod koniec XX w. w jego naukę zaangażowanych było ok. miliarda ludzi [402]. Natomiast w odmiennej sytuacji znajduje się wiele małych języków indoeuropejskich, zagrożonych wymarciem [403]. Należą do nich m.in. liczne lokalne języki indoirańskie (jak baszkardi, domari, gurani czy jagnobijski) i romańskie (np. aragoński, friulski, piemoncki czy waloński), wypierane przez inne, dominujące. Zagrożone są też niektóre etnolekty albańskie (arbaryjski oraz arwanicki) i fryzyjskie, zachodniosłowiańskie języki łużyckie i kaszubski czy celtyckie bretoński, irlandzki, kornijski i manx[403]. Dwa ostatnie wymienione udało się zrewitalizować już po ich wymarciu. Kornijski, utracony w XVIII lub na początku XIX stulecia, odtworzono w początkach XX w. [404] Z kolei manx, którego ostatni rodzimy użytkownik zmarł w 1974 r., ożywiono już w następnych dekadach [405].
Wielu badaczy przyjmuje, że strukturę rodziny indoeuropejskiej najlepiej przedstawia model drzewa [406] – wzorowany na znanym z nauk przyrodniczych schemacie drzewa rodowego, opartym na metodach kladystycznych [407]. Kolejne poziomy jego gałęzi reprezentują coraz dalsze stadia rozwojowe, grupy i podgrupy, aż do pojedynczych języków[407]. Natomiast poszczególne podziały symbolizują utratę kontaktów językowych między pierwotną społecznością a jej odłamami, czego skutkiem był odrębny rozwój mów poszczególnych zbiorowości [408]. Problemy stwarzają niektóre cechy, których zasięgu występowania nie da się wytłumaczyć w ten sposób – wykorzystywany bywa wówczas model fali, przyrównujący rozprzestrzenianie się zmian językowych do fal na wodzie [409]. W XXI w. zwracana jest uwaga na tego typu niekladystyczny charakter w szczególności grupy germańskiej, której wiele właściwości prawdopodobnie zostało przejętych od sąsiadów językowych [410]. Według Williama Labova oba modele ewolucji języków wzajemnie się uzupełniają [411].
Mimo badań filogenetycznych rodziny indoeuropejskiej trwających od połowy XIX w., naukowy konsensus obejmuje jedynie ogólny podział jej języków na grupy, odrębny status gałęzi anatolijskiej oraz wyróżnianie kategorii wyższego rzędu: indoirańskiej i bałtosłowiańskiej. Wszystko pomiędzy – przebieg procesu różnicowania się praindoeuropejskich dialektów oraz powstawania kolejnych gałęzi językowych, a co za tym idzie dokładny kształt indoeuropejskiego drzewa rodowego – w XXI w. wciąż jest przedmiotem spekulacji i rozważań badaczy [412].
Ringe i in. (2002)
Donald Ringe, Tandy Warnow i Ann Taylor dokonali rekonstrukcji drzewa binarnego rodziny, używając metod analizy matematycznej zapożyczonych z biologii ewolucyjnej [413]. W najlepszym stworzonym przez specjalne oprogramowanie schemacie, który uwzględniał wszystkie główne grupy językowe, badacze uzyskali następującą kolejność wydzielania się poszczególnych gałęzi: anatolijska, tocharska, italoceltycka, albano-germańska (z zastrzeżeniami), helleno-ormiańska, na końcu zaś indoirańska i bałtosłowiańska [414]. Uwagę zwróciła zmieniająca się pozycja grupy albańskiej, której różne cechy fonologiczne i morfologiczne – w zależności od tego, które z owych cech brano pod uwagę – wykluczały ją z poszczególnych gałęzi wyższego rzędu (italoceltyckiej, helleno-ormiańskiej, indoirańskiej i bałtosłowiańskiej) [415]. Drugą problematyczną grupą okazała się germańska, która nie dała się w prosty sposób wkomponować w schemat drzewa. Według autorów mogła ją na wczesnych etapach rozwoju łączyć sieć powiązań z innymi gałęziami [416].
Chang i in. (2015)
Z kolei grupa naukowców z Uniwersytetu Kalifornijskiego przeprowadziła – również korzystając ze specjalistycznego oprogramowania, tym razem przeznaczonego do badań z wykorzystaniem metod bayesowskich [417] – filogenetyczną analizę statystyczną języków indoeuropejskich. Zgodnie z jej wynikami jako pierwsza miała wykształcić się odrębna gałąź anatolijska, następna w kolejności zaś – tocharska, co potwierdzało dotychczasowe badania. Natomiast dalsze postulowane etapy ewolucji przyjęły już inne kształty [418]. Uzyskane rezultaty zasugerowały, że po wydzieleniu się grupy tocharskiej doszło do podziału głównego pnia rodziny na dwie odrębne linie rozwojowe: albano-helleno-ormiańską oraz drugą, obejmującą pozostałe późniejsze grupy. Pierwsza z nich rozpadła się następnie na albańską i helleno-ormiańską; z drugiej zaś odrywały się kolejno gałęzie: indoirańska, bałtosłowiańska, a na końcu nastąpił jej podział na germańską oraz italoceltycką[418].
Kassian i in. (2021)
Natomiast zespół z udziałem m.in. Aleksieja Kassiana i Gieorgija Starostina oparł swoje badania o leksykostatystykę, wykorzystując listę Swadesha [419]. Rosjanie jako kolejni potwierdzili pierwszeństwo odłączenia się grupy anatolijskiej, a następnie tocharskiej. Później zaś miało dojść do równoczesnego (politomicznego) wykształcenia się gałęzi: albańskiej, helleno-ormiańskiej, germano-italo-celtyckiej (podzielonej następnie – także jednocześnie – na poszczególne grupy) oraz bałtosłowiańsko-indoirańskiej (która potem rozpadła się na bałtosłowiańską i indoirańską) [420]. Ekipa Kassiana wskazała, że ów politomiczny charakter niektórych węzłów drzewa rodziny może świadczyć o serii pojedynczych, szybko następujących po sobie rozłamów w bardzo krótkich historycznie przedziałach czasu (być może nawet w ciągu jednego ludzkiego pokolenia). Dokładna kolejność takich podziałów byłaby wówczas niemożliwa do odtworzenia – co według autorów prowadzi do uzyskiwania różnych wyników i odzwierciedla mnogość propozycji jego kształtu [421].
Zaprezentowane badania potwierdzają, że jako pierwsza od prajęzyka rodziny odłączyła się gałąź anatolijska. Przemawia za tym m.in. deklinacja języka hetyckiego, który w liczbie podwójnej i mnogiej odziedziczył jedynie praindoeuropejskie formy mianownika – co może dowodzić, że przypadki zależne (a więc inne niż mianownik) form mnogich i podwójnych zaczęły się wykształcać w prajęzyku dopiero po odejściu dialektów praanatolijskich[366]. O wczesnym charakterze tej, a także – drugiej w kolejności rozwoju – grupy tocharskiej mają świadczyć również następujące argumenty [422]:
Część propozycji sugeruje, że jako kolejna wyodrębniła się gałąź italoceltycka[32]. Dowodzić tego mają m.in. nieobecne w italoceltyckich językach następujące nowe formy indoeuropejskie, które wykształciły się prawdopodobnie w późniejszym okresie rozwoju (nieistniejące więc również w gałęziach anatolijskiej i tocharskiej) [423]:
Dalsza rekonstrukcja drzewa rodziny sprawia już większe trudności. Problematyczna jest gałąź albańska – w zależności od metody badań jej pozycja w obrębie „wewnętrznych” (czyli z wyłączeniem anatolijskich i tocharskich[44]) języków indoeuropejskich skrajnie się różni: od najbardziej odrębnej grupy (czyli oddzielonej jeszcze przed italoceltyckimi) aż do wspólnego pokrewieństwa z bałtosłowiańskimi i indoirańskimi [424]. Rezultaty jeszcze innych analiz wiążą albańskie z helleno-ormiańskimi[418] lub germańskimi[414]. Niepewne jest również miejsce tych ostatnich – dawniej grupa germańska bywała łączona z bałtosłowiańskimi [425], w XXI w. zaś zauważalna jest tendencja do bliższego wiązania jej z italoceltyckimi[418][420]. Leszek Bednarczuk twierdzi, że wykształciła się ona na tym samym obszarze dialektalnym co gałąź bałtosłowiańska, natomiast w późniejszym okresie utworzyła wspólny areał rozwojowy z italoceltycką [426]. Z kolei Ringe zwrócił uwagę na możliwość istnienia łańcucha wzajemnie przenikających się dialektów germańskich, bałtosłowiańskich i indoirańskich w ich początkowych fazach rozwoju [427].
Zgodnie więc z aktualnym stanem wiedzy szczegółowe stosunki i dokładne pokrewieństwo filogenetyczne między gałęziami: albańską, bałtosłowiańską, germańską, helleno-ormiańską, indoirańską oraz italoceltycką nie zostały dotychczas jednoznacznie ustalone[421] [428].
W latach 70. XIX w. Johannes Schmidt zauważył, że w dwóch dowolnych grupach rodziny indoeuropejskiej, niezależnie od ich stopnia pokrewieństwa, zawsze występują jakieś identyczne innowacje językowe – tym liczniejsze, im bliżej siebie geograficznie dane gałęzie się znajdują. Ponadto zmiany takie na różnych areałach rodziny nakładają się na siebie – co nie przystaje do modelu drzewa filogenetycznego [429]. Na podstawie owych obserwacji rozwinięta została teoria falowa, według której każda zmiana w języku rozchodzi się z miejsca swojego powstania w różnych kierunkach, obejmując – tak jak fale na wodzie – coraz większy obszar [430]. Model falowy jest przedstawiany na mapach językowych w postaci serii izoglos – linii wyznaczających granice poszczególnych cech [431].
Innowacjami, których rozprzestrzenienie się w różnych gałęziach indoeuropejskich może być tłumaczone za pomocą modelu falowego są np.[429]:
Do innych zmian, obejmujących różne areały rodziny, należą m.in. [432]:
Według Bednarczuka zaprezentowane wyżej zbieżności świadczą o tym, że na praindoeuropejskim obszarze początkowo uformowały się dwa areały dialektalne, będące centrami odrębnych innowacji językowych[426]:
W późniejszym czasie zaś – po przesunięciu się centrów innowacji – miały się wykształcić nowe subareały[432]:
Istotną dla modelu falowego przyczyną są kontakty graniczne, gdy dochodzi do wymiany pewnych cech pomiędzy sąsiadującymi językami wskutek ich wzajemnego oddziaływania – zmiany utrwalają się następnie na większym obszarze [433]. Część językoznawców wskazuje, że do tego typu kontaktów dochodziło we wczesnych fazach rozwoju niektórych gałęzi indoeuropejskich. Ślady tego zjawiska można odnaleźć w językach potomnych – według grupy badaczy miało ono miejsce w trzech przypadkach: gałęzi bałtyckiej i germańskiej, germańskiej i italskiej oraz italskiej i helleno-ormiańskiej [434]. Zwracana jest też uwaga na zbieżności w ramach języków satemowych: ormiańsko-albańskie, albańsko-bałtosłowiańskie, bałtosłowiańsko-indoirańskie, a wśród tych ostatnich przede wszystkim słowiańsko-irańskie (m.in. pewien zasób dawnego słownictwa irańskiego w językach słowiańskich) [435].
Tamaz Gamkrelidze i Wiaczesław Iwanow sugerowali, że istniały kontakty językowe grupy tocharskiej z postulowaną przez nich gałęzią germano-bałtosłowiańską, a tej ostatniej – z helleno-ormiano-indoirańską. Po wyodrębnieniu się germańskich i helleńskich miało dojść z kolei do zbliżenia gałęzi bałtosłowiańskiej z ormiano-indoirańską [436]. Natomiast David Anthony twierdzi, że we wczesnych stadiach rozwojowych dochodziło do wzajemnych pożyczek germańsko-celtyckich, germańsko-słowiańskich, indoirańsko-bałtyckich, indoirańsko-helleńskich oraz indoirańsko-ormiańskich [437]. Według Anthony’ego doszło również do wtórnego upodobnienia się języków bałtosłowiańskich – wskutek częstych zapożyczeń już po rozpadzie na odrębne grupy bałtycką i słowiańską. Na mniejszą skalę zjawisko to miałoby też zajść pomiędzy grupą italską a celtycką[437].
Języki indoeuropejskie są przedmiotem badań nauki zwanej indoeuropeistyką, która jest specjalistycznym obszarem językoznawstwa. Zajmuje się ona badaniem rozwoju języków rodziny, zmian językowych w czasie i formułowaniem związanych z tym reguł, odtwarzaniem wymowy języków martwych, opracowywaniem klasyfikacji genetycznej języków indoeuropejskich, a przede wszystkim rekonstrukcją ich przodka – języka praindoeuropejskiego [438]. Rodzina indoeuropejska znajduje się również w sferze zainteresowań kulturoznawstwa, archeologii oraz genetyki, dla których odtworzony w znacznym stopniu prajęzyk jest narzędziem służącym poznaniu hipotetycznej kultury praindoeuropejskiej i jej praojczyzny [439] oraz genetycznego pochodzenia jej ludności [440]. Językoznawstwo indoeuropejskie w ścisłym znaczeniu powstało na początku XIX w. [441] Jego pierwotnym stadium było niewiele starsze językoznawstwo historyczno-porównawcze, z którym w wielu aspektach wciąż się pokrywa [442].
Już w starożytności zauważono podobieństwa między językiem greckim a łacińskim (np. héks : sex ‘sześć’, heptá : septem ‘siedem’), świadomie wskazywano nawet na pewne regularności – jak greckie h- na początku wyrazu odpowiadające łacińskiemu s-. Tłumaczono to tym, że łacina pochodzi jakoby od greki. Kwestia związków między językami nie zwracała jednak większej uwagi badaczy aż do czasów nowożytnych [443]. Natomiast jeszcze ok. V w. p.n.e. powstała pierwsza w dziejach gramatyka opisowa języka z rodziny indoeuropejskiej (i jakiegokolwiek w ogóle) – indyjski gramatyk Pāṇini skodyfikował kilka tysięcy reguł sanskrytu [444].
W XVI w. przybywający na subkontynent indyjski Europejczycy zaczęli dostrzegać podobieństwa między językami Europy a językami Indii. W 1583 r. Thomas Stephens, jezuicki misjonarz, w liście do brata podzielił się swoimi spostrzeżeniami na temat takich podobieństw języków indyjskich z greckim i łacińskim [445]. Dwa lata później (w 1585) Filippo Sassetti, kupiec z Florencji, zauważył zbieżności pomiędzy sanskrytem a językiem włoskim (szczególnie w liczebnikach od sześciu do dziewięciu oraz w rzeczownikach „bóg” i „wąż”). Obserwacje te nie wzbudziły jednak zainteresowania ówczesnych językoznawców[445].
W świecie naukowym pokrewieństwo niektórych języków dostrzegł w r. 1647 holenderski badacz Marcus Zuerius van Boxhorn. Zestawił on ze sobą łacinę, grecki, perski, sanskryt, germańskie, słowiańskie oraz bałtyckie i przypisał im tego samego językowego przodka, którego nazwał „scytyjskim” [446]. Jego hipoteza wywarła późniejszy wpływ na Gottfrieda Leibniza, który był świadomy bliskości „celto-scytyjskich”. Leibniz w swoich rozważaniach (1710) stwierdził, że wraz z „aramejskimi” wywodziły się one ze wspólnego języka całej Eurazji [447]. Natomiast w drugiej połowie XVIII w. (1767) Gaston Coeurdoux zauważył podobieństwa nie tylko sanskryckich, łacińskich i greckich wyrazów, lecz także gramatyk owych języków. Ale i jego badania nie zostały od razu docenione i doczekały się publikacji dopiero na początku następnego stulecia [448].
Ideę językowego pokrewieństwa rozpowszechnił dopiero William Jones, sędzia i filolog brytyjski, który w wykładzie wygłoszonym w lutym 1786 r. w Kalkucie zwrócił uwagę na zbieżności w zakresie słownictwa oraz struktury gramatycznej pomiędzy sanskrytem, łaciną i greką. Zasugerował w nim, że muszą one pochodzić ze wspólnego, prawdopodobnie nieistniejącego już źródła [449]. Nowo rozpoznana rodzina języków nie miała jeszcze wówczas powszechnie stosowanej nazwy. W r. 1810 geograf Conrad Malte-Brun zaproponował termin „języki indogermańskie” (używany w literaturze niemieckojęzycznej do dziś), a trzy lata później (w 1813) Thomas Young po raz pierwszy użył określenia „języki indoeuropejskie”, które w czasach współczesnych znajduje się w powszechnym użyciu [450]. Za początek indoeuropeistyki jako właściwej dziedziny naukowej uznawany jest r. 1816, w którym Franz Bopp udowodnił pokrewieństwo języków rodziny oraz opublikował przedmowę do swojego fundamentalnego dzieła Über das Conjugationssystem der Sanskritsprache in Vergleichung mit jenem der griechischen, lateinischen, persischen und germanischen Sprache[441].
W późniejszych latach Bopp dowiódł indoeuropejskiego charakteru języków celtyckich, a także albańskiego (jako osobnej gałęzi) i ormiańskiego [451]. Schemat języków rodziny w postaci drzewa rodowego jako pierwszy zaproponował z kolei August Schleicher w swoim Compendium der vergleichenden Grammatik der indogermanischen Sprachen (1861/62). Natomiast w latach 70. XIX w. w Lipsku powstała szkoła naukowa młodych badaczy (tzw. młodogramatyków), której liderzy – Karl Brugmann i Hermann Osthoff – sformułowali zasadę bezwyjątkowości praw głosowych [452]. W 1878 r. Ferdinand de Saussure wysunął hipotezę istnienia w prajęzyku „koeficjentów sonantycznych” (nazwanych później laryngałami – głoskami o artykulacji gardłowej lub krtaniowej)[315] jako wyjaśnienie pewnych anomalii fonetycznych, obserwowanych w starożytnej grece[317]. Powszechnie został też zaakceptowany pierwszy główny podział w klasyfikacji rodziny, oparty na różnicach fonologicznych – na języki kentum i satem, obowiązujący jako standard jeszcze w pierwszych dekadach XX w.[45]
Na przełomie XIX i XX stulecia odkryto teksty w nieznanych dotąd językach, które wkrótce potem zostały zidentyfikowane jako indoeuropejskie – lecz przynależące do nowych gałęzi, określanych dzisiaj jako anatolijska i tocharska [453]. W wyniku odczytania owych tekstów indoeuropeistyka dokonała znaczącego postępu – w r. 1927 Jerzy Kuryłowicz zauważył, że głoska ḫ w anatolijskim języku hetyckim jest jedną z głosek laryngalnych[318], co potwierdzało tezę de Saussure’a sprzed kilkudziesięciu lat. Rozwinięta na jej podstawie teoria laryngalna wniosła istotny wkład w badania nad językami indoeuropejskimi, a same laryngały bywają uważane za najważniejsze odkrycie w dziejach dyscypliny[315]. W 1935 r. Émile Benveniste zaproponował strukturę rdzenia i zasady jego formacji w prajęzyku. Natomiast w latach powojennych dwa dzieła na temat akcentu i przegłosu indoeuropejskiego, kolejno L'accentuation des langues indo-européennes (1952) oraz L’apophonie en indo-européen (1956) opublikował wspomniany już Kuryłowicz [454].
W 1959 r. Austriak Julius Pokorny udostępnił Indogermanisches etymologisches Wörterbuch – słownik etymologiczny zrekonstruowanych rdzeni prajęzyka wraz z ich zaświadczonymi formami potomnymi[335]. Z kolei od lat 70. XX w. zauważalne jest zwiększone zainteresowanie badaczy syntaktyką praindoeuropejskiego i starszych języków rodziny [455]. Na przełomie stuleci – pod redakcją niemieckiego językoznawcy Helmuta Rixa – zmodernizowany i dostosowany do ówczesnego stanu wiedzy został słownik Pokorny’ego, wydany jako Lexikon der indogermanischen Verben (oznaczany skrótowo jako LIV, 1998). Już w XXI w. zostały opublikowane leksykon nominalnych części mowy kilku autorów (Nomina im Indogermanischen Lexikon – NIL, 2008) oraz leksykon partykuł i zaimków George’a Dunkela (Lexikon der indogermanischen Partikeln und Pronominalstämme – LIPP, 2014) [456]. Ukazują się również czasopisma indoeuropeistyczne, m.in. Journal of Indo-European Studies czy Indogermanische Forschungen.
W międzynarodowym, bibliotecznym systemie uniwersalnej klasyfikacji dziesiętnej pozycjom z dziedziny językoznawstwa indoeuropejskiego przyporządkowano klasę o numerze 811.1/.2 [457]. Niektóre języki rodziny posłużyły za podstawę wybranych języków sztucznych. Prawdopodobnie najbardziej znanym i rozpowszechnionym na świecie sztucznym międzynarodowym językiem pomocniczym jest esperanto, stworzone przez Ludwika Zamenhofa w 1887 r., które zostało oparte głównie na językach romańskich [458].
Badaniami indoeuropeistycznymi zajmowali się m.in. [459] [460]:
Główną metodą naukową stosowaną w badaniach nad rodziną indoeuropejską jest metoda porównawcza, która opiera się na poszukiwaniu analogii w strukturze fonetycznej i morfologicznej odpowiadających sobie w różnych językach wyrazów, a następnie odtwarzaniu ich form pierwotnych w prajęzyku[304]. Dzięki niej został zrekonstruowany duży zasób słownictwa i gramatyki praindoeuropejskiej [461]. Innym często wykorzystywanym w pracy badawczej narzędziem jest rekonstrukcja wewnętrzna, polegająca na poszukiwaniu oboczności na wybranym etapie rozwojowym danej mowy w celu ustalenia, które z odpowiadających sobie elementów są starsze. W ten sposób są odwzorowywane dawniejsze fazy poszczególnych języków [462]. W praktyce odtwarzanie pramowy polega na przechodzeniu z metody porównawczej do rekonstrukcji wewnętrznej i z powrotem, co pozwala uniknąć wielu potencjalnych błędów[315].
Indoeuropeistyka korzysta również z warsztatu lingwistyki arealnej, badającej geograficzny zasięg poszczególnych cech językowych, a także – w szczególności w czasach współczesnych – z lingwistyki matematycznej [463]. W ramach tej drugiej jest wykorzystywane m.in. wnioskowanie bayesowskie[417]. Rzadziej natomiast stosowana bywa kontrowersyjna – odrzucana przez wielu językoznawców – masowa komparacja leksykalna, porównująca słownictwo wielu języków jednocześnie i służąca poszukiwaniom powiązań filogenetycznych całej rodziny z innymi [464]. Metody wypracowane przez językoznawstwo indoeuropejskie znacząco przyczyniły się do postępu w badaniach nad pozostałymi rodzinami językowymi[241].
Sceptykiem wobec idei pokrewieństwa filogenetycznego języków indoeuropejskich był Nikołaj Trubieckoj. Według rosyjskiego badacza podobieństwa między nimi wynikają wyłącznie z wzajemnych kontaktów językowych [465]. Trubieckoj twierdził, że niemożliwe jest wyodrębnienie wspólnych, indoeuropejskich elementów morfologiczno-słownikowych niewystępujących nigdzie indziej – zamiast tego powinny być brane pod uwagę wyłącznie cechy strukturalne. W latach trzydziestych XX w. zaproponował on sześć następujących kryteriów, których spełnienie klasyfikowałoby daną mowę jako indoeuropejską [466]:
Nie są znane żadne źródła historyczne praindoeuropejskiego[1], nie wiadomo zatem, jak mówiąca nim ludność nazywała (o ile w ogóle miało to miejsce) siebie i swój język. Pojawiały się więc różne sugestie, jakim przymiotnikiem określić pochodzącą od niego rodzinę. Proponowano następujące nazwy[450]:
Przed II wojną światową konkurowały ze sobą określenia „języki indoeuropejskie” oraz „języki indogermańskie”. To drugie w pewnym okresie zaczęło być jednak wykorzystywane m.in. w ideologii nazistowskiej, fałszywie utożsamiającej Niemców z Aryjczykami [467]. Współcześnie występuje ono prawie wyłącznie w literaturze niemieckojęzycznej[450] (już bez rasistowskich konotacji). Spotykane są też nazwy „języki indo-anatolijskie”[43] oraz „języki indo-hetyckie”[154], używane przez niektórych specjalistów podkreślających bazalny charakter gałęzi anatolijskiej w stosunku do pozostałych linii rozwojowych rodziny indoeuropejskiej [468].
Alfabetyczny indeks haseł indoeuropeistycznych
Artykuły dotyczące języków indoeuropejskich jako zbioru
Artykuły związane z językoznawstwem indoeuropejskim
Artykuły z zakresu geografii językowej
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.