Corpuslinguïstiek
een tak van de linguïstiek die taal bestudeert aan de hand van voorbeelden in echte teksten / Uit Wikipedia, de vrije encyclopedia
Corpuslinguïstiek of corpustaalkunde is de studie van bepaalde taalverschijnselen met behulp van een verzameling geannoteerde teksten. Zulke verzamelingen van teksten worden corpora genoemd.
Zaken die vaak worden onderzocht zijn de frequentie van bepaalde woorden en de typische contexten waarin ze opduiken. Dit gebeurt tegenwoordig over het algemeen digitaal. Voordat de computer werd uitgevonden, maakte men hiervoor gebruik van concordanties, in de vorm van handmatig opgestelde overzichten van de contexten waarin een bepaald woord werd aangetroffen. Aan het eind van de 17e eeuw deed Abraham Trommius bijvoorbeeld iets dergelijks voor de Bijbel. Tegenwoordig maken onderzoekers gebruik van concordantieprogramma's.