Corpus lingüístico
conxunto amplo e estruturado de exemplos reais de uso da lingua From Wikipedia, the free encyclopedia
Remove ads
Un corpus lingüístico é un conxunto, normalmente moi amplo, de exemplos reais de uso dunha lingua. Estes exemplos poden ser textos (tipicamente), ou mostras orais (normalmente transcritas).
Chámaselle lingüística de corpus á subdisciplina da lingüística que estuda a lingua a través destas mostras. Este tipo de aproximación choca co enfoque chomskiano que tende a estudar a lingua a través da intuición lingüística do falante.
Esta subdisciplina, dado o volume de datos que se manexa, normalmente asóciase coa lingüística computacional.
Esta disciplina iniciouse en 1967 cando Henry Kucera e Nelson Francis publicaron o clásico Computational Analysis of Present-Day American English, baseándose no corpus Brown, unha compilación de inglés americano de aproximadamente un millón de palabras seleccionadas dunha ampla variedade de fontes.
Remove ads
Véxase tamén
Outros artigos
Ligazóns externas
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads