Korpus dilçiliyi
Korpus dilçiliyi — mətn korpusunun inkişafı, yaradılması və istifadəsi ilə məşğul olan dilçiliyin bir sahəsidir. Termin 1960-cı illərdə korpusların yaradılması təcrübəsinin aparılması ilə meydana çıxmışdır və 1980-ci illərdə kompüter texnologiyasının inkişafı ilə əlaqədar istifadəyə başlanmışdır.
Mətnlərin linqvistik və ya dil korpusu xüsusi linqvistik problemləri həll etmək üçün nəzərdə tutulmuş böyük, maşınla oxuna bilən, vahid, strukturlaşdırılmış, etiketlənmiş, filoloji cəhətdən səlahiyyətli dil məlumatlarının məcmusudur.
Müasir korpusun əsas xüsusiyyətləri maşınla oxuna bilən format, reprezentativlik və metalinqvistik məlumatın mövcudluğudur. Reprezentativlik xüsusi mətn seçimi prosedurundan istifadə etməklə əldə edilir.
Linqvistik korpus müəyyən prinsiplərə uyğun toplanmış, müəyyən standarta uyğun olaraq işarələnmiş və ixtisaslaşmış axtarış sistemi ilə təmin edilmiş mətnlər toplusudur. Bəzən korpus ("birinci dərəcəli korpus") sadəcə olaraq hansısa ümumi xüsusiyyət (dil, janr, müəllif, mətnlərin yaranma dövrü) ilə birləşdirilən hər hansı mətnlər toplusu adlanır.
Mətn korpusunun yaradılmasının mümkünlüyü aşağıdakılarla izah olunur:
linqvistik məlumatların real kontekstdə təqdim edilməsi;
kifayət qədər böyük məlumatların təqdim olunması (böyük həcmli korpusda);
müxtəlif linqvistik problemlərin həlli üçün bir dəfə yaradılmış korpusdan təkrar istifadənin mümkünlüyü, məsələn, qrafematik və leksiko-qrammatik mətn təhlilinin həyata keçirilməsi və s.
== Tarixi ==
İlk böyük kompüter korpusu 1960-cı illərdə Braun Universitetində yaradılmış və hər biri 2 min sözdən ibarət 500 mətn fraqmentindən ibarət olan və 1961-ci ildə ABŞ-də ingilis dilində istifadəyə verilən Braun korpusu (BK ing. Brown Corpus, BC) hesab olunur.