Profil ústavu

Ústav Českého národního korpusu (ÚČNK) se od svého založení v roce 1994 soustředí zejména na kontinuální a všestranný rozvoj projektu Český národní korpus (ČNK). Cílem projektu je systematické mapování vývoje češtiny (psané i mluvené) v mnoha jejích podobách a žánrech prostřednictvím vytváření a zpřístupňování rozsáhlých souborů autentických textů – jazykových korpusů, které slouží jazykově orientovanému výzkumu v oblasti společenských a humanitních věd. Při budování korpusů se hlavní pozornost ČNK soustředí na jejich pestré a reprezentativní složení, vysokou kvalitu zpracování jazykových dat a jejich bohatou anotaci.

Nedílnou součástí aktivit ČNK je také vývoj specializovaných webových aplikací pro uživatelskou práci s korpusy, poskytování konzultací a školení, pořádání workshopů, hostování korpusů vytvořených mimo ČNK, analýza uživatelských dat a poskytování datových balíčků pro specifické účely, zejména počítačové zpracování přirozeného jazyka. Aplikace pro práci s korpusy jsou spolu s uživatelskou podporou (manuály, kurz práce s ČNK, on-line poradna atd.) a dalšími aktivitami projektu ČNK soustředěny na portálu http://www.korpus.cz.

Činnost ČNK je rozdělena do čtyř sekcí:

  • sekce lingvistická (vědecká, publikační a pedagogická činnost, uživatelská podpora)
  • sekce akvizice a zpracování dat (sběr jazykových dat a jejich zpracování)
  • sekce lingvistické analýzy a anotace (morfologická a syntaktická anotace)
  • sekce komputační (vývoj uživatelských aplikací a dalšího software, správa IT).

Vedle rozvoje projektu ČNK se ÚČNK zabývá především vědeckou a publikační činností v oboru korpusová lingvistika, rozvojem jeho metodologie, a v neposlední řadě také výchovou studentů jak v rámci doktorského studia, tak i na seminářích pro magisterské studenty dalších oborů FF UK.

ČNK má statut K-centra CLARIN, aktivně se zapojuje do činnosti CLARIN ERIC a spolupracuje s řadou dalších institucí s podobným zaměřením.

Úvod > Ústav > Profil ústavu