Co je korpus?

Korpus je soubor počítačově uložených textů (v případě mluveného jazyka - přepisů záznamu mluvy), který primárně slouží k jazykovému výzkumu. K práci s korpusy slouží speciální vyhledávací program KonText . S jeho pomocí je možné vyhledávat slova a slovní spojení v kontextu a zjistit jejich frekvenci v korpuse i původní textový zdroj. Umožňuje i další zpracování nalezeného (např. abecední třídění apod.). U některých korpusů lze vyhledávat i podle slovních druhů.

Všechny nástroje pro práci s korpusovými daty jsou umístěny na portále www.korpus.cz. Zde je k dispozici zejména korpusový vyhledávač KonText, nástroj pro vyhodnocování variant SyD a další, ale také manuál ve formě Wiki a poradnu pro uživatele.

Český národní korpus (ČNK) je akademický projekt zaměřený na budování rozsáhlého počítačového korpusu především psané češtiny. Pracuje na něm Ústav Českého národního korpusu na Filozofické fakultě Univerzity Karlovy v Praze (ÚČNK). Od svého založení roku 1994 má ÚČNK na starosti budování ČNK, jeho rozvoj a rovněž činnosti související, zvláště v oblasti výuky a pěstování oboru korpusová lingvistika.

Aktuality

Přednášky dr. Martina Henzelmanna
Srdečně Vás zveme na přednášky dr. Martina Henzelmanna ze Slavistického institutu Technické univerzity v Drážďanech, které proběnou ve dnech 17. a 18. 2. 2016 na FF UK. Více informací naleznete zde.

Korpusová lingvistika Praha 2016
ČNK zve všechny své uživatele a příznivce na další ročník konference Korpusová lingvistika Praha 2016, který ponese podtitul Od mluvené češtiny k psané. Více informací na konferenčních stránkách www.korpus.cz/kl2016.

Nominace
V úterý 15. prosince od 14:00 proběhne v ÚČNK (Panská 7, Praha 1) nominace nového vedení ústavu na funkční období 2016–2019.

Aktualizované verze korpusů Aranea
V červnu 2015 byla v ČNK aktualizována rodina nereferenčních srovnatelných webových korpusů Aranea sestavených Vladimírem Benkem. Pokrývá již celkem 14 jazyků (cs, de, en, es, fi, fr, hu, it, nl, pl, pt, ru, sk, zh), další informace najdete zde.

InterCorp verze 8
V červnu 2015 byla zveřejněna další verze paralelního korpusu InterCorp. Podrobnosti zde.

Konec aplikací Bonito, Park a NoSkE
Na konci března byla ukončena podpora aplikací Bonito, Park a NoSketch Engine. Pro uživatele těchto aplikací jsme připravili užitečné rady pro přechod na nové rozhraní KonText.