Co je korpus?
Korpus je soubor počítačově uložených textů (v případě mluveného jazyka - přepisů záznamu mluvy), který primárně slouží k jazykovému výzkumu. K práci s korpusy slouží speciální vyhledávací program. S jeho pomocí je možné vyhledávat slova a slovní spojení v kontextu a zjistit jejich frekvenci v korpuse i původní textový zdroj. Umožňuje i další zpracování nalezeného (např. abecední třídění apod.). U některých korpusů lze vyhledávat i podle slovních druhů.
Český národní korpus (ČNK) je akademický projekt zaměřený na budování
rozsáhlého počítačového korpusu především psané češtiny. Pracuje na něm
Ústav Českého národního korpusu na Filozofické fakultě Univerzity Karlovy v
Praze (ÚČNK). Od svého založení roku 1994 má ÚČNK na starosti budování ČNK,
jeho rozvoj a rovněž činnosti související, zvláště v oblasti výuky a
pěstování oboru korpusová lingvistika.
 |
Korpusový průzkum variant - SyD |
|
| Od konce září 2011 je k dispozici program
SyD, který umožňuje srovnávání jazykových variant. SyD je dostupný pro
všechny zájemce zde. |
 |
Velký slovník rýmů |
|
| Na začátku července 2011 vyšel v Nakladatelství Lidové noviny Velký slovník rýmů. Více... |