Srdečně zveme všechny zájemce na další z tradičních bezplatných korpusových workshopů, který se bude tentokrát konat v sobotu 2. 11. 2019 na FF UK. Registrační formulář a podrobný program naleznete zde.
Srdečně zveme všechny zájemce na další z tradičních bezplatných korpusových workshopů, který se bude tentokrát konat v sobotu 2. 11. 2019 na FF UK. Registrační formulář a podrobný program naleznete zde.
Calc je zbrusu nová korpusová kalkulačka, která doplňuje sadu webových aplikací ČNK. Je rozdělena do několika uživatelsky přístupných modulů vhodných pro počítání typických statistických úloh běžných v korpusovém výzkumu.
K výročí 25 let od založení Ústavu Českého národního korpusu byla spuštěna nová aplikace Slovo v kostce, která slouží k vytvoření rychlého a přehledného profilu zadaného slova a vychází přitom výhradně z korpusových dat.
12. června 2019 vystoupil v pořadu Interview DVTV náš kolega Václav Cvrček. Na rozhovor se můžete podívat zde. Další mediální výstupy pracovníků ÚČNK naleznete v sekci Ústav > ČNK v médiích.
S radostí oznamujeme, že se projekt Český národní korpus stal oficiálně uznaným K-centrem CLARIN v oblasti korpusové lingvistiky se zaměřením na empirický výzkum češtiny.
V nakladatelství Springer právě vyšla nová kniha Taming the Corpus: From Inflection and Lexis to Interpretation zabývající se empirickým výzkumem, která je založena na českých datech.
V listopadu 2018 byly v ČNK zpřístupněny dva nové korpusy: specializovaný korpus Koditex vytvořený pro účely multidimenzionální analýzy češtiny a nkjp_1m, ručně označkovaný milionový vzorek Národního korpusu polského jazyka.
Byla zveřejněna další verze rozhraní KonText s novými funkcemi; zejména jde o zobrazování překladových ekvivalentů z Trequ přímo v KonTextu (pro paralelní korpusy) a zvýraznění syntaxe při psaní dotazů v CQL.
Konference SlaviCorp 2018 proběhla úspěšně. Pro případné zájemce jsou k dispozici prezentace jednotlivých přednášejících na webu konference.
Dne 18. 12. 2017 byla zveřejněna verze 6 korpusu SYN, jehož velikost po zahrnutí dosud nezveřejněné publicistiky přesáhla 4 mld. slov.