Ve spolupráci s ÚČL AV ČR jsme vytvořili nový korpus současné české poezie (KSP). Obsahuje básnické texty publikované v letech 1990–2020 knižně i na literárních serverech. Rozsahem (35 mil. slov) se řadí k největším korpusům svého druhu na světě.
S radostí oznamujeme, že náš milý kolega Václav Cvrček byl jmenován profesorem pro obor Český jazyk. Gratulujeme!
Zveřejnili jsme další aktualizaci korpusu současné psané češtiny SYN, jehož verze 10 nyní po zahrnutí publicistiky z roku 2020 dosahuje téměř 4,9 miliardy slov.
Na konci ledna byla zveřejněna verze 14 paralelního korpusu InterCorp. Přehled všech změn a vylepšení oproti předchozí verzi najdete v historií verzí na wiki ČNK.
Korpus DIALEKT se v nově zveřejněné verzi 2 rozrostl na 223 tisíc slov. Aktualizaci korpusu doplňuje nová verze aplikace Mapka, která byla rozšířena o nové funkce, např. o možnost uložit si vlastní mapové vrstvy s body zakreslenými uživatelem.
Zveřejnili jsme korpus InterCorp verze 13ud, který obsahuje stejné texty jako verze 13, ale v alternativní anotaci podle standardu Universal Dependencies. Tato anotace je na rozdíl od původní verze ve všech jazycích srovnatelná a zahrnuje také syntax.
Zveřejnili jsme další aktualizaci korpusu současné psané češtiny SYN, jehož verze 9 nyní po zahrnutí publicistiky z roku 2019 přesahuje velikost 4,7 miliardy slov. SYN verze 10 s daty z roku 2020 bude k dispozici na začátku příštího roku.
Šestý ročník konference Translation in Transition se uskuteční v září 2022 v Praze. Abstrakty příspěvků přijímáme do 14. 2. 2022. Podrobnější informace najdete ve druhém callu na konferenčním webu.