Na konci ledna byla zveřejněna verze 14 paralelního korpusu InterCorp. Přehled všech změn a vylepšení oproti předchozí verzi najdete v historií verzí na wiki ČNK.
Na konci ledna byla zveřejněna verze 14 paralelního korpusu InterCorp. Přehled všech změn a vylepšení oproti předchozí verzi najdete v historií verzí na wiki ČNK.
Korpus DIALEKT se v nově zveřejněné verzi 2 rozrostl na 223 tisíc slov. Aktualizaci korpusu doplňuje nová verze aplikace Mapka, která byla rozšířena o nové funkce, např. o možnost uložit si vlastní mapové vrstvy s body zakreslenými uživatelem.
Zveřejnili jsme korpus InterCorp verze 13ud, který obsahuje stejné texty jako verze 13, ale v alternativní anotaci podle standardu Universal Dependencies. Tato anotace je na rozdíl od původní verze ve všech jazycích srovnatelná a zahrnuje také syntax.
Zveřejnili jsme další aktualizaci korpusu současné psané češtiny SYN, jehož verze 9 nyní po zahrnutí publicistiky z roku 2019 přesahuje velikost 4,7 miliardy slov. SYN verze 10 s daty z roku 2020 bude k dispozici na začátku příštího roku.
Šestý ročník konference Translation in Transition se uskuteční v září 2022 v Praze. Abstrakty příspěvků přijímáme do 14. 2. 2022. Podrobnější informace najdete ve druhém callu na konferenčním webu.
Tým Českého národního korpusu hledá posily na místa „Vědecký pracovník v oboru korpusová lingvistika„, „Vývojář softwarových nástrojů / webových aplikací“ a „Informatik pro práci s texty v XML„.
Evropský projekt CLS INFRA vydal výzvu k podávání žádostí o stáže, jejichž cílem je pomoci výzkumníkům pracujícím v oblasti computational literary studies získat podporu a přístup k infrastruktuře v jedné ze zúčastněných institucí (včetně ČNK).
Zveřejnili jsme novou verzi aplikace Mapka pro práci s mluvenými a nářečními korpusy. Mezi nové prvky patří například přidané Historické členění nebo možnost uložit si vlastní mapovou vrstvu se zakreslenými body.
ČNK zveřejňuje hostovaný diachronní korpus italštiny, který sestavila Maria Silvia Micheli. Korpus CODIT pokrývá šesti hlavními typy textů celé období vývoje italštiny od 13. století do roku 1947.