Zveřejnili jsme další aktualizaci korpusu současné psané češtiny SYN, jehož verze 10 nyní po zahrnutí publicistiky z roku 2020 dosahuje téměř 4,9 miliardy slov.
Zveřejnili jsme další aktualizaci korpusu současné psané češtiny SYN, jehož verze 10 nyní po zahrnutí publicistiky z roku 2020 dosahuje téměř 4,9 miliardy slov.
Na konci ledna byla zveřejněna verze 14 paralelního korpusu InterCorp. Přehled všech změn a vylepšení oproti předchozí verzi najdete v historií verzí na wiki ČNK.
Korpus DIALEKT se v nově zveřejněné verzi 2 rozrostl na 223 tisíc slov. Aktualizaci korpusu doplňuje nová verze aplikace Mapka, která byla rozšířena o nové funkce, např. o možnost uložit si vlastní mapové vrstvy s body zakreslenými uživatelem.
Zveřejnili jsme korpus InterCorp verze 13ud, který obsahuje stejné texty jako verze 13, ale v alternativní anotaci podle standardu Universal Dependencies. Tato anotace je na rozdíl od původní verze ve všech jazycích srovnatelná a zahrnuje také syntax.
Zveřejnili jsme další aktualizaci korpusu současné psané češtiny SYN, jehož verze 9 nyní po zahrnutí publicistiky z roku 2019 přesahuje velikost 4,7 miliardy slov. SYN verze 10 s daty z roku 2020 bude k dispozici na začátku příštího roku.
Šestý ročník konference Translation in Transition se uskuteční v září 2022 v Praze. Abstrakty příspěvků přijímáme do 14. 2. 2022. Podrobnější informace najdete ve druhém callu na konferenčním webu.
Tým Českého národního korpusu hledá posily na místa „Vědecký pracovník v oboru korpusová lingvistika„, „Vývojář softwarových nástrojů / webových aplikací“ a „Informatik pro práci s texty v XML„.
Evropský projekt CLS INFRA vydal výzvu k podávání žádostí o stáže, jejichž cílem je pomoci výzkumníkům pracujícím v oblasti computational literary studies získat podporu a přístup k infrastruktuře v jedné ze zúčastněných institucí (včetně ČNK).
Zveřejnili jsme novou verzi aplikace Mapka pro práci s mluvenými a nářečními korpusy. Mezi nové prvky patří například přidané Historické členění nebo možnost uložit si vlastní mapovou vrstvu se zakreslenými body.