Nástroj Treq na vyhledávání překladových ekvivalentů se dočkal aktualizace podkladových dat, která nyní odpovídají verzi 15 paralelního korpusu InterCorp.
Nástroj Treq na vyhledávání překladových ekvivalentů se dočkal aktualizace podkladových dat, která nyní odpovídají verzi 15 paralelního korpusu InterCorp.
Byl zveřejněn rozvrh korpusových seminářů magisterského studia pro letní semestr 2022/2023. Rozvrh je k dispozici v menu Studium > Magisterská výuka.
Ve spolupráci s ÚČL AV ČR jsme vytvořili nový korpus současné české poezie (KSP). Obsahuje básnické texty publikované v letech 1990–2020 knižně i na literárních serverech. Rozsahem (35 mil. slov) se řadí k největším korpusům svého druhu na světě.
S radostí oznamujeme, že náš milý kolega Václav Cvrček byl jmenován profesorem pro obor Český jazyk. Gratulujeme!
Zveřejnili jsme další aktualizaci korpusu současné psané češtiny SYN, jehož verze 10 nyní po zahrnutí publicistiky z roku 2020 dosahuje téměř 4,9 miliardy slov.
Na konci ledna byla zveřejněna verze 14 paralelního korpusu InterCorp. Přehled všech změn a vylepšení oproti předchozí verzi najdete v historií verzí na wiki ČNK.
Korpus DIALEKT se v nově zveřejněné verzi 2 rozrostl na 223 tisíc slov. Aktualizaci korpusu doplňuje nová verze aplikace Mapka, která byla rozšířena o nové funkce, např. o možnost uložit si vlastní mapové vrstvy s body zakreslenými uživatelem.
Zveřejnili jsme korpus InterCorp verze 13ud, který obsahuje stejné texty jako verze 13, ale v alternativní anotaci podle standardu Universal Dependencies. Tato anotace je na rozdíl od původní verze ve všech jazycích srovnatelná a zahrnuje také syntax.