Byla zveřejněna další verze rozhraní KonText s novými funkcemi; zejména jde o klíčová slova a o zobrazování překladových ekvivalentů v paralelních korpusech po kliknutí na vybrané slovo přímo v konkoranci.
Byla zveřejněna další verze rozhraní KonText s novými funkcemi; zejména jde o klíčová slova a o zobrazování překladových ekvivalentů v paralelních korpusech po kliknutí na vybrané slovo přímo v konkoranci.
V následujících dvou týdnech jste všichni srdečně vítáni na popularizačních přednáškách a jazykových rychlokurzech, které proběhnou v rámci Měsíce pro fakultu. Už v neděli 21. 1. při Pootevření fakulty proběhne v místnosti 18 na hlavní budově série krátkých přednášek určená pro studující, akademickou i neakademickou obec FF UK. Následovat bude pondělní Den jazykových rychlokurzů, během […]
Také letos koncem roku zveřejňujeme další aktualizaci korpusu současné psané češtiny SYN, jehož verze 12 nyní po zahrnutí publicistiky z roku 2022 dosahuje velikosti 5,17 mld. slov.
ČNK zveřejňuje diachronní korpus OnomOs sestavený badateli Katedry českého jazyka FF OU. Korpus obsahuje texty z vybraných čísel (Rudého) Práva od 20. let 20. stol. do současnosti a zahrnuje také anotaci jmenných entit.
Gratulujeme kolegům k zisku standardních projektů GAČR: Jiří Milička uspěl s grantem Velké jazykové modely prizmatem korpusové lingvistiky a tým Hany Skoumalové bude řešit projekt Česká frazeologie a proměny jejího užívání v dobových a žánrových kontextech.
Vydali jsme novou verzi aplikace KWords. Mezi hlavní novinky patří to, že s její pomocí můžete analyzovat texty ve více než 30 jazycích a při identifikaci prominentních jednotek lze využívat lemmatizaci a tagování (tzv. keymorph analýza). Nově lze k aplikaci přistupovat také pomocí API.
Od září můžeme díky podpoře TA ČR pracovat na projektu HiČKoK – Historie češtiny v korpusovém kontinuu. Ve spolupráci s ÚJČ AV ČR, NK ČR a ÚFAL MFF UK hodláme vytvořit jednotně značkovaný korpus, který bude zahrnovat texty pokrývající 8 staletí vývoje češtiny.
Byla zveřejněna verze 16 paralelního korpusu InterCorp. Díky aktualizaci balíčku OpenSubtitles se korpus zvětšil téměř trojnásobně a přibylo 20 dalších jazyků. Přehled všech změn a vylepšení oproti předchozí verzi najdete v historii verzí.
Zveřejnili jsme verzi 2.0 aplikace Mapka pro práci s mluvenými a nářečními korpusy. Má vylepšený vzhled, intuitivnější ovládání a doplněný obsah: množství ukázek z mluvených korpusů a popisy nářečních rysů všech oblastí, podskupin, úseků a typů.