Ke konci roku 2020 byly zveřejněny nové verze mluvených korpusů ORTOFON a ORATOR. Celkový objem jazykového materiálu zahrnutého do korpusů ORTOFON v2 a ORATOR v2 se oproti jejich původním verzím přibližně zdvojnásobil.
S hrdostí oznamujeme zveřejnění monitorovacích korpusů ONLINE mapujících český web, tj. internetovou žurnalistiku, diskuse a sociální sítě, a to od roku 2017 do současnosti. Korpusy vznikají ve spolupráci se společností Dataweps, mají více než 6 mld. tokenů a jsou pravidelně každý den aktualizovány!
V aplikaci Slovo v kostce přibyl zcela nový srovnávací mód, který umožňuje srovnávání slovních profilů dvou a více zadaných slov podobně, jako to dělá SyD.
Nástroj Treq na vyhledávání překladových ekvivalentů se dočkal aktualizace podkladových dat, která nyní odpovídají verzi 12 paralelního korpusu InterCorp. Dále byly doplněny slovníky, takže nyní je možné vyhledávat nejenom v překladech z/do češtiny a angličtiny, ale také z/do španělštiny.
Mapka je interaktivní mapová aplikace určená pro práci s korpusy mluvené češtiny, zejména s korpusem nářečním. Spojuje v sobě několik různých funkcí, jednou z nich je prezentace charakteristických rysů nářečních oblastí ČR v podobě ukázek autentických projevů mluvčích.
Nová kolektivní monografie Registry v češtině v řadě Studie z korpusové lingvistiky shrnuje výsledky projektu Jazyková variabilita v CNC, jehož cílem bylo vytvořit empirický model variability textů v češtině. Kniha podrobně zachycuje celý projekt, zejména pak proces ustavení textových registrů.
Tým badatelů z Českého národního korpusu se zúčastní tříletého prestižního mezinárodního projektu, který je financován britskou institucí Arts and Humanities Research Council. Cílem projektu vedeného profesorem Neilem Bermelem z univerzity v Sheffieldu je zmapovat a uživatelům jazyka srozumitelně předložit dva protikladné jazykové jevy. Prvním z nich je chybějící slovní tvar, v češtině např. infinitiv ke […]
CNC zveřejnil webovou aplikaci Lists určenou k prohlížení a srovnávání frekvenčních seznamů. Aplikace nabízí interaktivní filtrování založené na 4 frekvenčních údajích ke každé jednotce (slovní tvar nebo lemma) ve zvoleném (sub)korpusu.
Srdečně zveme všechny zájemce na další z tradičních bezplatných korpusových workshopů, který se bude tentokrát konat v sobotu 2. 11. 2019 na FF UK. Registrační formulář a podrobný program naleznete zde.