Tým Českého národního korpusu hledá posily na místa „Vědecký pracovník v oboru korpusová lingvistika„, „Vývojář softwarových nástrojů / webových aplikací“ a „Informatik pro práci s texty v XML„.
Tým Českého národního korpusu hledá posily na místa „Vědecký pracovník v oboru korpusová lingvistika„, „Vývojář softwarových nástrojů / webových aplikací“ a „Informatik pro práci s texty v XML„.
Evropský projekt CLS INFRA vydal výzvu k podávání žádostí o stáže, jejichž cílem je pomoci výzkumníkům pracujícím v oblasti computational literary studies získat podporu a přístup k infrastruktuře v jedné ze zúčastněných institucí (včetně ČNK).
Zveřejnili jsme novou verzi aplikace Mapka pro práci s mluvenými a nářečními korpusy. Mezi nové prvky patří například přidané Historické členění nebo možnost uložit si vlastní mapovou vrstvu se zakreslenými body.
ČNK zveřejňuje hostovaný diachronní korpus italštiny, který sestavila Maria Silvia Micheli. Korpus CODIT pokrývá šesti hlavními typy textů celé období vývoje italštiny od 13. století do roku 1947.
Byla zveřejněna nová verze korpusu česky psané polooficiální internetové komunikace NET. Korpus je ve verzi 2 třikrát větší a zahrnuje internetové diskuse a blogy z více než 120 domén.
ČNK zveřejňuje Old Bailey Corpus se záznamy soudních procesů konaných v Londýně v letech 1720–1913. OBC se tak vedle EEBO stává dalším diachronním korpusem angličtiny přístupným přes KonText, pro oba je k dispozici podrobný kurz.
Ke konci roku 2020 byly zveřejněny nové verze mluvených korpusů ORTOFON a ORATOR. Celkový objem jazykového materiálu zahrnutého do korpusů ORTOFON v2 a ORATOR v2 se oproti jejich původním verzím přibližně zdvojnásobil.
S hrdostí oznamujeme zveřejnění monitorovacích korpusů ONLINE mapujících český web, tj. internetovou žurnalistiku, diskuse a sociální sítě, a to od roku 2017 do současnosti. Korpusy vznikají ve spolupráci se společností Dataweps, mají více než 6 mld. tokenů a jsou pravidelně každý den aktualizovány!