Od července 2017 jsou aktivity ČNK podporovány také projektem OP VVV zaměřeným na technologickou modernizaci infrastruktury a výzkum jazykové variability češtiny.
Od července 2017 jsou aktivity ČNK podporovány také projektem OP VVV zaměřeným na technologickou modernizaci infrastruktury a výzkum jazykové variability češtiny.
Začátkem června 2017 byla zveřejněna trojice nových mluvených korpusů: ORTOFON a nářeční DIALEKT, oba s dvouúrovňovou transkripcí, a dále sjednocení korpusů řady ORAL. Všechny korpusy jsou lemmatizovány a morfologicky označkovány.
Nástroj Treq na vyhledání překladových ekvivalentů na základě paralelního korpusu InterCorp se dočkal nové verze, v níž lze vyhledávat i víceslovné jednotky nebo pomocí regulárních výrazů, a to nejen v překladech z/do češtiny, ale nově i z/do angličtiny.
V lednu 2017 byl zveřejněn korpus LINDSEI_CZ, žákovský korpus spontánní mluvené angličtiny pokročilých mluvčích s češtinou jako L1. Korpus byl sestaven Tomášem Gráfem jako součást projektu LINDSEI.