Naše publikace

Radost z jazyků – Sborník příspěvků k 75. narozeninám prof. Františka Čermáka (2014)
Periferie jazyka – Slovník monokolokabilních slov (2014)
Formalized contrastive lexical description: a framework for bilingual dictionaries (2014)
Proverbs: Their Lexical and Semantic Features (2014)
Základní slovník českých přísloví (2013)
Odraz jazykových změn v synchronních korpusech (2013)
Kvantitativní analýza kontextu (2013)
Malý slovník reálií komunistické totality (2013)
Morfématika a slovotvorba češtiny (2012)
Deklinační systém femininních oikonym v češtině (2011)
Korpusová lingvistika Praha 2011 – 1 InterCorp (2011)
Korpusová lingvistika Praha 2011 – 2 Výzkum a výstavba korpusů (2011)
Korpusová lingvistika Praha 2011 – 3 Gramatika a značkování korpusů (2011)
Velký slovník rýmů (2011)
A Frequency Dictionary of Czech: Core Vocabulary for Learners (2011)
Slovník komunistické totality (2010)
InterCorp: Exploring a Multilingual Corpus (2010)
Mnohojazyčný korpus InterCorp: Možnosti studia (2010)
Perfektum v současné češtině (2010)
Lexikon a sémantika (2010)
Čeština, jak ji neznáte (2010)
Dnešní skloňování substantiv typů kámen, břímě (2010)
Mluvnice současné češtiny (2010)
Statistiky češtiny (2009)
Slovník Bohumila Hrabala (2009)
Valence českých substantiv (2009)
Regulace jazyka a Koncept minimální intervence (2008)
Čestina v mluveném korpusu (2008)
Morfologie mluvené češtiny: Frekvenční analýza (2008)
Slovník Karla Čapka (2007)
Frekvenční slovník mluvené češtiny (2007)
Vidová morfologie českého slovesa (2007)
Korpusová lingvistika: Stav a modelové přístupy (2006)
Kolokace (2006)
Víceslovné předložky v současné češtině (2006)
Valence českých adjektiv (2006)
Jak využívat Český národní korpus (2005)
Jazyky a jazykověda. Sborník k 65. narozeninám prof. Františka Čermáka (2005)
Frekvenční slovník češtiny (2004)

... publikace z let 1999-2001



Radost z jazyků – Sborník příspěvků k 75. narozeninám prof. Františka Čermáka

Vladimír Petkevič, Ana Adamovičová, Václav Cvrček (eds)

Jubilejní dvacátý svazek řady Studie z korpusové lingvistiky jsme věnovali jejímu zakladateli prof. Františku Čermákovi, který se v roce 2015 dožívá významného životního jubilea. Prof. PhDr. František Čermák, DrSc. (narozen v Praze 30. ledna 1940) je doma i ve světě uznávanou vědeckou kapacitou. Je autorem či spoluautorem 11 monografií, 17 slovníků (překladových, výkladových, frekvenčních), autorem bezpočtu odborných recenzí, editorem a překladatelem. Jeho jméno je spojováno s koncepcí a zpracováním rozsáhlého a mezinárodně uznávaného Slovníku české frazeologie a idiomatiky. Hlavním životním vědeckým počinem je však založení a dvacetileté ideové vedení Ústavu Českého národního korpusu FF UK, čímž položil zcela nový základ české empirické lingvistice v ČR. Předkládaný sborník je tematicky velmi pestrý, obsahuje příspěvky zabývající se lexikologií, frazeologií, korpusovou lingvistikou, ale také jazykovou kulturou či morfologií, čímž reflektuje košatost vědecké osobnosti prof. Čermáka a jeho široký rozhled po jazycích a jazykovědě.

Errata: Uveřejňujeme správnou verzi článku Ilony Kořánové Máte problém se soustředit? (str. 231). Ve sborníku byla omylem publikována starší verze textu, za což se autorce omlouváme.

Petkevič, V., Adamovičová, A., Cvrček, V. (eds): Radost z jazyků – Sborník příspěvků k 75. narozeninám prof. Františka Čermáka. Nakladatelství Lidové noviny. Praha 2014.
ISBN: 978-80-7422-361-7

Radost z jazyků


Periferie jazyka – Slovník monokolokabilních slov

František Čermák

Originální a dosud nikde neexistující systematický vhled do jazyka, který nabízí věrný a hloubkový pohled na povahu a chování takového typu slov jako najevo, vstříc, úkor, dokořán, kterým se nikdy pozornost nevěnovala.

Vstupními zdroji pro tento slovník byl stomilionový korpus češtiny (SYN), frazeologický slovník a další zdroje; tato data byla zpracována několika programy a následnou manuální analýzou vedoucí ke konečnému tvaru. Takto se k uživateli dostává celkem 3623 monokolokabilních slov (slovních tvarů), vybavených především frekvencemi a to ve dvou podobách.

Čermák, F.: Periferie jazyka – Slovník monokolokabilních slov. Nakladatelství Lidové noviny. Praha 2014.
ISBN: 978-80-7422-349-5

Periferie jazyka


Formalized contrastive lexical description: a framework for bilingual dictionaries

Pavel Vondřička

The goal of the study is a design of a framework for formalized representation of lexical knowledge, as presented in bilingual dictionaries. Little research has been done on the possibilities of representation and storage of the knowledge acquired in the process of lexicographical analysis and used in the synthesis of dictionary entries. Separation of content from a particular form would allow for re-use of the data for several purposes (including NLP) and for flexible customization of dictionaries for different users.

In the first part, general abstract principles of representation of lexical knowledge are sought. The structure of different dictionary entries is analyzed. Modern technical approaches, which may contribute to an efficient representation of the knowledge, are summarized and a generic abstract model for its representation is defined in terms of objects and relations, together with a proposal for a modular implementation separating the language and dictionary specific components.

The second part demonstrates the use of the model for one particular task: a detailed description of a group of Norwegian nouns in contrast with their Czech equivalents. The nouns are analyzed and a possible representation of the knowledge is presented using the proposed generic model and task specific specifications.

Vondřička, P.:  Formalized contrastive lexical description: a framework for bilingual dictionaries. LINCOM Studies in Computational Linguistics, 2014.
ISBN 978-3-86288-428-5

Formalized contrastive lexical description: a framework for bilingual dictionaries


Proverbs: Their Lexical and Semantic Features

František Čermák

For centuries, the habit of collecting proverbs, has been domain of interest and subsequent study attracting ethnographers and historians, primarily, though later on a number of scholars from other disciplines have made the field now truly interdisciplinary. Only rather recently, also linguistics, notably lexicology and phraseology, has started to offer linguistic insights into proverbs, too. However, unlike other disciplines, corpus linguistics approaches, used here enable more general insights using large amounts of data, also in paremiology. In general, lexical studies published here aim to point to what any proverb cannot do without, namely to words it is built on, its meaning and use.
This volume, devoted to a number of languages, their proverbs and lexicon is an attempt along these lines trying to bring together what has been published in many places. Twelve contributions offered here are based on modified and improved versions of what has come out elsewhere before Thus, the reader may inspect and compare them collected side by side here for the first time. Broadly, the book may be viewed as made up of items dealing with General Aspects (I, first three items), contributions to Lexicon and Pragmatics proper (II, the following five items), supplemented by studies on Specific topics (III, the last four contributions) where also paremiological minima are to be found.

Čermák, F: Proverbs: Their Lexical and Semantic Features. Proverbium in cooperation with the Institute of the Czech National Corpus, Supplement Series, Vol. 37, ed. W. Mieder. The University of Vermont, Burlington, Vermont 2014.
ISBN: 978-0-9846456-1-9

Proverbs: Their Lexical and Semantic Features


Základní slovník českých přísloví

František Čermák

Tento slovník přísloví obsahuje téměř pět set nejčastějších českých přísloví dneška. Uvádí jejich podobu, současný význam i způsob užití.

Běžná představa, že přísloví-tento prastarý útvar, který má každý jazyk-se v naší uspěchané době už neužívá či dokonce že nevznikají nová, neodpovídá realitě. Přísloví žijí i dnes, jakkoliv se jejich podoba i způsob užití pomalu mění a přibývají i nová. Součástí slovníku jsou také zaznamenané a většinou tedy autentické příklady použití přísloví, stejně jako výklad jejich významu i kontextu, ve kterém se s nimi setkáváme.

Čermák, F.: Základní slovník českých přísloví. Nakladatelství Lidové noviny. Praha 2013.
ISBN: 978-80-7422-258-0

Základní slovník českých přísloví

Odraz jazykových změn v synchronních korpusech

Michal Křen

Tento svazek představuje diachronní pohled na synchronní psané korpusy řady SYN, které zachycují blízké stavy jazyka. Cílem práce bylo především zjištění možností a mezí detekce vývojových tendencí v jazyce na materiálu korpusů této řady, mezi vedlejší výstupy patří také vyhodnocení jejich složení. Popisovaná metoda je aplikována v několika variantách na různě definované subkorpusy a podrobně vyhodnocena na úrovní lemmat a lexikálních kombinací. Protože je obtížné odlišit zárodky diachronních posunů od přirozeně existující synchronní variability, je statisticky zjištěná významnost frekvenčních rozdílů jednotlivých výrazů zpětně ověřována na korpusech a interpretace výsledků je korigována informacemi o jejich přesném složení.

Křen, M.: Odraz jazykových změn v synchronních korpusech. Nakladatelství Lidové noviny. Praha 2013.
ISBN: 978-80-7422-265-8
Odraz jazykových změn v synchronních korpusech


Kvantitativní analýza kontextu

Václav Cvrček

Kvantitativní analýza, popsaná v této knize, se zabývá tím, jaké jsou obecné charakteristiky kontextu, co můžeme považovat za anomální a co za běžné a jak je možné hodnoty v kontextu slov naměřené lingvisticky interpretovat.

O klíčové povaze kontextu při analýze jazykových jevů se v jazykovědě obecně nepochybuje. Bezesporný je jeho význam při analýze sémantiky slov.

Výsledky zde prezentované tak můžou posloužit jako východisko pro jakákoli jazyková bádání, která se snaží vedle pragmatického aspektu uchopovat i dosud podceňovaný rozměr syntagmatický.

Cvrček, V.: Kvantitativní analýza kontextu. Nakladatelství Lidové noviny. Praha 2013.
ISBN: 978-80-7422-264-1

Kvantitativní analýza kontextu


Malý slovník reálií komunistické totality

Věra Schmiedtová

Výběrový výkladový slovník, který se snaží zachytit dobový jazyk, s nímž přicházel v letech 1948-1989 do styku běžný člověk, který nepatřil ani mezi komunisty, ani mezi disidenty.

Tento jazyk už v současnosti postupně mizí. Heslář byl sestavený na základě speciálního Korpusu totality, který obsahuje tři sondy Rudého práva z různých časových období a 91 naskenovaných propagandistických příruček, a na základě excerpce. Obsahuje více než 1400 hesel. Slovník zachycuje na jedné straně jazyk komunistických vládců – jednotlivá slova oficiální propagandy, slovní kolokace a oblíbené syntaktické struktury. Dále jsou zde slova, která označovala politický a správní systém, ale i represivní zařízení a akce režimu. Na druhé straně je zde i jazyk ovládaných, kterým lidé reagovali na oficiální jazyk. Některá zařazená slova nemají politické pozadí, ale charakterizují dobovou realitu.

Schmiedtová, V.: Malý slovník reálií komunistické totality. Nakladatelství Lidové noviny. Praha 2013.
ISBN: 978-80-7422-192-7

Malý slovník reálií komunistické totality


Morfématika a slovotvorba češtiny

František Čermák

Systematický a úplný popis frekvenčního jádra češtiny po stránce všech jeho prostředků a způsobů, a to v rámci dosud opomíjené širší disciplíny, tvorby pojmenování. Popisují se tu především formální aspekty autosémantických slovních druhů (substantiv, adjektiv, verb i adverbií), významná pozornost se však věnuje i ostatním slovním druhům a poukazuje se na vzájemnou provázanost v rámci vlastní slovotvorby jednak bází a rezultátů, a jednak slovotvorby a kolokací (víceslovných pojmenování). Kniha přináší akcent, tradičně jinde neuplatňovaný, na systémovost popisu zvláště po stránce paradigmatické vedoucí k přehodnocování řady slovotvorných prostředků. Ten je vyvažován pozorností věnovanou aspektům syntagmatickým, např. souvislostem s valencí slova. Do knihy je zařazen vedle hlavní slovotvorné části i málo známý a systematický přehled české morfématiky, kde se najdou poprvé i partie o obtížné české alomorfii.

Čermák, F.: Morfématika a slovotvorba češtiny. Nakladatelství Lidové noviny. Praha 2012.
ISBN 978-80-7422-146-0

Morfématika a slovotvorba češtiny

Deklinační systém femininních oikonym v češtině

Jana Marie Tušková

Práce J. M. Tuškové, kterou přináší tento svazek Studií z korpusové lingvistiky, je vítaným vhledem do málo a nepřesně poznané oblasti vlastních jmen ženského rodu a jejich skloňování v ČNK, a tedy na taková jména jako Kouřim, Čáslav, Třeboň, Náměšť, Hluboká, Nusle, Stodůlky, Kateřinky, Rokycany či Pardubice. Kvůli množství dat se tu popisují jen necelé dvě tisícovky těch nejfrekventovanějších. Proti dosavadním pracím a slovníkům, založeným na manuálním a ne nutně vždy systematickém sběru, autorka zvolenou oblast popisuje nejen vyčerpávajícím způsobem, ale dává i představu o jejím jádru i případech periferních.

Tušková, J. M.: Deklinační systém femininních oikonym v češtině. Nakladatelství Lidové noviny. Praha 2011.
ISBN  978-80-7422-138-5

Deklinační systém femininních oikonym v češtině

Korpusová lingvistika Praha 2011 – 1 InterCorp

František Čermák, ed.

Příspěvky přednesené na konferenci Korpusová lingvistika Praha 2011 pořádané Ústavem Českého národního korpusu Filozofické fakulty Univerzity Karlovy. Tento svazek se prostřednictvím korpusu InterCorp věnuje srovnávání jazyků na základě paralelních korpusů, a navazuje tak na svazek z konference InterCorp z roku 2010. Z více než 20 v korpusu zastoupených jazyků se zde ve velmi širokém záběru představují příspěvky týkající se 15 z nich. Kontrastivní pohled zvláště z oblastí slovotvorby, lexikonu i gramatiky, založený na autentických datech InterCorpu, tak nabízí významný stimul k dalšímu srovnávacímu výzkumu mnoha jazyků. Ten byl donedávna opomíjen, přestože studium druhého jazyka se stále nejčastěji děje na základě srovnání s jiným jazykem, převážně mateřským, jehož vlastní obraz se zároveň prizmatem druhých jazyků může objektivizovat a zpřesňovat.

Čermák, F. (ed.): Korpusová lingvistika Praha 2011 – 1 InterCorp. Nakladatelství Lidové noviny. Praha 2011.
ISBN 978-80-7422-114-9

1 InterCorp

Korpusová lingvistika Praha 2011 – 2 Výzkum a výstavba korpusů

František Čermák, ed.

Příspěvky přednesené na konferenci Korpusová lingvistika Praha 2011 pořádané Ústavem Českého národního korpusu Filozofické fakulty Univerzity Karlovy. Tento svazek se v prvním tematickém celku věnuje aspektům výstavby korpusů různého druhu, českým i zahraničním, jazykově obecným i specifickým (např. z fonetického, akustického či stylistického hlediska). Vedle převažujícího synchronního pohledu se tu však objevuje i příspěvek věnovaný problematice výstavby diachronního korpusu češtiny. Pozornost je věnována i korpusu romštiny, v rámci obecných příspěvků se tu podává také přehled aktuálního stavu a problematiky výstavby multilingválního korpusu InterCorp.
Výsledky vlastního výzkumu převážně synchronních dat představuje druhý tematický celek nabízející korpusově podepřený pohled na aspekty fonologické, morfologické a okrajově i syntaktické. Vedle příspěvků orientovaných na lexikální pragmatiku, možné výukové aplikace, regionální specifiku mluvených korpusů a aspekty oikonym je tento pohled doplňován i příspěvkem věnovaným novému nástroji pro korpusově založený synchronní i diachronní výzkum jazykové variability. Do tohoto svazku jsou také zařazeny tři plenární přednášky.

Čermák, F. (ed.): Korpusová lingvistika Praha 2011 – 2 Výzkum a výstavba korpusů. Nakladatelství Lidové noviny. Praha 2011.
ISBN 978-80-7422-115-6

2 Výzkum a výstavba korpusů

Korpusová lingvistika Praha 2011 – 3 Gramatika a značkování korpusů

Vladimír Petkevič, Alexandr Rosen, eds

Příspěvky přednesené na konferenci Korpusová lingvistika Praha 2011 pořádané Ústavem Českého národního korpusu Filozofické fakulty Univerzity Karlovy. Tento svazek se věnuje dvěma tematickým oblastem. První z nich je věnovaná výzkumu gramatiky v převážně synchronních korpusech, obsahově navazuje na příspěvky ve druhém svazku, především na oddíl Aspekty výzkumu korpusů, a přináší kvalifikované vhledy do oblasti slovotvorby, morfologie, ale i do různých oblastí syntaxe. Na ně navazují i aplikovaně orientované příspěvky s orientací na valenci a další. Druhá oblast je orientovaná spíše technicky a věnuje se různým aspektům syntaktického značkování korpusů. Tematicky ji doplňují příspěvky zabývající se identifikací frazémů a termínů a specifickým žákovským korpusem.

Petkevič, V., Rosen, A. (eds): Korpusová lingvistika Praha 2011 – 3 Gramatika a značkování korpusů. Nakladatelství Lidové noviny. Praha 2011.
ISBN 978-80-7422-116-3

1 InterCorp

Velký slovník rýmů

Václav Cvrček, Ludmila Cvrčková Porkertová

Příručka rýmů usnadní psaní jakýchkoli rýmovaných textů, což je úkol, před kterým stojí nejen začínající básníci, ale také autoři písňových textů, reklamních sloganů a mnozí další. Slovník zároveň může sloužit jako doplňková pomůcka při výuce literární teorie na základních a středních školách. Svým rozsahem i způsobem zpracování se jedná o unikátní projekt, který na současném knižním trhu nemá obdoby (posledním takovým pokusem byl Puchmajerův Rýmovník z roku 1824).

Cvrček, V., Cvrčková Porkertová, L.: Velký slovník rýmů. Nakladatelství Lidové noviny, Praha 2011.
ISBN 978-80-7422-095-1

Velký slovník rýmů

A Frequency Dictionary of Czech: Core Vocabulary for Learners

František Čermák, Michal Křen (eds)

Following the lines established by the Routledge Frequency Dictionaries series, the dictionary is aimed at learners and all other students of Czech. It is the first Czech frequency dictionary based on a balanced selection of both written and authentic spoken Czech (corpora SYN2005, ORAL2006, ORAL2008). It provides the 5,000 most frequently used words in the language listed in a detailed frequency-based index, as well as in alphabetical and part-of-speech indexes. All entries in the rank frequency list feature the English equivalent, a sample sentence with English translation and an indication of register variation.

Čermák, F.,  Křen, M. (eds): A Frequency Dictionary of Czech: Core Vocabulary for Learners. Routledge, London 2011.
ISBN 978-0-415-57661-1 (hardback)
ISBN 978-0-415-57662-8 (paperback)
ISBN 978-0-415-57663-5 (data CD)

A Frequency Dictionary of Czech

Slovník komunistické totality

František Čermák, Václav Cvrček, Věra Schmiedtová (eds)

Slovník komunistické totality je prvním pokusem o zmapování jazyka oficiální komunistické propagandy. Slovník vychází z korpusu Totalita, který je založen na třech sondách (roky 1952, 1969 a 1977) do dobového tisku a publikací významně zasažených ideologií. Z různých pohledů se tu zkoumá především lexikon a frazeologie oficiální propagandy, úvodní studie nabízí přehled specifických rysů z oblasti pragmatiky a sémantiky. Slovník je doplněn ukázkami dobových textů a frekvenčním seznamem nejčastějších slov. K publikaci je připojeno CD s úplným korpusem Totalita, který je možné pomocí speciálního obslužného programu prohledávat, a pokračovat tak v započatém výzkumu totalitního jazyka ve specifických, dosud nezkoumaných oblastech.

Čermák, F.,  Cvrček, V., Schmiedtová, V. (eds): Slovník komunistické totality. Nakladatelství Lidové noviny, Praha 2010.
ISBN 978-80-7422-060-9

Slovník komunistické totality - obálka

InterCorp: Exploring a Multilingual Corpus

František Čermák, Patrick Corness, Aleš Klégr (eds)

Exploration of grammar, lexis, translations, applications, and methodological issues are studied and illustrated on language pairs or on a group of more languages. This is supplemented by broad and general contributions delineating the field of comparative multilingual corpus linguistics showing possible directions of comparative research based on a multilingual parallel corpus.

Čermák, F., Klégr, A., Corness, P. (eds): InterCorp: Exploring a Multilingual Corpus. Nakladatelství Lidové noviny. Praha 2010.
ISBN 978-80-7422-042-5

InterCorp EN

Mnohojazyčný korpus InterCorp: Možnosti studia

František Čermák, Jan Kocek (eds)

Tento svazek je prvním výstupem z mnohojazyčného paralelního korpusu přinášejícím studie a  srovnávací analýzy celkem 13 jazyků (vůči češtině) v oblasti lexikonu, gramatiky, slovotvorby, frazeologie, syntaxe a dalších.

Čermák, F., Kocek, J. (eds): Mnohojazyčný korpus InterCorp: Možnosti studia. Nakladatelství Lidové noviny. Praha 2010.
ISBN 978-80-7422-058-6

InterCorp CZ - obálka

Perfektum v současné češtině

Mira Načeva-Marvanová

Perfektum v současné češtině nabízí svým čtenářům možnost podívat se spolu s autorkou do 500-milionové synchronní textové databáze Českého národního korpusu a na základě více než 20 000 dokladů, získaných z této databáze, poznat jedinečnost a překvapující rozmanitost složených forem českého perfekta, které přitom dokládají integraci češtiny do Evropského lingvistického areálu (ELA), respektive i do evropského areálu slovesa mít (tzv. „H-areálu“). Souběžný strukturní popis perfektních forem a konstrukcí je zároveň podroben testováním a analýze, zjišťujícím stav a proces jejich gramatikalizace, která je založena především na auxiliaci slovesa mít, které vystupuje jako iniciátor gramatikalizačního procesu bázových konstrukcí [mít + n-/t-participium], srov. např. máme napsáno, mám natrenováno, máme zaseto, mám to připraveno aj. Práce je opatřena množstvím příkladů, tabulek a frekvenční analýzou jednotlivých typů této konstrukce a jejích struktur.

Načeva-Marvanová M.: Perfektum v současné češtině. Nakladatelství Lidové noviny. Praha 2010.
ISBN 978-80-7422-041-8

Perfektum v současné češtině - obálka



Lexikon a sémantika

František Čermák

Kniha podává přehled celého lexikálního systému doplněného o řadu zcela nových a dosud nemapovaných oblastí jako je tradiční úsek jazykového pojmenování, sémiotické aspekty slova či přehled jeho grafické stránky, začleněny jsou však i přehledy slovotvorby, frazeologie a další. Nově je tu pozornost věnována dosud zcela opomíjeným aspektům syntagmatickým a kombinatorickým.

S omluvou uveřejňujeme seznam chyb nalezených po vydání publikace.

Čermák, F.:  Lexikon a sémantika. Nakladatelství Lidové noviny. Praha 2010.
ISBN 978-80-7422-020-3

Lexikon a sémantika - obálka

Čeština, jak ji neznáte

Věra Schmiedtová

Autorka na základě pilného sledování současného jazyka prostřednictvím korpusů - databází mluveného, psaného i literárního jazyka zachycených a umožněných počítačovými médii, jejichž objev je prý srovnatelný s vynálezem mikroskopu pro přírodní vědy - začala podávat na přelomu století "zprávy" o stavu současného jazyka a novinkách v něm posluchačům stanice ČRo 7 - Radio Praha.

Schmiedtová, V.:  Čeština, jak ji neznáte. Nakladatelství Lidové noviny. Praha 2010.
ISBN 978-80-7106-990-4

čeština - obálka


Dnešní skloňování substantiv typů kámen, břímě

Josef Šimandl

Desátý svazek řady Studie z korpusové lingvistiky mapuje skloňování skupiny substantiv, která po historicky dlouhou dobu kolísají ve 3 pádech singuláru mezi měkkým a tvrdým skloňováním. Práce přináší i sondy do elektronicky přístupného diachronního materiálu. Při popisu jsou konfrontována data podle různých korpusů i podle jiných zdrojů, především podle internetu.

Šimandl, J.: Dnešní skloňování substantiv typů kámen, břímě. Nakladatelství Lidové noviny. Praha 2010.
ISBN 978-80-7422-008-1

Obálka


Mluvnice současné češtiny

Václav Cvrček, Vilém Kodýtek, Marie Kopřivová, Dominika Kováříková, Petr Sgall, Michal Šulc, Jan Táborský, Jan Volín, Martina Waclawičová

Mluvnice současné češtiny autorů působících na Filozofické fakultě a Matematicko-fyzikální fakultě Univerzity Karlovy je po téměř patnácti letech novým pokusem o stručný a srozumitelný popis našeho mateřského jazyka. Mluvnice je koncipována jako dvoudílná, přičemž první díl zahrnuje poučení mj. o zvukové stránce jazyka, slovní zásobě, slovotvorbě, tvarosloví, stylistice a psací soustavě (druhý díl pak bude věnován větné skladbě). Jako vůbec první popis svého druhu se mluvnice pokouší systematicky zachycovat rozdíl mezi mluvenou a psanou češtinou a to na základě rozsáhlých dat z  Českého národního korpusu. Výsledkem je materiálově založená moderní a přehledná publikace, která nepodává obraz o tom, jak by jazyk vypadat měl, ale o tom, jak skutečně mluvíme a píšeme. Čtenář si tak může sám udělat obrázek o tom, jaké způsoby vyjadřování jsou obvyklé a vhodné pro určitou situaci a které prostředky jsou naopak nevšední či v daném kontextu nepreferované.

Cvrček, V. a kol.: Mluvnice současné češtiny. Nakladatelství Karolinum, Praha 2010.
ISBN 978-80-246-1743-5

Mluvnice současné češtiny - obálka


Statistiky češtiny

Tomáš Bartoň, Václav Cvrček, František Čermák, Tomáš Jelínek, Vladimír Petkevič

Příručka umožňuje uživateli udělat si ucelenou představu o frekventovaném jádru fonologických, morfologických a syntagmatických jevů v češtině na jedné straně a perifériích jazykového systému na straně druhé, což je informace, kterou klasické gramatické příručky podávají zřídka, nebo ji – ve většině případů – úplně opomíjejí. Doplňuje se tak popis systému češtiny o důležitý aspekt frekvenční, který nám jednoznačně ukazuje, že často je věnována intenzivní pozornost jevům marginálním, zatímco rozsáhlé neprobádané oblasti jevů frekventovaných (např. problematika kombinatoriky slovních druhů) zůstávají nepovšimnuty.

S omluvou uveřejňujeme seznam chyb nalezených po vydání publikace.


Bartoň, T. a kol.: Statistiky češtiny. Nakladatelství Lidové noviny, Praha 2009.
ISBN 978-80-7106-5944
Statistiky češtiny - obálka

Slovník Bohumila Hrabala

František Čermák, Václav Cvrček (eds.)

Slovník Bohumila Hrabala je pokusem o komplexní popis jazyka výjimečného slovesného tvůrce druhé poloviny 20. století. Z různých pohledů se tu zkoumá Hrabalův lexikon, specifičnosti jeho morfologie i frazeologie, stejně jako statistické aspekty jeho tvorby. Vedle úplného slovníku Hrabalových lexémů zde čtenář najde i soubor Hrabalových myšlenek a originálních výroků. K publikaci je připojeno CD, které obsahuje kompletní korpus Hrabalových děl spolu s obslužným programem, seznamy hrabalovských kolokací a frekvenční slovník.

Čermák, F. - Cvrček, V..: Slovník Bohumila Hrabala. Nakladatelství Lidové noviny, Praha 2009.
ISBN 978-80-7106-488-6

Slovník Bohumila Hrabala - obálka


Valence českých substantiv

Anna Čermáková

Valence substantiv se v knize pojímá jako jev lexikologický pro substantiva svébytný, a nikoli (nutně) odvozený od sloves, mající ve svém úhrnu povahu odlišnou a výrazně sémantickou, což naznačuje i řada uváděných subklasifikací. Pojetí valence a zvláště jejích formálních exponentů se přitom soustřeďuje na všechny formální a kategoriální rysy, které ji v korpusu vyjadřují, bez apriorní (a zpravidla omezující) teorie.

Čermáková, A.: Valence českých substantiv. Nakladatelství Lidové noviny, Praha 2009.
ISBN 978-80-7106-426-800

Valence českých substantiv


Regulace jazyka a Koncept minimální intervence

Václav Cvrček

Tento svazek představuje první pokus, jak na základě korpusových metod vystavět plán jazykově regulační činnosti založené na minimální intervenci do jazyka a řečové činnosti – Koncept minimální intervence (KMI). Přijatým předpokladem tohoto konceptu je fakt, že jazyk se samovolně vyvíjí v účelný nástroj dorozumívání bez pomoci ze strany lingvistů, a není proto důvod, proč by jazykověda měla do vývoje jazyka svými preskriptivními intervencemi zasahovat. V polemice s předcházejícími koncepty jazykově regulační činnosti (Teorie jazykové kultury, puristický koncept apod.) vychází KMI striktně z informací, které nám o jazykových prostředcích může poskytnout korpus, mezi něž nepatří kritéria hodnocení na ose spisovný – nespisovný (nebo správný – nesprávný). Zároveň tato publikace přináší obecnější Teorii intervencí, která slouží jako zastřešující teoretický model nad jednotlivými koncepty jazykově regulační činnosti, a korpusové sondy měřící míru preskriptivismu v českém prostředí a dopad kodifikačních intervencí na jazyk.

Cvrček, V.: Regulace jazyka a Koncept minimální intervence. Nakladatelství Lidové noviny, Praha 2008.
ISBN 978-80-7106-600-2

Regulaca jazyka a Koncept minimální intervence


Čestina v mluveném korpusu

Marie Kopřivová - Martina Waclawičová (eds)

Svazek přináší soubor příspěvků z mezinárodní a interdisciplinární konference Čeština v mluveném korpusu konané v roce 2007 na Filozofické fakultě Univerzity Karlovy v Praze. Texty se shodně věnují velmi aktuální a dříve opomíjené mluvené formě jazyka z hlediska řady aspektů. Představují ji tak, jak je zachycena v různých autentických mluvených korpusech, a podrobují ji zkoumání korpusovými metodami. Témata knihy, první svého druhu, zahrnují široké pole od problematiky budování mluvených korpusů přes zkoumání obecných rysů mluvenosti a variantnosti v mluveném jazyce až po různé aspekty gramatického popisu mluveného jazyka.

Kopřivová, M. -  Waclawičová (eds):  Čeština v mluveném korpusu. Nakladatelství Lidové noviny, Praha 2008.
ISBN 978-80-7106-982-9

Čeština v mluveném korpusu


Morfologie mluvené češtiny: Frekvenční analýza

Jitka Šonková

Tento svazek podává první soustavnou charakteristiku skloňování a časování v mluvené češtině. Studie vychází z kvantitativní analýzy Pražského mluveného korpusu, tvořeného přepisy více než 304 nahrávek z Prahy a okolí, a zaměřuje se především na konkurenci spisovných a nespisovných tvarů v běžné komunikaci českých mluvčích.

Šonková, J.: Morfologie mluvené češtiny: Frekvenční analýza. Nakladatelství Lidové noviny, Praha 2008.
ISBN 978-80-7106-956-0

Morfologie mluvené češtiny


Slovník Karla Čapka

František Čermák (ed.)

Tímto svazkem se začíná nová řada v sérii korpusových publikací o jazyku nazvaná Korpusová lexikografie. Představí postupně řadu slovníků určitého důležitého období či autorských slovníků významných jednotlivců národní kultury, které zpravila není třeba představovat a kteří se významně podepsali na podobě své doby i jejího jazyka. Prvním v této řadě je Slovník Karla Čapka, jednoho z nejvýznamnějších českých spisovatelů a myslitelů vůbec.

Slovník Karla Čapka mapuje Čapkův jazyk v řadě parametrů a způsobem, jakým dřívější a většinou ručně sestavované slovníky slavných autorů (od antiky přes Shakespeara až po Otokara Březinu) postupovat nemohly. Vedle vlastního slovníku tu zájemce najde nejenom několik odborných studií, ale také soubor Čapkových myšlenek k jeho době. Kniha je doprovázena CD s korpusem celého Čapkova díla v počítačové podobě, díky němuž se uživateli nabízí široká možnost vlastního studia celého materiálu, na kterém je slovník založen.

S omluvou uveřejňujeme seznam chyb nalezených po vydání slovníku.

Čermák, F. (ed.):  Slovník Karla Čapka. Nakladatelství Lidové noviny, Praha 2007
ISBN 978-80-7106-915-7

Slovník Karla Čapka - obálka


Frekvenční slovník mluvené češtiny

František Čermák (ed.)

Frekvenční slovník mluvené češtiny je vůbec první slovník svého druhu, představující autentickou mluvenou češtinu, která tu stojí v protikladu k češtině spisovné a psané. Ukazuje, jak lidé skutečně mluví, tj. bez kodifikačních zásahů a deformací. Slovník vychází z Pražského mluveného korpusu, založeného na sociolingvisticky reprezentativních nahrávkách rozhovorů.  Na přiloženém CD je k dispozici celý tento korpus i s obslužným programem, pomocí kterého si uživatel může podle zájmu vyhledávat mnoho dalšího, a to především v autentickém kontextu, kde se daný skutečně výraz užívá. Nabízí se tu takto mimořádná možnost studia skutečného mluveného jazyka v kontextu včetně jeho statistického vyhodnocení, která až dosud k dispozici nebyla ani pro vědecké ani například pedagogické účely.

Čermák, F. (ed.): Frekvenční slovník mluvené češtiny. Karolinum, Praha 2007.
ISBN 978-80-246-1425-0

Frekvenční slovník mluvené češtiny


Vidová morfologie českého slovesa

François Esvan

Tento svazek představuje podrobný popis vidové morfologie českých sloves z hlediska jejich tvoření, a to na základě stomiliónového korpusu současné češtiny SYN2000. Tento popis je zachycen v podobě relační databáze obsahující údaje o frekvenci všech sloves nacházejících se v korpusu SYN2000 a o vztazích mezi těmito lexémy z vidového hlediska. Detailně jsou zpracovány a frekvenčně zachyceny způsoby tvoření vidových derivátů: prefixace, sufixace a iterativní sufixace.

Esvan, F.: Vidová morfologie českého slovesa. Nakladatelství Lidové noviny, Praha 2007.
ISBN 978-80-7106-913-300

Vidová morvologie českého slovesa


Valence českých adjektiv

Marie Kopřivová

Tato práce se věnuje valenci českých adjektiv a využívá při tom rozsáhlého korpusového materiálu, který poskytuje korpus psané češtiny SYN2000. Jejím východiskem je lexikologické pojetí valence a zaměřuje se na popis formálních exponentů adjektivní valence. Nejedná se o vyčerpávající popis valence adjektiv, spíše o naznačení možností, jak k jejímu zkoumání využít korpusový materiál.

Kopřivová, M.: Valence českých adjektiv. Nakladatelství Lidové noviny, Praha 2006.
ISBN 80-7106-862-4

Valence adjektiv


Víceslovné předložky v současné češtině

Renata Blatná

Tento svazek představuje všeobecný popis víceslovných předložek, např. (v rámci něčeho, vzhledem k něčemu, spolu s něčím), kterých jsou v jazyce řádově stovky (kolem 400). Od jednoslovných předložek, např. (v, na, proti) apod., kterých jsou řádově desítky, se víceslovné předložky liší především sémanticky. Uvedený popis víceslovných předložek vychází z velkého korpusu SYN2000 a navazuje na zpracování těchto jednotek ve Slovníku české frazeologie a idiomatiky. Výrazy neslovesné.

Blatná, R.:  Víceslovné předložky v současné češtině. Nakladatelství Lidové noviny, Praha 2006.
ISBN 80-7106-865-9

Predlozky


Kolokace

František Čermák - Michal Šulc (eds.)

Svazek Kolokace je tematickým sborníkem, prvním českým věnovaným dané oblasti. Téma kolokací, "společného výskytu slov", je dnes centrálním pojmem korpusové lingvistiky, jehož rozmanitost a rozpětí od víceslovných termínů a idiomů až k náhodným kombinacím klade na uchopení problematiky i její zpracování velké nároky.

Čermák, F. - Šulc, M. (eds.): Kolokace. Nakladatelství Lidové noviny, Praha 2006.
ISBN 80-7106-863-2

Kolokace


Korpusová lingvistika: Stav a modelové přístupy

František Čermák - Renata Blatná (eds)

Tento svazek předkládá čtenářům korpusově založené studie (tzv. case studies), které se věnují takovým základním jazykovým jevům a problémům, jako je např. hranice mezi lexikonem a gramatikou, hranice mezi psaným a mluveným jazykem apod., jejichž řešení lze chápat jako modelové pro zkoumání obdobných případů, tj. jejichž závěry lze extrapolovat.

Čermák, F. - Blatná, R. (eds): Korpusová lingvistika: Stav a modelové přístupy. Nakladatelství Lidové noviny, Praha 2006.
ISBN 80-7106-861-6

Korpusova lingvistika


Jak využívat Český národní korpus

František Čermák - Renata Blatná (eds)

Studijní pomůcka pro přemýšlivé studenty středních škol, žáky vyšších ročníků základních škol i studenty vysokoškolské, kteří chtějí vniknout do zákonitostí českého jazyka poněkud jinak, než je v tradičníchučebnicích obvyklé. Pracuje se s Českým národním korpusem, který při svém rozsahu 100 mil. slovních tvarů umožňuje interpretovat jazykové jevy ze zcela nových hledisek, především s využitím frekvence slov a tvarů a různých statistických funkcí. Příručka provede studenta jednoduchým i detailně sofistikovaným vyhledáváním jazykových jevů v Českém národním korpusu i problematikou spojenou s různými jazykovými rovinami od hláskosloví až po slovní zásobu a slovní spojení (kolokace). Na své si při práci s touto knihou přijdou především ti pedagogové a studenti, které baví práce s počítačem a současně je zajímá naše mateřština. Přemýšlivějším a otevřenějším se tu nabízí inspirativní cesta, jak překonat dříve neslučitelné zájmy, češtinu a matematiku.

Hlavní části:

  • Práce s ČNK krok za krokem - úkoly na jevy z hláskosloví, tvoření slov, tvarosloví, slovní zásoby, syntaxe a slovních spojení.
  • Co říká o různých slovech korpus a co slovníky - úkoly na zjištění významu méně frekventovaných slov.
  • Význam slova prozrazuje kontext - úkoly, v nichž je třeba na základě kontextu odhalit vynechané slovo nebo slovní spojení, popř. odlišit slova formálně podobná.
  • Úkoly pro náročnější - úkoly na zadávání sofistikovaných korpusových dotazů.
  • Práce se subkorpusy - úkoly s různými typy textu.

Studijní příručka Jak využívat ČNK byla na jaře 2007 vydána v reedici s opravami, které nabízíme ke stažení ve formátech RTF a PDF.

Čermák, F. - Blatná, R. (eds): Jak využívat Český národní korpus. Nakladatelství Lidové noviny, Praha 2005.
ISBN 80-7106-736-9

Jak využívat ČNK - obálka


Jazyky a jazykověda

Renata Blatná - Vladimír Petkevič (eds)

Při příležitosti 65. narozenin prof. Františka Čermáka vyšel sborník Jazyky a jazykověda. Sborník představuje práce kolegů a doktorandů prof. Františka Čermáka z různých oblastí jeho odborného zájmu, neboť jubilující prof. František Čermák svými publikacemi zasáhl do mnoha lingvistických oborů a navíc se stal průkopníkem naprosto nového oboru, korpusové lingvistiky. Svými kolegy a studenty však není vnímán pouze jako vědec světového věhlasu, ale také jako skvělý člověk a organizátor, který dokázal podnítit řadu spolupracovníků k práci na projektech světového významu, a neméně skvělý pedagog, který mezi studenty zasel řadu obecnělingvistických, frazeologických a korpusových "semínek".

Obsah sborníku naleznete zde. Publikaci je možné zakoupit v ÚČNK za 350 Kč (17,80 euro / 23,20 USD).

Blatná, R. - Petkevič, V. (eds): Jazyky a jazykověda. Sborník k 65. narozeninám prof. Františka Čermáka. ÚČNK FF UK, Praha 2005.
ISBN 80-7308-079-6

Jazyky a jazykověda


Frekvenční slovník češtiny

František Čermák - Michal Křen (eds)

Koncem listopadu 2004 byl vydán v Nakladatelství Lidové noviny Frekvenční slovník češtiny. Je založen na korpusu FSC2000, jehož složení bylo proporčně vyváženo tak, aby věrně zachycovalo současný psaný jazyk. Korpus byl zpracován automatickými metodami, po kterých však následovaly rozsáhlé manuální korekce. Tento lingvistický vklad spolu s dostatečně velkým reprezentativním korpusem, na němž je slovník založen, zajišťují vysokou spolehlivost předkládaných dat. 

V hlavní části slovníku najdete:

  • 50 000 nejběžnějších apelativ (slov obecných) spolu s údaji o jejich frekvencích, pořadí podle těchto frekvencí, a také procentuálně vyjádřené typičnosti jejich užití v hlavních žánrech: beletrii, odborné literatuře a publicistice
  • 2 000 nejčastějších vlastních jmen
  • 1 000 nejčastějších zkratek

Z dodatků se dále dozvíte:

  • jaká interpunkční znaménka jsou nejpoužívanější,
  • která písmena jsou v českém textu nejfrekventovanější,
  • jak velkou část textu pokrývají tvary ve slovníku uváděných hesel.

Ke slovníku je přiložené CD, které umožňuje pohodlné prohlížení hesláře v elektronické podobě, jeho třídění a prohledávání podle nejrůznějších kritérií, a samozřejmě také ukládání vybraných hesel pro další zpracování.

Čermák, F. - Křen, M. (eds): Frekvenční slovník češtiny. Nakladatelství Lidové noviny, Praha 2004.
ISBN 80-7106-676-1

Frekvenční slovník češtiny