Tipy na elektronické jazykové slovníky a databáze

Pro všechny psavce, textaře, copywritery i webcopywritery: 5 spolehlivých lingvistických zdrojů pro ty, kdo chtějí psát obsahově a mluvnicky správně.
Český národní korpus

Být „copíkem“ či tvůrcem textového obsahu není jen tak. Umět se vyvarovat stylistických přehmatů, naučit se psát „skenovatelně“ a rozhodně nikdy nevydávat cizí obsah za svůj! K tomu se může se také stát, že si nebudete zrovna jisti správným tvarem u nějakého slova nebo jeho významem, a tak se raději podívejte do spolehlivého zdroje. Dáme vám tipy.

Internetová jazyková příručka

Pokud váháte nad pravopisnou podobou nějakého slova, pak Internetová jazyková příručka (IJP) bude pro vás neocenitelným nástrojem. Obsahuje jednotlivá hesla včetně údajů tvaroslovných a jiných s výklady o problematických jevech. Provoz IJP od počátku zajišťují pracovníci Centra zpracování přirozeného jazyka Fakulty informatiky Masarykovy univerzity (Dana Hlaváčková, Karel Pala a Pavel Šmerk).

Příručka má dvě části:

  • Slovníkovou - tato část obsahuje přes 102 000 slovníkových hesel.

obrazek_1.jpg

Ukázka zpracování slova „ranný“ ve slovníkové části IJP.
Ukázka zpracování slova „ranný“ ve slovníkové části IJP.

 

  • Výkladovou - do výkladové části byly zařazeny především ty jevy, na které se uživatelé češtiny v jazykové poradně ptají opakovaně.

obrazek_2.jpg

Ukázka výkladové části IJP.
Ukázka výkladové části IJP.

 

Odkaz: https://prirucka.ujc.cas.cz/

Příruční slovník jazyka českého (1935–1957)  

Tento výkladový slovník velkého rozsahu má 8 dílů v 9 svazcích (4. díl byl rozdělen do dvou svazků) a dodatky, které nakonec nikdy nevyšly. Vznikal v letech 1935–1957 a obsahuje přes 200 000 hesel. První sešit vyšel v únoru 1935 a poslední v říjnu 1957.

Tento komplexně zpracovaný slovník je dosud nejrozsáhlejším slovníkářským počinem našeho národního jazyka. Všechny významy, významové odstíny i frazeologická spojení jsou doloženy přesnými citáty. Digitalizovaná podoba Příručního slovníku jazyka českého byla zpřístupněna v roce 2007.

Ukázka zpracování hesla „ranný“

obrazek_3.jpg

Ukázka zpracování slova „ranný“ v Příručním slovníku jazyka českého.
Ukázka zpracování slova „ranný“ v Příručním slovníku jazyka českého.

Odkaz: https://psjc.ujc.cas.cz/

Slovník spisovného jazyka českého (1960–1971)

Slovník spisovného jazyka českého vycházel knižně v letech 1960–1971 a obsahuje 197 200 hesel české slovní zásoby s jejich výklady a typickými příklady užití. Na rozdíl od Příručního slovníku českého jazyka to byl slovník s kodifikačním statusem (po stránce pravopisné, výslovnostní i gramatické). Ústav pro jazyk český AV ČR zveřejnil jeho digitalizovanou podobu v roce 2011.

obrazek_4.jpg

Slovo „ranný“ ve Slovníku spisovného jazyka českého.
Slovo „ranný“ ve Slovníku spisovného jazyka českého.

 

Odkaz: https://ssjc.ujc.cas.cz/

Neomat

Databáze Neomat je budována průběžně od začátku 90. let 20. století, původně jako neologický excerpční materiál pro lexikografické účely. První část neologického lexikálního materiálu dala vzniknout dvěma slovníkům neologizmů – Nová slova v češtině. Slovník neologizmů 1(1998) a Nová slova v češtině. Slovník neologizmů 2 (2004) a rovněž sborníku statí Neologizmy v dnešní češtině(2005). Zpřístupňování neologického archivu probíhalo po etapách: v roce 2011 bylo zveřejněno 132 000 hesel, v roce 2013 bylo zveřejněno 202 340 hesel. Od září roku 2015 je neologický archiv Neomat plně zpřístupněn pro laickou i odbornou veřejnost.

obrazek_5.png

Doklad užití nového slova v češtině „footprint“.
Doklad užití nového slova v češtině „footprint“.
.

 

Odkaz:  http://www.neologismy.cz/

Český národní korpus (ČNK)

Jazykový korpus je elektronický soubor autentických textů (psaných nebo mluvených), v němž je možné jednoduše vyhledávat slova a slovní spojení a zobrazovat je v jejich přirozeném kontextu. Podle časového hlediska se korpusy dělí na synchronní a diachronní. Synchronní korpusy zobrazují jazyk v relativně omezeném a krátkém časovém období, naopak diachronní korpusy zachycují jazyk v různých vývojových fázích.

Korpusy ČNK zahrnují vedle psaného současného jazyka (v rozsahu přes 4 mld. slov) i soubory spontánního mluveného jazyka (přes 7 mil. slov), diachronní korpus starších textů a paralelní korpus InterCorp obsahující překlady z nebo do více než 30 jazyků.​

Pokud si nejste jisti, která varianta v soudobé češtině je používanější, využijte Korpusový průzkum variant SyD, který je určen pro všestranný průzkum variant jak v současném jazyce - synchronní část, tak v průběhu jeho vývoje - diachronní část.

obrazek_6.jpg

Porovnání slov „už“ a „již“ v soudobé češtině.
Porovnání slov „už“ a „již“ v soudobé češtině.

 

Pojďme na online-kafe

napište nám

Přidat komentář