Časopis Slovo a slovesnost
en cz

K dialogu o české lexikografii a lexikologii, předpočítačové i počítačové

Josef Filipec

[Rozhledy]

(pdf)

Concerning the dialogue on Czech pre-computational and computational lexicography

1. Pozornost teoretické lingvistiky byla v posledním vývojovém období zaměřena postupně na sémiotické úseky, syntax, sémantiku, pragmatiku a komunikaci. Při tom se pochopitelně octla v centru pozornosti i problematika slovníku, především současného jednojazyčného slovníku výkladového. Je to logické, protože lingvistická teorie, pokud usiluje o adekvátní popis a výklad přirozeného jazyka, nemůže pominout lexikální zásobu (slova, spojení slov a frazémy) a nauku o ní, teoretickou – lexikologii a aplikovanou – lexikografii. K zájmu o tyto úseky přispívá i současná [133]počítačová (komputerová) lingvistika, z jejíž strany lze vedle aplikace dosud vypracovaných teoretických, zvláště zahraničních analýz, hypotéz a experimentů, zpětně očekávat i podněty teoretické.

Např. v pracích R. Schanka a spolupracovníků (1985) a M. Selfridgeové (1986) jde o integraci sémantiky a pragmatiky (k tomu se v našich pracích – při diferenciaci obou úseků – vždy přihlíží) a o konstrukci vyšších konceptuálních struktur, vyjadřujících typické situační scény komplexním zřetelem k slovníku včetně kontextu a předmětných (encyklopedických) znalostí a samozřejmě gramatických ukazatelů. Tato vazba lexikálních jednotek (dále LJ) jako stavebních prvků na vyšší struktury je pro současnou lexikografii aktuální.

Jako podnět i výzvu k diskusi lze u nás v uvedené předělové situaci hodnotit náměty, které přineslo několik příspěvků v Slově a slovesnosti (především 1992), k nimž zaujímám stanovisko souhrnně.[1] Spektrum lingvistů, jichž se uvedená problematika týká, má pochopitelně značný rozptyl ve větší nebo menší zasvěcenosti, teoretické i praktické, na jedné straně do možností počítače a vlastní práce s ním, na druhé straně do problematiky výkladových slovníků různých typů. Jde tu o různé stupně nejen komputerové, ale i lexikografické „gramotnosti“.

Nám zde jde o vyjádření stanoviska k přínosným i jednostranným informacím a argumentům. Vítáme skutečnost, že „je možná svobodná, otevřená diskuse. Tato možnost by měla být využita co nejplněji“ (Sgall, 1992, s. 93). Žádoucí je „vnitrooborový dialog“, hledající „při plném respektování značného teoreticko-metodologického rozptylu … univerzálie“ (Kořenský, 1992a, s. 97), tj. oboustranně přínosnou základnu dalšího výzkumu, ovšem takovou, která by nebrzdila možnost různých řešení. Předpokladem přínosnosti diskuse je informovanost diskutujících a věcné, neprestižnické zaměření.

 

2.0. Od počítačové lingvistiky – a zde nám jde o její lexikální úsek – očekáváme především tři pozitiva: a) získání základního lexikálního fondu, a to vzhledem k jejím technickým možnostem, dříve neexistujícím, samozřejmě mnohem rozsáhlejšího a mnohem rychleji pořízeného než dříve – dnes se uvažuje až o stomilionovém korpusu (např. nový Duden), b) jednotné propracování heslových statí v celém slovníku – tato úmorná práce se dělala např. v SSČ „ručně“ a c) hlubší propracování programového vybavení počítače (softwaru), pokud jde o kódování textů, lemmatizaci, monosémizaci atd., a zřetele k tomu, že „nejpodstatnější částí počítačové lingvistiky je počítačová sémantika“ (Gorodeckij, 1989, s. 7).[2]

2.1. Výchozí etapou počítačové lexikografie je vybudování „lexikografického počítačového korpusu a tezauru (počítačového fondu) češtiny“, tj. současného i historického spisovného jazyka i jazyka lidového, psaných i mluvených textů, slov, kmenů a kořenů slov. Podle toho nejde tedy jen o lexikum a o texty, ale i o jazyk. Tento materiál, čítající aspoň dvacet milionů jednotek, by sloužil k vytváření slovníků i gramatik (Čermák – Králík – Pala, 1992, s. 44n.). Na tomto programu, za nímž stojí několik zainteresovaných pracovišť, se sjednotili tři odborníci, kteří pracují [134]s počítačem a z nichž, pokud víme, jeden má zkušenost se specifickým výkladovým slovníkem frazeologickým a se slovníky dvojjazyčnými.

Uvedený projekt má celou řadu etap a složek, z nichž každá je komplexem dílčích úkolů sui generis. Cesta od dvaceti-, popř. stomilionového korpusu k výkladovému slovníku není jednoduchá. Má-li být korunována úspěchem, je třeba už od začátku vidět cíl a etapy k jeho dosažení. Tak např. každý výskyt lexému, potenciálně polysémického, musí být jako jeho stavební prvek sémanticky jednoznačně interpretován a identifikován, což předpokládá zkušeného lingvistu-sémaziologa, popř. i oporu v existujícím slovníku. Pořízení mluveného lexikálního subkorpusu jen tří milionů jednotek je totiž náročné jak v etapě identifikace výskytů slov (jen mluvené – jen psané – obojí: více psané – více mluvené a naopak), tak v etapě textu slovníku: doklad kolokvialismu vyžaduje často minimální sémantický kontext v rozsahu tří čtyř řádků anebo tří a více replik dialogu.[3] Všichni počítačoví lexikografové jsou zatím zcela bezstarostní, pokud jde o rozsah textu budoucího slovníku, ale právě ten byl pro dosavadní synchronní slovníky tvrdou skutečností.

Velmi závažným dílčím úkolem je získání „termínů různých druhů z různých zdrojů“ (s. 44). Při naléhavosti dnešní specializace a s tím souvisící rozsáhlé determinologizace v různých médiích je třeba založit příslušný subkorpus a pamatovat při personálním obsazení na specialistu (a ne jednoho), který by byl zasvěcen jak do problematiky termínů a jejich odborné definice, tak i do metody její nezkreslující lexikografické formulace vhodné pro uživatele výkladového slovníku. K tomu přistupuje i zřetel k repertoáru odborných úseků. Např. šestisvazkový Dudenův slovník jich uvádí 182 (1976, s. 16n.), tedy více než Malá československá encyklopedie.

2.2. Uvedení autoři charakterizují lexikální sbírky Ústavu pro jazyk český jako „muzeum ručně psaných kartoték s více než 12 miliony lístků“ (s. 41). Je to muzeum a není to muzeum. Muzeum je to svou částí zachycující lexikum od r. 1770 zhruba do konce 19. stol., ale i tohoto „muzea“ hodlají autoři podle bodu C svého projektu postupně využít. Využil ho ostatně kromě materiálu PS, SSJČ a SSČ z nedostatku vlastního materiálu i Slovník české frazeologie a idiomatiky[4] a využívá ho i připravovaný Valenční slovník českých sloves (Macháčková – Svozilová, 1990).[5] Muzeální je ostatně i první generace počítačů. Další skutečností je, že ústavní materiál má několik dobových vrstev souvisejících s ukončením tří různých českých akademických slovníků a také tohoto vrstvení lze využít. Jednak má současný jazyk svou dynamiku a svou časovou hloubku (Filipec, 1992a), jednak potřebuje lexikograf pro svou prognózu oporu v znalosti předchozího stavu jazyka (Filipec, 1979).[6]

V této souvislosti není bez zajímavosti návaznost počítačové a předpočítačové lexikografie, pokud jde o členění korpusu a typy excerpce (Čermák, 1994, s. 3, úsek 1.). Tak např. rozlišení korpusu a subkorpusu a dále korpusu referenčního a monitorovacího, který „slouží jako filtr k odfiltrování dat“ (tamže), dále zjišťování [135]řídkých LJ odpovídá tradičnímu pojetí pomocných kartoték, do nichž se ukládaly např. termíny a frazémy v době přípravy SSČ. S filtry se pracovalo při shromažďování excerpčního materiálu z první poloviny 19. stol. Při tom se rozlišovaly tři typy excerpce: úplná, částečná a zvláštnosti, tj. jevy řídké. S těmi má potíž i stomilionový slovník (Trésor de la langue française). Počítačová terminologie jen nově pojmenovává mnohé dříve známé a osvědčené skutečnosti.

2.3. Kritizuje-li se minulost, je třeba dát průchod i historické pravdě, kterou mladší pracovníci neznají. V době svého vedení oddělení lexikologie a lexikografie (1969–1977), než jsem byl K. Horálkem odvolán a jím samým nahrazen, jsem od r. 1974 marně usiloval o vyslání tehdejší správkyně lexikálního archivu V. Červené buď do Göttingen nebo do Itálie (byly styky s P. Busou), právě kvůli modernizaci lexikálních sbírek za využití počítače. Pro tento účel však nebyly devizy. Za ředitele J. Petra pak byla excerpce vůbec zastavena a oddělení zajišťovalo čtyřmi silami mimo běžný pracovní úvazek roční přírůstky excerpce v rozsahu cca 20 000 výskytů. Do 2. vydání SSČ jsem dodával materiál z vlastní excerpce.

Závěry této části tedy vyznívají v doporučení: Projekt počítačové lingvistiky a lexikografie je velmi aktuální, jeho možnosti a etapy je třeba vidět reálně (k tomu též Savický, 1987, s. 61n.), je třeba nezkreslovat skutečnosti a neodmítat návaznost na dosavadní výsledky (k tomu i Němec, v. dále), jako by bylo třeba začínat od nuly.

 

3.0. Jako první reagoval na uvedený projekt I. Němec (s. 48–55) a zahrnul do své kritiky obecně i českou současnou lexikografii a lexikologii, jejímž je spolupředstavitelem, a stal se tak i sám nejen kritikem, ale i spolu kritizovatelným.

K tomu je třeba obecně poznamenat, že slovník živého jazyka je dnes exponentem celé lingvistiky od pravopisu po syntax a text, že jeho kvalita závisí na předběžných materiálových monografiích (např. popisu sekundárních předložek, slovesné elipsy) a speciálních slovnících (synonymických, valenčních) a na homogennosti lexikografického kolektivu. Kritika uvádějící tři čtyři nedostatky nemůže ohrozit kvalitu díla uvádějícího deseti- i statisíce informací. Výklady abecedního slovníku, ačkoliv jsou syntaktickými formulacemi relevantních sémů, nelze ztotožňovat s cíli speciální sémické analýzy. Ta předpokládá popis dílčích sémantických podsystémů v slovníku jako celku. Tomu zatím nemůže dostát např. rozsáhlý, dlouhodobě založený, reprezentativní, ale kusý Staročeský slovník (dosud písmena n – část p).

Poněkolikáté opakovaný požadavek I. Němce a vlastně už M. Dokulila, aby se i v jednosvazkovém slovníku uváděly slovotvorné vztahy, byl z rozsahových důvodů k lítosti autorů nemožný. Odkazy typu nárok1 k nařéci, nařčenie k nařéci, nařčený k nařéci, nářek k nařéci v StčSl by byly pro SSČ luxusem a polykačem řádků, zvláště když tento slovník naznačuje slovotvorné vztahy hnízdováním a výkladem (nářek ‚naříkání 1,2’). Výmluvné jsou rozdíly rozsahu slovníků různého typu a cíle, např. u písmena n: SSČ 43 strany, PS 655 stran, StčSl 1022 strany. V této souvislosti zaráží, že StčSl sice uvádí heslové předpony naj-, ná-, ne-, ale nikoliv ještě důležitější předpony na-, nad-, o-, ob/e/-, pa-, pod- v dosud vyšlých sešitech.

Za nedostatek SSČ považuje Němec, že se u slovesa vyjadřovat neuvádí sémantická spojitelnost se slovy místo, směřování, celek, doba aj., která se objevuje ve výkladech předložek (např. v 2. vyj. místo …). Ovšem slovník dokládá heslová slova příklady z přirozeného jazyka, nikoli z metajazyka.

Souhlasit lze s Němcovým požadavkem metody sémické analýzy, kterou jsem os[136]tatně před čtvrt stoletím do české lexikologie uvedl (Filipec, 1968a, b), a zjišťování nejblíže nadřazených definičních generických sémů (s. 51n.), jakož i s požadavkem uvádět u termínů výklady nezatížené dalšími termíny (pavouk ‚členovec’, tj. ‚živočich s článkovaným tělem’). Tento způsob byl v SSČ zvolen i v jiných případech právě ze snahy najít pro jistý dílčí systém nejblíže nadřazený sém. Zahrnuje-li Němec do rozsahu lexému hmyz (‚drobní živočichové … s třemi páry noh’) i pavouky se čtyřmi páry noh, pak je třeba u tohoto lexému zavést polysémii a rozlišit význam odborný a neodborný. Lexikograf sotva může změnit zoologické skutečnosti a odbornou systematiku (srov. Kratochvíl – Bartoš, 1954, s. 54n., 62). Najít tu generický sém není snadné. Nejblíže nadřazeným generickým sémem není slovo živočich, uvedené v StčSl např. u slov paúk, plž, zvláště když u slov osel, ovcě, pes, stojících v hierarchii živočichů výše, se uvádí specifičtější generický sém ‚zvíře’. Ostatně metajazyk slovníku současného jazyka nemůže a dokonce ani nemá být totožný s metajazykem slovníku historického.

Absolutizovat nelze ani požadavek, že definující slovo musí být vždy frekventovanější než slovo definované. Slova zobecňující povahy, označující třídy, zvláště třídy substantiv, mívají nižší frekvenci než specifičtější slova definovaná, např.: škola (1129) je v prvních třech významech definována slovy ‚instituce‘ (62), ‚budova‘ (116) a ‚žactvo‘ (99); nebo život (2736) ‚souhrn‘ (40) ‚jevů‘ (118) ‚charakterizujících‘ (36) ‚organismus‘ (262) (číselné údaje se uvádějí podle českého frekvenčního slovníku, čerpajícího data z jazyka před více než 30 lety; v. i Gougenheim, 1961, s. 8–15).

 

4. Souvislosti počítačové a předpočítačové lexikologie a lexikografie zaujaly také J. Kořenského (1992b, s. 265–272). Pro počítačový výkladový slovník konstruuje procesuální model řeči, jehož je jazyková složka předpokladem, a navrhuje pro něj model lexikálního komponentu. Své řešení konfrontuje s pojetím České lexikologie a snad nepochybím, domnívám-li se, že jde především o mou část. Kritizuje pojetí stratifikačního modelu, diskrétnosti jazykových jednotek, diferenciace systému lexikálního a gramatického, nepřihlížení k „stavu sémiotických teorií“ a naráží na „hranice institucionální jazykovědy“ (s. 265). Proti „klasické lexikální teorii“ (s. 269) staví „představu dynamického kontinua obsahových předpokladů“ (s. 267) formovaného do výrazů různého typu (slov, syntagmat, vět) a reflektujícího dynamické kontinuum „vnější“ reality včetně obou komunikantů (s. 268). Odtud pak vyplývá představa procesuálně pojatého „velkého výkladového slovníku“ s „lexikální bází uloženou na počítači“ a zahrnující tři složky: textovou, lexikální a gramaticko--stylistickou (s. 270). Jde tu zřejmě o představu počítačového slovníku zapojeného na centrální počítač, kontinuálně doplňovaný lexikálními daty. Bez „možnosti terminálových vstupů“ je ovšem „výše charakterizovaný způsob materiální existence slovníku“ podle autora „pouhou utopií“ (s. 271).

Kladný rys Kořenského vystoupení je v tom, že uznává rovnoprávnost zapojení lexika vedle gramatiky do komunikačního modelu a oprávněnost toho, co označuje jako klasickou lexikální teorii, tj. z jeho hlediska předpočítačovou, která mu posloužila jako komparační východisko jeho cílů. S tím souvisí i jeho pozitivní vztah k návaznosti nového pojetí na pojetí dřívější. Jeho integrální komunikační procesuální model má ovšem paralely i v zahraniční lingvistice. Autor sám jej konstruoval, jak uvádí ve své Teorii přirozeného jazyka (1989), v průběhu 80. let (s. 6) a snažil se [137]překonat dualitu jazyka a řeči i další protiklady „monismem dialektickomaterialistické filozofie“ (s. 87). Proto označil jazyk jako předpoklad řečového procesu. Ovšem je-li něco předpokladem, tj. nutnou podmínkou existence něčeho, znamená to, že bez této podmínky neexistuje ani to, co z ní vyplývá. Spojitý řečový model je tedy možné formulovat, ale nejde to bez zřetele k dosavadním výsledkům lingvistiky a nauky o lexikální zásobě. Tak např. na pojetí jazykových rovin je založena i Mluvnice češtiny, obsahující v druhém svazku i rozsáhlý příspěvek J. Kořenského. I počítačový požadavek situačních komplexů (rámců, scén), dosud víceméně jen teoretický (srov. sub 1.), vychází z lexikálních jednotek, jejich významů a valencí (Fillmore, 1985, rus. 1988, s. 64).

Při některých výtkách Kořenského se nelze ubránit dojmu, že ho z mé práce zaujal jen jistý úsek. Tak např. tvrzení, že „lexikální systém … stojí jaksi stranou tohoto systému chápaného jako gramatický“ (s. 265) je negativem k pozitivu úseku ČL „Lexikologie a gramatika“ (s. 38–47, 76–82). Domnívá-li se, že se ČL soustředila jen na „vnitřní vývoj tohoto oboru“, přehlédl zřejmě 11stránkový, před vynuceným zkrácením 50stránkový „Přehled hlavních směrů usilujících o poznání významu“ (s. 54–65). Chybí-li mu zřetel k pragmatice a komunikaci, nepostřehl asi kapitolu „Pragmatická složka významu“ (s. 69–71) a zvlášť komunikační model LJ (s. 29n.), dále prohloubený v článku z r. 1989 a otištěný v definitivní německé verzi 1992b. Koncepce ČL, dopsané před 10 lety, není nehybná, stejně jako názory Kořenského. Zbytečná by byla i jeho poznámka o mém pojetí „víceméně stabilního lexikálního významu“,[7] kdyby mu neuniklo mé vysvětlení dynamičnosti významu, sémému vztahem sémů a kontextových subsémů (s. 69), dokonce „v komunikační situaci“ (s. 75). Ostatně už ve svých pracích z let 1957 a 1961, které vznikly individuálně bez „institucionální“ podpory a týmového přispění, jsem přistupoval k slovu z hlediska kontextu a pak teprve jako k systémové abstrakci.

 

5. Velmi vehementním programatickým příspěvkem, týkajícím se možného pojetí teorie budoucího českého výkladového slovníku, přispěl do současné diskuse F. Čermák (1992, s. 249–264). Protože jsem do připravovaného Manuálu lexikografie (red. F. Čermák, R. Blatná) odevzdal své současné pojetí Teorie a praxe jednojazyčného slovníku výkladového před vyjitím jeho článku, naskýtá se možnost obě navzájem nezávislá pojetí porovnat. Redakce Slova a slovesnosti zároveň otevřela k Čermákovu článku diskusi.

Autor např. dobře ukazuje aktivní úlohu slovníku při jeho souvztažnostech s gramatikou (s. 249, 251), chápe slovo jako centrální jazykovou jednotku (s. 249), rozlišuje cíle lexikografie a lexikologie (s. 251), sémaziologie a onomaziologie (s. 252), postihuje slovnědruhovou symetrii výkladu významu a definienda (s. 254), postuluje zpřesnění sémické analýzy (s. 254n., 258), usiluje o standardizaci postupu při výstavbě hesla atd. To vše je metodicky důležité pro začínající lexikografy.

Zasloužilý překladatel de Saussurova Kurzu obecné lingvistiky zakládá svou koncepci na protikladu paradigmatiky a syntagmatiky. Tím se v pozitivním ohledu zdůrazňuje strukturní pojetí lexika, jistě primární, ale na druhé straně může být tento strohý duální rámec chápán příliš úzce, ba jako brzda: počítačová lexikografie [138]se dnes otvírá jednak při výkladu významu i encyklopedickým znalostem, zvláště při konstrukci rámců a scén (srov. dříve Schank et al., 1985, s. 33n.; Fillmore, 1985), jednak interdisciplinárním vztahům, takže např. při výběru a popisu obsahu termínů „nemůže být soudcem jen lexikograf“ (Čermák, 1992, s. 251). Uvádí-li se v schématu heslo i položka diachronie, obsazená jen etymologickým údajem, neměla být tím spíše opomenuta časová dynamika systému, obohacující de Saussurův dualismus, zvláště doporučuje-li i Čermák přihlížet např. při určování toho, co je řídké, k „odhadu více reprezentativních mluvčích, mj. různých generací“ (s. 254).

Příspěvek obsahuje některé obecné formulace, nepočítačově polemizující s blíže neidentifikovatelnými vykonstruovanými odpůrci. Tak např. se odsuzuje „tradiční nezájem“ slovníků o kombinatoriku, syntagmatiku, „úporná praxe (popisných) slovníků snažící se uživateli tuto stránku v podstatě zamlčet“, pojetí slova jako „nesmyslného a umělého konstruktu“ atd. (s. 249). Možná tu převládly autorovy zkušenosti se slovníky dvojjazyčnými, na nichž pracuje. Ovšem autoři výkladového slovníku vycházejí z excerpce lexémů v textu, což bylo dávno stvrzeno i teoreticky postupem od textových exemplářů lexému k lexému typu a jeho distribuční oblasti (Filipec, 1957, s. 132n.) a pojetím lexému i slova jako formálně-významové jednotky (tamže; v. i Filipec – Čermák, 1985, s. 240). Autorovy formulace tak nespravedlivě zastírají skutečný stav české lexikologie a teorie lexikografie a dokonce i české lingvistiky.[8]

Podle F. Čermáka „není valence jev syntaktický (tam, tj. v syntaxi, se jen aktualizuje)“ (s. 250). Jde o jistý druh syntagmatičnosti (Filipec – Čermák, 1985, s. 173) a valence je „kategoriálně pojímatelná“ (Čermák, 1992, s. 256). Je nepochybné, že valence jako schopnost dominujícího, klíčového lexému vyžadující jistý počet větných pozic (valenčních členů) by neexistovala bez konkrétní lexikální jednotky (lexému-sémému). Ovšem valence by nebylo ani bez valenčních pozic, bez aktantů, diferencovaných dokonce i pádově. Jde tedy o jev komplexní, syntakticky (konstrukčně) lexikologický. Valenci nelze vylučovat ze syntaxe ani proto, že komplexní povaha slovních druhů v aktantech zahrnuje i kritéria syntaktickofunkční (Mluvnice češtiny, 2, s. 14) a protože u valence je důležité i větněčlenské rozlišení predikace a determinace (Mluvnice češtiny, 3, s. 18, 25 aj.).

Několik mých připomínek se vztahuje k sémantické stránce lexika. Metajazyk se týká nejen významu lexému, ale i znaku jako celku a jeho formy (Filipec, 1994). Za nedostatek považujeme odsunutí polysémie, úhelného kamene lexikografie (v. i sub 2.1.), do odstavce na konci výčtu složek heslové stati, za etymologii, její odtrženost od sémické analýzy, závislost její hierarchie na frekvenci a závislost sémému na počtu výskytů. Polysémie je hierarchická významová struktura lexému s průnikem jednotlivých sémémů. Manifestuje se v spojité distribuční, kontextové oblasti lexémů jako jazyková potencialita. Zahrnuje sémantické spektrum sémémů, z nichž každý jako obsahová stránka (hyper)lexému tvoří monosémickou LJ se specifickou [139]distribucí a nabízí mluvčímu při komunikaci repertoár výskytů (exemplářů). Jednotlivé sémémy lze identifikovat existujícími metodami jako soubory sémů a syntakticky formulovat výkladem, ale je třeba respektovat přirozenou pohyblivost, oscilaci sémémů („vágnost“), která umožňuje i dvojsmysly, např. v hovoru nebo v poezii. Jednotlivé sémémy lze sice seřadit podle frekvence, ovšem frekvence rozlišitelné podle sémémů, nikoli jen podle počtu výskytů lexému jako celku, ale toto mechanické pojetí, vyhovující možná počítačové lexikografii, je neadekvátní z hlediska lingvistického popisu, který sleduje významové závislosti a motivaci sémémů. Podle autora lze uznat za samostatný ten lexikální význam, který se manifestuje v neuzavřené řadě 7±2 různých výskytů (s. 259; Filipec – Čermák, 1985, s. 172). Jinde však uvádí „hranici pro samostatný význam lexému v 50 evidovaných výskytech“ (Čermák, 1994, 3.3.). Ověřit tato a další tvrzení bude jistě jedním z vděčných úkolů právě pro počítačovou lexikografii.

Frekvenci nadřazuje Čermák také stylu (s. 253). Zavrhuje tradiční pojetí funkčních stylů jako vágní – uznává jen odborný styl a slang a podle Longmannova slovníku doporučuje „sociolingvisticky bezesporu základní“ kritérium ne/psanosti a ne/formálnosti (s. 254). K tomu poznamenejme, že toto kritérium je příliš obecné: např. máme-li řadu synonym: To jsme se dnes napapali, nabaštili, nacpali, nadlabali, najedli, nasytili, nafutrovali, nažrali aj., jde tu nejen o uvedené dva protiklady, ale ještě o další rozdíly jednak spisovnosti a nespisovnosti, popř. standardnosti a nestandardnosti, jednak neutrálnosti a kladné/záporné expresivity, která je primárně jevem pragmatické složky významu,[9] ale sekundárně i jevem sociálním. Autor ji považuje za jev stylový a „nepříliš vhodně nazývaný“ (s. 258). Uvedený příklad dokládá též sémantickou a stylistickou důležitost synonym, jejichž funkce autor nedoceňuje („náhodná distribuce“, „deskriptivní komplikace“, s. 256). Nepřihlíží také k rozsáhlé oblasti vrstevních příznaků, kterou se uvnitř systému jazyka, nejen českého, vyznačují existující diasystémy (Filipec, 1994, s. 32n., 39n.; Hausmann, 1989). S nepřípadností charakteristiky publ., kterou se označovala spíš novinářská, zvláště sportovní klišé, souhlasíme. Z omezené využitelnosti lexika krásné literatury vyvodil důsledky už SSČ (s. 6, 779).

Závažnější připomínka se týká ještě normativnosti slovníku. Autor zdůrazňuje důležitost „úzu, který je vždy v konečné instanci arbitrem nejvyšším“, důležitost mluvené komunikace, stále nedostatečně poznané a hodnocené, a nadřazenost kritéria frekvence. Silnými slovy odsuzuje „preskribomanií poznamenané lingvisty“, jejich „augurství“ a „rostoucí schizofrenní (!) umělou propast mezi jazykem psaným a mluveným“ (s. 252). Bohemisté vědí, že už před 50 lety konstatoval přísný F. Trávníček, že „obecný zvyk (tj. užívání slov celým jazykovým společenstvím) je nejvyšší rozhodčí v jazyce“ (1942, s. 129). Také B. Havránek už před 60 lety zdůraznil, že „nelze … slovník (spisovného jazyka) nikdy nivelizovat na slovník jedné z jeho funkcí, ani nelze je poutat dočasnou normou!“ (1932, cit. 1963, s. 116). Výkladový slovník plní volky nevolky normativní funkci, ovšem v čase proměnlivou. Průměrný úzus je výsledkem průniku množiny jednotlivých textů a záleží na jejich výběru, pohybu v čase a hodnocení. Tvůrčího uživatele lexika sotva mohou vázat v specifických komunikačních situacích pouhé frekvenční údaje.

[140]Závěrem je třeba poznamenat, že k diskusi o počítačové a nepočítačové lexikografii a lexikologii dochází v současné vývojové situaci, charakterizované zde v úvodu, docela zákonitě. Při zpoždění, které u nás má první z nich, a nejen ona, vinou omezenosti bývalého systému, je třeba zaměřit se na pozitivní reálné promyšlené kroky, teoretické i praktické a organizační, a na pracovní úsilí charakteristické právě pro lexikografy. Bez kolektivu znalců lingvistické problematiky výkladového slovníku nelze úspěšně a fundovaně dělat ani výkladový slovník počítačový.[*]

 

LITERATURA

 

Bernet, Ch. – Rézeau, P.: Dictionnaire du frinçais parlé. Paris 1989.

Collins Cobuild English Language Dictionary. Ed. J. Sinclair. London – Glasgow 1987.

Čermák, F.: Paradigmatika a syntagmatika slovníku: problémy a možnosti. SaS, 53, 1992, s. 249–264.

Čermák, F.: Komputační lexikografie. In: Manuál lexikografie. Red. F. Čermák – R. Blatná. Praha 1994 (v tisku).

Čermák, F. – Králík, J. – Pala, K.: Počítačová lexikografie a čeština (počítačový fond češtiny). SaS, 53, 1992, s. 41–48.

Daneš, F. – Hlavsa, Z. a kol.: Větné vzorce v češtině. Praha 1981.

Duden. Das große Wörterbuch der deutschen Sprache in 6 Bänden. Red. G. Drosdowski. Mannheim – Wien – Zürich 1976–1981.

Filipec, J.: Lexikálně sémantická výstavba hesla – ústřední otázka lexikografické práce. SaS, 18, 1957, s. 129–150.

Filipec, J.: Akademický Příruční slovník jazyka českého dokončen. SaS, 19, 1958, s. 211–224.

Filipec, J.: Česká synonyma z hlediska stylistiky a lexikologie. Praha 1961.

Filipec, J.: K úkolům české lexikologie. SaS, 29, 1968a, s. 259–276.

Filipec, J.: Zur innersprachlichen Konfrontation von semantischen Teilstrukturen im lexikalischen System. TLP, 3, 1968b, s. 105–118.

Filipec, J.: Kodifikace a slovník. In: Aktuální otázky jazykové kultury v socialistické společnosti. Red. J. Kuchař. Praha 1979, s. 190–197.

Filipec, J.: Naše současná společnost, slovní zásoba s slovníky. , 75, 1992a, s. 1–11.

Filipec, J.: Kommunikativ-pragmatische Aspekte der Lexikologie. In: Beiträge zur Phraseologie, Wortbildung, Lexikologie. Red. R. Große – G. Lerchner – M. Schröder. Frankfurt a. M. aj. 1992b, s. 179–188.

Filipec, J.: Teorie a praxe výkladového slovníku. In: Manuál lexikografie. Red. F. Čermák – R. Blatná. Praha 1994 (v tisku).

Filipec, J. – Čermák, F.: Česká lexikologie. Praha 1985.

Fillmore, Ch. J.: Frames and the semantics of understanding. Quaderni di Semantica, 6, s. 222–254. Rus. v Novoje v zarubežnoj lingvistike, 23. Moskva 1988, s. 52–92.

Gorodeckij, B. J.: Kompjuternaja lingvistika: modelirovanije jazykovogo obščenija. In: Novoje v zarubežnoj lingvistike, 24. Moskva 1989, s. 5–31.

Gougenheim, G.: Dictionnaire fondamental de la langue française. Paris 1961.

Havránek, B.: Studie o spisovném jazyce. Praha 1963.

Jelínek, J. – Bečka, J. V. – Těšitelová, M.: Frekvence slov, slovních druhů a tvarů v českém jazyce. Praha 1961.

[141]Kořenský, J.: Teorie přirozeného jazyka. Praha 1989.

Kořenský, J.: Teoretická jazykověda a komunikačně orientovaný výzkum řeči. SaS, 53, 1992a, s. 97–103.

Kořenský, J.: K otázce procesuálního pojetí slovní zásoby. SaS, 53, 1992b, s. 265–272.

Kratochvíl, J. – Bartoš, E.: Soustava a jména živočichů. Praha 1954.

Macháčková, E. – Svozilová, N.: Slovesná valence ve slovnících. SaS, 51, 1990, s. 219–229.

Malá československá encyklopedie, 1–6. Praha 1984–1987.

Mluvnice češtiny, 2. Tvarosloví. Red. M. Komárek – J. Kořenský – J. Petr. Praha 1986.

Mluvnice češtiny, 3. Skladba. Red. F. Daneš – M. Grepl – Z. Hlavsa. Praha 1987.

Němec, I.: Vědecké a technické možnosti rozvoje české lexikografie. SaS, 53, 1992, s. 48–55.

Panevová, J. – Sgall, P.: Předpoklady počítačového zpracování češtiny. JazAkt, 24, 1987, s. 58–60.

Savický, N.: O perspektivách počítačové lingvistiky a jejím vztahu k obecné jazykovědě. JazAkt, 24, 1987, s. 61–63.

Selfridge, M.: Integrated processing produces robust understanding. Computational Linguistics, 12, 1986, s. 89–106. Rus. v Novoje v zarubežnoj lingvistike, 24. Moskva 1989, s. 161–208.

Sgall, P.: Teoretická lingvistika a výzkum komunikace. SaS, 53, 1992, s. 87–96.

Schank, R. – Birnbaum, L. – Mey, J.: Integrating semantics and pragmatics. Quaderni di Semantica, 6, 1985. Rus. v Novoje v zarubežnoj lingvistike, 24. Moskva 1989, s. 32–47.

Slovník české frazeologie a idiomatiky. Přirovnání. Red. F. Čermák – J. Hronek – J. Machač. Praha 1983.

Slovník spisovné češtiny pro školu a veřejnost. Red. J. Filipec – F. Daneš. Praha 1978. Zkr. SSČ.

Slovník spisovného jazyka českého, 1–4. Red. B. Havránek et al. Praha 1960–1971. Zkr. SSJČ.

Staročeský slovník (dosud na-povolánie). Red. B. Havránek – J. Petr. Praha 1977–. Zkr. StčSl.

Trávníček, F.: O jazykové správnosti. In: Čtení o jazyce a poezii. Red. B. Havránek – J. Mukařovský. Praha 1942, s. 103–228.

Trésor de la langue française 1-. Red. P. Imbs. Paris 1971-.


[1] Jde hlavě o tyto články: Čermák – Králík – Pala, 1992, s. 41–48; Němec, 1992, s. 48–55; Sgall, 1992, s. 87–96; Kořenský, 1992a, s. 97–103 a 1992b, s. 265–272; Čermák, 1992, s. 249–264. Srov. i dřívější práce: Panevová – Sgall, 1987; Savický, 1987.

[2] „Rozhodujícím východiskem veškeré činnosti s korpusem je vědomí, že vše v ní závisí na úrovni softwaru a že ten zatím dramaticky za vývojem hardwaru bohužel zaostává“, Čermák, 1994, 1.3.

[3] Srov. k tomu Bernet – Rézeau, 1989.

[4] Srov. sv. Přirovnání, s. 10: opírá se „o průběžně doplňovaný (to už však v době práce na tomto svazku neplatilo!) lexikální archiv ÚJČ ČSAV a jeho speciální frazeologickou kartotéku“. K té jsem dal právě při přípravě SSČ podnět.

[5] Srov. SaS, 51, 1990, s. 224, pozn. 5: „využití celých větných kontextů z excerpovaného materiálu uloženého v lexikálním archivu ÚJČ od dokončení PS“.

[6] I Collins Cobuild English Language Dictionary uvádí mezi prameny autory až z let 1932 a 1926, s. XXIIb. O mluvčích různých generací se zmiňuje i Čermák, 1992, s. 254.

[7] Relativní stabilnost významu uznává i formulace v Mluvnici češtiny, 2, s. 11: „Vztah mezi výrazovými prostředky a fakty skutečnosti musí být zprostředkován relativně ustálenými (zdůrazňuje J. F.) obsahově-významovými prostředky, které jsou známy nejen mluvčímu, ale i posluchači.“

[8] Nelze se nepozastavit hned nad úvodním tvrzením: „(Slovník) je mentálním depozitářem všech diskrétních jazykových jednotek, tedy nominací …“ (s. 249, zdůrazňuje J.F.). Jde zde tedy o mentální slovník nebo o depozitář mentálních jednotek? Dále se totiž píše o praxi (popisných) slovníků, tedy nementálních. Slova slovník se tu užívá ve dvou různých významech (srov. rozlišení SSČ: slovník 1. proti 3. Jsou jednotky tohoto depozitáře opravdu všechny? Žádný mentální slovník neobsáhne všechny jazykové jednotky a podle autorova desatera „žádný slovník není úplný“ (s. 263). Jde jen o nominace? Např. u uváděných víceslovných konjunkcí typu kam co (s. 257)?

[9] Srov. Filipec – Čermák, 1985, s. 69n.; Schank, 1985; Novoje, s. 33; Sgall, 1992, s. 91: „prolínání sémantiky a pragmatiky ve významu“.

[*] Tento příspěvek byl přednesen 7. 4. 1993 v lexikologické sekci Jazykovědného sdružení za účasti PhDr. Jana Králíka, PhDr. Jana Kořenského, DrSc., a PhDr. Igora Němce, DrSc. Doc. PhDr. František Čermák, DrSc., byl o hlavních bodech informován telefonicky.

Slovo a slovesnost, ročník 55 (1994), číslo 2, s. 132-141

Předchozí Alena Macurová: Jazyk v komunikaci neslyšících (Předběžné poznámky)

Následující František Štícha: Čas korpusové lingvistiky