Pavel Novák
[Články]
К одной модели стилистического компонента языкового кодирования II / À propos d’un modèle du constituant stylistique du codage linguistique II
„Biology is advanced by the use, not the misuse of mathematics“ (J. G. Defares — I. N. Sneddon, Intr. to the Mathematics of Medicine and Biology).
V tomto příspěvku vyložím své stanovisko k Doleželově odpovědi (D2) na můj kritický rozbor (N) jeho koncepce „jazykového kódování“, zejm. „stylistické složky“ tohoto kódování (D1).[1]
[37]Souvislost mezi N, D2 a tímto příspěvkem je naznačena na začátku části druhé. Obsah první části by vlastně patřil před 2.1; přijaté rozvržení však umožňuje jít in medias res a navíc osvětlit Doleželův postoj k některým obecným otázkám matematické lingvistiky. Hlavní výsledek tohoto příspěvku je obsažen v 2.4.
1. V D2 s. 236 čteme: „Cílem mých pokusů je nalézt takový matematicko-logický model, který by umožnil zobrazit vzájemné vztahy a působení (? — P. N.) těchto elementárních pojmů teoretické stylistiky: výběrové alternativy, objektivní a subjektivní faktory kódování, stylové charakteristiky. K tomu jsem navrhl model náhodného automatu“[2] … „Protože sám nejsem matematikem, omezil jsem se v podstatě jen na návrh modelu a jeho lingvistickou interpretaci“ … „Další rozvinutí formální stránky modelu (jež je ovšem předpokladem jeho celkového rozpracování) spadá především do kompetence matematika.“ (Toto Doleželovo prohlášení budu postupně v části 1 komentovat.)
1.11 Markovův automat (v. pozn. 2) je pětice C = ⟨Σ, S, M, Y, Ψ⟩, kde Σ = {σl, …, σm} je konečná množina (vstupní abeceda), S = {so, …, sn} je konečná množina (vnitřních stavů), M je funkce zobrazující množinu S × Σ do [0,1]n + 1 (tabulka pravděpodobností přechodu) taková, že pro (s, σ) ∊ S × Σ
M (s, σ) = [po (s, σ), …, pn (s, σ)],
∅ ⩽ pi (s, σ),
Y je konečná množina (výstupní abeceda) a Ψ je funkce zobrazující množinu S do Y. (Množiny Σ, S a Y jsou vzájemně disjunktní.)
Automat „funguje“ („chová se“, „pracuje“) tak, že je-li ve stavu s a je-li na vstupu σ, může přejít do kteréhokoli si ∊ S, a pravděpodobnost přechodu do stavu si rovná se (i + 1)-ní souřadnici pi (s, σ) vektoru M (s, σ); při přechodu do stavu si produkuje výstupní symbol Ψ (si) (symbol jednoznačně přiřazený stavu si funkcí Ψ). Automat tak převádí řetězy nad Σ v řetězy nad Y (totožné délky).[3] (Příklad viz N 2.32.)
1.12 Markovův automat je příkladem matematického systému. Několik jiných příkladů: pologrupa (druh algebry), částečné uspořádání (druh relativu), konečný automat, pravděpodobnostní automat, jazyk ve smyslu Kulaginové, nekontextová gramatika, potencionální fonetický systém ve smyslu Marcusově a kód.[4] Takový systém je vymezen jako posloupnost množin [38]a relací (funkcí, operací),[5] které popř. vyhovují jistým podmínkám (tzv. axiómům, k nimž lze počítat i vymezení vztahu mezi jednotlivými členy systému dané jeho definicí).
Množina teorémů (vět ve smyslu matematickém) vyplývajících z definice jistého matematického systému (z jeho axiómů) tvoří teorii tohoto systému (např. teorii grup, teorii svazů).[6] Místo o budování teorie matematického systému, tj. formulování a dokazování příslušných teorémů,[7] se někdy mluví o studování (vyšetřování) vlastností takového systému.
1.13 Praví-li se v D1 s. 230, že tam „nejsou studovány jiné vlastnosti modelu než ty, které umožňují formalizaci dvou základních typů selekce“, je třeba říci, že v D1 žádné vlastnosti Markovova automatu ve výše uvedeném smyslu prostě studovány nejsou. V D1 lze najít jen dvě problematická tvrzení, která by mohla být považována za konjektury, tj. návrhy dosud nedokázaných teorémů (k důležitějšímu z nich viz zde 1.31).
1.2 Pokud bychom zůstali v rámci (abstraktní) teorie jistého matematického systému, jsme v oblasti ryzí matematiky, nezávisle na tom, jak jsou definice a studium matematického systému geneticky motivovány. Pro empirickou vědu může mít takový matematický systém hodnotu teprve tehdy, je-li modelem reality, kterou daná věda zkoumá, resp. našich představ o této realitě. Matematickým (formálním) modelem nějaké oblasti objektů zkoumání empirické vědy se matematický systém stává teprve interpretací (úplnou nebo částečnou), tj. přiřazením empirických objektů, jejich (předpokládaných) vlastností a vztahů apod. jednotlivým členům matematického systému.[8]
1.21 Uveďme nyní znovu Doleželovu interpretaci, jíž se Markovův automat má stát modelem stylistického selektoru.
„Budiž Q = {q1,… qp} [tj. množina „objektivních faktorů“ kódování — P. N.] vstupní abeceda Σ, S = {so, …, sz} konečná množina vnitřních stavů selektoru [množina subjektivních faktorů? — P. N.], M (s, q)[9] matice pravděpodobností přechodu daného selektoru; abecedu alternativ A = { a, b, …, z} ztotožníme s výstupní abecedou Y.“ (D1 s. 230.)
Podle definice Markovova automatu a jeho fungování a podle Doleželovy interpretace se tedy v jeho modelu přechází z jednoho vnitřního stavu (subjektivního faktoru?) do jiného vnitřního stavu selektoru v souladu s pravděpodobnostmi danými působícím objektivním faktorem a předchozím vnitřním stavem a výběr alternativy je pak už jednoznačně dán současným vnitřním [39]stavem.[10] Soudím, že empirická neadekvátnost této představy je tak zřejmá, že ji nebylo a není třeba prokazovat.
1.22 Jak v této souvislosti rozumět slovům z D2 s. 236 citovaným zde na začátku 1 o dalším rozvinutí formální stránky modelu? Míní se jimi budování teorie (viz 1.12) anebo modifikace, zobecnění nebo specializace Markovova automatu (tedy v těchto třech posledních případech zavedení automatu nového typu)? — Avšak aby mohl mít teoretik stylistiky opravdový užitek z budování teorie Markovových automatů nebo ze zavedení automatu blízkého typu a budování jeho teorie, musilo by být zaručeno, že příslušný automat a jeho fungování při dané interpretaci přijatelně modeluje, zobrazuje přijaté pojetí stylistické složky jazykového kódování. Tomu však tak není, viz N 2.3 a zde 1.21.
1.23 Lze také říci, že jde při aplikaci matematických metod vlastně o „překlad“ problémů empirické vědy do jazyka matematiky. Tyto problémy se tak stávají problémy některé oblasti matematiky, teorie nějakého matematického systému. Přitom mohou nastat různé případy:[11] (a) na zmatematizovanou podobu empirické vědy je matematická odpověď už známa, (b) v opačném případě může jít buď (ba) o určitý problém týkající se dobře známého a prostudovaného matematického systému (jeho teorie), nebo (bb) takové pozadí pro řešení problému dosud neexistuje a příslušný matematický systém a jeho teorii je nutno teprve vytvořit (i v tomto posledním případě je však vždy k dispozici nejobecnější matematická disciplína — teorie množin).
V N 2.31 jsem při konfrontaci Doleželovy interpretace Markovova automatu a jeho předchozích výkladů tvrdil, že by Doležel musil mít pro každý akt výběru jiný automat (aspoň s jinou abecedou alternativ a jinou funkcí Ψ[12]), a k tomu jsem poznamenal: „Že si tuto skutečnost Doležel neuvědomuje, je vidět z toho, že vůbec neuvažuje, jakým způsobem by tyto automaty byly na sebe napojeny.“ K tomu nyní Doležel: „Ve skutečnosti jsem ovšem o zmíněném napojení automatů neuvažoval proto, že jde, jak jistě i Novák uzná, o problém, který je obtížný i pro vyspělého matematika“ (D2 s. 238). Avšak obtížnost řešení, která je ovšem relativní, je v této souvislosti věc vedlejší. Je-li napojení automatů důležité pro adekvátní popis stylistické etapy jazykového kódování, měl Doležel problém aspoň zaznamenat, „uložit“ matematikům (jak jinde [40]činí). Šlo by o úlohu typu bb); ovšem Doležel by musil formulovat na ono napojení nějaké empiricky motivované požadavky.
1.3 Jakákoli interpretace matematického systému však ještě nemusí být zárukou toho, že se příslušným konkrétním matematickým modelem vyslovují o modelované skutečnosti („originálu“) nějaká tvrzení, hypotézy, které je dále možno (a nutno) ověřovat.
1.31 V této souvislosti je důležité si uvědomit, že nerozlišujeme-li jasně matematický systém chápaný jako model a jeho originál, nemáme nikdy jistotu, že se nám do matematického systému nevkrádají zbožná přání, něco, co bychom podle empirické motivace chtěli v matematickém systému mít, ale co v něm nemáme zaručeno; pak se užívání matematického aparátu, které by mělo vést k potřebné přesnosti, míjí účinkem.[13]
Avšak tuto distinkci právě Doležel zanedbal. Po souvětí, jež jsem zde citoval v 1.21, následuje brzy věta: „Po r krocích generuje selektor řetězec symbolů o délce r, který se vyznačuje určitým rozložením pravděpodobností ω (A).“ Toto tvrzení (v D2 s. 237 označené jako předpoklad o fungování automatu), připojené jako naprostá samozřejmost, mohlo by být oprávněno jen potud, pokud by byl jeho abstraktní korelát součástí teorie příslušného matematického systému.
Nechť f (ai) je relativní četnost symbolu ai v řetězu, o němž je řeč. Je otázka, dovedeme-li na základě definice automatu a jeho fungování obecně udat pravděpodobnost výskytu symbolu ai, v řetěze délky r, jíž by relativní četnost výskytu symbolu ai odpovídala. V N 2.41 jsem ukázal, že k tomu, aby mohl Doležel na tuto otázku odpovědět kladně, musilo by být známo jisté zobecnění teorie Markovových řetězců pro Markovovy automaty (jichž jsou tyto řetězce speciálním případem).[14]
1.32 Jak dbá Doležel o vazbu svého modelu s empirií, je patrno ze slov, jako jsou tato: „Posuzováno z hlediska výběrových alternativ, musí být přirozeně pro každou množinu alternativ zadány příslušné funkce.“ … „Zadání příslušných funkcí je nepochybně těžký problém, avšak nedotýká se samé adekvátnosti modelu“ (D2 s. 238).[15]
Avšak adekvátnosti modelu se týká jistě otázka, zda je zadání příslušných funkcí zásadně možné. Jak by chtěl Doležel zjišťovat pravděpodobnost, s níž přejde selektor z vnitřního stavu (subjektivního faktoru kódování) s do vnitřního stavu s', působí-li zároveň objektivní faktor kódování q (viz N 2.31 a zde 1.21)? (Toto přecházení je pouze fikcí jeho „modelu“, při mluvení mu nic neodpovídá, a není tedy empirický podklad pro stanovení „příslušných“ pravděpodobností.)
2. Konstatování uvedené zde v 1.21 mi bylo v N jedním z argumentů pro tvrzení (I), že tzv. Markovův automat není, interpretujeme-li ho tak jako Doležel, matematickým modelem stylistické [41]složky jazykového kódování, jak ji pojímá Doležel (N 2.3).[16] Toto tvrzení jsem opíral o konfrontaci předchozích Doleželových výkladů s definicí Markovova automatu a Doleželovou interpretací tohoto automatu. Na to, že je taková konfrontace namístě, soudím z těchto důvodů. Úvodní věta k D1 III.4 zněla: „K zobrazení obecných vlastností a činnosti selektoru lze použít abstraktního náhodného automatu.“ Z ní, dále z toho, že předtím popisované vlastnosti a činnost selektoru jsou zcela obecného rázu, z toho, že se jiné obecné vlastnosti selektoru v D1 III.4 už neuváděly, a z předpokladu, že by jednotlivé partie D1 spolu měly souviset, jsem usoudil, že v D1 III.4 chce Doležel podat matematický model toho, co předtím v D1 I—III.3 vyložil neformálním způsobem (viz popis operace výběru v D1 224—225 a v N 2.12). Pokud měl Doležel na mysli jen část zmíněných obecných vlastností a činnosti selektoru nebo nějaké jiné obecné vlastnosti a jinou činnost selektoru, měl to výslovně říci. Výsledky zmíněné konfrontace jsou uvedeny v N 2.31, kde se tvrzení (I) zdůvodňuje, kdežto příklad automatu a jeho fungování v N 2.32 je uvedeno jen pro ilustraci.
[Tvrzení (I) se týkají Doleželovy body 1 a 2.]
Vedle toho jsem prokázal tvrzení (II), že vztah Doleželových stylových parametrů a stylových charakteristik není vztahem teoretických rozložení pravděpodobností a empirických rozložení četností (N 3.1).[17] Opíral jsem je o jistý výklad výrazu stylový parametr (viz N 2.42), Doleželovy „formální“ definice vlastností stylových charakteristik a o konfrontaci obojího s jím uváděnými příklady stylových charakteristik.
[Tvrzení (II) se týká Doleželův bod 3.]
Obě mé kritické připomínky Doležel odmítá:[18] Svým bodem 1 dokládá Doležel své tvrzení a), že jsem prostě nepochopil hlavní cíl jeho modelu:
„Novák trvá na tom, že můj model selekce má být modelem konkrétního výběrového aktu a že by tedy měl zobrazit výběr jednoho prvku z abecedy alternativ.“ … [Avšak] „v mém modelu selekce“ … „nejde o zobrazení konkrétního výběrového aktu; selektor má fungovat tak, aby generoval (? — P. N.) stylové parametry jako obecná (? — P. N.) rozložení pravděpodobností alternativ, odpovídající proměnlivým podmínkám kódování“ (D2 237);[19]
a všemi třemi body dokládá své tvrzení b), že jsem nepochopil model sám:
„Novák mou koncepci zkreslil tím, že vytrhl model stylistické selekce z vícestupňo[42]vého schématu jazykového kódování a interpretoval ho jako primitivní generativní gramatiku“ (D2 s. 239 a jinými slovy s. 237, 3. odst., b).[20]
Tím, že ukáži na slabiny Doleželových bodů 1 až 3, odpovím na námitky proti mým tvrzením (I) a (II) a tím i na to, co Doležel považuje ze zdůvodnění svých tvrzení a) a b) (nechávám stranou otázku, zda jde o skutečné jejich zdůvodnění).
Přísně vzato, nemusil bych se body 1 a 2 vůbec zabývat: i kdyby v nich měl Doležel pravdu, jiné mé argumenty pro tvrzení (I) byly v D2 zcela pominuty (viz zde 1.21).
2.1 K Doleželovu bodu 1
V tomto bodě probírá Doležel především můj příklad z N 2.32 (nikoli námitky v obecné podobě). Potíž je v tom, že se Doležel vyjadřuje, jako kdyby v N nebyla vyslovena a motivována řada námitek: zejména užívá výrazu stylový parametr, ujasnění jehož významu jsem věnoval téměř celý N 2.42, a ignoruje celý můj odstavec 2.41, věnovaný poslední větě předposledního odstavce z D1 s. 230, která má v D2 1 základní úlohu.
Doležel se prostě vyjadřuje, jako by byl prokázal nesprávnost mých právě zmíněných rozborů. To však neučinil, a proto na ně znovu odkazuji.
Zvláště instruktivní by bylo podrobně probrat tu pasáž z D2, v níž Doležel ukazuje, jak by bylo třeba „v duchu jeho koncepce“ vykládat můj příklad selektoru a jeho fungování z N 2.32. Na potíže narážíme už při počátečních slovech: „Při kódování sdělení o r slovech …“ (s. 237). Avšak v mém příkladu šlo o jeden selektor, tedy o jednu množinu výběrových alternativ, nikoli o více selektorů; aby mohl Doležel obecně hovořit o kódování sdělení ve svém modelu, musil by mít formálně zvládnuty všechny etapy svého jazykového kódování, včetně napojení automatů, zmíněného zde v 1.23. — Je však třeba připomenout, že jakékoli Doleželovy připomínky k výkladu příkladu z N 2.32 nemohou nic napravit: je-li dána definice příslušného automatu, jeho fungování a jeho interpretace, je dán i „výklad“ příkladů.
Další Doleželovy formulace z D2 1 byly zde probrány v 1.23 a 1.32.
2.2 K Doleželovu bodu 2
„Novák vytýká, že v mém modelu nemá svůj protějšek empirická množina E (množina mimojazykových událostí, jež vstupují do operace kódování). Prosté nahlédnutí do mých schémat (s. 225 a 233) by mu však ukázalo, že stylistický selektor nemá žádné přímé spojení s množinou E, a že tedy tato množina nepatří k základním pojmům stylistiky, jež mají být v modelu zobrazeny. Stylistická selekce se týká výběru alternativních jazykových prostředků, nikoli výběru mimojazykových skutečností“ (D2 2).
Za prvé, nevytýkal jsem, že v modelu nemá svůj protějšek množina E, nýbrž množina E všech mimojazykových událostí (které má celé Doleželovo jazykové kódování zachytit, k tomu viz N 2.13). Z toho a ještě z jiné skutečnosti (viz N 2.31) jsem vyvodil, že by Doležel musil mít pro každý akt výběru jiný automat, o němž v D1 nebyla zmínka a což Doležel nyní v poněkud zastřené podobě přiznává (viz D2 s. 238, 2. odst.; k tomu srov. zde pozn. 12).
Za druhé, s prostým nahlédnutím do Doleželových schémat to není tak jednoduché: Co se týče schématu ze s. 225, je třeba říci, že i když stylistická složka (srov. schéma v N s. 32) nemá přímé spojení s množinou E = {e1, …, es} (viz D1 I.2 a N 2.11), je jasné, že se stylistická selekce, aspoň její část 2a, týká výběru alternativních prostředků pro jistou mimojazykovou „událost“. Co se pak týče tabulek na s. 231, není z nich jasné, co mají zachycovat. V N [43]2.132 a 2.42 jsem jisté pojetí navrhl (Doležel je nechal bez povšimnutí). Evidentním nedostatkem jeho tabulek ze s. 231 je právě to, že na nich není (v obecné formě) označeno, k jaké mimojazykové události se vztahují (kdežto na tabulce N s. 34 takové označení je).
Zde je dobře vidět, že přihlížím ke spojení stylistické složky Doleželova jazykového kódování se složkami ostatními, konkrétně se složkou předcházející, a že ji neizoluji, jak tvrdí Doležel. V tomto bodě tedy Doležel nepřesně reprodukoval mé výtky, opět zcela pominul příslušné výklady z N a k meritu věci se nedostal.
2.3 K Doleželovu bodu 3
„Zcela nepochopitelného posunu se Novák dopustil v odst. 3.1“, praví se v D2 3 a následuje delší citát z onoho odstavce. Především jsem na konci N 2.12 čtenáře žádal, aby si všechna konstatování týkající se složek 1 a 2a promítl i pro složky 3 a 2b (k označování složek viz D1 I.2). Nechť tedy čtenář vyhoví mé výzvě a výsledkem bude tato úprava: Jak mohou být tyto různé charakteristiky „empirickým obrazem“ Doleželových parametrů, které zachycují pravděpodobnosti výskytu pojmenování (mimojazykových událostí) a pravděpodobnosti výskytu funkčně ekvivalentních syntaktických konstrukcí?[21]
Doleželovy výklady z D2 3 odst. 2 můžeme tedy pominout jako bezpředmětné. I kdyby však byl měl Doležel pravdu, že bych byl jeho koncepci zkreslil zanedbáním skutečnosti, že jeho pojem abecedy alternativ je obecný (tj. zahrnuje jak alternativy pojmenování, tak alternativy syntaktické konstrukce), rozhodující je, zda by po odstranění tohoto omylu moje otázka o charakteru vztahu Doleželových parametrů a stylových charakteristik trvala či nikoli.
Stručně se k této otázce, na niž jsem odpověděl tvrzením (II) záporně, vrátím. Aby na ni bylo možno odpovědět kladně, musely by být totiž splněny jisté věcné i formální předpoklady.
2.31 Interpretačně vzato, musilo by jít o „stejné“ jevy. Ukažme si věc na příkladě. Podle L. F. Pičurina[22] se rozdělení četností délek věty řídí tzv. logaritmickonormálním zákonem. Jde v podstatě o toto: Provedeme-li rozbor dostatečně dlouhého textu, získáme rozložení četnosti délek věty. Vypočítáme-li střední hodnotu a rozptyl a dosadíme je do příslušného vzorce, dostaneme teoretické hodnoty, kterých mají — podle tohoto zákona — nabývat pravděpodobnosti výskytu vět různých délek. Tyto teoretické hodnoty můžeme pak konfrontovat se skutečnými empirickými hodnotami (i těmi, z nichž jsme střední hodnotu a rozptyl počítali) a podle známých matematickostatistických postupů jejich vztahy hodnotit. Je však jasné, že o nic podobného u Doležela nejde. U něho se teoretické hodnoty týkají podmíněných pravděpodobností výskytu jistých alternativních jazykových prostředků, zatímco jako příklady stylových charakteristik uvádí např. průměrnou délku věty, predikční entropii a poměr počtu sloves k počtu adjektiv (tzv. Busemannův koeficient).
[44]2.32 Jaké jsou pak formální podmínky, aby bylo vůbec možno konfrontovat Doleželovy stylové parametry (k významu tohoto výrazu srov. D1 s. 231 a N 2.42) a empirické hodnoty stylových charakteristik? Jistě stejný počet řádků v příslušných tabulkách a stejné rozmezí hodnot v nich. Z hlediska obou těchto aspektů je jasné, že by nebylo možno konfrontovat žádnou známou stylovou charakteristiku. Co se počtu řádků týče, jednoduše srov. tabulky stylových charakteristik (N 1.2), v nichž je jen jedna řádka, a tabulky D1 na s. 231, které musí obsahovat aspoň dvě řádky (aby bylo možno mluvit o výběru). Co se pak rozmezí hodnot týče, mohou stylové charakteristiky nabývat hodnot dost rozmanitých, např. průměrná délka věty může být vyjádřena reálným číslem větším než 1, kdežto v tabulkách ze s. 231 jde o pravděpodobnosti, a tedy o čísla v intervalu [0,1].
2.4 Mohu tedy učinit závěr: Doležel v D2 má tvrzení (I) a (II), která považuji za zásadní kritické připomínky k jeho koncepci jazykového kódování, odmítl, avšak oprávněnost tohoto odmítnutí neprokázal; jistá tvrzení sice jako argumenty uvedl, avšak ta neodpovídají skutečnosti.
2.5 Chceme-li se k Doleželově práci vyslovit s maximální dobrou vůlí, lze uvést tuto domněnku: Uvažujme všechny dosud navržené stylové charakteristiky. Není vlastně racionálním jádrem Doleželovy koncepce hledání takové z nich, popř. zavedení nějaké stylové charakteristiky nové, z jejichž hodnot by bylo možno „odvodit“ — na základě analytických vztahů — hodnoty pro co největší počet stylových charakteristik jiných?[23]
3. V závěru D2 vysvětluje Doležel domnělé zkreslení jeho koncepce z mé strany mým domnělým metodologickým a teoretickým „monotheismem“, „který uvádí pojmy a termíny rozebírané soustavy mechanicky na pojmy a termíny jediné, ‚zadané‘ soustavy, resp. interpretuje je ve smyslu této soustavy“ a který se „v konkrétní situaci naší matematické lingvistiky“ … „projevuje především apriorním odmítáním statistických metod a probabilistních modelů a jednostranným vyzdvihováním určité soustavy generativní gramatiky“. Proti němu vyhlašuje přístup svůj, řekněme metodologický a teoretický „polytheismus“, hlásající: nechť jsou „vyhledávány a používány nejrůznější matematické metody a modely adekvátní analyzované a vykládané jazykové skutečnosti“.[24]
Jsem v tomto smyslu metodický polytheista, podobně jako I. I. Revzin a mnoho jiných.[25]
Aplikaci matematických metod v lingvistice spatřuji v nacházení, konstruování, studiu a ověřování matematických modelů lingvistických objektů (předmětů lingvistického zkoumání). Tato aplikace má vést k „lepšímu“ popisu, „hlubšímu“ rozboru a chápání jazyka a jeho fungování, než byl popis, rozbory a chápání dosavadní, nebo aspoň vytvářet pro takový popis atd. předpoklady. Toto pojetí k žádným omezením co do výběru matema[45]tických systémů a metod užitečných pro lingvistiku nevede a ani vést nemůže. Zato však vede k uvědomění takových otázek, jako je otázka vztahu lingvistické teorie a faktů (v našem případě jistých kvantitativních ukazatelů textů) a v neposlední řadě otázka, co vlastně chce autor modelovat a za jakým účelem (k tomu viz zde pozn. 19).[26]
4. Závěrem své odpovědi prohlásil Doležel polemiku pro sebe za ukončenou (D2 pozn. 4). Je pravda, že studie a články z oboru matematické lingvistiky bývají u nás dosud daleko spíše předmětem citací než kritické diskuse. Doležel se octl proti očekávání v situaci do jisté míry výjimečné, a je tedy možno pochopit i udaný důvod tohoto jeho prohlášení, byť byl tak velmi geografický.
Nicméně jsem toho názoru, že naše debata i tak dosáhla jistého výsledku. Pokusil jsem se ve svých výkladech odstranit „matematické“ překážky k tomu, aby pracovníci zainteresovaných oblastí lingvistiky, zejména teorie stylistiky, mohli sami posoudit, zda a v čem jsou Doleželovy návrhy pro tyto obory přínosem. Doleželova jediná odpověď prokazuje pak dostatečně zřetelně, že dalšího objasňování těchto návrhů z autorovy strany ani netřeba: nové písemné rozklady by přinesly jen to, co pozorný čtenář již ví.[27] Mohu se proto připojit k Doleželovu prohlášení a diskusi uzavřít i za sebe.
R É S U M É
In N (cf. footnote 1) it was shown (I) that the so-called Markov automaton does not represent under Doležel’s interpretation a formal model of stylistic component of language encoding as had been formulated in D1 and (II) that the relation between Doležel’s style parameters and style characteristics is not that between the theoretical probability distribution and the empirical frequency distribution.
In this paper the items (1) — (3) of D2 are being proved false; Doležel’s arguments ignore the relevant points of N and are based partly or misunderstanding of those passages of N he mentions.
The actual discussion is preceeded by a more general part dealing with the Doležel’s attitude to some basic problems of applying mathematics in linguistics.
A main point left in D2 entirely aside is this: From the definition of the Markov automaton and from its interpretation given in D1 it follows that in Doležel’s model the transition from one inner state of the „selector“ to another inner state is carried out in compliance with the probabilities given by the given „supraindividual factor“ (supraindividual condition of encoding) and by the proceeding inner state; the choice of alternatives is then uniquely given by the present inner state. This conclusion, however, lacks any empirical support.
[1] Užívám těchto zkratek: D1 — L. Doležel, Model stylistické složky jazykového kódování, SaS 26, 1965, 223—235; N — P. Novák, K jednomu modelu stylistické složky jazykového kódování, SaS 27, 1966, 29—40 (k tomu viz red. pozn. tamtéž s. 192, v níž bylo opraveno několik rušivých tiskových chyb); D2 — L. Doležel, Ještě k jednomu modelu jazykového kódování, tamtéž 236—239. Číslicemi bez předchozí zkratky odkazuji na jiné místo tohoto příspěvku. — Užité matematické symboly jsou vyloženy v N pozn. 5. V citovaných úryvcích jsou vypuštěny číslice odkazující k poznámkám originálu; poznámky k citovaným úryvkům jsou mé. V těchto citátech jsou také mlčky upraveny indexy s ohledem na tento příspěvek jako celek.
[2] V N 2.2 jsem ukázal, že matematickým systémem (viz zde 1.12). který Doležel navrhuje jako model stylistické složky jazykového kódování, není pravděpodobnostní automat Rabinův (pro nějž užívá Doležel nevhodný název náhodný automat, viz N pozn. 28), nýbrž tzv. Markovův automat. Doležel však nadále užívá pro oba automaty téhož názvu (náhodný automat).
[3] Uvedená definice Markovova automatu se od původní definice Ju. A. Šrejdera Modeli obučenija i upravljajuščije sistemy, dodatek ke knize R. R. Buš - F. Mosteller, Stochastičeskije modeli obučenija (překlad z angl.), Moskva 1962, s. 469, liší jen způsobem vyjadřování. Symbol [0,1] označuje uzavřený jednotkový interval 0 ⩽ x ⩽ 1 a [0,1]n + 1 množinu všech (n + 1) -tic ⟨ xon, … x⟩, kde 0 ⩽ xi ⩽ 1.
[4] Obecnou definici algebry a relativu viz např. u H. Hermese Einführung in die Verbandstheorie, Berlin 1955, s. 153. K ostatním uváděným systémům viz po řadě např. K. Pala - M. Sedláčková, Nové práce N. Chomského a G. A. Millera v příručce matematické psychologie, SaS 27, 1966, 74; N s. 34; A. Jaurisová - M. Jauris, Užití teorie množin v jazykovědě, SaS 21, 1960, 35; B. Palek, Informace o transformační gramatice, SaS 24, 1963, 143; S. Marcus, Lingvistică matematică, Bukurešť 1963, s. 59 (český překlad má vyjít v nakl. Academia); E. F. Assmus, H. F. Mattson, Error-Correcting Codes: An Axiomatic Approach, Information and Control 6, 1963, 316.
[5] K výrazům relace a operace viz např. L. Nebeský - P. Sgall, Relace a operace v syntaxi, SaS 26, 1965, 218.
[6] Viz N. Bourbaki, Architektura matematiky (originál francouzsky), Pokroky matematiky, fyziky a astronomie 5, 1960, 513.
[7] Může však jít o zkoumání vztahů mezi různými matematickými systémy; např. z teorie gramatik jsme zvyklí na to, že se definují jisté typy gramatik a pak se zkoumají jejich vztahy na základě srovnávání množin jazyků, které jsou tyto gramatiky schopny generovat.
[8] Viz nověji K. Čulík, On mathematical models and the role of mathematics in knowledge of reality, Kybernetika 2, 1966, 1—13, dále překladový sborník Teorie modelů a modelování (pod red. K. Berky a L. Tondla; vyjde v nakl. Svoboda).
[9] Nepřesné: M je matice (tabulka) pravděpodobností přechodu, M (s, σ) je vektor, srov. definici Markovova automatu; srov. N pozn. 36.
[10] Dokonce viz D1 s. 230, druhé souvětí předposledního odstavce a D2 s. 238, 1. ř. sh.
[11] Srov. W. Karush, The use of mathematics in the behavioral sciences, v sb. P. Garvin (ed.), Natural languages and the computer, New York — San Francisco — Toronto — London 1963, s. 67—83.
[12] K tomu v D2 s 238: „První část úvahy je nepřesná, správná cesta je naznačena v závorce.“ Proč má být první část úvahy nepřesná, když je „jen“ obecná: to, co jsem uvedl v závorce, je speciálním případem toho, o čem je řeč před závorkou; vždyť automaty, které se od sebe liší funkcí Ψ, jsou podle definice různé automaty (i když stejného typu). — Doleželův poměr k odborné, zejm. matematické terminologii jsem obecně charakterizoval v závěru k N. Ještě několik ukázek: V D1 pozn. 2 Doležel naznačuje, že užívá výrazu událost „ve smyslu teorie informace“. Avšak (a) tento výraz se obyčejně za termín této teorie nepokládá, k výjimkám patří S. Goldman, Teorija informaciji (překlad z angl.), Moskva 1957, (b) i tento autor (např. s. 10) užívá tohoto výrazu tak, že lze mluvit o pravděpodobnosti jisté události pro příjemce sdělení (před přijetím sdělení, jakož i po přijetí). Avšak projdeme-li užití výrazu událost v D1, vidíme, že Doleželův úzus není zase v souhlase s b). — K výrazu náhodný automat viz zde pozn. 2 (navíc proč angl. probabilistic překládat nepatřičně jako náhodný (= angl. random), a jindy opět říkat probabilistní místo zavedeného pravděpodobnostní?). — K výrazu denotát (v D1, avšak znovu i v D2 s. 238!) viz N pozn. 15. K výrazu generativní gramatika viz zde pozn. 28. — Jako terminologické upozornění byla míněna i moje poznámka, na niž Doležel reaguje v D2 s. 237, 3. ř. sh. (prostě po výraze ω (A) schází výraz udávající a příslušné vysvětlení). — Zvláštního rozboru by si zasloužilo Doleželovo spojení generovat parametry a užívání výrazů předpoklad a synonymie.
[13] Srov. P. Novák, On mathematical models of linguistic objects, Prague Studies in Mathematical linguistics 1, 1966, 155—7. — Srov. též Ch. F. Hockett, Language, mathematics, and linguistics, sb. Current trends in linguistics III, Theoretical foundations (Th. A. Sebeok, ed.), The Hague — Paris 1966, s. 186.
[14] Šlo by o příslušné zobecnění tzv. occupation time problem, viz např. E. Parzen, Stochastic processes, San Francisco 19642, s. 211.
[15] V podobném tónu je i D1 III. 2. odst. 1, v němž se říká, že „výchozím pojmem každého modelu selekce je pojem množina (abeceda) výběrových alternativ“, že však vymezení této množiny je „nevyřešeným problémem“. Doležel místo aby jej řešil, ukládá řešení „teorii jazykového popisu“.
[16] V Doleželově podání: „Novák odmítá možnost navrhnout náhodný automat jako model stylistické selekce“… ( D2 1).
[17] Viz N 3.1, odst. 2 a 3; v D2 3 se uvádí jen citace z odst. 3.
[18] Celkem pozitivně hodnotí Doležel spíše popisné části z N, avšak kromě jediné výjimky, viz D2 s. 236, 3. odst., jich stejně nedbá.
[19] Zastával-li Doležel už dříve názor že „pravděpodobnostnímu modelu selekce nemůže jít o zobrazení konkrétní výběrové situace, nýbrž o zobrazení obecných podmínek, za nichž výběrové akty probíhají“ (D2 s. 237), neměl na začátku D1 III nadepsaného „Formální model“ vyslovovat předpoklad (a) že „selekce probíhá tak, že z množiny alternativních jazykových jednotek je vybírána jedna jednotka, která je v konkrétní situaci považována za optimální“, a zejména neměl v D1 III. 6b podotýkat, že „v modelu není studován problém optimálního stylistického výběru, jeho podmínek a kritérií“ a že „zde bude třeba model dále rozvíjet zavedením rozhodovacích procedur vedoucích k volbě optimální varianty“. Porovnejme uvedené citáty s prohlášením v D2 s. 236, 3. odst.
[20] Je známo mnoho typů generativních gramatik a všechny jsou definovány zcela přesně. V N o žádné generativní gramatice u Doležela nebyla prostě řeč.
[21] Dokonce by tato paralelní formulace mohla Doleželovi připomenout závažný problém uvedený v N pozn. 20: V Mathesiově formulaci citované v D1 s. 225 se mluví o „rozboru dané skutečnosti v úseky jazykově pojmenovatelné“, což — podle F. Daneše — nijak nevylučuje, že tyto úseky, a tedy i příslušná pojmenování, jsou v mysli mluvčího nějak navzájem vázány strukturou vyjadřované skutečnosti, a právě tyto vztahy by mohly pak být podkladem — mluveno Doleželovou terminologií — „operace usouvztažnění“.
[22] K voprosu o primenenii matematiki v jazykoznanii, VJaz 14, 1965, č. 4, 119—120.
[23] Tím také doplňuji N 3.1, odst. 4. K analytickým a syntetickým vztahům kvantitativních ukazatelů (a tedy i stylových charakteristik) viz P. Novák - M. Těšitelová, Kvantitativní lingvistika, v souboru P. Sgall a kol., Cesty moderní jazykovědy. Praha 1964, s. 129—130.
[24] Doležel konvertoval k tomuto „polytheismu“ poměrně nedávno, srov. ještě jeho pojetí matematické lingvistiky v zprávě Nové oddělení Ústavu pro jazyk český, NŘ 45, 1962, 104—105.
[25] Srov. např. jeho stať Strukturnaja lingvistika i jedinstvo jazykoznanija, VJaz 14, 1965, č. 3, s. 49. — K apriornímu odmítání (z předešlého odstavce): O kvantitativní lingvistiku se zajímám, jak je vidět např. z mé účasti na publikaci citované zde v pozn. 23. K jednostrannému vyzdvihování …: Každému, kdo sleduje naši lingvistickou produkci, musí být jasné, že tato výtka není opodstatněná.
[26] Srov. i F. Zítek, Aplikace matematiky v lingvistice a některé jejich „dětské nemoci“, Čs. rusistika 9, 1964, 113—116.
[27] Nevylučuji však účelnost uspořádat — po Doleželově návratu — diskusní večer o metodách naší matematické stylistiky, nejlépe na půdě Jazykovědného sdružení.
Slovo a slovesnost, ročník 28 (1967), číslo 1, s. 36-45
Předchozí Zdeňka Tichá: Několik poznámek k sémantické naplněnosti bezrozměrného verše
Následující Miroslav Mleziva: Problém označování a vyjadřování v logické sémantice
© 2011 – HTML 4.01 – CSS 2.1