en cz

K jednomu modelu stylistické složky jazykového kódování

Pavel Novák

[Články]

По поводу одной модели стилистического компонента языкового кодирования / À propos d’un modèle du composé stylistique du codage linguistique

Jak známo, věda nejen popisuje, ale hlavně vysvětluje. Také v kvantitativní lingvistice pozorujeme snahu nejen zavádět kvantitativní charakteristiky jazyka, stylu, autora aj. a zjišťovat jejich hodnoty, ale i odhalovat „mechanismus“, jehož působením kvantitativní charakteristiky nabývají svých hodnot.[1] Tímto směrem se nese i série programových statí L. Doležela, v nichž jde o „jazykové kódování“, zejména o jeho „stylistickou“ složku. Tato složka má podle D. vysvětlovat vlastnosti jisté skupiny kvantitativních charakteristik, tzv. stylových charakteristik.[2] Časově poslední Model stylistické složky jazykového kódování (SaS 26, 1965, 223—234)[3] má techničtější a konkrétnější ráz než práce ostatní, a dává proto možnost lépe postřehnout zásadní obrysy D-ovy koncepce.

Ve svém příspěvku uvádím k této koncepci některé kritické připomínky, po mém soudu zásadní. Mé kritické připomínky jsou převážně „imanentní“: zkoumám především koherenci D-ovy koncepce, nikoli otázku, zda a nakolik je D-ovo schéma jazykového kódování v souladu s poznatky psychologie řeči a příbuzných disciplín nebo i stylistiky a konec konců jazykovědy vůbec. V tomto příspěvku se tedy většinou vyjadřuji tak, jako bych D-ovo schéma jazykového kódování akceptoval. V jistém smyslu vytváří tedy můj příspěvek teprve předpoklady pro vlastní lingvistický rozbor D-ovy koncepce.

Stranou zatím nechávám také námitky, které lze mít proti onomu typu obecného pojetí pravděpodobnostních modelů, jehož je D. stoupencem.[4]

V části 1 se zabývám styl(ovými) charakteristikami, v části 2 schématem jazykového kódování, zejm. jeho styl(istickou) složkou a abstraktním, formálním zobrazením dvou složek tohoto schématu, v části 3 vztahem styl. charakteristik a schématu. Některé části jsou spíše popisné, tak celá část 1, dále 2.1, 2.2 a 3.2. Vlastní kritický rozbor je soustředěn do 2.3, 2.4 a 3.1.[5]

[30]1. Empirie (Stylové charakteristiky)

1.1 „… třídy sdělení[6] se mezi sebou liší určitými specifickými vlastnostmi, které nazveme vlastnostmi stylovými … Předpokládáme, že stylové vlastnosti jsou měřitelné anebo převeditelné na měřitelné vlastnosti. Jejich kvantitativním … vyjádřením jsou tzv. styl. charakteristiky“ (s. 226—227). Označme si nyní symbolem K_i třídu sdělení komunikačního okruhu i (1 ⩽ i ⩽ m), symbolem S_j třídu sdělení mluvčího j (1 ⩽ j ⩽ n) a symbolem S_ji třídu sdělení mluvčího j v komunikačním okruhu i. „Styl. charakteristiku budeme nazývat objektivní …, jestliže její hodnoty v určité třídě sdělení K_i jsou statisticky homogenní, tj. nevykazují statisticky významnou fluktuaci. Styl. charakteristiku budeme nazývat subjektivní …, jestliže její hodnoty v množině K_i vykazují významnou fluktuaci, avšak jsou statisticky homogenní v množině sdělení S_ji. Styl. charakteristiku budeme nazývat stacionární, jestliže v časovém průběhu sdělení bude statisticky stabilní“ (s. 227).[7] (Podobně jako D. omezíme se v dalším jen na charakteristiky stacionární.)

1.2 K prvním dvěma definicím je třeba poznamenat, že D. definuje vlastně pojmy ‚objektivní v K_i‘ a ‚subjektivní v K_i‘. Je tedy možné, aby jistá styl. charakteristika byla veskrze objektivní, tj. objektivní v K₁ až v K_m, jiná veskrze subjektivní, tj. subjektivní v K₁ až K_m, konečně jiná objektivní v jedněch komunikačních okruzích a subjektivní v druhých. Ve všech třech případech musíme ovšem dále lišit, zda je hodnota styl. charakteristiky stejná pro všechna K_i či nikoli. V prvním případě (veskrze objektivní) bychom tak dostali jednak D-ovy jazykové konstanty,[8] jednak styl. charakteristiky označené dále jako typ a. V případě druhém (veskrze subjektivní) bychom dostali styl. charakteristiky typu b a c, v případě třetím pak ještě větší množství typů, např. typ d.

Tabulka styl. charakteristiky typu a[9]

Komunikační okruh	K₁	K₂	…	K_m
Hodnota char.

[31]Tabulka styl. charakteristiky typu b[9a]

Mluvčí	M₁	M₂	…	M_n
Hodnota char.

Tabulka styl. charakteristiky typu c[10]

Kom. okruh	K₁			K₂			…	K_m
Mluvčí	M₁	…	M_n	M₁	…	M_n	…	M₁	…	M_n
Hodnota char.

Tabulka styl. charakteristiky typu d — průměrná délka věty[11]

Kom. okruh

…

novinářství

…

poezie

…

Mluvčí

⟨14,61 … 15,20⟩

Holub

…

Florián

Hodnota char.

10,32

14,26

2. Teorie (Jazykové kódování a jeho stylistická složka)

V této části předvedu D-ovo schéma kódování (2.1), budu charakterizovat formální systém, který má být formálním modelem styl. složky tohoto schématu (2.2), konfrontovat obé (2.3) a z hlediska výsledků této konfrontace podrobněji rozeberu jednu důležitou partii D-ovy práce (2.4).

2.1 Jazykovým kódováním rozumí D. „posloupnost operací,[12] jimiž vznikají sdělení (promluvy, texty) v přirozeném jazyce. … Základními úkoly teorie jaz. kódování jsou: 1. určit elementární jazykové jednotky, na nichž se provádějí kódovací operace,[13] 2. popsat pravidla …, jimiž se v procesu kódování vytvářejí ze slov výpovědi a z výpovědí sdělení“ (s. 223—224). (V rozebíraném článku má jít o popis etapy „slovo — výpověď.)

2.11 V procesu jazykového kódování musí být podle D. rozlišovány minimálně tři operace (viz obr. na s. 225): „1. Operace pojmenování: zadané množině mimojazykových událostí E = {e₁, e₂, …, e_r} se přiřazují jazyková zobrazení z konečné množiny slov V = {v_a, v_b, …, v_z}, jež má k dispozici kódovač. Slovo anebo skupinu[14] slov z V, které lze přiřadit elementární události e_i, budeme nazývat denotátem.[15] Ve shodě s jazykovou empirií předpokládáme, že ve většině případů je možno jedné elementární události přiřadit více denotátů významově ekvivalentních (synonymních).[16] Výsledkem operace pojmenování je tedy přiřazení podmnožiny denotátů V_i ⊂ V elementární události e_i. 2a. Operace výběru (selekce): z V_i se vybírá pouze [32]jeden denotát, pro daný případ optimální,[17] zatímco ostatní jsou eliminovány. Opakováním obou popsaných operací[18] dostáváme negramatikalizovanou (gramaticky neorganizovanou) posloupnost[19] denotátů … 3. Operace usouvztažnění: Gramaticky amorfní posloupnost denotátů se přetváří v gramatikalizovanou výpověď mající formu určité syntaktické konstrukce. Přitom je zpravidla možné transformovat jednu a touž posloupnost denotátů ve dvě anebo více syntaktických konstrukcí funkčně ekvivalentních (synonymních).[20] 2b. Operace výběru, analogická operaci výběru denotátů: v průběhu této operace je zvolena jedna syntaktická konstrukce, která je považována pro danou situaci za optimální“ (s. 224—225). Operaci pojmenování nazývá D. sémantickou složkou, operaci usouvztažnění — složkou syntaktickou a operaci výběru (zahrnující 2a i 2b) — stylistickou složkou jazykového kódování.

2.12 Později (v odd. III. 1) se pak styl. složka doplňuje takto: Předpokládá se, že „alternativní jednotky vstupují do selekce bez jakýchkoli pravděpodobnostních charakteristik. Výsledkem selekce je přiřazení určitých pravděpodobností výskytu jednotlivým alternativám“ (s. 229, „předpoklad“ c).[21] Poslední větu přitom nemůžeme chápat úplně doslova, neboť výsledkem selekce má být přece výběr jediné alternativy. D. tedy vlastně operaci výběru (2a) rozčleňuje na operaci přiřazení pravděpodobností výskytu a operaci vlastního výběru.

Po této D-ově modifikaci složky 2a si proto fungování složky 1 a 2a musíme představit jinak, než je uvedeno u D. na obr. ze s. 225, totiž takto:

událost		množina pojmeno- vání		pravdě- podobnost výskytu		vybrané pojmeno- vání
e₁ →	operace	→ V₁ →	operace	→ P (V₁) →	operace	→ v₁
e₂ →	pojmeno- vání	→ V₂ →	přiřazení pravdě- podobností výskytu	→ P (V₂) →	výběru pojmeno- vání	→ v₂
∙		∙		∙		∙
∙		∙		∙		∙
∙		∙		∙		∙
e_r →		→ V_r →		→ P (V_r) →		→ v_r

Události e_i se operací pojmenování přiřadí množina pojmenování V_i, později jsou prvkům množiny V_i přiřazeny pravděpodobnosti jejich výskytu jako pojmenování události e_i a opět podle přidělených pravděpodobností P (V_i)[22] je později vybrán jediný prvek v_i z množiny V_i.

[33]Podobné modifikace by bylo přirozeně nutno provést i pro složky 3 a 2b. Z úsporných důvodů si obou těchto složek přestaneme všímat. Čtenář nechť si laskavě všechna konstatování týkající se složek 1 a 2a promítne i pro složky 3 a 2b.

2.13 Zatím jsme si nekladli otázku, podle jakého „předpisu“ probíhají operace pojmenování a operace přiřazení pravděpodobností výskytu (pro operaci vlastního výběru je odpověď jednoduchá, viz pozn. 22). O předpisu pro operaci pojmenování nepraví D. sice ve svých neformálních výkladech nic, ale je jasné, že to musí být předpis (označme si jej symbolem O) přiřazující každé mimojazykové události e z množiny všech mimojazykových událostí E[23] příslušnou množinu V' = O(e) možných pojmenování z množiny V (slov). Předpisu pro přiřazení pravděpodobností výskytu (označme si jej symbolem P) se týká D-ův „předpoklad“ b, že je selekce „řízena“ objektivními a subjektivními faktory.[24] Předpis P musí tedy každé mimojazykové události e, každému z jejích možných pojmenování v ∊ O(e) a jistým kombinacím objektivních a subjektivních faktorů přiřazovat pravděpodobnost výskytu pojmenování v. K tomu by ovšem bylo třeba mít soupis objektivních faktorů (množinu Q) a soupis subjektivních faktorů jednotlivých (typů) mluvčích (množinu S).[25] D. se jasně vyslovuje v tom smyslu, že může působit více objektivních faktorů současně (s. 231, 7. ř. sh.), a podle toho, které příklady subjektivních faktorů uvádí, lze předpokládat, že je tomu stejně i s faktory subjektivními.

2.131 Jsme nyní schopni uvést abstraktní strukturu soustavy Z, podle níž by D-ova schéma složky 1 a 2a jaz. kódování probíhalo. Soustavou Z je uspořádána šestice ⟨E, V, O, Q, S, P⟩, kde E, V, Q, S jsou disjunktní neprázdné konečné množiny (po řadě množina mimojazykových událostí, množina slov, množina objektivních faktorů, množina subjektivních faktorů); O (funkce pojmenování) je předpis přiřazující každému prvku e množiny E jistou podmnožinu V' = O(e) množiny V; P (pravděpodobnostní funkce) je předpis přiřazující každé čtveřici ⟨e, v, Q', S'⟩ ∊ R reálné číslo x (∅ ⩽ x ⩽ 1), kde R je množina všech prvků ⟨e', v', Q'', S''⟩ kartézského součinu E × V × Q × S takových, že v' ∊ O(e'), kde Q ⊂ 2^Q, S ⊂ 2^S (Q a S jsou empiricky možné kombinace objetivních a subjektivních faktorů).

Předpis P musí dále vyhovovat podmínce, že pro všechna e ∊ E, S' ∊ S, Q' ∊ Q,

, kde v_i ∊ O(e) a k je počet prvků množiny O(e). (Tato podmínka spolu s podmínkou, že P ⟨e, v, Q', S'⟩ ⩾ ∅, uvedenou už vlastně ve [34]vymezení funkce P, jen zaručuje, že funkce P má opravdu známé žádoucí vlastnosti pravděpodobnostní funkce.)

2.132 Kdybychom nyní uvažovali obdobně jako v 1.2, dospěli bychom ke konstatování, že tabulky pro zachycení funkce P by mohly být podobné jako tabulky pro udávání hodnot styl. charakteristik (viz 1.2).

Pro stručnost uvedu jen tabulku typu a',[26] v níž pro totéž e jsou přiřazované pravděpodobnosti v každém jednotlivém komunikačním okruhu stejné pro všechny mluvčí, a tabulku typu c',[27] v níž pro totéž e jsou přiřazované pravděpodobnosti v každém jednotlivém komunikačním okruhu pro různé mluvčí různé, přičemž jsou tyto pravděpodobnosti pro téhož mluvčího v různých komunikačních okruzích různé. (V tabulkách: Q₁, …, Q_n ∊ Q, S₁, …, S_z ∊ S.)

Tabulka typu a'

Prvek

Q₁

Q₂

…

Q_n

e_i

v_i1

v_i2

∙

v_ik

P₁ (v_i1)

P₁ (v_i2)

∙

P₁ (v_ik)

P₂ (v_i1)

P₂ (v_i2)

∙

P₂ (v_ik)

P_n (v_i1)

P_n (v_i2)

∙

P_n (v_ik)

Např.: P₁ (v_i₁) = P (e_i, v_i₁, Q₁, S₁) = P (e_i, v_i₁, Q₁, S₂) … = P (e_i, v_i₁, O₁, S_z_{— 1}) = P (e_i, v_i₁, Q₁, S_z)

Tabulka typu c'

	Prvek	Q₁				Q₂
	Prvek	S₁	S₂	….	S_z	S₁	S₂	….	S_z
e_j	v_j1	P₁₁ (v_j1)	P₂₁ (v_j1)		P_z1 (v_j1)	P₁₂ (v_j1)	P₂₂ (v_j1)		P_z2 (v_j1)
	v_j2	P₁₁ (v_j2)	P₂₁ (v_j2)		P_z1 (v_j2)	P₁₂ (v_j2)	P₂₂ (v_j2)		P_z2 (v_j2)
	∙	∙	∙		∙	∙	∙		∙
	∙	∙	∙		∙	∙	∙		∙
	∙	∙	∙		∙	∙	∙		∙
	v_jl	P₁₁ (v_jl)	P₂₁ (v_jl)		P_z1 (v_jl)	P₁₂ (v_jl)	P₂₂ (v_jl)		P_z2 (v_jl)

2.2 Formální systém. „K zobrazení obecných vlastností a činnosti selektoru“ (zařízení provádějícího výběr alternativ, tedy kódovače nebo jisté jeho „části“) chce D. užít tzv. pravděpodobnostního automatu[28] podle Rabina. Připomeňme si, že automaty jsou v matematice pojímány jako zcela abstraktní útvary; k jejich zavádění a studiu sice dávají moderní samočinné počítače podněty, ale obojí je třeba přesně lišit.[29]

Rabinova definice zní: „Pravděpodobnostní automat nad abecedou Σ je sou[35]stava A = ⟨S, M, s_o, F⟩, kde S = {s_o, …, s_n} je konečná množina (množina vnitřních stavů), M je funkce zobrazující množinu S × Σ do [0,1]ⁿ^{+ 1} (tabulka pravděpodobností přechodu) taková, že pro (s, σ) ∊ S × Σ

M (s, σ) = [p_o (s, σ), …., p_n (s, σ)],

∅ ⩽ p_i (s, σ), ,

s_o ∊ S (počáteční stav) a F ≤ S (množina vyznačených koncových stavů).[30] Podle D. je zřejmé, „že pro naše účely jsou v definici automatu relevantní hlavně množiny S, M a Σ“ (s. 230). To však znamená, že by D. vlastně pracoval s automatem A, v němž S = F = S_o (zobecníme-li ovšem Rabinovu definici tím, že místo jediného počátečního stavu připustíme množinu počátečních stavů S_o). To ovšem dále znamená, že jde o velmi jednoduchý pravděpodobnostní automat nad abecedou Σ definovaný jako soustava B = ⟨S, M⟩, kde Σ, S a M jsou stejné jako v definici Rabinově.

Dále D. doplňuje „podle K. Čulíka … do definice automatu množinu symbolů Y, která představuje výstupní abecedu automatu, a (determinovanou) funkci Ψ(s_i), která každému stavu s_i ∊ S přiřazuje určitý výstupní symbol z abecedy Y“ (s. 230).[31] Definuje tedy D. vlastně pravděpodobnostní automat nad abecedou Σ jako soustavu C = (S, M, Y, Ψ), kde Σ, S, M jsou stejné jako v definici Rabinově, Y je konečná množina (výstupní abeceda) a Ψ je funkce zobrazující množinu S do Y. To však je definice tzv. Markovova automatu, jak ji nalézáme u Šrejdera.[32]

Automat pracuje tak, že „je-li ve stavu s a je-li na vstupu σ, … může přejít do kteréhokoli s_i ∊ S, a pravděpodobnost přechodu do stavu s_i rovná se (i + 1)-ní souřadnici p_i (s, σ) vektoru M (s, σ)“.[33] Při přechodu do stavu s_i produkuje výstupní symbol Ψ (s_i) (symbol jednoznačně přiřazený stavu s_i funkcí Ψ).[34]

Příklad na „fungování“ automatu bude uveden v 2.32.

2.3 Vztah formálního aparátu a „mechanismu“. V tomto odstavci ukáži, že Markovův automat není, interpretujeme-li ho tak jako D., formálním modelem[35] D-ovy styl. složky jaz. kódování.

[36]Uveďme nejprve D-ovu interpretaci: „Budiž Q = {q₁, …, q_n} vstupní abeceda Σ, S = {s_o, …, s_z} konečná množina vnitřních stavů selektoru, M (s, q)[36] matice pravděpodobností přechodu daného selektoru; abecedu alternativ A = {a, b, …, z} ztotožníme s výstupní abecedou Y“ (s. 230).

2.31 Zkonfrontujeme-li nyní takto interpretovaný Markovův automat se soustavou Z (jak jsme ji v 2.131 přirozeně zrekonstruovali na základě D-ova neformálního popisu styl. složky kódování), vidíme na první pohled závažné rozdíly. Obojímu jsou společné jen množiny Q a S. Avšak další složky soustavy Z svůj protějšek v Markovově automatu (interpretovaném podle D.) nemají, nebo jim jistým způsobem odpovídají složky jiné, s vlastnostmi z hlediska D-ovy styl. složky jaz. kódování nežádoucími: a) Množina E svůj protějšek nemá a množině V odpovídá jen množina A,[37] což znamená, že by D. musil mít pro každý akt výběru jiný automat (aspoň s jinou abecedou alternativ A a jinou funkcí Ψ), neboť mimojazyková událost, jejíž jazykové zobrazení má být kódováním získáno, vůbec není v automatu zachycena. (Že si tuto skutečnost D. neuvědomuje, je vidět z toho, že vůbec neuvažuje, jakým způsobem by tyto automaty byly na sebe napojeny.) b) Svůj protějšek v C nemá pojmenovávací funkce O, místo pravděpodobnostní funkce P je tu tabulka pravděpodobností přechodu M a navíc je v C funkce Ψ, což znamená, že místo výběru jednoho z možných pojmenování v souladu s pravděpodobnostmi jejich výskytu danými objektivními a subjektivními faktory se v D-ově modelu přechází z jednoho vnitřního stavu do jiného vnitřního stavu selektoru v souladu s pravděpodobnostmi danými působícím objektivním faktorem a předchozím vnitřním stavem a výběr alternativy je pak už jednoznačně dán současným vnitřním stavem. Ke kontrole tvrzení a) i b) stačí přihlédnout k definici soustavy Z a její interpretaci (ve 2.131) a k definici Markovova automatu a jeho interpretaci podle D.

2.32 Nyní si ukažme fungování Markovova automatu na hypotetickém příkladě.[38]

Vstupní abeceda (= objektivní faktory) = {písmem, ústně}.

Vnitřní stavy (selektoru) = {neutrální, optimistický, pesimistický}.

Výstupní abeceda (abeceda alternativ) = {Honza, klouček, uličník}.

Tabulka pravděpodobností přechodu M (srov. pozn. 30):

M (neut., pís.)

M (opt., pís.)

M (pes., pís.)

M (neut., úst.)

M (opt., úst.)

M (pes., úst.)

neut.

(1/3,

(1/2,

(1/5,

(1/4,

(1,

(1/3,

opt.

1/3,

1/4,

2/5,

1/2,

1/6,

pes.

1/3)

1/4)

2/5)

1/4)

1/2)

Funkce Ψ zobrazující množinu vnitřních stavů do množiny výstupních symbolů

[37]Ψ (neut.) = Honza

Ψ (opt.) = klouček

Ψ (pes.) = uličník

Nyní si představme tuto situaci: Na vstupu je pís., automat začíná pracovat ve vnitřním stavu neut.; automat přejde např. (s pravděpodobností 1/3) do vnitřního stavu neut. a vydá na výstupu Honza; je-li na vstupu i nadále pís., přejde např. do vnitřního stavu pes. (opět s pravděpodobností 1/3) a vydá na výstupu uličník; je-li na vstupu i nadále pís., přejde např. do stavu opt. (s pravděpodobností 2/5) a vydá na výstupu klouček. Za udaných podmínek (počáteční stav neut., vstupní řetěz pís., pís., pís.) generuje automat na výstupu řetěz Honza uličník klouček, a to s pravděpodobností 1/3 . 1/3 . 2/5 = 2/45. Automat by přirozeně mohl za udaných podmínek generovat i jiné řetězy délky 3 symbolů výchozí abecedy, ovšem s jinými pravděpodobnostmi.

Na tomto příkladě vidíme, že formální systém funguje zcela jinak, než by podle D-ova předchozího neformálního popisu stylistické složky jazykového kódování měl. Místo výběru jednoho prvku z abecedy alternativ (srov. zde 2.11 a 2.12) generuje řetězy z prvků abecedy alternativ. I kdyby však měl D. na mysli řetězy délky 1, zůstává skutečností konstatování z 2.31.

2.4 V odstavci 2.3 jsme ukázali, že Markovův automat není modelem D-ovy styl. složky jaz. kódování. Chceme-li však přejít k otázce, jaký je podle D. vztah této složky a styl. charakteristik, musíme věnovat pozornost úseku D-ova textu vymezeného posledním odstavcem na s. 230 a posledním odstavcem oddílu III. 4. (Zjišťujeme-li totiž, kde se v D-ově stati o uvedeném vztahu vykládá, dojdeme brzy k závěru, že je o něm řeč právě zde.)

2.41 Klíč k této pasáži tvoří rozbor věty, která bezprostředně navazuje na D-ův popis činnosti stylistického selektoru: „Po n krocích generuje selektor řetězec symbolů o délce n, který se vyznačuje určitým rozložením pravděpodobností ω (A)“ (s. 230). První část souvětí je v pořádku, obsahuje pravdivý výrok (víme už ovšem, že se jím jasně prokazuje neadekvátnost použití Markovova automatu pro modelování D-ovy styl. složky jaz. kódování, v níž mělo být pro určitou mimojazykovou událost vybráno jen jedno pojmenování), avšak co znamená 2. část souvětí, o rozložení pravděpodobností čeho jde? V D-ově článku se symbol ω (A) vyskytl předtím jen jednou, a to ve formulaci předpokladu c: „Výsledkem selekce je přiřazení určitých pravděpodobností výskytu jednotlivým alternativám, tj. transformace abecedy alternativ A v náhodnou proměnou ω (A) s určitým rozložením pravděpodobností“ (s. 229). Nebudu tu rozvádět, proč „vysvětlení“ následující po zkratce tj. spíše mate, než objasňuje, stačí nám zde, že D-ovi jde o rozložení pravděpodobností výskytu symbolů výstupní abecedy A ve výstupních řetězech délky n. Avšak hodnotu těchto „absolutních“ pravděpodobností výskytu symbolů výstupní abecedy nelze nadekretovat zevně, jak činí D. předpokladem c, aniž však tento předpoklad jakýmkoli způsobem se svým formálním modelem spojil.

Uvědoměme si, že zjištění mnohem jednodušší, totiž zjištění pravděpodobností, s jakými se výstupní symbol y vyskytuje m-krát ve výstupním řetězu délky n (m ⩽ n), vyžaduje znalost rozložení pravděpodobností výskytu jednotlivých vnitřních stavů na počátku činnosti automatu a dále rozložení pravděpodobností výskytu všech vstupních řetězů délky n. Avšak odtud je k případnému zjištění zmíněných „absolutních“ pravděpodobností výskytu symbolů výstupní abecedy ještě dlouhá cesta. Nechci zde zabíhat do technických podrobností, jen poznamenám, že aby druhá část citovaného D-ova [38]souvětí měla smysl, musilo by být známo jisté zobecnění teorie Markovových řetězců pro případ Markovových automatů, jichž jsou Markovovy řetězce speciálním případem.[39] Taková teorie však, pokud vím, zatím neexistuje.

2.42 D-ův text následující po větě citované na začátku odstavce 2.41 je tvořen úseky týkajícími se jednak Markovových automatů, jednak tabulek pro uvádění pravděpodobností výskytu pojmenování (srov. 2.132). K prvnímu patří slova o generování řetězů délky n, chybné označení 2. tab. ze s. 231,[40] k druhému — obě tabulky ze s. 231 samy; celistvost textu je nesena homonymií symbolů ξ_i (A), η_ji (A), které patří k obojímu. Ty mají totiž jednak být konkretizací symbolu ω (A), tj. ξ_i (A) pro kódování, při němž se uplatňují jen objektivní faktory, η_ji (A) pro kódování, při němž se uplatňují faktory objektivní i subjektivní,[41] jednak označovat pravděpodobnost výskytu pojmenování (viz obě tab. na s. 231).

Protože souvislost první je obsahově (interpretačně) neudržitelná (viz 2.3) a matematicky nezdůvodněná (viz 2.41), přidržíme se souvislosti druhé. Pak nám ovšem vychází, že D-ovy objektivní stylové parametry a subjektivní stylové parametry[42] nemají s Markovovým automatem nic společného, nýbrž označují právě jen sloupce v tabulkách, o nichž je řeč, a to tímto způsobem: ξ_i (A) označuje pravděpodobnosti výskytu pojmenování v tabulkách typu a', η_ji (A) v tabulkách typu c' (viz 2.132).

3. Vztah teorie a empirie

Můžeme nyní konečně přistoupit k přezkoumání vztahů mezi styl. charakteristikami a jejich vlastnostmi a styl. složkou jazykového kódování.

3.1 D. uvádí tyto „formální definice“ vlastností styl. charakteristik: „Styl. charakteristika X_i se bude nazývat objektivní a stacionární, jestliže nevykazuje statisticky významnou odchylku od parametru ξ_i (A); styl. charakteristika bude subjektivní a stacionární, jestliže se od parametru ξ_i (A) odchyluje významně, avšak nevykazuje statisticky významnou fluktuaci vzhledem k příslušnému parametru η_ji (A). Měření odchylky je přirozeně záležitostí běžných statistických testů vztahu mezi teoretickým rozložením pravděpodobností a empirickým rozložením četností“ (s. 232).

Nechme stranou otázku, nakolik situace předpokládaná v definici subjektivní stacionární styl. charakteristiky odpovídá předchozím D-ovým výkladům, připomeňme jen zjištění z 2.42, že totiž D-ovy objektivní a subjektivní stylové parametry lze nanejvýš pojímat jako označení sloupců udávajících pravdě[39]podobnosti výskytu pojmenování mimojazykových událostí v tabulkách jistých typů. Uvedené formální definice by tedy měly zachycovat vztah mezi styl. složkou jaz. kódování, totiž funkcí P (srov. 2.13), a styl. charakteristikami jako vztah teoretických a empirických hodnot.

Avšak tu je nasnadě zásadní otázka: Styl. charakteristik je mnoho: průměrná délka věty, predikční entropie (podle D.[43]), Yuleova charakteristika, poměr sloveso — adjektivum atd. atd. Jak mohou být tyto různé charakteristiky „empirickým obrazem“ D-ových styl. parametrů, které — jak jsme viděli — zachycují pravděpodobnosti výskytů pojmenování (mimojazykových událostí)? Odpověď může být jen negativní.

Dá se však uznat, že D. vlastně implicitně navrhuje novou styl. charakteristiku zachycující pravděpodobnosti výskytu alternativních pojmenování a že přirozeně je možné zkoumat empirické vztahy mezi touto styl. charakteristikou a styl. charakteristikami jinými.[44]

3.2 Doleželova styl. charakteristika (charakteristika D). Představme si, že máme pro každý soubor synonym (při pojetí intenzionálním) nebo pro každou mimojazykovou událost (v pojetí extenzionálním) zjištěnu funkci P a že je P úsporně uváděna v tabulkách různých typů (viz 2.132). Hodnota charakteristiky D pro různé objektivní a subjektivní faktory by byla tvořena jistým výsekem z těch tabulek, v jejichž záhlaví je název toho kterého objektivního nebo subjektivního faktoru obsažen. Další specifikaci této styl. charakteristiky však přenechám autorovi.

Poznamenejme ještě, že při extenzionálním chápání by šlo o zcela nový druh styl. charakteristiky. Dosavadní styl. charakteristiky byly totiž založeny na relativní četnosti různých prvků jazyka (např. fonémů, slov) v textech, kdežto u D. by se přihlíželo i k mimojazykovým událostem (označované skutečností). — D. nedává najevo, jaké pojetí (extenzionální či intenzionální) má na mysli; upozorňuje sice, že vymezení množiny výběrových alternativ je v lingvistice nevyřešeným problémem (s. 229), ale neříká, jak by si její zjišťování (které je pro stanovení charakteristiky D podstatné) představoval.

4. Závěr. Zjistili jsme, že spojení mezi stylovými charakteristikami a stylistickou složkou jazykového kódování je zcela jiného druhu, než by se zdálo z D-ových formulací (viz 3.1), a že D-ův pokus formálně zobrazit stylistickou složku jazykového kódování pomocí Markovova automatu je prostě nedorozumění (viz 2.3).

Vzhledem k výsledkům rozboru nepovažuji za nutné zabývat se D-ovými výklady z IV. části jeho stati. — V tomto mém příspěvku nedošlo na některá další místa z částí I—III, která by si také zasloužila pozornosti. Namátkou uvádím poslední odstavec z III. 2.

Podotkněme, že k tomu, abychom dospěli k uvedenému závěru, stačilo použít jen několika známých matematických pojmů (včetně některých typů automatů) a vůbec nebylo nutné sáhnout k matematickým poznatkům ve vlastním smyslu (teorémům). Prostě jsme zacházeli s odbornými (zde matematickými) výrazy jako s termíny[45] a zkusili jsme si věc na příkladě.

[40]Vtírá se jistě otázka, jak k uvedeným nedorozuměním vůbec mohlo dojít. Odpovím jenom na snazší otázku, totiž jak by k nim vůbec nedošlo: Kdyby byl D. pokračoval v abstraktním množinovém způsobu vyjadřování, kterým při popisu procesu jaz. kódování začal, tj. kdyby užíval výrazů množina, přiřazovat apod. funkčně, jako prvků jisté terminologické soustavy, dospěl by nutně k stanovení abstraktní struktury soustavy, podle níž by jaz. kódování mělo probíhat (srov. zde 2.131). Tím by — na této úrovni obecnosti — byla konstrukce formálního modelu jeho styl. složky skončena a zbývalo by se rozhlédnout, zda se už ona soustava stala předmětem matematického studia. Narazil-li by autor při takovém rozhlížení na Markovův automat, bylo by na první pohled jasné, že Markovův automat onou soustavou není.

Stručně řečeno, užívání matematických metod v empirické vědě má svá pravidla[46] a není užitečné zaměňovat užívání těchto metod s užíváním matematizující frazeologie.

R É S U M É

On one model of the stylistic component of language encoding

This paper gives a critical analysis of the article “A model of the stylistic component of language encoding” (SaS 26, 1965, 223—235) which is the latest and technically most elaborated one of the series of papers by L. Doležel, concentrating on the disclosure of the “mechanism” through which the so-called style characteristics acquire their numerical values. It is shown that the so-called Markov automaton (a), the definition of which has in fact been given by Doležel in III. 4, does not represent — under D.’s interpretation (b) — a formal model of the stylistic component of language encoding (c), as has been formulated by D. in I and III. 1. This conclusion is immediate, it is sufficient to confront the three items just mentioned. The cause of D.’s mistake is regarded before all as being rooted in an inaccurate usage of mathematical terminology.

[1] Na jednoduchém příkladě je tento postup osvětlen v stati P. Novák - M. Těšitelová, Kvantitativní lingvistika, sb. Cesty moderní jazykovědy (P. Sgall a kol.), Praha 1964, s. 131—133.

[2] Viz např. G. A. Miller, Language and Communication, New York — Toronto — London 1963², s. 120—128, P. Guiraud, Les caractères statistiques du vocabulaire, Paris 1954, s. 50n.

[3] Obsahově i formulačně jí stojí blízko D-ův příspěvek pro 1965 Intern. Conference on Computational Linguistics nazvaný Probabilistic Automaton in a Model of Language Encoding i stať Un modèle statistique du codage linguistique, Études de linguistique appliquée III, 1964, 51—63. Dále srov. L. Doležel, Východiska teorie uměleckého stylu, Česká literatura 12, 1964, 1—7, týž, Pražská škola a statistická teorie básníckého jazyka, Česká literatura 13, 1965 (cit. 1965a), 101—113, týž Kybernetika a jazykověda v sb. Kybernetika ve společenských vědách, Praha 1965 (cit. 1965b), s. 267—279.

[4] Srov. W. Mays, Probability Models and Thought and Learning Processes, Synthese 15, 1963, 204—221.

[5] Užívám známých matematických symbolů: a ∊ A (a je prvkem množiny A), B ⊂ A (množina B je podmnožinou množiny A), symbol 2^A označuje množinu všech podmnožin množiny A (např. je-li A = {a, b, c}, pak 2^A = {{a, b, c}, {a, b}, {a, c}, {b, c}, {a}, {b}, {c}, ∅} . Σ a_i = a1 + a2 + … + a_n. Kartézský součin X₁ × X₂ × … × X_m množin X₁, X₂, …, X_m je množina všech uspořádaných m-tic ⟨x₁, x₂, …, x_m⟩ takových, že x₁ ∊ X₁, x₂ ∊ X₂, …, x_m ∊ X_m. Funkce f z množiny A do množiny B je předpis přiřazující každému prvku a ∊ A určitý a jediný prvek b ∊ B, který se často označuje symbolem f (a) (hodnota funkce f v bodě a). Posloupnost je funkce z množiny přirozených čísel {1, 2, …, k} do jakékoli množiny. Vektor je zvláštním případem posloupnosti. Interval je množina čísel vyhovujících určité nerovnosti. Viz O. Zich a kol., Moderní logika, Praha 1958 a M. Novotný, Matematika pro lingvisty (skriptum), Praha 1965. — V citovaných úryvcích jsou vypuštěny číslice odkazující k poznámkám originálu. Poznámky k citovaným úryvkům jsou mé. U citací z D-ova článku jsou uvedeny jen stránky originálu. — Pozn. korekt. Indexy (_m, _n, _z aj.) mají „lokální“ platnost, např. mezi _z z 2.11 a z 2.132 není souvislost.

[6] Třídy vydělené podle komunikačních okruhů a/nebo podle mluvčích. K termínu komunikační okruh viz Doležel 1965b, 267n.

[7] Podmínky pro stacionární posloupnosti, které uvádí D. (v pozn. 14), jsou z knihy B. V. Gnedenka Kurs teorii verojatnostej, Moskva 1961³, s. 335, reprodukovány neúplně.

[8] Viz Doležel 1964, 4.

[9] Srov. D-ovu 1. tabulku na s. 231 a tabulku typu a' zde v 2.132.

[9a] Symboly M_j v tabulkách b a c odpovídají symbolům S_j z citací v 1.1.

[10] Srov. D-ovu 2. tabulku na s. 231 a tabulku typu c' zde v 2.132.

[11] Údaje v tabulce jsou vzaty od D. 227—228.

[12] Zde se užívá výrazu operace nikoli v matematickém smyslu, viz L. Nebeský - P. Sgall, Relace a operace v syntaxi, SaS 26, 1965, 218.

[13] Podle D. jsou těmito jednotkami slova-lexémy.

[14] Jde patrně o možnost víceslovného pojmenování. Pro jednoduchost však dále s víceslovným pojmenováním nepočítám.

[15] Výraz mimojazyková událost i denotát ukazuje jasně na chápání extenzionální, avšak výrazu denotát je užito naprosto nevhodně. Podle běžného mezinárodního úzu (angl. denotatum, rus. denotat) se jím totiž rozumí právě naopak jev označený. V citátech z D. jej ponechávám, ale sám mluvím prostě o pojmenování.

[16] Výrazy, které by mohly ukazovat na chápání intenzionální. Míšení obou pojetí není ovšem korektní. K termínům extenze a intenze viz např. B. Palek, Zajímavé podněty pro lingvistickou sémantiku, SaS 26, 1965, s. 255, zejm. pozn. 14.

[17] Viz pozn. 21.

[18] V jakém pořadí?

[19] Pak by však bylo třeba mluvit i dříve o posloupnosti mimojazykových událostí (v množině se může vyskytnout každý prvek jen jednou, v posloupnosti i víckrát).

[20] Podotkněme však, že touž posloupnost pojmenování lze zpravidla „transformovat“ i ve více nesynonymních syntaktických konstrukcí, např. ⟨Jan, vidět, Igor⟩.

[21] K „předpokladu“ c viz ještě 2.41. S předpokladem c je v rozporu předpoklad a o výběru optimální alternativy, který je však jinak anulován D-ovou formulací v III. 6b.

[22] Představme si věc na známém urnovém modelu.

[23] Množinu E nutno odlišovat od množiny E, tj. množiny zadaných mimojazykových událostí, jejichž kódováním vznikne podle D. výpověď.

[24] Objektivními faktory rozumí D. „podmínky působící v jednotlivých komunikačních okruzích nezávisle na mluvčím“ (s. 226), subjektivními faktory „všechny vlastnosti mluvčího, jež jsou relevantní při provádění výběru“ (s. 226). — Předpoklad b zní celý takto: „Předpokládá se, že řízení selekce objektivními a subjektivními faktory má povahu automatické regulace, tj. probíhá tak, že se výběr alternativ přizpůsobuje (adaptuje) působícím extralingvistickým faktorům“ (s. 228—229). Avšak (1) schéma automatické regulace je sice uvedeno na s. 229, ale bez jakéhokoli zabudování do formálního aparátu, (2) text po zkratce tj. neobjasňuje, co se míní automatickou regulací v tomto případě, pouze se slovesně (poněkud obecněji) opakuje předcházející nominální výraz řízení (selekce) objektivními a subjektivními faktory. — Poučení o aut. regulaci viz např. J. Závorka, Základy automatické regulace, Pokroky matematiky, fyziky a astronomie 10, 1965, 202—203.

[25] Symbolů S a Q užívám podle D.

[26] Srov. D-ovu 1. tabulku na s. 231 a tabulku typu a zde v 1.2.

[27] Srov. D-ovu 2. tabulku na s. 231 a tabulku typu c zde v 1.2.

[28] D. užívá výrazu náhodný automat, avšak probabilistic = verojatnostnyj = pravděpodobnostní.

[29] Viz zde recenzi P. Nováka, K. Paly a M. Sedlákové Nové práce N. Chomského a G. A. Millera …, s. 71n. Viz dále J. Bečvář, Teorie automatů a matematická logika, v sb. Kybernetika a její využití, Praha 1965, s. 13—24, S. Marcus, Gramatici şi automate finite, Bucureşti 1964.

[30] M. O. Rabin, Probabilistic automata, Information and Control 6, 1963, 234 (rusky — Verojatnostnyje avtomaty, Kibernetičeskij sbornik 9, 1964, s. 127). Uvádím celou Rabinovu definici v svém překladu, aby si mohl čtenář porovnat D-ovu úpravu, která obsahuje nesmysluplnou frázi ‚M je funkce s x Σ taková‘ (tato fráze má svůj protějšek i v anglické verzi citované v poznámce 3). — Symbol [0,1] označuje uzavřený jednotkový interval ∅ ⩽ x ⩽ 1, a [0,1]ⁿ^{+ 1} množinu všech (n + 1)-tic ⟨x₀, x₁, …, x_n⟩, kde ∅ ⩽ x_i ⩽ 1.

[31] Nepřesné: Ψ je funkce, Ψ(s_i) je hodnota funkce v s_i ∊ S, tedy Ψ(s_i) ∊ Y.

[32] Ju. A. Šrejder, Modeli obučenija i upravljajuščije sistemy, dodatek k ruskému překladu knihy R. R. Bush - F. Mosteller, Stochastic Models for Learning (Stochastičeskije modeli obučenija, Moskva 1962), s. 469. Z D-ovy pozn. 26 lze soudit, že D. Šrejderovy práce zná.

[33] Rabin, loc. cit.

[34] Tuto formulaci jsem si ověřil dotazem u K. Čulíka (ČVUT), jehož rukopisnou práci citovanou D-em jsem však nečetl. (Poznamenávám, že matematik, o jehož práci je řeč, není totožný s matematikem K. Čulíkem z MÚ ČSAV, autorem několika statí lingvisticky zaměřených, např. Některé problémy teorie jazyků, v sb. Kybernetika a její využití, Praha 1965, s. 276—290.)

[35] O matematickém (formálním, abstraktním) modelu nějakého objektu empirické vědy mluvíme v těch případech, když je jistý matematický systém (deduktivní teorie, algoritmus, kombinatorický systém, automat) uveden interpretací do vztahu k onomu objektu (problému) zkoumání.

[36] Nepřesné: M je matice (tabulka) pravděpodobností přechodu, M (s, σ) je vektor, srov. původní Rabinovu definici.

[37] Podle D. 229 je A abeceda alternativ, která je v konkrétním výběrovém aktu předmětem selekce.

[38] Příklad je formulován v extenzionálním pojetí. Nečiní ovšem potíže uvést příklad v pojetí intenzionálním.

[39] Srov. např. V. M. Gluškov, Vvedenije v kibernetiku, Kijev 1964, s. 166. — Uvedení do teorie Markovových řetězců: B. Hostinský, Počet pravděpodobnosti (druhá část), Praha 1950, s. 22n., J. G. Kemeny - J. L. Snell, Finite Markov Chains, Princeton 1960, H. Lahres, Einführung in die diskrete Markoff-Processe und ihre Anwendungen, Leipzig 1964.

[40] D. míní matice přechodu (M), označuje je symbolem pro vektor [M (s, σ)], srov. už mou pozn. 36, avšak obojí v tabulce obsaženo není.

[41] D. totiž rozlišuje dva typy regulace: a) regulaci „objektivní, při níž se parametry kódovače neuplatňují a výběr je řízen pouze množinou objektivních faktorů Q“; b) regulaci „subjektivní, při níž se na regulaci podílejí jak množina faktorů Q, tak individuální vlastnosti selektoru“ (s. 230).

[42] „Náhodná proměnná ξ_i(A) se nazývá objektivní stylový parametr …“, náhodnou proměnnou η_ij(A) „budeme nazývat subjektivním stylovým parametrem“ (s. 231). Čtenář nechť si laskavě přečte vždy celý odstavec, v němž se právě citované věty vyskytují, a porovná s mým prvním odstavcem z 2.42.

[43] L. Doležel, Předběžný odhad entropie a redundance psané češtiny, SaS 24, 1963, 173.

[44] Viz stať cit. v pozn. 1, s. 130—131.

[45] Srov. už P. Sgall, K užívání matematických termínů v lingvistice, SaS 26, 1965, 83—85.

[46] Srov. P. Novák, On Mathematical Models of Linguistic Objects, Prague Studies in Mathematical Linguistics 1, 1966, s. 155.

Slovo a slovesnost, ročník 27 (1966), číslo 1, s. 29-40

Předchozí Ivan Poldauf: Neaktuálnost jako gramatická kategorie českého slovesa?

Následující Slavomír Utěšený: České nářeční názvy pro „stodolu“, „mlat“ a „pernu“ (Příspěvek k strukturnímu studiu slovní zásoby)

Menu
O archivu
Archiv
Nová domovská stránka
Hledání v archivu: