Časopis Slovo a slovesnost
en cz

Algebraický přístup k jazyku

Ladislav Nebeský

[Kronika]

(pdf)

Алгебраический подход к языку / The algebraic approach to language

Během 2. poloviny 50. let v souvislosti s výrazným zvýšením zájmu o formální vlastnosti přirozeného jazyka vykrystalizovaly dva směry matematického modelování v lingvistice: generativní směr spjatý s jménem N. Chomského a analytický směr zformulovaný O. S. Kulaginovou a dalšími badateli. Při jistém zjednodušení lze oba směry považovat za navzájem opačné: jedním z hlavních cílů generativního směru je ze znalosti vhodné konečné množiny dostatečně obecných vlastností jazyka efektivně odvodit množinu jeho vět, zatímco jedním z hlavních cílů analytického směru je ze znalosti množiny vět jazyka odvozovat jeho dostatečné obecné vlastnosti. Spojení těchto dvou cílů, kterým se již v 60. letech zabýval A. V. Gladkij, není nijak jednoduché. S výsledky důkladného průzkumu tohoto problému nás seznamuje kniha našeho významného matematika M. Novotného S algebrou od jazyka ke gramatice a zpět, kterou v edici Cesta k vědění vydalo nakladatelství Academia (Praha 1988; 312 s., 42 obr.).

Kniha má dvanáct kapitol. První z nich (Lineární algebra) se v dalším výkladu přímo neuplatní, může však čtenáři pomoci adaptovat se na algebraický způsob výkladu. V druhé kapitole (Algebra) jsou potom položeny základy, na nichž je stavba této knihy budována (mj. jsou zde definovány monoidy a uspořádané množiny). Styl třetí kapitoly (Přirozený jazyk) se od stylu ostatních kapitol liší; autor zde shromáždil lingvistický materiál, který potom dále využívá. Dvěma uvedeným směrům matematického modelování v lingvistice jsou věnovány kapitoly čtvrtá až sedmá. Další rozvinutí algebraických metod v lingvistice nalézáme v kapitolách osmé až jedenácté, kde sledujeme propojení obou směrů. V poslední kapitole (Syntaktické rozpoznávání obrazců) je ukázáno, jak metody v knize rozpracovávané nacházejí uplatnění i mimo rámec původní motivace. Zaznamenejme, že se v knize setkáváme nejen s obecnými matematickými větami (teorémy) a jejich důkazy, ale i s řadou důkladně probíraných příkladů.

V matematicky orientované literatuře je obvyklé nazývat jazykem nějakou množinu – řekněme množinu L – řetězů nad konečnou množinou prvků – řekněme nad množinou V – nebo přesněji uspořádanou dvojici (V, L). Běžnou (avšak nikoli jedinou) interpretací takto formálně chápaného jazyka je ta, v níž se V interpretuje jako množina slovních tvarů (nebo terminálních symbolů) jazyka a L jako množina všech správně utvořených vět. Podobně je pojem jazyka zaveden i v čtvrté kapitole recenzované knihy. V souladu s názvem kapitoly (Jazyk jako algebraická struktura) je studium jazyka opřeno o pojem monoidu; na tomto základě jsou zde také definovány regulární jazyky. V další kapitole (Morfologické a syntaktické kategorie formálního jazyka) hraje důležitou roli pojem svazu. V šesté kapitole (Gramatiky) jsou definovány zobecněné gramatiky, které se – zhruba řečeno – od běžně známých frázových gramatik liší tím, že připouštějí, aby množina nonterminálních symbolů, množina počátečních řetězů i množina pravidel byly nekonečné, přičemž je dovoleno, aby levou stranu pravidla mohl tvořit řetěz složený ze samých terminálních symbolů. Jsou-li množiny nonterminálních symbolů, počátečních řetězů a pravidel konečné, o zobecněné gramatice se hovoří jako o gramatice. Zobecněné gramatice, resp. gramatice se říká čistá, když množina nonterminálních symbolů je prázdná. Je tu vyložena Chomského hierarchie gramatik a jazyků. Na základě pojmu nekontextové algebry se v kapitole sedmé (Zásobníkové automaty) studuje vztah gramatik a jazyků typu 2 (tedy nekontextových) a zásobníkových automatů.

Jádro knihy tvoří čtveřice kapitol obsahující závažné výsledky, kterých M. Novotný dosáhl se svými spolupracovníky. V kapitole osmé (Konstrukce gramatik užitím syntaktických kategorií) je pro každý jazyk (V, L) konstruována taková zobecněná gramatika s nekontextovými pravidly, že množina všech terminálních řetězů, které lze odvodit z libovolně zvoleného nonterminálního symbolu, tvoří nějakou syntaktickou kategorii ve smyslu kapitoly páté. Pro regulární jazyky jsou odvozeny silnější výsledky. Další tři kapitoly vycházejí z jednoho z významných pojmů matematického modelování v lingvistice, totiž z pojmu konfigurace. V kapitole deváté (Konstrukce gramatik užitím syntaktických konfigurací) se zavádějí dva druhy konfigurací: n-konfigurace a obecnější m-konfigurace. Pro každý jazyk (V, L) je sestrojena čistá zobecněná gramatika, která jazyk (V, L) generuje, jejímiž pravidly jsou dvojice řetězů, v nichž druhým je n-konfigurace, resp. m-konfigurace a prvním její výsledek. Nabízí se otázka, zda lze najít čistou gramatiku s takovými pravidly, která by generovala týž jazyk. Jemnému rozboru této otázky se [74]věnuje i kapitola následující (Redukující operátory čistých zobecněných gramatik). Pokud je však na takovou otázku odpověď kladná, vyvstává problém, zda lze najít efektivní proceduru, která k takové čisté gramatice vede. Tomuto problému je věnována jedenáctá kapitola (Efektivní varianty konstrukcí gramatik), která pro m-konfigurace přináší řešení.

Novotného monografie podává promyšleně skloubený, algebraicky fundovaný výklad jádra analytických a generativních modelů v lingvistice. Zároveň přináší novou teorii, která toto modelování významnou měrou a potřebným způsobem prohlubuje. To jsou dva dobré důvody, proč by lingvistický čtenář zajímající se o možnosti kontaktu lingvistiky a matematiky rozhodně měl o této knize vědět.

Slovo a slovesnost, ročník 52 (1991), číslo 1, s. 73-74

Předchozí Ludmila Uhlířová: Frekvenční slovník mluvené bulharštiny

Následující Iva Nebeská: Relevance jako hlavní princip komunikace