Kolektiv semináře strojového překladu a matematické lingvistiky na filos. fakultě KU
[Chronicles]
Две конференции по прикладной лингвистике / Deux conférences sur la linguistique appliquée
I. Ve dnech 24.—31. ledna 1961 se konala na Moskevské státní universitě konference o zpracování informací, strojovém překladu (SP) a automatickém čtení textu, kterou uspořádal Všesvazový institut pro vědecké a technické informace při radě ministrů SSSR a zejména jeho Institut vědecké informace AV SSSR. Na konferenci bylo přihlášeno asi 140 referátů, z nichž některé ani předneseny nebyly. Referujeme tu pouze o význačnějších a nám přístupných přednáškách (k některým viz již P. Novák, SaS 23, 1962, 11n.). Před konferencí byly vydány teze a později jednotlivé referáty (ne všechny) vyšly tiskem jako samostatné publikace Institutu vědecké informace.
Referáty přednesené na konferenci můžeme rozdělit do těchto oblastí: (1) strojový překlad (otázky kódování slovníku; lingvistické problémy SP; programování lingvistických algoritmů; problémy sémantiky v rámci SP; obecné otázky SP); (2) zpracování vědecko-technických informací (informační jazyk: IJ): slovník; otázky zápisu v IJ; přechod z přirozeného jazyka do IJ; otázky programování; automatické referování; standardizace jazyka; analýza otázek; obecné otázky zpracování vědecko-technických informací; (3) teoretické otázky matematické lingvistiky (modelování jazyků, modelování sémantiky); (4) technická zařízení pro řešení lingvistických problémů a další přidružené problémy aplikované lingvistiky.
1. Strojový překlad. Ekonomické kódování slov v textu a v slovníku uloženém v počítači má pro SP důležitou úlohu. Vhodným kódováním je možno zkrátit počet znaků připadajících na slovo do té míry, že je lze uložit na jedno paměťové místo. Na konferenci přednášel I. I. Revzin o takovém kódování němčiny, připravovaném se zřetelem k její strukturní i statistické charakteristice.
Ze syntaktických otázek byla na konferenci rozbírána velmi obtížná a ve SP [233]důležitá problematika syntaktické homonymie (v ref. A. L. Vasiljevského o odstranění syntaktické homonymie na základě formálního popisu kontextu v současné angličtině). Velmi zajímavá a do jisté míry objevná byla zpráva J. P. Pivarovové a I. P. Sebra o pokusech prováděných na počítači Kijev, kde se analýza ruského odborného textu řeší na základě údajů získaných z koncovek textových slov, bez užití slovníku kmenů (odkud se část gramatické informace zpravidla získává). Pro současný stav výzkumu syntaxe pro SP je charakteristické, že se pozornost stále častěji obrací k otázkám souvětí. V referátu A. B. Kovrigina o rozčlenění německých souvětí jsou zkoumána formální kritéria funkce spojek v souvětí tak, aby bylo možno rozdělit souvětí na věty, slovesné celky (tj. rozvité infinitivní nebo participiální části vět) a „volné“ části (tj. apozice apod.). V referátu, který připravil spolu s M. B. Stratilovovou, jsou vyšetřovány funkce koordinačních spojek und / oder. — B. M. Lejkinová v analýze frazeologismů při rozboru angličtiny se zabývala jednotlivými případy z hlediska slovníku převodního jazyka a stanovila programy pro nalezení a určování frazeologismů v textu. — V menší míře než na některých dřívějších konferencích o strojovém překladu a matematické lingvistice uplatnil se v Moskvě zájem o problematiku převodního jazyka (PJ). Nejdůležitějším referátem v tomto úseku byl referát N. D. Andrejeva a kol. o vlivu gramatiky PJ na algoritmy SP; byly tu předloženy konkrétní zásady a pravidla PJ a návrh prvních gramatických kategorií, které by měly být součástí PJ, vytyčena hranice mezi morfologií a syntaxí PJ. Otázkám slovníku PJ byl věnován další referát N. D. Andrejeva a kol., charakterizující typy slovníkových neshod jednotlivých jazyků.
Charakteristickým rysem konference byl také zvýšený zájem o otázky sémantiky při SP. V této oblasti pracují v SSSR zejména pracovníci Laboratoře SP na Moskevském pedagogickém institutu cizích jazyků. Na konferenci přednesli několik referátů věnovaných jednotlivým otázkám sémantiky.[1] Jde především o referát N. N. Leontjevové o modelu syntézy ruské věty. Smysl (obsah) výpovědi lze zapsat určitým způsobem. Autorka zjišťovala, kolik je takových způsobů v konkrétním jazyce, např. v ruštině. Je to problém velmi složitý a jeho úspěšné řešení závisí především na způsobu zápisu smyslu. — Kódováním smyslu se zabýval J. S. Martemjanov, který ukázal, že k zápisu významu věty používají v MGPIIJ v podstatě určité obměny sémantických faktorů.[2] Sama otázka sémantických faktorů není dnes ještě úspěšně rozřešena, zejména nejsou známa formální kritéria pro jejich výběr.
Teoretické hodnocení výsledků a metod SP v zahraničí bylo předmětem referátu I. A. Meľčuka.[3] — Přehled problematiky SP a dosavadní výsledky z hlediska teoretické jazykovědy přednesl známý sovětský lingvista V. V. Ivanov. Jeho referát nebyl jen zhodnocením a přehledem toho, co se ve SP v SSSR udělalo, ale obsahoval také cenné konkrétní návrhy pro další rozvoj SP. — V. J. Rozencvejg věnoval svůj referát otázkám obecné teorie překladu; vymezil určité typy překladu (doslovný, volný, adekvátní apod.), určil jejich vzájemný vztah a navrhl, aby se výzkum SP soustředil na rozpracování algoritmů překladu různých typů, přičemž by se při konkrétním strojovém překládání vždy automaticky vybíral podle nutnosti určitý typ algoritmu. — Jiného charakteru byl referát známé matematičky O. S. Kulaginové o automatickém sestavení algoritmů analýzy textu, týkající se problematiky blízké automatickému programování. — Část referátů byla věnována technickým otázkám SP, především programování.
2. Automatické zpracování vědecko-technických informací. Centrálním problémem tohoto úkolu je vypracová[234]ní tzv. informačních jazyků (IJ) pro jednotlivé vědní obory. Pomocí IJ má být zachycen obsah textu, který je pak srovnáván s tím, co je již v paměti stroje zachyceno. Na sestavování IJ se podílejí logikové, matematici, lingvisté a odborníci z jednotlivých oborů. Část referátů se zabývala konkrétními úkoly IJ, a to především lineárním zápisem chemických vzorců. Nejdůležitější v této oblasti byly referáty V. K. Fina a G. E. Vleduce, v kterých je popsán systém IJ pro chemii; zjišťuje se tu, že bez formální teorie příslušného vědního oboru je velmi problematické uvažovat o sestavení IJ. Z postupu autorů pak vidíme, že se v podstatě snaží formální teorii vytvořit. — Z lingvistických referátů je třeba upozornit především na referát I. N. Šelimové o analýze otázek v IJ a překladu z přirozeného jazyka do IJ. Sémantické výstavbě textu byl věnován referát M. M. Langlebena. L. určoval vztahy mezi slovy a pokoušel se formulovat pravidla algoritmu pro přechod z jazyka přirozeného do IJ. Velmi vítaným byl referát G. L. Miščenka, v němž autor podal systematický přehled výše uvedené problematiky a zabýval se klasifikací zpráv o chemických sloučeninách, jejich vhodným vyhledáváním a zpracováním.
Vedle IJ byla na konferenci věnována pozornost automatickému referování. V. A. Purto podal přehled o jednotlivých směrech ve výzkumu a navrhl jako vzorec pro preferaci věty její entropii. Je to obměna vzorce Shannonova; jeho pomocí se zachycuje vztah mezi větami v článku a jejich závažnost. Novou metodu automatického referování navrhli ve svém referátu B. R. Pevzner a N. I. Stjažkin. Až dosud se určité věty článku preferovaly, nikoli pozměňovaly, aby se obsah textu vyjádřil „vlastními slovy“. Autoři se snaží dospět dále tím, že vycházejí z toho, že jsou zadány typické (reprezentativní) věty daného oboru, které jsou pak určitým způsobem srovnávány s větami příslušného textu. Do referátu pak byly vybrány takové věty, které se svou strukturou částečně nebo úplně shodují s tzv. reprezentativními větami.
Velmi cenným přínosem konference byla řada referátů (E. V. Padučevové, A. V. Kuzněcova, A. L. Šumilinové aj.), které byly věnovány tzv. standardní ruštině a obecně standardizaci jazyka. Při převodu textů do IJ se často naráží na dvojí, popř. několikeré vyjádření stejné skutečnosti (lišící se v různých jazykových plánech); tím se velmi komplikuje sestavení pravidel, která by umožňovala automaticky odvodit z přirozené věty její logický a sémantický zápis. Při vytváření standardního jazyka se postupuje tak, že jsou určeny základní věty daného oboru (z hlediska syntaktického a s ohledem na formální teorii daného oboru) a stanovena pravidla, jimiž jsou odvozovány věty další. Tímto postupem lze vytvořit všechny gramaticky správné věty tohoto jazyka.
Několik referátů bylo věnováno analýze dotazů a požadavků čtenářů na informační fond. Šlo v nich o problémy kódování, klasifikace, systemizace katalogů apod. Tato problematika se teoreticky dotýká i podobných otázek v informačních jazycích. Přednesené referáty často obsahovaly návrhy na konkrétní technická opatření.
3. Teoretické otázky matematické lingvistiky. Hlavní pozornost referátů věnovaných této otázce se soustředila na modelování syntaxe a na otázky s tím spojené. Autory referátů byli především lingvisté a matematici z Leningradu pracující na SP a příbuzných otázkách. Tak známý matematik G. S. Cejtin v referátu o otázce konstrukce matematických modelů jazyka nastínil vztah modelů analytických a syntetických, zdůraznil užitečnost studia některých speciálních typů algoritmů pro lingvistickou teorii a praxi a podrobněji probral jeden typ algoritmu analýzy SP. V referátu o přechodném stadiu při překladu z přirozeného jazyka do jazyka predikátové logiky zavedl Cejtin do predikátové logiky jistý analogon přívlastku přirozených jazyků. — Modelování syntaxe bylo předmětem referátů S. Ja. Fitialova, kde jsou probrány ve srovnání s větně strukturní gramatikou N. Chomského určité podoby tzv. gramatiky závislostí, formalizující u nás běžné pojetí stavby věty jako vztahu syntaktických dvojic.[4] V referátu o výstavbě formální mor[235]fologie ve spojitosti se strojovým překladem předložil F. promyšlenou formální teorii morfologie s jednotlivými variantami. — Příbuzným otázkám byl věnován také referát I. L. Bratčikova o některých teoriích formální morfologie. Algoritmickým popisem ruských slovních spojení (přívlastkových) s využitím transformační metody se zabývala Z. M. Volocká. — Řada referátů se týkala automatického čtení textu a příbuzných otázek. Tematická šíře a teoretická úroveň referátů je novým svědectvím rychlého rozvoje matematické a aplikované lingvistiky v SSSR.
II. Ve dnech 5.—8. září 1961 probíhala v anglickém Teddingtonu První mezinárodní konference o SP a aplikované analýze jazyka (applied language analyses). (První mezinárodní konference SP byla již v červenci r. 1952 a druhá v říjnu 1956.) Celkem bylo předneseno 35 referátů. Na konferenci byli přítomni jazykovědci, matematici, logici a inženýři; ze SSSR se konference zúčastnila O. S. Kulaginová. Pro úsporu místa nebudeme uvádět názvy referátů v plném znění, nýbrž jen číslo brožury, v níž byl referát předběžně otištěn.[5]
Většina referátů byla věnována SP. Mnoho nových myšlenek bylo obsaženo v těchto šesti referátech: G. H. Matthews (10) uvedl hlavní zásady tzv. analýzy syntézou, při níž je věta vstupního textu analyzována tím, že je v jistém systému generativní gramatiky odvozena (popř. více způsoby) posloupnost symbolů totožná s analyzovanou větou; výhodné je tu mj. sblížení analýzy se syntézou. — M. Corbe a R. Tabory (35) navrhli odstranit značné potíže spojené s řešením syntaktické homonymie: v paměti samočinného počítače je uložen seznam „fragmentů“, vyskytujících se slovních druhů pro angličtinu (dvojic až šestic), nejčastěji trojic až pětic, s nimiž je při analýze srovnávána posloupnost syntaktických údajů odpovídající posloupnosti slovních tvarů analyzované věty.[6] — Japonec I. Sakai (28) podal zprávu o jistém schématu překladového algoritmu, použitelném pro všechny jazyky. Syntaktická analýza je založena na analýze podle bezprostředních složek;[7] příznačné je tu využití logické algebry. — Různým aspektům tzv. predikativní analýzy, jejíž iniciátorkou je I. Rhodosevá, bylo věnováno několik referátů. Při tomto typu analýzy se text rozebírá zleva doprava, přičemž se podle již zjištěných slov dělají „předpovědi“ o slovech, která se v textu ještě vyskytnou. Podle úspěchů nebo neúspěchů těchto „předpovědí“ se upravují „předpovědi“ další. Prediktivní analýza je založena na uznání syntaktických závislostí slovních tvarů (srov. P. Novák, o. c. v pozn. 4, par. 2.1).
A. F. Parker-Rhodes vyložil metodu syntaktické analýzy cambridžské skupiny, stručně již popsanou v cit. čl. P. Nováka (3,521). Autor tuto metodu vykládá jako praktickou aplikaci nového syntaktického modelu, založeného na matematické teorii svazů.[8] — Avšak spojení onoho konkrétního systému synt. analýzy a nového modelu je velmi nejasné a samo uplatnění teorie svazů je podle zjištění K. Čulíka jen zdánlivé.[9] — M. Zarechnak (12) se zabýval použitím transformační metody pro překlad ruských adnominálních genitivů do angličtiny; S. Kuno (27) referoval o japonsko-anglickém překladovém algoritmu. Využívá se přitom prediktivní analýzy, avšak vzhledem k vlastnostem japonštiny provádí se analýza zprava doleva. — W. Foust a J. Walklingová (14) uvedli seznam základních ekvivalentních syntaktických konstrukcí ruštiny a angličtiny, I. Lynchová (22) popsala překládání ruských reflexív a reflexívních tvarů slovesných do angličtiny, L. Summers (17) a J. H. Wahlgren (19) rozebrali ruskou chemickou terminologii. — A. Janiotisová a H. H. Josselson (15) se zabývali různými typy homonymie a polysémie vyskytujícími se v ruských mate[236]matických textech. — Technickým otázkám SP bylo věnováno pět referátů, a to o ukládání gramatických a lexikálních údajů do samočinného počítače s velkou kapacitou (33, 26), o otázkách adresování (addressing) (4, 23), o způsobu hledání v slovníku a o morfologické analýze ruských slov v závislosti na požadavku, aby se hledání v slovníku dělo důsledně podle abecedy. — Referáty italské skupiny, vedené S. Ceccatem (30, 31), byly věnovány vztahu mezi strojovým překladem a činností překladatele.
U některých lingvistických referátů byl vztah ke SP a překladu vůbec volnější. Transformační metodou zpracoval anglická slovesa podle typu objektu S. Chatman (9), ruské genitivní predikativní konstrukce D. S. Worth (16). J. Barton (32) analyzoval užívání členů v angličtině. E. S. Klima (13) řešil na protikladu sloves slyšet: poslouchat, vidět: dívat se ap. otázku systému ve slovníku.
Ve dvou referátech se využívalo moderní formální logiky. R. P. Mitchell (24) zjistil, že Bar-Hillelova kategoriální gramatika (srov. P. Novák, o. c., par. 3.53), resp. tři její podoby, je jen zvláštním případem rozsáhlejší třídy gramatik jistého obecnějšího typu, a dokázal, že je ve všech gramatikách tohoto typu kategorie „věta“ rozhodnutelná, tj., že existuje takový čistě mechanický postup, s pomocí kterého lze o každé posloupnosti symbolů dané gramatiky zjistit, je-li „větou“.[10] E. K. Charneyová (8) rozebrala význam angl. spojek either - or (VJaz 10, 1961, č. 6, 139n.).
Řada referátů pojednávala o různých možnostech využití samočinných počítačů pro výzkumné účely lingvistické. M. Levison (29) probral některé způsoby sestavování slovníku a konkordancí, K. Spack-Jones (25) navrhl způsob mechanické sémantické klasifikace slov. V. H. Yngve (6) referoval o ověřování anglické generativní gramatiky jistého typu (jde o větně strukturní gramatiku připouštějící diskontinuitní složky) na samočinném počítači produkcí náhodného souboru vět. W. Plath (2) probral teoretické předpoklady i užívané zásady automatického sestavování větných diagramů na základě provedené již syntaktické analýzy textu.
V přednáškách P. Garvina (1) byl popsán jeden z možných způsobů automatického sestavování gramatiky z dostatečně dlouhého textu za předpokladu, že je v textu již provedena segmentace (tedy prakticky z psaného textu). Výsledkem má být klasifikace všech slovních tvarů do jistých syntaktických tříd a soupis všech syntaktických konstrukcí. V takových postupech je nutno využívat základních poznatků o jazykových jednotkách a jejich chování v textech, platných pro všechny jazyky.[11]
[1] Výklad a základní návrh na systém sémantiky v pojetí tohoto kolektivu ve sborníku Mašinnyj perevod, Trudy ITM i VT, vyp. 2, Moskva 1961.
[2] J. W. Perry - A. Kent, Tools for Machine Literature Searching, New York 1958.
[3] Referát byl publikován ve sb. O točnych metodach issledovanija jazyka, srov. SaS 23, 1962, 131n.
[4] Srov. P. Novák, Některé otázky syntaktické analýzy (z hlediska strojového překladu), SaS 23, 1962, odst. 3.522.
[5] Vydala je Národní fyzikální laboratoř (National Physical Laboratory).
[6] Některé podobné myšlenky jsou obsaženy v dávno již hotové práci manželů Jaurisových, která je v tisku v publ. AUC-Philosophica.
[7] Srov. P. Novák, o. c. v pozn. 4, par. 2.2.
[8] Viz u nás L. Rieger, O grupách a svazech, Praha 1952, část 2.
[9] Srov. K. Čulík, On Some Axiomatic Systems for Formal Grammars and Languages, Praha 1962, přednáška, která bude přednesena na kongresu IFIPu, 28. srpna—1. září 1962 v Mnichově.
[10] Již dříve bylo známo, že je Bar-Hillelova kategoriální gramatika ekvivalentní s větně strukturní gramatikou a že je větně strukturní gramatika rozhodnutelným systémem.
[11] První takový systém navrhl N. D. Andrejev, Modelirovanije jazyka na baze jego statističeskoj i teoretiko-množestvennoj struktury, Tezisy soveščanija po matemat. lingvistike (15—21 aprelja 1959 g.), Leningrad 1959, 15—22.
Slovo a slovesnost, volume 23 (1962), number 3, pp. 232-236
Previous Igor Němec: Hujerovy příspěvky a podněty k historickému studiu češtiny
Next Karel Horálek: Mezinárodní jazykovědná bibliografie
© 2011 – HTML 4.01 – CSS 2.1