Časopis Slovo a slovesnost
en cz

Stroje na zpracování informací a jejich význam pro jazykovědu

Jitka Štindlová

[Discussion]

(pdf)

Машины для обработки данных и их значение для языкознания / Machines de traitement des informations et leur importance pour la linguistique

Stroje na zpracování informací[1] jako prostředek mechanizace a automatizace začaly zasahovat již dnes do našeho života; pomáhají zvládat a automaticky řídit složitou organizaci výrobních i administrativních úkolů. Umožňují řešení vědeckých úkolů, které doposud nebylo možné lidskými silami zvládnout. V poslední době se stala aktuální i otázka jejich využití v jazykovědě.

Myšlenka užít strojů pro jazykovědnou práci se objevila jednak v souvislosti s řešením automatického strojového překladu, úkolu, který před lingvisty postavily právě samočinné počítače,[2] jednak v souvislosti s možnostmi pomocí strojů zpracovávat statistická data a se širokými zkušenostmi z komplexních záznamů statistických dat nejrůznějšího charakteru na děrné štítky.

Jazykověda potřebuje ke své práci velký počet speciálních excerpčních sbírek, v nichž musí být zkoumaný zjev zastoupen dostatečným počtem dokladů, aby jeho podoba mohla být popsána, jeho obsah vymezen a jeho funkce zobecněna. I když ve většině případů není takový materiál shromažďován proto, aby jen číselné součty charakterizovaly jazykové skutečnosti [209](zobrazené v nějaké sbírce dokladů nebo postižené nějakou excerpční sbírkou), neboť toto číselné statistické vyjádření je jen dokreslujícím, pomocným materiálem, přesto má vlastně každá jazykovědná excerpce, i lexikografická i gramatická, jisté statistické rysy — zastupuje jistými vybranými případy, vzatými z určitého celku, jistý jev. Předpokladem pro číselné statistické vyjádření nějakého jevu je shromáždění záznamů tohoto jevu, evidence jeho výskytu. A lingvistům v podstatě jde o sebrání nebo vyhledání případů jistého jevu více než o jejich konečný součet. Tyto součty mohou poskytnout jen hrubou pomocnou informaci proporcionálního zastoupení, neboť tyto sbírky si nekladou za úkol úplnost všech dokladů. Konečná statistická data mají pro vyjádření mnohých poměrů a zákonitostí v jazyce svůj smysl a svou cenu, a v některých případech jsou jediným cílem a ukazatelem; ovšem musí vycházet z úplného nebo pro statistické vyjádření dostatečného materiálu, např. pro zjištění frekvencí písmen, fonémů, morfémů a slov, event. slovních celků, nebo nejčastějších kombinací těchto jevů. Takováto přesná, statistickým šetřením získaná čísla vytvářejí nejen předpoklady pro jazykovědná zobecňování (ať synchronního, historického nebo srovnávacího pohledu), ale zároveň slouží jiným oborům, jsou nutná jako podklady pro řešení technických otázek přenosu a zpracování informací.

Statistickým charakterem všech jazykovědných excerpcí je však dána i možnost užít k této práci moderních technických prostředků, které má statistika k dispozici, strojů na děrné štítky a samočinných počítačů.

Stroje na děrné štítky jsou schopny z jednoho celku, v němž jsou komplexně zaznamenána všechna potřebná data, vytřídit podle nejrůznějších hledisek série sbírek specifikovaných a zase je vrátit v jeden celek, připravený pro úkoly další. Stroje umožňují s excerpčním materiálem operativně pracovat, abecedně i věcně jej přeskupovat, kombinovat a konfrontovat z nejrůznějších hledisek. V této možnosti kombinovat a konfrontovat nejrůznější hlediska je největší přednost takovéhoto zpracování excerpčních sbírek, neboť stroje umožní později řešit i ty úkoly, o jejichž potřebě dnes ještě nevíme, které však budou záležet především v novém a dalším kombinování různých jazykových kritérií. Dosavadní organizace excerpcí žádnou z těchto možností neměla. Byla stejně nákladná, organizování a udržování znamenalo vždy mnoho námahy jazykovědných pracovníků a byla v základě jen jednoúčelová, jednostranně použitelná.

Děrné štítky jsou pro uložení jazykovědného excerpčního materiálu velice vhodné. Naše úkoly nevyužijí sice plně počítací schopnosti strojů pracujících s děrnými štítky, budou však vynikat bohatostí třídicích hledisek. Děrný štítek je kartón přesných rozměrů (183,7 mm × 82,5 mm) a vlastností (přesné síly a jakosti kartónu), v němž se děrováním zaznamenávají informace, s nimiž stroje pracují. Mohou však být na něm i záznamy, které neděrujeme (tj. záznamy písemné, s kterými stroje nepracují, v našem případě např. definice, citáty apod.).[3] Na děrném štítku je maximálně devadesát děrných sloupců a v každém z těchto sloupců je možné umístěním jedné perforace nebo nějaké závazné kombinace perforací, tj. podle stanoveného kódu, vyjádřit buď číselné údaje (od nuly do devítky), nebo údaje abecední (vždy v jednom sloupci jedno písmeno). Různá třídicí hlediska jsou na štítek ukládána a stroji zpracovávána v jistém klíči[4] v podobě čísel.

[210]Každá informace, hodnota, podle které chceme materiál uspořádat a zpracovávat, musí být vyjádřena nějakým číslem a určena pozicí v některém děrném sloupci. Různých informací (v našem případě třídicích znaků), vložených do paměti stroje, tj. při užití děrnoštítkových strojů záznamů různého druhu na děrném štítku, může být daleko více, než je míst pro perforaci (může jít o milióny údajů). Tím, že spojíme několik děrných sloupců, vytvoříme děrné pole, v němž pozice čísel v různých sloupcích představují různé řády (jednotky, desítky atd.). Tím podstatně zvýšíme počet možných záznamů různých informací. Ve vytvořeném poli můžeme na každém štítku umístit vždy jednu informaci jistého charakteru. Těchto informací ve vytvořeném poli může být např. při spojení dvou sloupců, tj. vytvoření dvousloupcového pole, kdy čísla v prvém sloupci značí desítky, v druhém jednotky, již 99 místo 20 ve dvou děrných sloupcích samostatných. Při spojení tří sloupců 999 (místo 30 ve třech samostatných sloupcích) a např. při spojení sedmi sloupců vzniká možnost zaznamenat na každém štítku jeden případ z miliónu možných případů. To znamená, že např. pro evidenci faktů oklasifikovaných formou šestimístného desetinného třídění postačí pouhých šest sloupců.

S děrnými štítky pracují stroje na děrné štítky. Hlavní stroje děrnoštítkové soupravy: děrovač, přezkoušeč, popisovač, reproduktor, třídič, tabelátor a počítač[5] umožňují záznam údajů, tj. vyděrování údajů v kódu na štítky, jejich zpracování, zvl. třídění a různé početní operace a nakonec dekódování a automatický výpis výsledků.

I samočinné počítače mohou pro vstup úlohy do stroje užít děrných štítků, mohou údaje ze štítků snímat, převádět např. na magnetické pásky a dále zpracovávat. Vstup nebo vstupní jednotka a výstup nebo výstupní jednotka jsou vedle paměti a řadiče hlavní části samočinných počítačů.[6] Perspektivně počítáme, že některé úlohy budeme řešit na novém československém samočinném počítači EPOS.[7]

[211]Samočinný počítač je např. schopen zaznamenat sbírky dokladů jistého jevu z vytříděných štítků před jejich návratem do základního celku nebo před dalším přeskupením. Takovéto archívní záznamy bude možno dále zpracovávat a budou mít cenu pro pozdější konfrontace různých etap, evidenci a samostatné zpracovávání přírůstků. Možnost konfrontovat různé etapy bude mít cenu především v těch oblastech jazykovědného studia, kde rychle postupuje vývoj, kde je neustálý pohyb, kde statické sbírání materiálu nepostačuje. Jednou z takových oblastí je např. odborné názvosloví. Bez moderních technických prostředků je myšlenka souborného pohotového uložení názvosloví nejrůznějších oborů prakticky neuskutečnitelná. Teprve stroje umožní takovýto úkol zvládnout a řešit, tj. veškerý názvoslovný materiál uložit opravdu operativně tak, aby jej bylo možno třídit, přeskupovat a tím využít k účelům praktickým i teoretickým v plánu pojmovém i v plánu formálního vyjádření.[8]

Teprve pomocí strojů je možno rychle, přesně, zcela mechanograficky, tj. strojním záznamem, zprаcovat úplnou, „totálníexcerpci děl autorů — zaznamenat všechna slova, která příslušný text obsahuje.[9] Vedle konkordančních indexů, tj. abecedně seřazených slov s udáním všech míst, v kterých se v díle nebo v dílech nacházejí, je možno strojně vyrobit i konkordanční listy s kontexty, které dávají podklady pro lexikografické zpracování a především pro sémantickou a stylistickou analýzu.

[212]Výrazy získané totální excerpcí, tj. záznamem všech slov v textu, je možno zkoumat a přeskupovat podle nejrůznějších kritérií významových, gramatických i stylistických. Je snadné získat frekvenční indexy a podle indexů strojně rychle a přesně uspořádat frekvenční slovníky.[10] Je možné strojně tyto výrazy abecedně seřadit nejen od začátku slov, ale i od jejich konce.

Retrográdní seřazení slov v tvarech, v jakých se vyskytují v textech, spolu se záznamem jejich frekvence by mělo velký význam pro studium morfologie. Retrográdní řazení základních tvarů, tj. infinitivů, nominativů, adjektiv v 1. pádě muž. rodu, tvarů, v kterých jsou slova uváděna a řazena v slovnících, by mělo význam především pro studium slovotvorby.[11]

Retrográdní seřazení slov i sousloví, zvláště úplné zpracování slovní zásoby starších období, dávalo by také předpoklady pro rekonstrukci slov a jejich tvarů v poškozených a neúplných textech starších období.[12]

Možnosti, jaké užití strojů lingvistice dává, nejlépe si uvědomíme, představíme-li si, že by náš, i tak skvělý poklad — lexikografický archív Ústavu pro jazyk český, dnes obsahující více než devět miliónů dokladů, byl zpracován na děrných štítcích. Odpadlo by už samo pracné abecední řazení a udržování abecedního pořádku v řazené kartotéce — to by obstaraly stroje. Ale zároveň by bylo možné z jednoho abecedního celku kdykoli vyjmout všechny doklady, které v tomto celku jsou z některého autora (např. Němcové, Jiráska, Nerudy); tím by byly vytvořeny podklady pro zpracování autorských slovníků.

Archív ÚJČ původně obsahoval asi 2 200 abeced, autorských, publicistických nebo určité období dokumentujících celků. Ještě v době, kdy se psal první díl Příručního slovníku, nebylo všech těchto více než dva tisíce abeced sloučeno v jedinou velikou abecedu, ale zůstávalo ještě 36 abeced, zachycujících zvlášť doklady z děl našich velkých autorů, autorů jisté doby, žurnalistiky některých období. Ovšem průběhem práce na prvním svazku Příručního slovníku se ukázalo, že je nemožné při práci na slovníku udržovat i těchto už jen 36 abeced. Proto byl veškerý materiál sloučen v jednu abecedu a tímto sloučením bylo vlastně znemožněno z tohoto materiálu později specializované úseky zpracovávat.

Stroje by ovšem umožnily nejen vytřídit všechny doklady z jistého autora, ale i všechny doklady z kteréhokoli jeho díla. To by mělo velkou cenu pro doplňování a porovnávání s novými vydáními a s vydáními kritickými.

Mnoho práce a starostí způsobil pracovníkům ÚJČ např. fakt, že mnohé excerpce (od r. 1911, kdy se se sbíráním materiálu pro slovník jazyka českého začalo) byly vypracovány z tehdejších vydání, která se nevyrovnají novým textově kritickým vydáním. V takových případech bylo třeba provést revizi excerpce. Nová kritická vydání se musela porovnat s vydáními, z nichž bylo excerpováno, místa, v nichž se oba texty neshodovaly, musela být znovu vypsána na nové označené lístky a vložena do archívu, aniž staré výpisy byly zrušeny, neboť vyhledávání těchto lístků mezi ostatními doklady by představovalo velkou práci.[13]

[213]Literární historikové i stylistikové by mohli také stanovit své požadavky např. na eventuální vyjmutí slovní zásoby autorů spřízněných buď lokálním původem, nebo sociální příslušností, sujetovou nebo žánrovou podobností apod.

Jindy by mohl být materiál archívu přeskupen podle stáří dokladů, což by mohlo mít cenu i pro studia historická a kulturně historická. Bylo by možno i z lexikálních sbírek např. zjistit, v kterém roce se prvně objevuje to či ono slovo a pro ten či onen nový pojem nebo kdy se obsah jistého pojmu v tom slově ustaluje, v kterém roce které otázky a problémy stály v popředí zájmu, jakým způsobem se kdy o nich psalo apod.

Podobně by mohl být archív roztříděn podle charakteru pramenů; např. slova, která jsou doložena z poezie, prózy a vůbec z krásné literatury, slova z novin, populárně vědecké tvorby nebo z prací vědeckých. Mohlo by být odděleno např. odborné názvosloví a roztříděno do základních oborů, aby bylo možné sledovat zastoupení jednotlivých oborů v archívu. Takovéto roztřídění by mělo cenu především pro získání lexikálních podkladů pro charakteristiku stylových vrstev.

Mechanografické zpracování lexikálního archívu ÚJČ by však dovolilo archív připravit i pro studia gramatická, získat sbírky slov uspořádaných podle slovních druhů, gramatických kategorií a vlastností i s frekvenčními údaji pro jednotlivé otázky, jaké by těžko jednotlivě bez strojního zpracování vůbec mohl kdo získat a uspořádat.

To jsou jen náměty, které dnes už není možno zpětně na tomto archívu realizovat. Bylo by však možno uvažovat, jak zpřístupnit a zrychlit práci s devítimiliónovým archívem — dnes už je rozsah materiálu mnohdy překážkou rychlého zpracování, pohotového přehledu dokladů nebo snadného vyhledání některých dokladů. Pro mnohé účely by jistě pomohl mechanografický záznam v podobě jakýchsi „excerpčních snímků“. Takovýto snímek na děrném štítku by obsahoval např. slovo a jeho gramat. charakteristiku, obraz četnosti jeho dokladů a tvarů, záznam, z kterých děl a autorů a jejich děl je slovo doloženo, informace o zdrojích excerpce a charakteru těchto zdrojů, data nejstarších a nejmladších dokladů, záznam o event. odborném využití (pro které obory). Zároveň by se na něm zaznamenávalo, zda je slovo zpracováno v Příručním slovníku jazyka českého a v Slovníku spisovného jazyka českého a zaznamenaly by se stylistické a normativní hodnoty, které slova v těchto slovnících mají. Podrobnější charakteristika materiálu k jednotlivým významům by se mohla opřít o členění na významy a jejich číslování v Slovníku spisovného jazyka českého. K těmto snímkům jednotlivých slov by se připojila podobně hodnocená sousloví i automatizovaná spojení slov a frazeologické celky, v nichž se slovo objevuje. I takovéto informativní zpracování archívu na „snímcích“ by bylo obtížné a znamenalo by zhruba tolik práce, kolik vyžaduje první zpracování lexikografických hesel, ale přesto by bylo užitečné o něm uvažovat.

Je však třeba bezpodmínečně se starat o to, aby pomocí nových postupů byly organizovány ty sbírky dokladů, které teprve vznikají nebo budou vznikat, např. staročeský archív, archív jazyka díla J. A. Komenského, archív odborného názvosloví, archív lidového jazyka a materiálové podklady pro atlas slovanských nářečí, rovněž i nové sbírky základního lexikálního archívu.

Stroji je ovšem možno nejen mechanizovat sbírání, popis, ukládání a třídění excerpčního materiálu, tj. získávání materiálového základu vědecké analýzy a zobecňování, ale pomocí strojů je možno dokumentovat i zpracované, publikované jazykovědné dílo. Např. by bylo možno zachytit slovník tak, aby veškerého materiálu uloženého v díle a veškerých výsledků práce mohlo být pohotově v nejrůznějších aspektech a kombinacích aspektů užíváno k praktickým účelům i k dalšímu vědeckému zkoumání. Proto také zamýšlíme v ÚJČ připravit pro strojní zpracování právě vycházející Slovník spisovného jazyka českého. Získáme tím mimo jiné i přesné podklady pro redakční práci (sjednocování, doplňování, odkazování apod.). To bude mít cenu pro doplnění jeho prvního vydání, především však pro vydání druhé. Zároveň získáme široký materiál pro lexikální, gramatická i stylistická studia potřebná jak pro praktické účely, tak pro vědeckou práci teoretickou. Mechanograficky dokumentované zpracování slovníku by mohlo sloužit i jiným [214]účelům a úkolům, které se teprve vynořují. Např. stroji zachycená přesná klasifikace podle slovních druhů a morfologických charakteristik by mohla dát předpoklady pro užití slovní zásoby tohoto slovníku při strojovém překladu.

Toto všechno je ovšem jen stručné naznačení možností, které nám stroje nabízejí.[14]

Stroje dávají předpoklady i úspěšně užít nových, exaktních metod v lingvistické práci, dávají možnost aplikovat i metody jiných věd, zvláště matematiky,[15] a dobrat se tak výsledků přesných, spolehlivých, vyčerpávajících, nezaložených na subjektivním názoru nebo neovlivněných subjektivním názorem, odhadem, nedostatečným materiálem a nekomplexním pohledem.

Nové možnosti a potřeby práce na strojích kladou velice náročný úkol před lingvisty — provést důkladnou a všestrannou jazykovědnou analýzu jazykovědných skutečností z pohledů poněkud nových. Nestačí analyzovat jen některé jevy jazykové skutečnosti, ale je třeba provést komplexní analýzu a komplexní klasifikaci. Při této práci je také třeba vidět, jaké jsou potřeby jazykovědné analýzy nejen pro vlastní lingvistiku, ale i pro ostatní vědy, ať společenské nebo exaktní, nebo pro techniku.[16] (Ovšem stanovení programu bude muset předcházet řada přesných strojových zpracování dílčích úseků.) Repertoár základních znaků pro strojní zpracování jazykových faktů bude nutné stanovit a uspořádat za účasti široké odborné veřejnosti, předních našich lingvistů. Každá oblast jazykovědy bude pro účely strojového zpracování zachycena v podobě klasifikace. Návrhy jednotlivých klasifikací bude nutno předkládat odborné diskusi. Protože lze předpokládat, že se mechanografické, strojové zpracování jazykovědného materiálu stane obecnějším způsobem práce s jazykovým materiálem,[17] je třeba tím více v těsné spolupráci dohodnout a sjednotit hlediska pro klasifikaci jednotlivých oblastí jazykovědy. Technické prostředky, dovolující potenciálně začlenit a vyčlenit nejrůznější sbírky, umožňují snadno i celé [215]komplety sbírek reprodukovat. Bude tedy např. možno, aby sbírky nejrůznějších pracovišť byly pro některé potřeby sloučeny, pro jiné opět rozděleny. Eventuální kombinování materiálu nejrůznějších sbírek nejrůznějších pracovišť, např. pro zpracování lexikografického díla, zpracování co nejúplnějšího retrográdního slovníku, získání obrazu o frekvenci atd. může vycházet jen z faktu, že byly dohodnuty a stanoveny shodné klíče pro shodnou klasifikaci základních jazykovědných skutečností. Při stanovení jednotlivých klíčů je třeba vidět všechny úkoly a potřeby, které vznikají na jednotlivých úsecích práce. Tak např. základní klasifikace slov, která vznikne jen z potřeb excerpovat slova přímo v textu, bude pro strojový překlad jiná než pro tradiční jazykovědná zkoumání a bude opět jiná, vzejde-li jen z potřeb zachytit slovní zásobu již zpracovanou v slovníku. Při stanovení základní klasifikace je třeba ke všem těmto potřebám přihlížet a pokusit se navzájem je sladit.[18]

V souvislosti se stanovením programu jazykovědné analýzy pro stroje vznikne i potřeba jazykovědné terminologické práce. Bude třeba mnohé termíny pojmově vymezit, jiné pojmy jednotně pojmenovávat; pojmenování jednotně a jednoznačně užívat a obsah pojmů definovat. Proto je třeba vítat, že Československá terminologická komise lingvistická, vedená prof. A. Jedličkou, rozvíjí velice aktivně svou činnost (právě nyní zpracovává česko-slovenský rejstřík základní lingvistické terminologie) a je kompetentní řešit nejasné nebo sporné termíny.

Možnosti, které stroje na zpracování informací jazykovědě slibují a zaručují, jsou veliké a dnes snad ještě plně ani netušené a nepředstavitelné. Ovšem abychom mohli na strojích opravdu přesně pracovat, musí vyjadřovat plně českou nebo slovenskou (event. českou i slovenskou) abecedu.[19] Abecední záznamy dosud řešených jazykovědných úkolů na děrnoštítkových strojích jsou buď kompromisem mezi anglickou a českou abecedou, kterou dosavadní abecedně číselné stroje, i naší československé výroby, nepostihují plně (nevyjadřují např. krátké a dlouhé samohlásky), nebo jsou získávány pracným převodem písmen na čísla (dvojčíslí).

Proto usilujeme o to, aby Ústav pro jazyk český adaptací nebo speciální konstrukcí strojů, které by vyjadřovaly a zpracovávaly úplnou českou (eventuálně českou i slovenskou) abecedu, získal strojní vybavení, které by umožnilo přesné abecední záznamy a přesné abecední zpracování (zvl. řazení).[20] Kolem tohoto strojního vybavení by mohly být soustředěny v Ústavu pro jazyk český i práce ostatních lingvistických pracovišť a lingvistických pracovníků, pokud nevznikne speciální pracoviště pro aplikovanou lingvistiku. Tím, že vytváření strojně zpracovaného jazykovědného pomocného materiálu by bylo soustředěno na jediném, k tomu účelu uzpůsobeném pracovišti, byla by zajištěna vzájemná koordinace všech pomocných prací, zabránilo by se eventuální duplicitě, která doposud není vyloučena, a bylo by snadno možné kombinovat různé sbírky pro různé účely.

Jazykovědný materiál, zpracovaný na strojním vybavení Ústavu pro jazyk český, by ovšem vyžadoval, aby byla zajištěna možnost zpracovávat jej i na samočinném počítači typu, jako bude EPOS, tj. aby byla zajištěna spolupráce s pracovištěm, které bude tento dokončovaný československý samočinný počítač vlastnit.


[1] Zařízení, která samočinně nebo polosamočinně zpracovávají kódované informace. Rus. mašiny dlja obrabotki dannych, angl. information processing machines, něm. Maschinen für Informationsverarbeitung, fr. machines de traitement des informations, pol. maszyny przetwarzające informace.

[2] Samočinné počítače jsou číslicové počítače, které samočinně zpracovávají informace podle instrukční sítě (programu) uložené do jejich paměti. Rus. bystrodejstvujuščaja vyčisliteľnaja mašina, avtomatičeskaja mašina, angl. automatic computer, něm. automatische Rechenmaschine, programgesteuerter Rechenautomat, franc. calculateur numérique automatique, pol. automatyczna maszyna.

[3] Štítek, na němž jsou děrované i neděrované údaje sdruženy, nazývá se sdruženým.

[4] Klíč není totéž co kód. Kódem se rozumí systém znaků a pravidel pro vyjádření informací ve stroji. Kód je záležitostí stroje. Nikdo se nemusí starat o to, jakou pozicí nebo kombinací dírek se vyjadřuje např. 1 nebo 9, A nebo B — ani operátorka u stroje ne. Klíčem se rozumí soustava čísel, číselné řady, které vyjadřují a od sebe odlišují jednotlivé pojmy, hodnoty, údaje, třídicí znaky. Jestliže pro některé záznamy užijeme klíče, tj. stanovíme jistá čísla pro vyjádření jistých údajů, pak kódem rozumíme technický způsob zachycení tohoto klíče. — V cizojazyčné literatuře se slova kód užívá často ve významu „kód“ i „klíč“ a slova kódování nebo kodifikace i ve významu „vytváření klíčů, vypracovávání klasifikace“.

[5] Stroje na děrné štítky, rus. sčetno-perforacionnyje mašiny, angl. punched card machines, něm. Lochkartenmaschinen, franc. machines à cartes perforées, pol. maszyny systemu kart dziurkowanych; děrný štítek, rus. perfokarta.

Děrovač — stroj, na němž se děrují údaje do děrných štítků v jistém kódu; rus. perforator, angl. card punch, něm. Kartenlocher, franc. poinçonneuse, perforatrice, pol. dziurkarka.

Přezkouseč — stroj, na němž se kontroluje, zda údaje byly do štítku správně vyděrovány; rus. kontrolčik, angl. verifier, něm. Lochprüfer, franc. vérificatrice, pol. sprawdzarka.

Popisovač — stroj, který na vyděrované štítky napíše, co je na nich vyděrováno; to znamená, že převede, „přeloží“ kódované informace v informace nekódované, v „otevřené řeči“, popíše, co je štítkem stroji sdělováno; rus. rasšifrovočnaja mašina, angl. interpreter, něm. Lochschriftübersetzer, franc. traductrice.

Reproduktor a opakovač — stroje, které přenášejí děrování jednoho štítku do štítku jiného (nebo do celé řady jiných štítků). Opakovač jen opakuje děrování jednoho štítku do štítků jiných, reproduktor umožňuje i různá přemístění a porovnávání vyděrovaných údajů, rus. reprodukcionnyj perforator, reproduktor, angl. reproducer, reproducing punch, něm. Kartendoppler, franc. reproductrice, reproductrice-duplicatrice, pol. reproducer.

Třídič — stroj, který třídí děrné štítky na základě údajů v nich vyděrovaných; rus. sorter, angl. sorting machine, něm. Sortiermaschine, franc. trieuse, pol. segregarka, sorterka.

Tabelátor — stroj, který vyděrované údaje ze štítků snímá (některé početně zpracovává) a zvolené údaje vypisuje slovy a čísly; rus. tabuljator, angl. tabulating machine, něm. Tabelliermaschine, franc. tabulatrice, pol. tabulator.

Počítač (děrnoštítkový) — polosamočinný číslicový počítač, tj. stroj, který samočinně čte informace vyděrované ve štítcích, provádí s těmito informacemi různé operace a výsledky opět děruje do děrných štítků; rus. vyčisliteľnaja mašina, angl. computer, calculator, něm. Rechner, Rechnenmaschine, franc. calculateur.

[6] Vstup — část počítače, která prostředkuje vkládání vstupních informací do stroje; rus. vchodnoje ustrojstvo nebo ustrojstvo vvoda, angl. input unit, něm. Aufnahmegerät, Eingabe, franc. entrée.

Výstup — část počítače, která umožňuje výstup informací ze stroje; jeho součástí může být tiskárna, která umožňuje přímé tištění výsledků; rus. vychodnoje ustrojstvo, ustrojstvo vyvoda, angl. output unit, něm. Ausgabegerät, Ausgabe, franc. sortie.

Paměť — část počítače, kde jsou zaznamenány a uchovávány všechny kódované informace; rus. pamjať, zapominajuščeje ustrojstvo, nakopiteľ, angl. memory, storage, store, něm. Speicher, Speichewerk, franc. mémoire, pol. pamięć.

Řadič nebo řídící jednotka — část počítače, která řídí chod celého stroje podle instrukcí instrukční sítě (podle algoritmu); rus. upravljajuščeje ustrojstvo, angl. control unit, něm. Steuerrechenwerk, Steuerwerk, Leitwerk, franc. organe de commande, unité de commande, pol. układ sterowania, starowanie.

[7] Např. retrográdní řazení slov by na děrných štítcích trvalo poměrně dlouho a vyžadovalo by vedle normálního děrování slov pro řazení od začátku i speciální jejich vyděrování pro retrográdní řazení, což by znamenalo podstatné zmenšení kapacity štítku. — Každé slovo by muselo být na štítku vyděrováno dvakrát. Má-li třídič děrnoštítkové soustavy řadit slova od konce, musí je mít pro toto řazení vyděrována, a to tak, aby všechna poslední písmena, předposlední atd. byla vždy vyděrována v jednom sloupci. Rezervujeme-li pro slovo dvacet sloupců, tj. počítáme-li s maximálním rozsahem dvacet písmen pro slovo, znamenalo by děrování pro retrográdní řazení dalších dvacet sloupců, tedy celkem čtyřicet sloupců jen pro zachycení slova pro jeho abecední řazení:

1

2

3

4

5

6

7

8

9

10

n

e

n

a

h

r

a

d

i

t

n

o

s

 

 

 

 

 

 

 

m

o

ž

n

o

s

t

 

 

 

20

19

18

17

16

15

14

13

12

11

 

 

 

 

 

 

n

e

n

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

11

12

13

14

15

16

17

18

19

20

e

l

n

ý

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10

9

8

7

6

5

4

3

2

1

h

r

a

d

i

t

e

l

n

ý

 

 

 

 

 

 

 

n

o

s

 

 

 

m

o

ž

n

o

s

t

 

Samočinný počítač by speciální děrování nepotřeboval a celý úkol by provedl v podstatně kratším čase.

Návrh řešení retrográdního řazení slov pomocí strojů na děrné štítky je podán v článku J. Štindlové Les dictionnaires inverses, Cahiers de Lexicologie, Besançon 1960, č. 2, s. 79 až 86; stručná informace o retrográdních slovnících a retrográdním řazení slov v SaS 21, 1960, 270—272.

[8] Článek J. Štindlové Využití technických prostředků mechanizace a automatizace při organizaci archívních sbírek odborného názvosloví, NŘ 44, 1961, 23—32, seznamuje s návrhem, jak Ústav pro jazyk český hodlá ukládat názvoslovný materiál na děrné štítky a pomocí strojů na děrné štítky jej zpracovávat.

[9] Stroje mimo jiné dávají i nové možnosti, jak shromáždit materiál pro kritiku textů a přípravu kritických vydání děl klasiků.

[10] Práce Frekvence slov, slovních druhů a tvarů v českém jazyce byla vypracována ve Výzk. ústavu pedagogickém v Praze pod vedením J. Jelínka, J. V. Bečky a M. Těšitelové na základě speciální namáhavé a dlouhé, ale přece jen omezené excerpce, která pro tento účel byla získávána několik let velkým počtem pracovníků (zvl. učitelů a vysokošk. studentů). Excerpční sbírky jsou nyní uloženy v Ústavu pro jazyk český. — Dílo, oceňované v cizině, čekalo u nás dlouho na publikování přesto, že má značnou cenu teoretickou i praktickou; nyní právě vychází. Další frekvenční slovník na podkladě značně širším, doufáme, že vznikne úsporně a rychle strojním zpracováním mechanografických záznamů. Bližší seznámení s problematikou tzv. frekvenčních slovníků v. zde na s. 171—181 v článku M. Těšitelové.

[11] Materiálovým podkladem díla o odvozování slov v češtině, právě dokončovaného pracovníky Ústavu pro jazyk český, je v ÚJČ pracně získaný retrográdní slovník z devítisvazkového Příručního slovníku jazyka českého; z vycházejícího Slovníku spisovného jazyka českého bude už asi možno získat retrográdní slovník nepoměrně rychleji a úsporněji.

[12] Proto se s retrográdním seřazením slov pracovalo u mrtvých jazyků; v. uved. čl. SaS 21, 1960, 270—272.

[13] Problematikou tzv. revize klasiků se v ÚJČ zabývá Fr. Havlová.

[14] Nemluvíme zde i o mnoha jiných úsecích, na nichž by užití strojů mohlo naší práci prospět, jako např. o možnosti strojně evidovat bibliografické údaje lingvistických prací apod.

[15] Především teorie množin a počet pravděpodobnosti se pro postižení mnohotvárnosti jazykových skutečností, „nezákonné zákonitosti“ kombinací jednotlivých jevů ukazují velice cennými. — Teorie informace jakožto matematickostatistická teorie přenosu informací nás vede k užití matematických, matematickostatistických metod v práci s jazykem, jakožto jazykovým kódem. Základní informace v těchto pracích, uveřejněných v Slově a slovesnosti: P. Sgall, Nové otázky matematických metod v jazykovědě, SaS 20, 1959, 44—55. — A. Jaurisová - M. Jauris, Užití teorie množin v jazykovědě, SaS 21, 1960, 34—41. — J. Krámský, Teorie sdělné promluvy, SaS 20, 1959, 44—55.

[16] Aby bylo možno požadavky z jiných oblastí vědních nebo úseků technických klást a řešit, a to řešit v koordinaci a v spolupráci, byla vytvořena při VIII. sekci ČSAV Komise aplikované lingvistiky. Hospodářsky a organizačně je připojena k Ústavu pro jazyk český, jehož ředitel, akademik B. Havránek je zároveň předsedou této komise. V komisi vedle lingvistů jsou členy i matematikové, technici, logikové z akademických pracovišť, výzkumných ústavů i kateder vysokých škol, a to i ze Slovenska.

[17] V Ústavu pro jazyk český jsme připravili návrh, jak pomocí mechanografických záznamů na děrné štítky organizovat archív odborného názvosloví, jak zpracovávat retrográdní slovníky, a připravujeme pokus dokumentovat tímto způsobem Slovník spisovného jazyka českého.

Na filosofické fakultě KU v odd. strojového překladu ve spolupráci s Výzkumným ústavem matematických strojů pro účely strojového překladu již přistoupili k mechanografickému záznamu elektrotechnických textů pro výzkum optimálního kódu češtiny. (Na úkolu pracuje inž. Korvasová z VÚMS a B. Palek z KU.)

Ve Fonetickém kabinetu ČSAV přistoupili ke stanovení klíčů pro záznam údajů na děrné štítky, aby získali podklady pro výběr slovních tabulek při zkouškách srozumitelnosti (viz o tom zprávu B. Borovičkové a J. Novotné v SaS 21, 1960, 265—270).

Z katedry jazyků na Vysoké škole báňské a hutní v Ostravě přichází návrh, aby se užilo děrných štítků pro práci kateder jazyků na vysokých školách. (I. Jiráková, Perspektivy badatelské činnosti kateder jazyků pomocí soustavy děrných štítků, Sborník Vysoké školy báňské v Ostravě 6, 1960, 265—267.

[18] Např. pro stanovení morfologické klasifikace bude třeba přihlížet k prvním výsledkům práce oddělení strojového překladu na filosofické fakultě KU a publikovaným pracím P. Sgalla Soustava pádových koncovek v češtině a D. Konečné Flexe českého slovesa z hlediska přípravy strojového překladu, Acta Universitatis Carolinae, Slavica Pragensia II, 1960, 65n., 85n., a další práci sledovat, prohlubovat a koordinovat.

[19] Pracovní skupina pro otázky mechanizace a automatizace jazykovědných otázek v ÚJČ (F. Daneš, J. Machač, J. Štindlová, M. Těšitelová) sestavila za účasti akademika B. Havránka repertoár znaků potřebných k vyjádření úplné české a slovenské abecedy, interpunkčních znamének a číslic ve strojích na zpracování informací.

[20] Konstruovat tyto stroje by bylo velice důležité nejen pro lingvistickou práci, ale vůbec pro každou práci, která bude vyžadovat přesné abecední záznamy, abecední řazení, zvl. pro úkoly dokumentační a bibliografické.

Slovo a slovesnost, volume 22 (1961), number 3, pp. 208-215

Previous Karel Berka, Pavel Novák: Pokus o využití deduktivní metody k popisu ruské pádové soustavy

Next Vladimír Šmilauer: Česko-maďarský slovník