Redakce, Marie Těšitelová
[Articles]
On direct speech in Czech fiction texts from the quantitative viewpoint
Následující stať publikujeme u příležitosti autorčina významného životního jubilea (srov. zde s. 148–150). PhDr. Marie Těšitelová, DrSc., dlouholetá vedoucí vědecká pracovnice Ústavu pro jazyk český AV ČR, je osobnost, jež koncipovala, organizovala a řídila desítky let týmově založený kvantitativní výzkum češtiny, řadu let stála v čele vědecké společnosti Jazykovědné sdružení při ČSAV. Byla také, nikoli však v poslední řadě, bytostně, ba osudově spjata s naším časopisem. Právě v „havránkovské“ a „těšitelovské“ éře života Slova a slovesnosti se mnozí z členů dnešní redakce a redakční rady učili pod vedením paní doktorky psát a napsat recenzi, zprávu o konferenci, vědecký článek. Výsledky kvantitativních zkoumání češtiny a teoretická východiska těchto zkoumání měla od počátku nemalý mezinárodní ohlas. Čas k těmto skutečnostem nyní, v období vytváření textových korpusů pro účely informatické a pro potřeby počítačového zpracovávání konceptuálních soustav nejrůznějších oborů, připojuje i nezanedbatelný ohlas interdisciplinární, jak o tom svědčí např. publikace Juristická a lingvistická analýza právních textů.
Za časopis i jeho čtenáře přejeme Marii Těšitelové do dalších let zdraví, neutuchající aktivitu a optimismus.
Redakce
Při výběru textů pro kvantitativní analýzu jazyka uměleckého stylu představuje zvláštní problém jejich strukturní výstavba, kde – jak ukázal již J. Mukařovský – „monologičnost a dialogičnost tvoří základní polaritu jazykového dění“ (Mukařovský, 1948, s. 153). Jde o vztah mezi skutečností a jejím jazykovým vyjádřením, které se vyznačuje tím, že se tu prolíná – řečeno terminologií L. Doležela – „promluvové pásmo vyprávěče“ s „promluvovým pásmem postav“ (Doležel, 1960, s. 30n.). V zásadě zde jde o tzv. „přímou řeč“ (dále PŘ) a „řeč autora“ v terminologii naší lingvistické literatury. PŘ se obvykle chápe jako „doslovné opakování“ cizí řeči, přičemž jeho střídání se ztotožňuje s dialogem (Šmilauer, 1972, s. 279–280). V podstatě z tohoto pojetí výstavby textu umělecké prózy jsem vycházela při kvantitativní analýze zaměřené na PŘ, její některé kvantitativní charakteristiky a postavení ve struktuře českého textu uměleckého stylu. Při tom jsem ponechala stranou zřetel k řeči nepřímé, polopřímé a nevlastní přímé řeči (k tomu srov. Šmilauer, 1972; Doležel, 1960; Hoffmannová, 1997), protože PŘ sama o sobě představuje z hlediska kvantitativního problematiku v češtině zatím – pokud vím – neprobádanou. V tom smyslu má moje práce charakter průzkumné sondy, a to i co se rozsahu analyzovaného materiálu týká (srov. dále).
Na potřebu analyzovat PŘ z hlediska kvantitativního jsem narazila již při studiu frekvence slov v češtině (Jelínek – Bečka – Těšitelová, 1961, dále FSČ), nejnověji pak při studiu frekvence slov v současné české próze (Těšitelová, 2000, s. 6n.). Jde o to, do jaké míry má PŘ zvláštní postavení v textu a narušuje jeho homogennost v umě[82]lecké próze, takže by se z ní při kvantitativním studiu měla vyřazovat, popř. zvlášť vyčleňovat. Proto jsem podrobila kvantitativní analýze frekvenci slovních druhů a jejich skupin (srov. dále) v PŘ, ale i v uvozovacích větách (dále UV) a v autorské řeči (dále AŘ), které představují tři základní složky struktury textu v umělecké literatuře.
Při kvantitativním studiu PŘ v českých prozaických textech jsem vyšla z hypotézy, že PŘ má charakter dialogu v textu, a tudíž rozložení druhů slov a jejich skupin z hlediska kvantitativního by mělo být shodné s dialogem (Těšitelová, 1991) a mělo by se v tom lišit jak od UV, tak i od AŘ, kde bychom předpokládali shodu s textem umělecké literatury.
K ověření uvedené hypotézy jsem zvolila – jako v jiné své stati (Těšitelová, 2000) – jednak souvislý výběr prvních 3000 slov ze začátku dvou textů (Těšitelová, 1974, s. 28–46) současných českých autorů M. Viewegha Výchova dívek v Čechách (Český spisovatel, Praha 1994), dále Vw, a L. Procházkové Růžová dáma (Tiberone, Praha 1995), dále P, jednak – pro srovnání – dva stejně dlouhé texty ze 40. a 60. let, které jsem ve svých dřívějších pracích (Těšitelová, 1974 a 1980) analyzovala z hlediska kvantitativního, a to text K. Čapka Život a dílo skladatele Foltýna (Fr. Borový, Praha 1940), dále KČ, a text I. Kříže Úsek častých nehod (Mladá fronta, Praha 1965), dále K.
V citovaném článku (Těšitelová, 2000) a některých mých jiných pracích (Těšitelová, 1974 a 1980) jsou uvedeny kvantitativní charakteristiky týkající se základních druhů slov v češtině i jejich skupin zjištěných na základě jejich frekvence ve FSČ. Připomeňme si, že jde o tyto tři skupiny: (1.) nominální (substantiva, adjektiva a předložky), (2.) verbální (slovesa, zájmena, adverbia a spojky), (3.) ostatní (číslovky, citoslovce a částice). V tomto článku pracuji jen s prvními dvěma skupinami, jak je to časté ve většině mých prací vzhledem k pohybu ve vývoji některých členů třetí skupiny (srov. částice a citoslovce, popř. adverbia). Vycházím tudíž z rozložení prvních dvou skupin nejen v PŘ, ale i v UV a AŘ, a to ve čtyřech výše uvedených textech:
Výběr 3000 slov | ||||||||
Text | PŘ | UV | AŘ | Σ | ||||
| absol. | % | absol. | % | absol. | % | absol. | % |
Vw | 472 | 15,73 | 225 | 7,50 | 2303 | 76,77 | 3000 | 100 |
P | 638 | 21,27 | 337 | 11,23 | 2025 | 67,50 | 3000 | 100 |
KČ | 913 | 30,43 | 182 | 6,07 | 1905 | 63,50 | 3000 | 100 |
K | 618 | 20,60 | 136 | 4,53 | 2246 | 74,87 | 3000 | 100 |
Tab. č. 1
Na první pohled je zřejmé – a lze to i očekávat, že se PŘ i UV užívá ve všech čtyřech textech v závislosti na individuálním stylu jednotlivých autorů, bez zřetele k době vzniku textu. Interval zastoupení PŘ dosahuje maxima v textu KČ (30,43 %), minima v textu současného autora Vw (15,73 %), minimální rozdíl hodnot v intervalu nacházíme mezi textem K (20,60 %) a textem současné autorky P (21,27 %). Vedle individuálního stylu autora se zde zřejmě projevuje i tematika textu (např. oživení dlouhých vyprávěcích pasáží v textu KČ, v omezenější míře v textech P a K, popř. Vw).
[83]K doložení těchto tvrzení by bylo třeba mít k dispozici především mnohem rozsáhlejší materiál, než jaký jsem analyzovala, dále i jemněji utřídit jevy jazykové a stylistické. Nicméně i za dané situace lze ukázat některé objektivní rysy, opírající se o kvantitativní charakteristiky, vedoucí k objasnění vytčené problematiky.
Tab. č. 1 rovněž ukazuje, že při studiu PŘ je třeba sledovat i UV, které v různé míře i pozici většinou provázejí PŘ a spolu s ní vytvářejí nezanedbatelný souvztažný podíl na výstavbě prozaického textu. Existují ovšem rozdíly ve frekvenci slov připadajících na PŘ a UV v jednotlivých textech, podmíněné někdy i potížemi při vyčleňování UV v textu. Individuální styl autorů se totiž projevuje v tom, že se jeden autor např. omezuje na velmi krátké UV s jádrem v slovese dicendi (Kraus, 1976; Šoltys, 1983), kdežto jiný spojuje UV s dalším vyprávěním, začleňují je do textu, resp. do AŘ, srov.:
„Nazdárek!“ zahlaholil odtamtud Král, [ale v té tmě jsem ho neviděl] (Vw, s. 11).
„Děkuju!“ vydechl [a utekl do lavice, aby si dárek v klidu rozbalil, než skončí přestávka] (P, s. 18).
Jak naznačují věty v hranatých závorkách, hranice UV někdy volně splývá s následující větnou strukturou, srov. dále: „Nech si to, ano?“ šeptal mi vztekle s očima plnýma slz, [když ho náš latinář posadil se slabou dostatečnou] (KČ, s. 11). Vedlejší věta příslovečná časová v tomto případě už zcela vybočuje z UV, sama o sobě je do značné míry přetížena postupným příslovečným určením způsobu [vztekle s očima plnýma slz]. Jinak ovšem tato UV uvádí i následující PŘ:
„Já se nikoho o nic neprosím“ (s. 11).
Uvedený příklad z textu KČ dokládá, jak v některých textech jsou PŘ a UV propojeny a jak se někdy nesnadno oddělují od vlastní AŘ, což pro kvantitativní lingvistiku představuje jistý problém při stanovení jednotky souboru. V daném případě to znamená dodržet např. zásadu, že se délka UV vymezuje minimálně slovesem dicendi, popř. jeho bezprostředním rozvíjením.
V tomto článku se pokusím uvést některé kvantitativní charakteristiky jazyka uměleckého stylu v současné próze vzhledem k výše uvedeným složkám textu: (1.) PŘ, (2.) UV, (3.) AŘ. Východiskem k tomu budou jednak tab. č. 1, jednak tab. č. 2, 3, 4, které obsahují rozložení slovních druhů (dále SD) a jejich skupin z hlediska frekvenčního (Jelínek – Bečka – Těšitelová, 1961) ve čtyřech výše uvedených textech (Vw, P, KČ, K).
Ve všech čtyřech analyzovaných textech, dvou současných a dvou srovnávacích, převažuje skupina verbální (v intervalu: 70,22 % (P) – 50,95 % (Vw)) nad skupinou nominální (38,22 % (Vw) – 19,75 % (P)), srov. tab. č. 2 (s. 86) a data charakteristická pro dialog (Těšitelová, 1991, s. 113n.).
Ověřujeme-li významnost shod a rozdílů v rozložení SD a jejich skupin v PŘ (tab. č. 2) mezi dvojicemi textů testem dobré shody χ2, zamítá se hypotéza, že mezi oběma skupinami slov je v PŘ shoda v zastoupení obou skupin, nominální a verbální, srov.
χ2 = 49,816282 > χ2 0,05;3 = 7,81.
Poznámka. Vzorec pro výpočet testu χ2 z nedostatku místa neuvádím (srov. např. Těšitelová, 1974, s. 53n.). Totéž platí i pro průběžné výpočty tohoto testu.
[84]Statisticky významné rozdíly se ukazují u skupiny nominální, a to u textů ze současné literatury, nevýznamné u dvou textů srovnávacích; totéž platí i pro skupinu verbální, avšak rozdíl u textů současných je téměř poloviční. Podle mého názoru to svědčí o zvláštním postavení skupiny verbální v PŘ, jak je to doloženo v rozložení SD a jejich skupin i v dialogu (Těšitelová, 1991, s. 113).
Sledujeme-li detailně rozložení frekvence SD ve skupině nominální v PŘ, hypotéza o dobré shodě výskytů substantiv, adjektiv a předložek ověřená testem χ2 se přijímá, srov.
χ2 = 11,0729 < χ2 0,05;6 = 12,6.
Při výpočtu testu χ2 se větší odchylky vyskytují v současném textu P u hodnot substantiv a ve vztahu k nim i předložek; v srovnávacím textu K se významněji projevují jen u předložek. Znamená to, že někteří autoři častěji opakují v PŘ předložky.
Pokud jde o detailní analýzu skupiny verbální (slovesa, zájmena, adverbia a spojky), převládá v analyzovaných textech frekvence slovesa (24,42 %), vyjímaje text KČ, kde je silnější frekvence zájmen (26,18 %). Srovnání těchto dat z výběrů s daty pro tyto SD v celém textu (Těšitelová, 1948, s. 126n.) ukazuje, že odchylky zjištěné ve výběrech jsou zřejmě podmíněny především jejich omezeným rozsahem, ale i speciálním charakterem PŘ. To by mělo být předmětem dalšího kvantitativního studia na reprezentativním materiále. Jinak ovšem frekvence slovesa, většinou nejsilnější slovní kategorie skupiny verbální, která je typická pro rozložení SD a jejich skupin v českém dialogu (Těšitelová, 1991, s. 113n.), se v odchylkách u jednotlivých analyzovaných výběrů liší.
Větší odchylky ve frekvenci kategorií skupiny verbální nacházíme v textu Vw u zájmen (13,16 %), zatímco pak ve třech ostatních textech tato frekvence přesahuje 20 %, v textu KČ nabývá vyšší hodnoty (26,18 %). Užívání zájmen v PŘ v textech Vw a KČ je přímo protikladné. – Vyšší frekvence zájmen ve skupině verbální vůbec je zřejmě charakteristickým rysem PŘ; potvrzuje to ostatně i frekvence zájmen v textech P a K a v dialogu (Těšitelová, 1991, s. 114).
Na rozdíl od zájmen se v PŘ ve skupině verbální méně často užívají adverbia, např. v textu KČ jen v 8,11 %. Znamená to, že v PŘ poměrně zřídka je sloveso provázeno adverbiem v syntaktické funkci příslovečného určení. – Také frekvence spojek dosahuje v PŘ minimálních hodnot (srov. k tomu i nejnižší frekvenci tohoto SD v dialogu, Těšitelová, 1991, s. 115). Potvrzuje se tu dřívější zjištění, že český dialog dává přednost bezespoječnému spojení vět a slov, resp. volnému přiřazování vět apod., což se projevuje jako rys mluveného projevu vůbec.
Ověřením shod a rozdílů v rozložení SD v PŘ ve skupině verbální testem χ2
χ2 = 28,520080 > χ2 0,05;9 = 16,9
zamítá se hypotéza, že se neobjevily statisticky významné rozdíly v jednotlivých složkách této skupiny v PŘ. Největší odchylky se ukazují v hodnotách zájmen a adverbií (srov. výše), tedy u SD, které mají ve větě vzhledem k slovesu (nejčastěji ve funkci predikátu) zvláštní postavení (zájmeno jako subjekt nebo objekt, adverbia jako některý z druhů příslovečného určení). – V tom jde zřejmě o jeden ze základních rysů [85]jazyka PŘ v textu, tj. jednotliví autoři užívají SD ve skupině verbální se značnou volností, takže můžeme usuzovat na rys individuálního autorského stylu.
Sledujme dále rozložení SD a jejich skupin v PŘ analyzovaných čtyř textů a srovnejme významnost rozdílů v jejich hodnotách s analogickými hodnotami v dialogickém korpusu FSD, pořízeném na základě souboru dramat (D) z FSČ (tedy FSD) o rozsahu ND = 140 225 (Těšitelová, 1991, s. 110n.). Aplikujeme-li opět test dobré shody χ2, zamítá se hypotéza o shodě rozložení SD v korpusu FSD a v analyzovaných textech, srov.:
v textu Vw χ2 = 10,568659 |
|
v textu P χ2 = 44,417024 | > χ2 0,05;1 = 3,84; |
v textu KČ χ2 = 6,9129611 |
|
pouze v textu K se přijímá hypotéza, že rozdělení SD a jejich skupin se shoduje s rozložením SD a jejich skupin v dialogu
χ2 = 1,7204286 < χ2 0,05;1 = 3,84.
Celkem lze konstatovat, že se rozložení SD a jejich skupin v PŘ analyzovaných textů v podstatě pouze blíží (s výjimkou textu K) příslušnému rozložení v dialogickém korpusu, nejméně v současných textech Vw a P, nejvíce v srovnávacích textech v textu KČ, v textu K jde dokonce o shodu. K tomuto závěru mě opravňuje další ověřování dané problematiky na korpusu jazyka uměleckého stylu, jehož složku PŘ tvoří, a lze tudíž vyslovit hypotézu, že rozložení SD a jejich skupin v PŘ je shodné s analogickým rozložením v jazyce umělecké literatury, resp. v jazyce české prózy.
K uvedenému účelu jsem využila materiál rovněž z FSČ, a to ze skupiny A (beletrie) – FSA o rozsahu NA = 477 617 slov. Na tomto korpusu jsem sledovala rozložení SD a jejich skupin v PŘ, ověřovala je rovněž testem dobré shody χ2 a došla jsem k těmto závěrům:
Pouze v textu Vw se přijímá hypotéza o shodě v rozložení SD a jejich skupin v PŘ a v umělecké literatuře reprezentované korpusem FSA, srov.:
χ2 = 0,6050183 < χ2 0,05;1 = 3,84;
v ostatních třech textech, P, KČ, K, se hypotéza zamítá, a to ve vyšších hodnotách, než je tomu v analogickém srovnání s hodnotami v dialogickém korpusu FSD (srov. výše):
v textu Pχ2 = 120,49811 |
|
v textu KČ χ2 = 61,428494 | > χ2 0,05;1 = 3, 84. |
v textu K χ2 = 32,347757 |
|
Z uvedených dat vyplývá, že se s výjimkou jednoho textu (Vw) rozložení SD a jejich skupin neshoduje s rozložením analogických dat v korpusu jazyka uměleckého stylu. Při obou srovnáních – s FSD a FSA – však jde v 75 % o tendenci v PŘ projevující se jednak směrem k dialogu (vztah silnější), jednak směrem k uměleckému stylu, k próze (vztah slabší). Jen v 25 % převládá vztah v jednom směru, tj. k dialogu, anebo k próze. PŘ se z hlediska kvantitativního jeví jako útvar dialogický (mluveného projevu) stylizovaný v rámci uměleckého stylu (psaného projevu). Toto zjištění by bylo třeba ověřit na reprezentativním materiále, který PŘ – jako útvar sui generis – zřejmě vyžaduje.
[86]Frekvence slovních druhů v PŘ | |||||||||||
Text | Skupina nominální | Skupina verbální | Ostatní | Σ | |||||||
| absol. | % | absol. | % | absol. | % | absol. | % | |||
Vw | I. | 107 | 22,72 | V. | 94 | 19,96 | IV. | 9 | 1,91 | – | – |
| II. | 33 | 7,01 | III. | 62 | 13,16 | IX. | 13 | 2,76 | – | – |
| VII. | 40 | 8,49 | VI. | 63 | 13,37 | X. | 30 | 6,16 | – | – |
| – | – | VIII. | 21 | 4,46 | – | – | – | – | ||
Σ | 180 | 38,22 | 240 | 50,95 | 52 | 10,83 | 472 | 100 | |||
P | 86 | 13,48 | 187 | 29,31 | 5 | 0,78 | – | – | |||
| 23 | 3,61 | 145 | 22,73 | 10 | 1,57 | – | – | |||
| 17 | 2,66 | 82 | 12,85 | 49 | 7,68 | – | – | |||
| – | – | 34 | 5,33 | – | – | – | – | |||
Σ | 126 | 19,75 | 448 | 70,22 | 64 | 10,03 | 638 | 100 | |||
KČ | 168 | 18,40 | 223 | 24,42 | 11 | 1,20 | – | – | |||
| 40 | 4,38 | 239 | 26,18 | 4 | 0,44 | – | – | |||
| 62 | 6,79 | 74 | 8,11 | 39 | 4,27 | – | – | |||
| – | – | 53 | 5,81 | – | – | – | – | |||
Σ | 270 | 29,57 | 589 | 64,52 | 54 | 5,91 | 913 | 100 | |||
K | 103 | 16,67 | 144 | 23,30 | 10 | 1,62 | – | – | |||
| 28 | 4,53 | 131 | 21,20 | 9 | 1,45 | – | – | |||
| 53 | 8,58 | 64 | 10,35 | 38 | 6,15 | – | – | |||
| – | – | 38 | 6,15 | – | – | – | – | |||
Σ | 184 | 29,78 | 377 | 61,00 | 57 | 9,22 | 618 | 100 |
Tab. č. 2
Vysvětlivky k tab. č. 2–4: I. substantiva, II. adjektiva, III. zájmena, IV. číslovky, V. slovesa, VI. adverbia, VII. předložky, VIII. spojky, IX. citoslovce, X. částice.
Výskyt UV v české próze je relativně nízký (srov. tab. č. 1 a č. 3, s. 87). Z hlediska rozložení SD a jejich skupin existují mezi nimi statisticky nevýznamné rozdíly, jak potvrdil test χ2:
χ2 = 3,3456107 < χ2 0,05;3 = 7,81.
Detailní analýza zastoupení jednotlivých SD v obou skupinách dále ukázala, že statisticky nevýznamné rozdíly existuji – jako v PŘ – opět jen ve skupině nominální:
χ2 = 2,7426727 < χ2 0,05;3 = 7, 81,
tedy rozdíly ve frekvenci substantiv, adjektiv a předložek v UV jsou statisticky nevýznamné.
Pokud jde o podrobnou analýzu skupiny verbální, tedy frekvenci sloves, zájmen, adverbií a spojek, nebylo možno výsledky ověřit testem χ2, protože frekvence spojek v textu Vw neplní podmínku stanovenou pro aplikaci tohoto testu (nedosahuje počtu 5). V ostatních textech se frekvence tohoto SD vyskytuje v intervalu 10–23. Vedle spojek jsou mezi jednotlivými analyzovanými texty relativně velké rozdíly ve frekvenci adverbií: V textu K je to frekvence 16, kdežto v ostatních textech v inter[87]valu 33–48. – V jednotlivých složkách skupiny verbální v UV je tedy frekvence SD poměrně kolísavá, kdežto ve skupině nominální je relativně ustálená.
Frekvence slovních druhů v UV | ||||||||||
Text | Skupina nominální | Skupina verbální | Ostatní | Σ | ||||||
| absol. | % | absol. | % | absol. | % | absol. | % | ||
Vw | I. | 63 | 28,00 | V. | 79 | 35,11 | IV. |
| – | – |
| II. | 11 | 4,89 | III. | 14 | 6,22 | IX. |
| – | – |
| VII. | 16 | 7,11 | VI. | 35 | 15,56 | X. |
| – | – |
| – | – | VIII. | 4 | 1,78 |
|
| – | – | |
Σ | 90 | 40,00 | 132 | 58,67 | 3 | 1,33 | 225 | 100 | ||
P | 79 | 23,44 | 112 | 33,24 |
|
| – | – | ||
| 12 | 3,56 | 30 | 8,90 |
|
| – | – | ||
| 28 | 8,31 | 48 | 14,24 |
|
| – | – | ||
| – | – | 23 | 6,83 |
|
| – | – | ||
Σ | 119 | 35,31 | 213 | 63,21 | 5 | 1,48 | 337 | 100 | ||
KČ | 43 | 23,63 | 60 | 32,97 |
|
| – | – | ||
| 8 | 4,40 | 13 | 7,14 |
|
| – | – | ||
| 12 | 6,59 | 33 | 18,13 |
|
| – | – | ||
| – | – | 12 | 6,59 |
|
| – | – | ||
Σ | 63 | 34,62 | 118 | 64,83 | 1 | 0,55 | 182 | 100 | ||
K | 24 | 17,65 | 53 | 38,97 |
|
| – | – | ||
| 6 | 4,41 | 11 | 8,09 |
|
| – | – | ||
| 11 | 8,09 | 16 | 11,76 |
|
| – | – | ||
| – | – | 10 | 7,35 |
|
| – | – | ||
Σ | 41 | 30,15 | 90 | 66,17 | 5 | 3,68 | 136 | 100 |
Tab. č. 3
Srovnejme rozložení SD a jejich skupin v UV a v PŘ ve všech čtyřech analyzovaných textech; předpokládali bychom, že se rozložení v UV nejspíše shoduje s příslušným rozložením v jazyce uměleckého stylu, a že se tedy liší od rozložení v PŘ (srov. výše).
Ukázalo se však, že se rozložení SD a jejich skupin v UV a PŘ shoduje v 75 %, srov.:
| v textu Vw χ2 = 0,3198408 |
|
| v textu KČ χ2 = 0,7822031 | < χ2 0,05;1 = 3,89; |
| v textu K χ2 = 0,1090242 |
|
hypotéza se zamítá jen u textu P
χ2 = 20,575475 > χ2 0,05;1 = 3,89.
Jde o text, v němž se v UV vyskytuje relativně největší počet slov (srov. tab. č. 1 a č. 3) a kde UV celkem plynule přechází do vyprávění, resp. do AŘ.
Položíme-li si otázku, do jaké míry je rozložení SD a jejich skupin v UV shodné s rozložením v jazyce uměleckého stylu (prózy), dojdeme k zjištění, že statisticky významná shoda existuje pouze v jednom textu, a to Vw:
χ2 = 1, 5883646 < χ2 0,05;1 = 3, 89.
[88]Ve zbývajících třech textech se hypotéza zamítá; největší hodnoty χ2 dosahuje v textu P (10,634022).
To, že se rozložení SD a jejich skupin v UV v 75 % shoduje s rozložením v PŘ, utvrzuje nás v zjištění, že PŘ a UV jsou v uměleckém textu těsně spjaty, resp. jsou do značné míry jistým způsobem stylizovány jako komplementární celek. V obou případech se zde zřejmě uplatňuje psaná forma uměleckých textů. Také toto zjištění by bylo třeba ověřit na více reprezentativním materiále, pokud jde o jeho rozsah i jednotku statistického souboru.
Do AŘ řadím „zbytky“ výběrů o rozsahu 3000 slov (srov. výše) po odečtení slov připadajících na PŘ a UV a slov z tzv. třetí skupiny (v tabulkách označena jako „ostatní“), jejichž počet je celkem zanedbatelný (tab. č. 3 a 4).
Frekvence slovních druhů v AŘ | ||||||||||
Text | Skupina nominální | Skupina verbální | Ostatní | Σ | ||||||
| absol. | % | absol. | % | absol. | % | absol. | % | ||
Vw | I. | 612 | 26,57 | V. | 367 | 15,94 | IV. |
| – | – |
| II. | 341 | 14,81 | III. | 239 | 10,38 | IX. |
| – | – |
| VII. | 235 | 10,20 | VI. | 273 | 11,85 | X. |
| – | – |
| – | – | VIII. | 187 | 8,12 |
|
| – | – | |
Σ | 1188 | 51,58 | 1066 | 46,29 | 49 | 2,13 | 2303 | 100 | ||
P | 526 | 25,98 | 475 | 23,46 |
|
| – | – | ||
| 188 | 9,28 | 208 | 10,27 |
|
| – | – | ||
| 213 | 10,52 | 209 | 10,32 |
|
| – | – | ||
| – | – | 156 | 7,70 |
|
| – | – | ||
Σ | 927 | 45,78 | 1048 | 51,75 | 50 | 2,47 | 2025 | 100 | ||
KČ | 409 | 21,47 | 348 | 18,27 |
|
| – | – | ||
| 202 | 10,60 | 258 | 13,54 |
|
| – | – | ||
| 185 | 9,71 | 247 | 12,97 |
|
| – | – | ||
| – | – | 242 | 12,70 |
|
| – | – | ||
Σ | 796 | 41,78 | 1095 | 57,48 | 14 | 0,74 | 1905 | 100 | ||
K | 506 | 22,53 | 452 | 20,12 |
|
| – | – | ||
| 186 | 8,28 | 298 | 13,27 |
|
| – | – | ||
| 226 | 10,06 | 311 | 13,85 |
|
| – | – | ||
| – | – | 210 | 9,35 |
|
| – | – | ||
Σ | 918 | 40,87 | 1271 | 56,59 | 57 | 2,54 | 2246 | 100 |
Tab. č. 4
Pokud jde o rozložení SD skupiny nominální a verbální v pásmu AŘ, předpokládala jsem shodu s příslušným rozložením v jazyce uměleckého stylu a ověřila jsem je testem χ2. Hypotéza se potvrdila pouze v současném textu P
χ2 = 3,8211443 < χ2 0,05;1 = 3,84;
v ostatních třech případech se hypotéza zamítá, a to s největším rozdílem v druhém současném textu Vw
[89]χ2 = 57,503540 > χ2 0,05;1 = 3,84;
u obou srovnávacích textů se hypotéza sice zamítá, ale při malých rozdílech, srov.
| v textu KČ χ2 = 5,3539913 | > χ2 0,05;1 = 3,84. |
| v textu K χ2 = 6,9502183 |
Značné rozdíly v obou textech ze současnosti, jak se ostatně ukázalo v nejednom případě uvedeném v tomto článku, nás mohou vést na jedné straně k myšlence, že se tu projevuje individuální styl autora, a to současného, na druhé straně lze usuzovat na vliv omezeného rozsahu analyzovaného výběru. Oba případy by ovšem vyžadovaly, aby byly ověřeny především na materiále reprezentativnějším co do počtu výběrů i jejich rozsahu. Dále je třeba vzít v úvahu to, že se v AŘ různě uplatňuje i řeč nepřímá, polopřímá, nevlastní, apod. (Šmilauer, 1972, s. 280). Tato situace se ovšem projevuje nejen ve frekvenci SD, ale i některých jejich kategorií gramatických, např. slovesných (Těšitelová a kol., 1983, zvl. s. 100–127; Bečka, 1992, s. 276; Mistrík, 1985, s. 326n.). To by však znamenalo mnohem širší záběr problematiky, než který je předmětem tohoto příspěvku.
Při kvantitativní analýze nelze PŘ studovat izolovaně, nýbrž ve vztahu k základním složkám, které se podílejí na strukturní výstavbě textu, UV a AŘ. Kvantitativní rozbor těchto tří složek opírám v tomto příspěvku o rozložení SD a jejich zařazení do dvou skupin, nominální a verbální.
Shody a rozdíly v datech získaných ze čtyř stejně dlouhých textů, porovnávané navzájem i s korpusem dialogu (FSD) a korpusem jazyka uměleckého stylu (FSA), byly ověřovány testem dobré shody χ2. Na tomto základě byla zamítnuta hypotéza, že shody mezi uvedenými daty jsou statisticky významné. Analýzou takto dosažených výsledků lze zjistit jisté tendence vypovídající o fungování PŘ v textu.
Z hlediska kvantitativního se PŘ jeví jako útvar výstavby textu sice dialogického charakteru, který je však stylizován v rámci uměleckého stylu psaného. Výkyvy směrem k vlastnímu dialogu nebo k próze závisí do značné míry na individuálním stylu autora. Stylizace PŘ se provádí ve vztahu k dalším složkám výstavby textu, a to jak k UV, tak i k AŘ.
V UV jsou – ve srovnání s PŘ – z hlediska SD a jejich skupin statisticky nevýznamné rozdíly. Rozložení SD a jejich skupin se v UV v 75 % shoduje s analogickými jevy v PŘ. To ukazuje na stylizační sepětí PŘ a UV v rámci jazyka uměleckého stylu, v próze. UV lze považovat za jazykově i stylizačně komplementární jev k PŘ.
Co se týče AŘ, lze z hlediska kvantitativního konstatovat, že se rozložení SD a jejich skupin v textech srovnávacích blíží rozložení analogických dat v jazyce uměleckého stylu (v próze). Rozdíly v textech současných by mohly naznačovat výraznější rys individuálního stylu autora. Při omezeném rozsahu výběrů textů a jejich počtu je třeba hodnotit uvedené charakteristiky se značnou zdrženlivostí. Dále je nutno vzít v úvahu, že se v AŘ zvláštním způsobem uplatňují kategorie gramatické a stylistické, které jsou příznačné např. pro řeč nepřímou, polopřímou apod.
[90]Jak PŘ, tak i UV a AŘ představují jistý celek vyznačující se objektivními rysy (např. frekvence SD a jejich skupin), které se z hlediska jazykového a stylistického předpokládají, a to s jistou volností, která je dána individuálním stylem autora. Vzhledem k specifickému postavení PŘ ve výstavbě textu pokládám za problematické z hlediska jazykového i stylistického např. při výběru materiálu pro zjišťování frekvence slov v textech uměleckého stylu PŘ z textu vypouštět, popř. ji vydělovat (srov. např. frekvenční slovník ukrajinštiny, Perebejnos et al., 1981).
Problematiku PŘ by bylo třeba dále zkoumat na materiálu, který by byl nejen rozsahem více reprezentativní, ale který by i respektoval jemnější utřídění problematiky, např. zřetel k řeči nepřímé, polopřímé apod. Takový výzkum by předpokládal i srovnání s více reprezentativním korpusem dialogu.
LITERATURA
BEČKA, J. V.: Česká stylistika. Praha 1992.
DOLEŽEL, L.: O stylu moderní české prózy. Praha 1960.
HOFFMANNOVÁ, J.: Stylistika a …. Praha 1997.
JELÍNEK, J. – BEČKA, J. V. – TĚŠITELOVÁ, M.: Frekvence slov, slovních druhů a tvarů v českém jazyce. Praha 1961.
KRAUS, J.: Subjectivity of characters in the structure of the discourse. PSML, 5, 1976, s. 105–118.
MISTRÍK, J.: Štylistika. Bratislava 1985.
MUKAŘOVSKÝ, J.: Dvě studie o dialogu. In: Kapitoly z české poetiky, I. Praha 1948, s. 129–156.
MÜLLEROVÁ, O. – HOFFMANNOVÁ, J.: Kapitoly o dialogu. Praha 1994.
PEREBEJNOS, V. I. et al.: Častotnyj slovnyk sučasnoji ukrajinskoji chudožnoji prozy, I, II. Kiiv 1981.
ŠMILAUER, Vl.: Nauka o českém jazyku. Praha 1972.
ŠOLTYS, O.: Verba dicendi a metajazyková informace. Linguistica, 8. ÚJČ ČSAV, Praha 1983.
TĚŠITELOVÁ, M.: Frekvence slov a tvarů ve spise „Život a dílo skladatele Foltýna“ od Karla Čapka. NŘ, 12, 1948, s. 126–130.
TĚŠITELOVÁ, M.: Otázky lexikální statistiky. Praha 1974.
TĚŠITELOVÁ, M.: Využití statistických metod v gramatice. Praha 1980.
TĚŠITELOVÁ, M.: O frekvenci slov v dialogu a v monologu. SaS, 52, 1991, s. 109–122.
TĚŠITELOVÁ, M.: K současné české próze z hlediska frekvence slov. NŘ, 83, 2000, s. 1–9.
TĚŠITELOVÁ, M. a kol.: Psaná a mluvená odborná čeština z kvantitativního hlediska (v rámci věcného stylu). Linguistica, 4. ÚJČ ČSAV, Praha 1983.
R É S U M É
Direct speech (further DS) is studied in four Czech fiction texts of equal length N = 3000 words (samples of coherent parts from the beginnings of two contemporary texts and two middle of the 20th century texts). As for quantitative characteristics, the frequency of parts of speech (further PS) and their two groups: (1) nominal (nouns, adjectives, prepositions), (2) verbal (verbs, pronouns, adverbs, conjunctions) are used. The most important results of this quantitative analysis are as follows:
[91]In DS the verbal group dominates over the nominal one (cf. dialogue); the frequency of verbs and pronouns depends on the individual author’s style more often than that of adverbs. Conjunctions occur relatively rarely.
The frequency distributions of PS in DS were tested with the application of the test χ2 and compared with the distributions of the frequencies in the corpus of dialogue and those in the corpus of fiction style. The results of these verifications showed DS as a formation of text structure of a dialogical character stylized within the framework of the fiction style in written form. The deviations from this character (towards dialogue or towards fiction style) depend on the individual author’s style. The stylization of the DS is performed with regard to the other parts of the text structure, i.e., above all the introductory clause (IC) and the author’s language (words, AL).
The DS, IC and AL form a certain whole characterized with objective features (e.g., frequency of PS and their two groups, nominal and verbal); from the viewpoint of language and style, they are complementary parts with a certain freedom given by the individual author’s style.
With regard to the special position of DS in the text structure of fiction style, the omitting or isolation of DS for purposes of quantitative analysis of vocabulary are therefore problematic and disturb the image of word relations in a text.
Varnsdorfská 350
190 00 Praha 9
Slovo a slovesnost, volume 62 (2001), number 2, pp. 81-91
Previous Jaroslav Kyncl: Sympozium „Čeština – univerzália a specifika II“
Next Alena Macurová: Jazyk a hluchota
© 2011 – HTML 4.01 – CSS 2.1