Bohumír Dejmek
[Články]
Frequency of noun and verb words and forms in everyday spoken language
0. Kvantitativnímu průzkumu mluveného jazyka se v současnosti věnuje značná pozornost. Zjišťováním jeho výrazných znaků se zabývají odborná pracoviště, např. Ústav Českého národního korpusu při FF UK (k výzkumu mluvené češtiny viz Šonková, 2000), i specifické obory, jako je aplikovaná pedagogika, zvlášť zaměřená na výuku mateřského jazyka i jazyků cizích. Zvláštního významu pak nabývá výzkum běžně mluveného jazyka (BMJ): je totiž nejběžnějším prostředkem komunikace mezi lidmi.
Základy tohoto článku byly položeny před mnoha lety v souvislosti s výzkumem BMJ (městské mluvy) Přelouče (viz Dejmek, 1976) s úmyslem volně navázat na Frekvenci slov, slovních druhů a tvarů v českém jazyce (Jelínek – Bečka – Těšitelová, 1961; dále FSČ).
FSČ vychází z jazyka mnoha stylů a žánrů, z jazyka stylu uměleckého, odborného, publicistického a hovorového. Jsou tu excerpovány texty charakteristické pro výše uvedené styly. Styl hovorový, který nás nejvíce zajímá, je reprezentován dvěma skupinami:
(1) Mluvenými projevy uveřejněnými tiskem (skupina H), jejichž „mluvenost“ je však silně omezena tím, že jde o psané texty.
(2) Dramaty (skupina D), která měla vyvažovat nedostatek „mluvenosti“. Dramata vykreslením různých sociálních prostředí a charakterů v dialozích do jisté míry reprezentují mluvený jazyk, ale jde v nich především o umělecké ztvárnění se všemi charakteristickými rysy uměleckého stylu.
Autoři FSČ přiznávají, že se záznamy mluvených projevů byly problémy, a proto chtěli tento nedostatek do jisté míry kompenzovat žánry relativně blízkými. My však takové mluvené projevy, realizované BMJ, tedy ve sféře běžně dorozumívací, máme k dispozici, a proto si dovolujeme tuto chybějící část FSČ doplnit. Chceme-li poznat zákonitosti v slovní zásobě jazyka i v jeho gramatické stavbě, je třeba poznat kvantitativní poměry v jazyce (FSČ, s. 93)[1] komplexně.
Běžně mluveným jazykem rozumíme soubor mluvených prostředků (spisovných i nespisovných) fungujících ve vymezené komunikační sféře, v projevech vyznačujících se „komplexní mluveností“.[2] Je poznamenán výběrem slovní zásoby a specifickými stylistickými prostředky (využití slov parazitních, kontaktových), častým opakováním slov, různými nepravidelnostmi větné stavby, častými přerušováními, nedokončením projevu apod.
Tento článek si klade za cíl zpracovat náš materiál ve velkém zestručnění[3] a upozornit na případné shody a rozdíly ve frekvenci slov a tvarů mezi BMJ a ostatními styly [16]a žánry. Naše pojednání ovšem představuje torzo původní koncepce. Celý materiál potřebný k našemu účelu nebyl v letech, kdy probíhal jazykový výzkum v Přelouči, tj. na konci 60. let, pro jiné úkoly explorátora zpracován. Zůstala však podstatná část, kterou autor kdysi začal ručně zpracovávat a která dnes dovoluje zachytit frekvenci slov a tvarů v podobě a množství, které jsou využitelné pro srovnání s některými výsledky FSČ. Pořadí slov, zejména s malým zastoupením, a frekvenci slovních druhů z části, která zůstala v rukou autorových, už nebylo možné sumarizovat.
FSČ vychází z materiálu získaného ze 75 pramenů, podle stylových vrstev rozdělených do 8 skupin; námi sledované D-dramata vychází z 10 pramenů, H-mluvené projevy uveřejněné v tisku pak ze 4 zdrojů (FSČ, s. 10 a 22).
Náš materiál byl získán od 7 respondentů (R)[4] – pramenů. Jejich stručná charakteristika:
R1 – muž, 40 let, narozen v Lipolticích (6 km jižně od Přelouče), v zemědělsko-dělnickém prostředí. Pokrývač, nejvyšší vzdělání – měšťanská škola. Bydlí v Přelouči.
R2 – žena, 35 let, narozena ve Vrdech-Bučicích v živnostenské rodině. Gymnázium v Kutné Hoře, Plzeň, Praha vysoká škola; od roku 1957 žije v Přelouči – lékařka.
R3 – žena, 36 let, narozena v Litomyšli, tam vyrůstala a chodila do školy. V roce 1952 se provdala do Přelouče, má středoškolské vzdělání a pracuje jako úřednice.
R4 – muž, 40 let, narozen v Přelouči v rodině státního zaměstnance. Obecnou a měšťanskou školu vychodil v Přelouči. Má středoškolské vzdělání a pracuje jako náměstek technického ředitele v Průmstavu.
R5 – muž, 35 let, narozen v Přelouči v řemeslnickém prostředí. V Přelouči vychodil obecnou a měšťanskou školu. Vzdělání nižší odborné – učňovská škola. Dělnický údržbář.
R6 – žena, 32 let, narozena v Přelouči v dělnické rodině; obecnou i měšťanskou školu vychodila v Přelouči, střední zdravotní školu v Pardubicích. Zdravotní sestra v Přelouči.
R7 – muž, 39 let, narozen ve Svinčanech (8 km jihovýchodně od Přelouče) v řemeslnicko-zemědělské rodině. Do obecné školy chodil ve Svinčanech, do měšťanské školy v Cholticích. Pracoval jako kvalifikovaný dělník v Přelouči, pak školník tamtéž.
Besedy s každým R probíhaly v různých situacích, na různá témata (jsou patrna ze záznamů částí souvislých projevů, viz Dejmek, 1976, s. 201–211) a explorátor měl ke každému R sice blízký, ale přece jen různý vztah, od nejbližšího příbuzného po kamarády a sousedy až po původně málo známé osoby (blíže viz Dejmek, 1976, s. 23–25).
Naše zpracování frekvence slov a tvarů substantiv a sloves dodržuje ve značné míře metody tabulace, jak je uvádí FSČ na s. 22–24, aby výsledky mohly být co nejvíce srovnatelné.
V následující části vytýkáme některé zásady, které jsou obsaženy ve FSČ, ale i ty, které se více či méně od FSČ liší a které by mohly do jisté míry frekvenci slov ovlivnit.
(1) Za samostatná slova jsme považovali:
[17](a) předložky,
(b) jednotlivé členy sousloví (střední – škola, Kutná – Hora apod.),
(c) spojky aby, kdyby; u těchto spojek ve spojení s podmiňovacím způsobem jsme postupovali jinak než FSČ, např. v abychom šli jsme vyčleňovali zvlášť spojku aby a zvlášť tvar kondicionálu bychom šli (ve frekvenci slovo řazeno samozřejmě pod jít),
(d) sloveso být/bejt ve významu existence a sponovém; jinak je zahrnuto ve frekvenci složených slovesných tvarů,
(e) zájmena se, si, pokud měla funkci předmětu (bylo možno nahradit je podobami sebe, sobě), např. zvolil si; odlišení od typů 2b bylo velmi nesnadné, někdy i nemožné.
(2) Za samostatná hesla jsme pokládali:
(a) slovesné tvary složené: přišel jsem, budu hlídat, řek(l) bych,
(b) spojení reflexiv se, si se slovesem, šlo-li o reflexiva tantum (smát se), dále o slovesa, která mají s reflexivem jinou vazbu (dobývat něco x dobývat se do něčeho), nebo o slovesa, kde se, si vyjadřují reciprocitu (líbali se); v takových případech se, si nezapočítáváme, ale zaznamenáváme, např. dělat (se); typy šlo se jsou zachyceny u pasiva zvratného.
(3) Problémy třídění slov
Řazení k slovním druhům bylo někdy velmi obtížné; vedle jasných případů existovaly situace, kdy slovnědruhová příslušnost slova byla sporná nebo nejasná, např. u slov jako jo, no, nu, že, jak, co, tak, v BMJ zvlášť četných. Taková polyfunkční slova zařazujeme pod jedno heslo (stejně tak činí i FSČ).
(4) Řazení hesel a jejich podoba
(a) hesla řadíme podle základního tvaru slova; u jmen podle nominativu, u sloves podle infinitivu (přišli jsme řadíme pod přijít),
(b) nespisovné nebo různé deformované podoby spisovných slov se uvádějí ve slovníku pod spisovným tvarem, za lomítkem na nespisovnou podobu upozorňujeme, ale zvlášť ji nevyčíslujeme, např. obecněčeské von (vyskytující se v této podobě téměř ve 100 %) řadíme pod on/von,
(c) výrazy, které neměly spisovný protějšek nebo které se výrazněji odlišovaly hláskovou nebo slovotvornou podobou, jsme řadili podle jejich zvukové podoby, např. bajvočko, ajznboňák apod.,
(d) individualismy a slova polysémantická jsou zařazována buď jako samostatná hesla, např. šumovat (ve špajzu šumuje), nebo se přiřazují ke slovu se základním významem, např. von ho sejmul (=srazil) pod sejmout, dal si krajskýho (=velkého panáka) pod krajský.
Přestože se hesla pod 4 (b)-(d) v našem výrazně zestručnělém článku, resp. v kratičké slovníkové části, téměř nevyskytují (s výjimkou být/bejt, on/von, když/dyš), chtěli jsme svými poznámkami spíše jen naznačit, že problematika záznamu slov se může v BMJ od postupů ve FSČ někdy lišit.
Pořadí slov začíná slovem s nejvyšší frekvencí a končilo by slovy s frekvencí 1. Zde uvádíme 20 nejfrekventovanějších slov, ostatní jsou v domácím záznamu autora tohoto článku. Na rozdíl od FSČ není třeba u našeho přehledu zkráceného pořadí uvádět [18]u hesla všechna čísla,[5] která pořadí hesel určují. Hesla jsou excerpována z jedné skupiny, z BMJ, a prvních 20 hesel v našem pořadí použilo všech 7 respondentů. Na dalších místech by ovšem hodnota frekvence, a tedy i pořadí, mohla být dána nejen absolutní frekvencí, nýbrž i počtem respondentů, u nichž je slovo doloženo. To jsme ovšem nemohli důsledně, zejména u slov s menší četností, sledovat.
Tab. č. 1
R | počet slov |
| % | pořadí slov |
R1 | 9313 |
| 16,7 | 2 |
R2 | 8507 |
| 15,3 | 3 |
R3 | 6885 |
| 12,4 | 5 |
R4 | 6833 |
| 12,3 | 6 |
R5 | 10393 |
| 18,7 | 1 |
R6 | 6238 |
| 11,2 | 7 |
R7 | 7430 |
| 13,4 | 4 |
celkem | 55599 |
| 100,0 |
|
2.1. Frekvence prvních 20 slov v BMJ ve srovnání s týmiž slovy ve FSČ, a to ve skupinách D, H a celkem (C)[6]
Pořadí a slovo | BMJ | D |
| H |
| C |
| |
1. | ten | 5240/7[7] | 6991/10 | 1. | 3656/4 | 2. | 44964/8[8] | 2. |
2. | být/bejt | 2541/7 | 5758/10 | 2. | 2733/4 | 3. | 43148/8 | 3. |
3. | a | 1925/7 | 4301/10 | 3. | 4781/4 | 1. | 67122/8 | 1. |
4. | on/von | 1519/7 | 2758/10 | 5. | 1057/4 | 10. | 32496/8 | 5. |
5. | já | 1157/7 | 3781/10 | 4. | 378/4 | 32. | 11060/8 | 12. |
6. | no | 1124/7 | 249/10 | 69. | 3/1 | ?. | 480/7 | 368. |
7. | mít | 1079/7 | 1863/10 | 8. | 780 | 12. | 11426 | 11. |
8. | tak | 1028/7 | 1301/10 | 14. | 483 | 26. | 7930/8 | 20. |
9. | na | 872/7 | 2302/10 | 6. | 1363/4 | 6. | 27753/8 | 6. |
10. | tam | 872/7 | 355/10 | 54. | 136/4 | 66. | 2594/8 | 69. |
11. | že | 707/7 | 1900/10 | 7. | 1393/4 | 5. | 18092/8 | 7. |
12. | v(e) | 613/7 | 1688/10 | 10. | 1960/4 | 4. | 33679/8 | 4. |
13. | jo | 519/7 | 32/5 | ?. | 0 | – | 115/4 | 1713. |
14. | ale | 469/7 | 1372/10 | 13. | 488/4 | 25. | 9406/8 | 16. |
15. | když/dyš | 445/7 | 657/10 | 30. | 302/4 | 39. | 5819/8 | 31. |
16. | jít | 406/7 | 599/10 | 35. | 244/4 | 43. | 3336/8 | 50. |
17. | do | 403/7 | 798/10 | 20. | 516/4 | 24. | 10831/8 | 14. |
18. | se | 395/7 | 561/10 | 37. | 657/4 | 16. | 7174/8 | 23. |
19. | s(e) | 392/7 | 1119/10 | 15. | 587/4 | 20. | 14951/8 | 8. |
20. | jak | 347/7 | 615/10 | 32. | 454/4 | 30. | 6123/8 | 29. |
[19]Mezi prvními dvaceti slovy jsou zastoupena především zájmena (ten, on/von, já), částice (no, jo, tak, že), spojky (a, že, ale, když/dyš), předložky (na, v(e), do, s(e)), dále slovesa, nejčastěji sponové být/bejt, mít a z plnovýznamových sloveso jít.
Pořadí ve všech třech sloupcích z FSČ odpovídá situaci v BMJ jen u prvních tří hesel, ale na prvních pěti místech jsou si skupiny BMJ a D velmi blízké. Pořadí sledujeme i u C, kde hesla uvedená v BMJ jsou na předních místech, tj. do 50. místa (výjimku tvoří jen no a zvláště jo – viz dále).
Časté užívání zájmena ten víceméně potvrzuje názory některých lingvistů, že ten v mluvených nespisovných projevech nabývá – stojí-li před substantivem – podobnou funkci, jakou mají v některých jazycích členy (ten řidič tu ženskou vyhodil ze dveří). Zájmeno ten v BMJ silně převyšuje ostatní hesla; do celkového počtu zařazujeme i podoby tenhle, tenle, tenhleten, tenleten, tenhlencten, tendlencten, dokonce i případy, kde zájmeno ten zastupuje sloveso, např. potentočkovat.[9]
Také počet a by se změnil, kdybychom postupovali přesně podle FSČ. Spojení abychom přišli rozkládal FSČ na a+bychom přišli. V našem případě jsme vyčleňovali spojku aby+podmiňovací způsob. K počtu spojky a bychom tedy – abychom mohli lépe srovnávat – měli připočíst všechna a ze spojky aby, tj. 152. Pozici a by to však v BMJ neovlivnilo.
S prvními 20 hesly v BMJ nejvíce koresponduje skupina D, a to 15 hesly, i když na různých místech, zatímco ve skupině H jen 10 hesly. Zvláštní postavení v D, H i C – ve srovnání s BMJ – mají hesla no a jo. V BMJ figuruje no na 6. pozici a jo na 13., v D je no 69. v pořadí a jo počtem 32/5 stojí v dalekém odstupu od předních míst; v H no svým zastoupením 3/1 patří na zcela koncové pozice, jo se nevyskytuje vůbec.[10]
Z plnovýznamových slov nám stav našeho materiálu dovoluje sledovat jen substantiva a verba. Substantiva se mezi prvními dvaceti slovy nevyskytují. Dále je můžeme sledovat jen u jednotlivých respondentů. Jako 38. se umístilo substantivum Bojda (hypokoristikon explorátora) u R3. Toto jméno je první substantivum i u R4 (49.). Další substantiva se objevují v pořadí až kolem 50. místa a na dalších místech: muž (R6 – 47.), pán (R2 – 49.), Jirka (R6 – 49.), škola (R4 – 51., R7 – 55.), kluk (R1 – 63.), metr (R5 – 64.) atd. Kdybychom mohli pracovat se součty substantiv u všech R, jejich pořadí by se silně propadla.
Slovesa vstupují do pořadí mnohem dříve a ve větším počtu. Mít a jít jsou dokonce v první dvacítce hesel v BMJ. Mezi prvními dvaceti hesly u jednotlivých R jsou ještě výrazněji zastoupena slovesa dát (si), říkat, dělat (si), chtít, myslet (si) aj.
Z důvodů výše uvedených se ze slovních druhů orientujeme pouze na frekvenci substantiv a sloves. Srovnáváme jejich zastoupení v BMJ a ve FSČ, a to skupiny D, H a C.
[20]Tab. č. 3
| BMJ | % | D | % | H | % | C | % |
substantiva | 9034 | 43,5 | 28318 | 46,6 | 24222 | 60,1 |
| 60,5 |
verba | 11717 | 56,5 | 32451 | 53,4 | 16071 | 39,9 |
| 39,5 |
V BMJ je nejnižší poměrné zastoupení substantiv ve srovnání s ostatními skupinami (i s C), naopak nejvyšší zastoupení sloves. Slovesa převažují i v D. Skupina H je s větším počtem substantiv v souladu s C.
Tab. č. 4
| BMJ | % | D | % | H | % | C | % |
singulár |
|
|
|
|
|
|
|
|
1. pád | 2161 | 23,9 | 6757 | 23,9 | 4185 | 17,3 |
| 22,5 |
2. pád | 866 | 9,6 | 3048 | 10,8 | 4706 | 19,4 |
| 16,9 |
3. pád | 207 | 2,3 | 907 | 3,2 | 898 | 3,7 |
| 3,4 |
4. pád | 1978 | 21,9 | 5961 | 21,1 | 3726 | 15,4 |
| 15,0 |
5. pád | 317 | 3,5 | 3438 | 12,1 | 46 | 0,2 |
| 1,8 |
6. pád | 689 | 7,6 | 1876 | 6,6 | 2242 | 9,2 |
| 8,5 |
7. pád | 444 | 4,9 | 1592 | 5,6 | 16,26 | 6,7 |
| 7,7 |
celkem | 6662 | 73,7 | 23579 | 83,3 | 17429 | 71,9 |
| 75,8 |
|
|
|
|
|
|
|
|
|
plurál |
|
|
|
|
|
|
|
|
1. pád | 645 | 7,1 | 1069 | 3,8 | 1496 | 6,2 |
| 5,9 |
2. pád | 573 | 6,3 | 1072 | 3,8 | 2160 | 8,9 |
| 7,6 |
3. pád | 59 | 0,7 | 202 | 0,7 | 344 | 1,4 |
| 1,0 |
4. pád | 785 | 8,7 | 1503 | 5,3 | 1520 | 6,3 |
| 4,9 |
5. pád | 14 | 0,2 | 176 | 0,6 | 162 | 0,7 |
| 0,2 |
6. pád | 168 | 1,9 | 393 | 1,4 | 626 | 2,6 |
| 2,4 |
7. pád | 128 | 1,4 | 324 | 1,1 | 485 | 2,0 |
| 2,2 |
celkem | 2372 | 26,3 | 4739 | 16,7 | 6793 | 28,1 |
| 24,2 |
sg.+pl. | 9034 | 100 | 28318 | 100 | 24222 | 100 | 450798 | 100 |
Ve všech sledovaných skupinách převažují tvary singuláru nad plurálem. Co se týče pořadí jednotlivých pádů, skupiny se ne zcela shodují. V BMJ v singuláru jasně převládá nominativ vyjadřující původce, činitele děje (na prvním místě je nominativ také v D a C), jako druhý nejfrekventovanější tvar je akuzativ singuláru označující cíl, výsledek děje a tak je tomu i v D. Z ostatních pádů v singuláru má relativně silnější postavení ještě genitiv (především v D a H), příp. lokál, nejmenší zastoupení téměř ve všech skupinách dativ. Ve vokativu singuláru je skupina D svými 12,1 % velmi charakteristická pro mluvený jazyk (BMJ – 3,5 %; skupina H má jen 0,2 %).
V plurálu je zastoupení pádů obdobné jako v singuláru, tzn. že tu střídavě na prvních třech místech figurují akuzativ, nominativ a genitiv, zatímco na 6. pozici všude existuje dativ a nejméně je zastoupen vokativ. Rozdíly mezi skupinami nejsou nijak výrazné.
Tab. č. 5
| BMJ | % | D | % | H | % | C | % |
Ind. préz. akt. | 5786 | 49,4 | 16493 | 50,8 | 7209 | 44,9 | 15038 | 39,0 |
Imperativ | 412 | 3,5 | 2378 | 7,3 | 339 | 2,1 | 7547 | 2,6 |
Préteritum |
|
|
|
|
|
|
|
|
(perf. ind. akt.) | 3284 | 28,0 | 6045 | 18,6 | 3073 | 19,1 | 101466 | 34,4 |
Infinitiv | 1133 | 9,7 | 4014 | 12,4 | 2728 | 17,0 | 32450 | 11,0 |
Přechodníky | 0 | 0 | 13 | 0,0 | 36 | 0,2 | 2610 | 0,9 |
Plusquamperf. | 0 | 0 | 3 | 0,0 | 6 | 0,0 | 66 | 0,0 |
Kondicionál préz. | 622 | 5,3 | 2111 | 6,5 | 1185 | 7,4 | 14950 | 5,1 |
Kondicionál min. | 0 | 0 | 96 | 0,4 | 29 | 0,2 | 810 | 0,3 |
Složené futurum | 150 | 1,3 | 615 | 1,9 | 383 | 2,4 | 3090 | 1,0 |
Pasivum | 330 | 2,8 | 683 | 2,1 | 1083 | 6,7 | 16699 | 5,7 |
Celkem | 11717 | 100 | 32451 | 100 | 16071 | 100 | 294726 | 100 |
Vytkněme jen nejvýraznější rozdíly v zastoupení slovesných tvarů (srovnáváme BMJ, D a H; C zůstává jako možnost obecnější orientace).
V indikativu prézenta aktiva, nejčastějším slovesném tvaru, se jednotlivé skupiny příliš neliší. V BMJ má také dominantní postavení – na rozdíl od D a H – préteritum. Skupina D a do jisté míry i BMJ převažují i v imperativu. Naopak pasivum je v D a BMJ zastoupeno méně. Některé tvary pak nebyly v BMJ zaznamenány vůbec (přechodníky, plusquamperfektum, kondicionál minulý), v D a H minimálně.
Tab. č. 6
| BMJ | % | D | % | H | % | C | % |
1. osoba sg. | 1037 | 17,9 | 4250 | 25,8 | 735 | 10,2 |
| 11,1 |
2. osoba sg. | 689 | 11,9 | 1848 | 11,2 | 10 | 0,1 |
| 4,8 |
3. osoba sg. | 2674 | 46,2 | 6960 | 42,2 | 3880 | 53,8 |
| 58,9 |
celkem sg. | 4400 | 76,0 | 13058 | 79,2 | 4625 | 64,1 |
| 74,8 |
|
|
|
|
|
|
|
|
|
1. osoba pl. | 273 | 4,7 | 777 | 4,7 | 1074 | 14,9 |
| 7,1 |
2. osoba pl. | 281 | 4,9 | 1641 | 9,9 | 206 | 2,9 |
| 3,2 |
3. osoba pl. | 832 | 14,4 | 1017 | 6,2 | 1304 | 18,1 |
| 14,9 |
celkem pl. | 1386 | 24,0 | 3435 | 20,8 | 2584 | 35,9 |
| 25,2 |
sg.+pl. | 5786 | 100 | 16493 | 100 | 7209 | 100 | 115038 | 100 |
Poměr mezi tvary singuláru a plurálu je v BMJ a C zhruba 3:1, v D se tomuto poměru blíží a v H je spíše 2:1. Ve všech skupinách převažuje výrazně 3. osoba, následuje 1. osoba a nejméně je zastoupena 2. osoba. Skupiny BMJ a D jsou si zastoupením 2. osoby velmi blízké, zvl. v singuláru. Ve skupině H se 2. osoba sg. téměř nevyskytuje.
I v plurálu je u tří skupin pořadí stejné jako v singuláru, jen v D má 2. osoba silnější postavení než 3. a 1. osoba.
Tab. č. 7
| BMJ | % | D | % | H | % | C | % |
2. osoba sg. | 286 | 69,4 | 1244 | 52,3 | 18 | 5,3 |
| 52,5 |
3. osoba sg. | 0 | 0 | 101 | 4,2 | 37 | 10,9 |
| 4,2 |
celkem sg. | 286 | 69,4 | 1345 | 56,5 | 55 | 16,2 |
| 56,7 |
|
|
|
|
|
|
|
|
|
1. osoba pl. | 11 | 2,7 | 50 | 2,1 | 93 | 27,4 |
| 9,6 |
2. osoba pl. | 115 | 27,9 | 962 | 40,5 | 184 | 54,3 |
| 32,3 |
3. osoba pl. | 0 | 0 | 21 | 0,9 | 7 | 2,1 |
| 1,4 |
celkem pl. | 126 | 30,6 | 1033 | 43,5 | 284 | 83,8 |
| 43,3 |
sg.+pl. | 412 | 100 | 2378 | 100 | 339 | 100 | 7547 | 100 |
Postavení imperativu se dosti liší u BMJ a u skupin D, H, C. Poměrně velký počet imperativních tvarů má skupina D. Co se počtu i procentuálního zastoupení týče, málo jsou – pochopitelně – zastoupeny singulárové tvary ve skupině H. V BMJ a v D převládají tvary 2. osoby sg., naopak v H 2. osoby pl. Poměrně vysoké procento má 1. osoba pl. v H. V BMJ se nevyskytují vůbec 3. osoba sg. a 3. osoba pl.
Tab. č. 8
| BMJ | D | H | C |
| 1133 | 4014 | 2728 | 32450 |
% z celkového počtu sloves | (9,7) | (12,4) | (17,0) | (11,0) |
Infinitiv má v BMJ poměrně nízké zastoupení ve srovnání s D a H.
Tab. č. 9
| BMJ | % | D | % | H | % | C | % |
1. osoba sg. | 685 | 20,9 | 1654 | 27,4 | 196 | 6,4 |
| 7,3 |
2. osoba sg. | 126 | 3,8 | 554 | 9,2 | 1 | 0,0 |
| 1,6 |
3. osoba sg. | 1648 | 50,2 | 2524 | 41,7 | 1684 | 54,8 |
| 69,8 |
celkem sg. | 2459 | 74,9 | 4732 | 78,3 | 1881 | 61,2 |
| 78,7 |
|
|
|
|
|
|
|
|
|
1. osoba pl. | 257 | 7,8 | 262 | 4,3 | 375 | 12,2 |
| 2,3 |
2. osoba pl. | 45 | 1,4 | 581 | 9,6 | 39 | 1,3 |
| 1,1 |
3. osoba pl. | 523 | 15,9 | 470 | 7,8 | 778 | 25,3 |
| 17,9 |
celkem pl. | 825 | 25,1 | 1313 | 21,7 | 1192 | 38,8 |
| 21,3 |
sg.+pl. | 3284 | 100 | 6045 | 100 | 3073 | 100 | 101466 | 100 |
Také v préteritu mají ve všech skupinách silnou převahu tvary singulárové, a to – až na H (61,2 %) – v poměru 3:1. Nejužívanější je 3. osoba sg., dále ještě 1. osoba sg. v D a BMJ; pozoruhodné jsou nulový výskyt 2. osoby sg. v H a hojněji zastoupená 2. osoba pl. v D.
Tab. č. 10
| BMJ | % | D | % | H | % | C | % |
1. osoba sg. | 205 | 33,0 | 675 | 32,0 | 131 | 11,0 |
| 14,4 |
2. osoba sg. | 57 | 9,1 | 263 | 12,4 | 0 | 0 |
| 5,2 |
3. osoba sg. | 237 | 38,1 | 757 | 35,9 | 550 | 46,4 |
| 55,7 |
celkem sg. | 499 | 80,2 | 1695 | 80,3 | 681 | 57,4 |
| 75,3 |
|
|
|
|
|
|
|
|
|
1. osoba pl. | 46 | 7,4 | 101 | 4,8 | 232 | 19,6 |
| 7,1 |
2. osoba pl. | 21 | 3,4 | 188 | 8,9 | 46 | 3,9 |
| 3,3 |
3. osoba pl. | 56 | 9,0 | 127 | 6,0 | 226 | 19,1 |
| 14,3 |
celkem pl. | 123 | 19,8 | 414 | 19,7 | 504 | 42,6 |
| 24,7 |
sg.+pl. | 622 | 100 | 2111 | 100 | 1185 | 100 | 14950 | 100 |
Kondicionál prézenta je dalším ze slovesných tvarů, v nichž v BMJ a D (i C) jsou tvary singuláru a plurálu v poměru 3:1. Ve skupině H je výskyt 2. osoby sg. nulový, zatímco v D a BMJ je nad průměrem (viz C).
Tab. č. 11
| BMJ | % | D | % | H | % | C | % |
1. osoba sg. | 32 | 21,3 | 167 | 27,2 | 29 | 7,6 |
| 15,1 |
2. osoba sg. | 16 | 10,7 | 85 | 13,8 | 0 | 0 |
| 8,5 |
3. osoba sg. | 51 | 34,0 | 205 | 33,3 | 140 | 36,5 |
| 42,7 |
celkem sg. | 99 | 66,0 | 457 | 74,3 | 169 | 44,1 |
| 66,3 |
|
|
|
|
|
|
|
|
|
1. osoba pl. | 19 | 12,7 | 74 | 12,0 | 121 | 31,6 |
| 13,5 |
2. osoba pl. | 13 | 8,6 | 46 | 7,5 | 9 | 2,3 |
| 4,3 |
3. osoba pl. | 19 | 12,7 | 38 | 6,2 | 84 | 21,9 |
| 15,9 |
celkem pl. | 51 | 34,0 | 158 | 25,7 | 214 | 55,9 |
| 33,7 |
sg. + pl. | 150 | 100 | 615 | 100 | 383 | 100 | 3090 | 100 |
Ve složeném futuru ve všech skupinách vynikají tvary 3. osoby sg., v BMJ a v D ještě 1. osoby sg. Je třeba upozornit na rozdíl 2. osoby sg. i pl. v BMJ a v D, i když jen malý, a v H (sg. 0 %, pl. 2,3 %).
Tab. č. 12
| BMJ | % | D | % | H | % | C | % |
složené | 13 | 3,9 | 432 | 63,3 | 820 | 75,7 |
| 69,3 |
zvratné | 317 | 96,1 | 251 | 36,7 | 263 | 24,3 |
| 30,7 |
složené+zvratné | 330 | 100 | 683 | 100 | 1083 | 100 | 16699 | 100 |
V použití dvou forem pasiva se BMJ výrazně liší od FSČ, a to téměř výhradním zastoupením pasiva v podobě zvratné, zatímco D a H (i C) mají častěji pasivum složené.
Tvary přechodníků, kondicionálu minulého a plusquamperfekta se v našem materiálu z BMJ nevyskytly vůbec. Ale i ve skupinách D, H a C jsou tyto tvary velmi málo frekventované.
4. Tento článek je jen dílčí sonda do problematiky, tolik složité a rozvětvené. Posuďme, co se podařilo vytěžit z našeho materiálu.
[24]Slovní zásoba BMJ je ovlivňována skutečností, že má většinou dialogický charakter (v tom je mu blízká skupina D), a pokud monologický, pak v něm převládají krátká dynamická vypravování a jednoduché popisy a úvahy.[11] Kromě jazykových prostředků, které jsou běžné v obou formách jazykových projevů, tj. písemné i psané, jako jsou spojky, předložky, zájmena a základní slovesa, slovní zásoba BMJ silně vyzdvihuje funkci částic. Částice no, jo, tak, že, a, jednotlivé i v nejrůznějších kombinacích (no jo, že jo, no tak, no a apod.) fungují jako důležité prostředky kontaktové, resp. jako souhlasné reakce. Funkci částic nabývají také zájmena on/von a to.[12]
I tvary substantiv a sloves signalizují rozdíly mezi BMJ a sledovanými skupinami FSČ.
Ve frekvenci pádů jsou v BMJ nejvýznamnější nominativ a akuzativ, a to jak v singuláru, tak i v plurálu (i když tam v menším počtu). Ve skupině D a H mají tyto pády rovněž silné postavení, ve srovnání s ostatními pády však tolik nevynikají. Jejich postavení se blíží genitiv singuláru i plurálu, v menší míře i lokál, zvláště ve skupině H. Vokativ je silněji zastoupen ve skupině D, v menší míře i v BMJ, ale v H a C minimálně.
V použití slovesných tvarů se BMJ se skupinami D a H v mnohém shoduje, např. v největším zastoupení tvarů indikativu préz. akt. a préterita i ve využití jednotlivých osob v obou číslech.[13] Za pozornost stojí, že BMJ užívá více 2. osoby singuláru, a to ve všech frekventovaných tvarech, nejvíce pak v imperativu.
Z obou sledovaných slovních druhů se v BMJ více využívá sloves, což odpovídá dynamičtějším projevům v BMJ.
Prostředky zde vytčenými se BMJ shoduje či odlišuje od skupin, reprezentujících ve FSČ mluvený jazyk. Je zřejmé, že skupina D v sledovaných jevech se více blíží BMJ než skupina H, která jako reprezentant mluveného jazyka sloužit nemůže.
LITERATURA
DEJMEK, B.: Běžně mluvený jazyk (městská mluva) města Přelouče. Pedagogická fakulta, Hradec Králové 1976.
DEJMEK, B.: Mluva nejstarší generace Hradce Králové. Pedagogická fakulta, Hradec Králové 1981.
DEJMEK, B.: Běžně mluvený jazyk nejmladší generace Hradce Králové. Pedagogická fakulta, Hradec Králové 1987.
HOFFMANNOVÁ, J. – MÜLLEROVÁ, O. – ZEMAN, J.: Konverzace v češtině při rodinných a přátelských návštěvách. Trizonia, Praha 1999.
JEDLIČKA, A.: Spisovný jazyk v současné komunikaci. UK, Praha 1978.
JELÍNEK, J. – BEČKA, J. V. – TĚŠITELOVÁ, M.: Frekvence slov, slovních druhů a tvarů v českém jazyce. SPN, Praha 1961.
ŠONKOVÁ, J.: Mluvená čeština a korpusová lingvistika. SaS, 61, 2000, s. 190–202.
[25]R É S U M É
The author engages in quantitative analysis of everyday spoken language (běžně mluvený jazyk – BMJ); he focuses primarily on the frequency of noun and verb words and forms. He compares the results of his analyses with the conclusions of the seminal work on Czech quantitative linguistics – Frekvence slov, slovních druhů a tvarů v českém jazyce (Frequency of Words, Word Types and Forms in the Czech Language) (FSČ). Spoken language in FSČ is represented or simulated by dramas (D) and utterances published in the press (H). The author demonstrates that many BMJ devices and those of groups D and H coincide but many also differ. The differences are evident both in the frequency of vocabulary and in the forms of nouns and verbs.
BMJ usually has the character of dialogue and numerous uninflected words are used, particularly prepositions and conjunctions; the inflected words particularly include personal and demonstrative words. Of the uninflected words, particles play a specific role, whether as contact elements or as affirmative reactions (no, jo, tak, že, a – or in reciprocal combinations). The most important position among pronouns (as in the case of FSČ) is taken by ten (often coming close to the function of the definite article) and von (which is often expressive and superfluous – vono to bylo mokrý).
More verbs are used in BMJ than nouns. Some verbal forms have a higher frequency in BMJ than is given in FSČ, e. g. the 2nd person singular, especially in the active present indicative, the past, the present conditional and particularly in the imperative. As for the passive, the reflexive form (řeklo se) was found almost exclusively in BMJ. Transgressives, past conditionals and past perfects do not occur in BMJ.
[1] Poněvadž FSČ používáme jako základního pramene a budeme se často na něj odvolávat a s ním srovnávat, odkazy na něj budeme uvádět přímo v textu.
[2] K našemu pojetí BMJ blíže viz Dejmek, 1976, 1981, 1987. – O komplexní mluvenosti viz Jedlička, 1978, s. 44.
[3] Tento článek je přizpůsoben k prezentaci v časopisu, a nemůže tedy obsahovat všechny zjištěné údaje a tabulky, které by bylo možné vytěžit z materiálu, jímž disponujeme. Některé další údaje jsou uloženy u autora.
[4] Oproti jazykovému výzkumu prováděnému v Přelouči v letech 1966–68 jsme počet respondentů omezili na 7. Z původního počtu 10 respondentů jsme vyřadili ty, kteří se počtem slov i útržkovitostí materiálu vymykali ze skupiny ostatních respondentů.
[5] Ve FSČ první číslo označuje absolutní frekvenci, druhé číslo počet skupin, v nichž je slovo zastoupeno, a třetí číslo počet pramenů uvnitř skupin. Jak tato čísla ovlivňují celkové pořadí viz FSČ (s. 28).
[6] Celkové výsledky (C) uvádíme proto, abychom využili konečné sumarizace všech skupin a kategorií ve FSČ. C vypovídací hodnotu jistě má, ale detailnější porovnávání provádíme jen u BMJ, D a H. U C také – kromě frekvence slov – neuvádíme reálná čísla, nýbrž jen jejich procentuální zastoupení.
[7] Číslo za lomítkem u BMJ, D a H označuje počet pramenů, resp. R.
[8] Číslo za lomítkem u FSČ znamená počet skupin.
[9] Ale i v D, H a C jsme v tab. č. 2 uvedli součet hesel ten, tenhle, tenhleten a tento. Pořadí se tím nikde nezměnilo.
[10] Nerozlišujeme jako FSČ jo (pořadí v C 1713) a jó (2645). Vzhledem k různému počtu pramenů ve skupinách D i C obě hesla nesčítáme a přebíráme jen frekvenci a pořadí jo. Ve skupině H nejsou jo ani jó obsaženy.
[11] To dokázaly všechny naše výzkumy v Přelouči i v Hradci Králové.
[12] Ke kontaktovým částicím a souhlasným reakcím viz také Hoffmannová – Müllerová – Zeman, 1999, s. 157–158.
[13] Shody a rozdíly jsou uvedeny pod příslušnými tabulkami.
Pod Zámečkem 212
500 06 Hradec Králové 6
Slovo a slovesnost, ročník 63 (2002), číslo 1, s. 15-25
Předchozí Jana Hoffmannová, Olga Müllerová: Čeština v dialogu věkově rozdílných mluvčích
Následující Světla Čmejrková: Identita slova a prolínání hlasů v dialogu, konverzaci a institucionální komunikaci
© 2011 – HTML 4.01 – CSS 2.1