KVANTITATIVNÍ LINGVISTIKA

Základní

Jedna z oblastí ↗matematické lingvistiky využívající metod matematické statistiky (např. ↗shluková analýza), teorie pravděpodobnosti, teorie informace, teorie ↗fraktálů, ↗entropie, teorie chaosu i jiných matematických disciplín k výzkumu kvantitativních vlastností (zákonitostí) přirozeného jaz. Filozofický základ české k.l. byl pojmenován už na poč. 20. stol. ✍Mathesiem (1911) (angl. znění ✍Mathesius, 1964) jako „potenciálnost jazykových jevů“; bylo upozorněno na to, že jaz. se neřídí „absolutními zákony“; v řeči každého jednotlivce existuje kolísání, oscilace „v určitých mezích a s určitou tendencí“. Jaz. jako systém účelných prostředků určovaných rozmanitými funkcemi, který inherentně existuje ve vědomí mluvčích, je systémem pravděpodobnostní povahy.

Č. začala být zkoumána z hledisek kvantitativních ve významnější míře počátkem 20. stol., kdy většina empirických kvantitativních výzkumů úzce souvisela jednak s konstrukcí různých těsnopisných soustav, jednak se snahou o pokrok v oblasti didaktické (při tvorbě slabikářů a čítanek i učebnic cizích jaz.; viz ✍Králík, 2007; ✍Králík, 2012). Jako lingvistická disciplína s vlastním předmětem, metodami a úkoly se č. k.l. začala rozvíjet v teoretickém rámci funkčního strukturalismu. Pojem kvanta byl v ↗Pražské škole vykládán jako nutná, konstitutivní složka jaz. skutečnosti. Není bezvýznamné ani nahodilé, zda se např. táž fonémová opozice vyskytuje v jaz. systému pouze jednou, dvakrát n. stokrát. Záleží nejen na tom, zda je např. určitý fonologický protiklad (či foném, skupina fonémů, morfém apod.) vůbec přítomen v inventáři jeho prvků, ale také na stupni, míře, intenzitě, v jaké je ho využito neboli na jeho funkčním zatížení (functional load, Belastungsfähigkeit). Zatímco přítomnost n. nepřítomnost prvku v jaz. systému je záležitostí kvalitativní, funkční zatížení prvku je komplementární vlastností kvantitativní; chceme‑li poznat jaz. fakta v úplnosti, je nutné přihlížet k oběma. Protože jedním z hlavních badatelských zájmů Pražské školy byla fonologie, soustředila se kvantitativní analýza v prvé řadě na zkoumání funkčního zatížení fonémů ve slovech (lexémech) n. v slovních tvarech a na zkoumání funkčního zatížení v souvislé řeči (v textu) (např. ✍Mathesius, 1964; ✍Vachek, 1940; ✍Krámský, 1939; ✍Trnka, 1935; ✍Trnka, 1937; ✍Trnka, 1964, na materiálu č. i jiných jaz.). Pozoruhodnou speciální aplikací byl ✍Trnkův (1937) pokus vytvořit novou č. těsnopisnou soustavu, v praxi však neprosazený. Soustava byla založena na funkční zásadě, že kvantitativní a kvalitativní rozdíly mezi fonémy mají mít přesné grafické korespondence. Proto v jeho návrhu byly nejkratší znaky těsnopisné abecedy rezervovány pro nejfrekventovanější fonémy a funkční fonologické opozice byly označovány graficky stejně u všech fonematických dvojic (např. b bylo odlišeno od p týmž grafickým příznakem jako d od t, z od s atd.).

Po pauze v 50. letech přišlo oživení č. k.l. až v 60. letech. Byla pro ni, alespoň zpočátku, charakteristická veliká diverzifikace generační, koncepční, tematická (aplikační) i metodická („technologická“). Nový program byl stále zřetelněji interdisciplinární; k.l. vymezovala své místo v sousedství různých dalších tehdy nových směrů v lingvistice, zejm. k ↗algebraické lingvistice. V r. 1961 vyšel (s desetiletým zpožděním) první ↗frekvenční slovníkč. (přípravné excerpce materiálu k němu započaly již za války), dále překladový sborník ✍Doležel (ed.) (1964), který zpřístupnil v č. novinky ze světové k.l. včetně zásadní stati ✍Shannonovy (1951); současně se objevily původní studie Shannonovou studií inspirované (např. ✍Komárek, 1964; ✍Doležel, 1963; ✍Doležel, 1967; ✍Korvasová & Palek, 1962; ✍Těšitelová, 1974). V průběhu 60.–80. let vznikl rozsáhlý soubor kvantitativních charakteristik současné spis.č. v její varietě psané i mluvené, který se opíral o původní, speciálně pro daný účel sestavený počítačově zpracovaný textový korpus o rozsahu 540 000 výskytů slov, který přinesl detailní kvantitativní data fonologická, grafematická, lexikální, slovnědruhová, morfologická a syntaktická, publikovaná č.angl., knižně i v periodikách (zejména v deseti svazcích Prague Studies in Mathematical Linguistics (PSML)), spolu s pokrokem metodologickým (✍Těšitelová, 1980; ✍Těšitelová (ed.), 1982; ✍Těšitelová (ed.), 1983; ✍Těšitelová, 1983a; ✍Těšitelová (ed.), 1983b; ✍Těšitelová (ed.), 1984; ✍Těšitelová, 1987; ✍Confortiová, 1986; ✍Králík, 1990; ✍Kraus, 1965; ✍Kraus, 1972; ✍Ludvíková, 1972; ✍Ludvíková, 1972; ✍Nebeská, 1978; ✍Nebeská, 1986; ✍Uhlířová, 1995). Tento korpus byl později modernizován a využívá se ho v novém vnitřním formátu a anotačních schématech v rámci č. ↗korpusové lingvistiky pod názvem Český akademický korpus (✍Králík & Uhlířová, 2007; ✍Hladká & Králík, 2006; ✍Vidová Hladká & Hajič ad., 2008), který je kompatibilní s ↗Pražským závislostním korpusem.

Opakovaně je zdůrazňován principiální požadavek, aby empiricky zjištěné poučky byly matematickými postupy odvozeny na základě hypotéz o jaz. a tím vysvětleny, tedy zapojeny do soustavy našich poznatků o jaz. (✍Novák, 2010).

K.l., původně obor převážně empirický, deskriptivní a aplikovaný, se v současné době výrazně posunul směrem teoretickým, tj. k vědě o univerzálních kvantitativních vlastnostech přirozeného jaz. (např. ✍Čech & Pajas, 2010; ✍Čech & Mačutek, 2010; ✍Čech & Altmann, 2011; ✍Hřebíček, 1992; ✍Hřebíček, 1995; ✍Hřebíček, 1997; ✍Hřebíček, 2000; ✍Hřebíček, 2007; ✍Králík, 1990; ✍Králík, 2009; ✍Králík, 2010; ✍Kučera, 2001; ✍Uhlířová, 1996; ✍Uhlířová, 1997; ad.); Hřebíček je autorem původní kvantitativní teorie textu jako matematicky testovatelné teorie o vlastnostech textů. Významné teoretické impulsy k rozvoji současné č. k.l. (včetně publikačních a editorských příležitostí) začaly přicházet od počátku 90. let od mezinárodního okruhu autorů publikujících v  časopisu Journal of Quantitative Linguistics (= oficiální fórum Mezinárodní asociace pro kvantitativní lingvistiku; nakl. Routledge, Taylor & Francis Group, Londýn; hlavní editor R. Köhler), v knižní sérii Quantitative linguistics (nakl. Mouton de Gruber, Berlin – New York; hlavní ediční rada: R. Köhler, G. Altmann, P. Grzybek), v Altmannově nakladatelství RAM‑Verlag (Lüdenscheid, Německo) i jinde. Viz také ↗matematická lingvistika, ↗algebraická lingvistika, ↗frekvenční slovník, ↗kvantitativní metody ve fonetice, ↗kvantitativní metody v sociolingvistice, ↗kvantitativní stylistika.

Rozšiřující
Literatura
  • Confortiová, H. On the Semantic Analysis of Prepositions from the Quantitative Point of View. PSML 9, 1986, 53–64.
  • Čech, R. & I. I. Popescu ad. Metody kvantitativní analýzy (nejen) básnických textů, 2013.
  • Čech, R. & P. Pajas ad. Full Valency. Verb Valency without Distinguishing Complements and Adjuncts. Journal of Quantitative Linguistics 17, 2010, 291–302.
  • Čech, R. & J. Mačutek. On the Quantitative Analysis of Verb Valency in Czech. In Grzybek, P. & E. Kelih (eds.), Text and Language. Structures Functions Interrelations. Quantitative Perspectives, 2010, 21–29.
  • Čech, R. & G. Altmann. Problems in Quantitative Linguistics 3, 2011.
  • Doležel, L. Předběžný odhad entropie a redundance psané češtiny. SaS 24, 1963, 165–174.
  • Doležel, L. Jména zdrobnělá. In TSČ 2, 1967, 494–530.
  • Doležel, L. (ed.) Teorie informace a jazykověda, 1964.
  • Hladká, B. & J. Králík. Proměny Českého akademického korpusu. SaS 67, 2006, 179–204.
  • Hřebíček, L. Text in Communication: Supra-sentence Structures, 1992.
  • Hřebíček, L. Text Levels. Language Constructs, Constituents and the Menzerath-Altmann Law, 1995.
  • Hřebíček, L. Lectures on Text Theory, 1997.
  • Hřebíček, L. Variation in Sequencies, 2000.
  • Hřebíček, L. Vyprávění o lingvistických experimentech s textem, 2002.
  • Hřebíček, L. Text in Semantics, 2007.
  • Komárek, M. Sur l'appréciation fonctionelle des alternances morphonologiques. TLP 1, 1964, 145–161.
  • Korvasová, K. & B. Palek. Některé vlastnosti entropie českého slovníku. SaS 23, 1962, 58–66.
  • Králík, J. On some Special Models in Quantitative Linguistics. PSML 10, 1990, 85–94.
  • Králík, J. Quantitative Linguistics within Czech Contexts. In Köhler, R. & P. Grzybek (eds.), Exact Methods in the Study of Language and Text, 2007, 343–351.
  • Králík, J. Contemplations on Corpus Afinity. In Köhler, R. (ed.), Studies in Quantitative Linguistics 5, 2009, 46–50.
  • Králík, J. Probabilistic Reading of Zipf. In Grzybek, P. & E. Kelih ad. (eds.), Text and Language, 2010, 91–98.
  • Králík, J. Kvantitativní lingvistika v Čechách. In Čmejrková, S. & J. Hoffmannová ad. (eds.), Čeština v pohledu synchronním a diachronním. Stoleté kořeny Ústavu pro jazyk český, 2012, 67–71.
  • Králík, J. & L. Uhlířová. The Czech Academic Corpus (CAC), its History and Presence. Journal of Quantitative Linguistics 14, 2007, 265–285.
  • Krámský, J. A Study in the Phonology of Modern Persian. AO 11, 1939, 66–83.
  • Kraus, J. Kódování a komprese psané češtiny. Kybernetika 1, 1965, 74–84.
  • Kraus, J. On the Stylistical-Semantic Analysis of Adjectives in Journalistic Style (a Quantitative Approach). PSML 4, 1972, 95–106.
  • Kučera, K. The Development of Entropy and Redundancy in Czech from the 13th through the 20th Centuries. In Altmann, G. & R. Köhler ad. (eds.), Text as a Linguistic Paradigm: Levels, Constituents and Constructs, 2001, 153–162.
  • Ludvíková, M. Some Quantitative Aspects of the Czech Syllable. PSML 4, 1972, 141–154.
  • Ludvíková, M. On the Occurrence of Syllables in Different Word Positions. PSML 6, 1978, 39–45.
  • Mathesius, V. O potenciálnosti jevů jazykových, 1911.
  • Mathesius, V. On the Potentiality of the Phenomena of Language. In Vachek, J. (ed.), A Prague School Reader in Linguistics, 1964, 1–32.
  • Mathesius, V. La structure phonologique du lexique du tchèque moderne. In Vachek, J. (ed.), A Prague School Reader in Linguistics, 1964, 156–176.
  • Nebeská, I. On the Order of Clauses in a Group of Complex Sentences Expressing Causal Relations. PSML 6, 1978, 73–81.
  • Nebeská, I. A Contribution to the Semantics of Model Verbs from the Quantitative Point of View. PSML 9, 1986, 53–66.
  • Novák, P. Lingvistika a jazyková realita. Výbor z díla, 2010.
  • Novák, P. & M. Těšitelová. Kvantitativní lingvistika. In Sgall, P. a kol. Cesty moderní jazykovědy, 1964, 126–133.
  • Shannon, C. E. Prediction and Entropy of Printed English. Bell Systems Technical Journal 30, 1951, 50–64.
  • Těšitelová, M. Otázky lexikální statistiky, 1974.
  • Těšitelová, M. Využití statistických metod v gramatice, 1980.
  • Těšitelová, M. (ed.) Kvantitativní charakteristiky současné české publicistiky, 1982.
  • Těšitelová, M. (ed.) Kvantitativní charakteristiky současné odborné češtiny, 1983.
  • Těšitelová, M. (ed.) Psaná a mluvená odborná čeština z kvantitativního hlediska, 1983a.
  • Těšitelová, M. (ed.) Kvantitativní charakteristiky gramatických jevů v současné administrativě, 1983b.
  • Těšitelová, M. (ed.) Kvantitativní charakteristiky gramatických jevů v češtině věcného stylu, 1984.
  • Těšitelová, M. Kvantitativní lingvistika, 1987.
  • Těšitelová, M. & J. Petr ad. Retrográdní slovník současné češtiny, 1986.
  • Těšitelová, M. & H. Confortiová ad. O češtině v číslech, 1987.
  • Trnka, B. A Phonological Analysis of Present-Day Standard English, 1935.
  • Trnka, B. Pokus o vědeckou teorii a praktickou reformu těsnopisu, 1937.
  • Trnka, B. Kvantitativní lingvistika. ČMF 34, 1951, 66–74.
  • Trnka, B. General Laws of Phonemic Combinations. In Vachek, J. (ed.), A Prague School Reader in Linguistics, 1964, 294–300.
  • Uhlířová, L. O jednom modelu rozložení délky slov. SaS 56, 1995, 8–14.
  • Uhlířová, L. How Long are Words in Czech? Glottometrika 15, 1996, 134–146.
  • Uhlířová, L. Length vs. Order: Word Length and Clause Length from the Perspective of Word Order. Journal of Quantitative Linguistics 4, 1997, 266–275.
  • Vachek, J. Poznámky k fonologii českého lexika. LF 67, 1940, 395–402.
  • Vidová Hladká, B. & J. Hajič ad. Czech Academic Corpus 2.0. – CD-ROM. Linguistic Data Consortium, catalog No.: LDC2008T22, Philadelphia, Pennsylvania, USA, 2008.
  • Vidová Hladká, B. & J. Hajič ad. Czech Academic Corpus 2.0 – Guide. PBML 89, 2008, 41–96.
  • Též Korpusová lingvistika, Matematická lingvistika, Algebraická lingvistika, Pražská škola, Frekvenční slovník, Kvantitativní metody ve fonetice, Kvantitativní metody v sociolingvistice, Kvantitativní stylistika.
Citace
Ludmila Uhlířová (2017): KVANTITATIVNÍ LINGVISTIKA. In: Petr Karlík, Marek Nekula, Jana Pleskalová (eds.), CzechEncy - Nový encyklopedický slovník češtiny.
URL: https://www.czechency.org/slovnik/KVANTITATIVNÍ LINGVISTIKA (poslední přístup: 20. 8. 2019)

CzechEncy – Nový encyklopedický slovník češtiny

Všechna práva vyhrazena © Masarykova univerzita, Brno 2012–2018

Provozuje Centrum zpracování přirozeného jazyka