APLIKACE KORPUSOVÉ LINGVISTIKY

Základní

Korpusový přístup se v lingvistice opírá o ↗korpusová data (kombinující rozsáhlou empirickou základnu, indukci a kvantitativní metody při ↗vytěžování korpusu), a dnes se uplatňuje téměř na všech rovinách popisu jaz. Kvantitativním analýzám nejmenších jednotek (fonémů a grafémů) se na angl. věnoval už H. Kučera v rámci vytěžování prvního moderního korpusu (Brown corpus). V současnosti vznikají za účelem výzkumu fonetické databáze poskytující rozsáhlé možnosti kvantifikace a zkoumání segmentálních i suprasegmentálních jevů mluveného jaz. Rovina grafémiky je vytěžována s pomocí korpusů psané češtiny, a to jak v perspektivě synchronní, tak diachronní. V oblasti gramatiky najdeme dnes pro č. celou paletu studií z morfologie a syntaxe (ovlivněné corpus‑based výzkumem i corpus‑driven výzkumem), stejně tak jako první souborná gramatická díla.

V lexikologii a lexikografii, což jsou oblasti, pro něž byly korpusy budovány především, je korpusový přístup dnes převládající metodologií; vedle tradičních výkladových a překladových slovníků umožnil příchod korpusů i vytváření slovníků specializovaných (frekvenční, kolokační). V současné době se stále více analýz zaměřuje na vyšší roviny; corpus assisted discourse studies (CADS) (studium diskurzu založené na korpusu) je jak synchronní, tak diachronní. Jejich hlavní odlišnost oproti kvalitativním metodám studia diskurzu, jako je ↗kritická analýza diskurzu (critical discourse analysis), spočívá v kvantitativním rozsahu empirické báze, kterou korpusy poskytují, což umožňuje redukovat badatelův subjektivní vliv na analýzu. Korpusový přístup se vedle lexikografie a cizojazyčné pedagogiky (tvorba učebnic) uplatňuje také v dialektologii, sociolingvistice, psycholingvistice, forenzní lingvistice, při studiu jaz. variability, v jaz. didaktice a studiu akvizice jaz. ad. Z nelingvistických disciplín se korpus užívá i v literární vědě, sociologii či psychologii.

Rozšiřující
Literatura
  • Baker, P. Using Corpora in Discourse Analysis, 2010.
  • Baker, P. & A. Hardie ad. A Glossary of Corpus Linguistics, 2006.
  • Bartoň, T. & V. Cvrček ad. Statistiky češtiny, 2009.
  • Cvrček, V. & D. Kováříková. Možnosti a meze korpusové lingvistiky. 94, 2011, 113–133.
  • Čermák, F. (ed.) Frekvenční slovník mluvené češtiny, 2007a.
  • Čermák, F. (ed.) Slovník Karla Čapka, 2007b.
  • Čermák, F. & M. Křen ad. Frekvenční slovník češtiny, 2004.
  • Čermák, F. & V. Cvrček ad. Slovník Bohumila Hrabala, 2009.
  • Čermák, F. & M. Křen ad. A Frequency Dictionary of Czech. Core Vocabulary for Learners, 2011.
  • KČG, 2011.
  • Kučera, K. The Development of Entropy and Redundancy in Czech from the 13th through the 20th Century: An Echo of The Arrow of Time. In Altmann, G. & R. Köhler ad. (eds.), Text as a Linguistic Paradigm: Levels, Constituents and Constructs. Quantitative Linguistics 60, 2001, 153–162.
  • MSoČ 1, 2010.
Citace
Václav Cvrček (2017): APLIKACE KORPUSOVÉ LINGVISTIKY. In: Petr Karlík, Marek Nekula, Jana Pleskalová (eds.), CzechEncy - Nový encyklopedický slovník češtiny.
URL: https://www.czechency.org/slovnik/APLIKACE KORPUSOVÉ LINGVISTIKY (poslední přístup: 25. 2. 2020)

Další pojmy:

korpusová lingvistika

CzechEncy – Nový encyklopedický slovník češtiny

Všechna práva vyhrazena © Masarykova univerzita, Brno 2012–2018

Provozuje Centrum zpracování přirozeného jazyka