KORPUSOVÝ KONTEXT

Základní

Okolí slova, prvku v textu, který je při lingvistické analýze třeba k určení konkrétního významu a/nebo funkce takového slova; podle povahy sledovaného jevu a potřeby je různě dlouhý. V ↗korpusu se zpravidla dosud nijak nezachycují aspekty kontextu mimojazykového, mluvní situace apod.; u textového korpusu to ani není dobře možné (zčásti se o to snaží korpus multimodální; viz ↗korpus). Bez ohledu na různé teorie ↗kontextu se jeho podstata obvykle redukuje na lineární povahu textového řetězce, tj. na kvantitativní aspekty délky okolí, a tedy (počtu) slov kolem hledaného tvaru v řádku, tj. před a za ním (viz ↗konkordance). Kromě empirických postřehů žádná pevná zásada pro volbu podoby a délky kontextu v korelaci s povahou hledaného tvaru není: např. velká část adjektiv si zřejmě sice vystačí s kontextem následujícího substantiva, zatímco naopak partikule obvykle vyžadují aspoň kontext jedné věty, ale pevného není dáno nic a různé typy zkoumaného tvaru vyžadují různé kontexty.

K.k. je naprosto primárním zdrojem informací a základem každé analýzy, ať formální, či sémantické, a je třeba s ním pracovat citlivě, především ve smyslu způsobu jeho vyhodnocování (a ptát se přitom, zda je postačující, n. není: není‑li, lze ho v korpusu snadno rozšířit). Výhodou konkordance je nashromáždění všemožných kontextů hledaného slova, které také snadno napoví, kde je centrum jeho úzu (podporované nejvyšší a vysokou frekvencí, resp. opakováním kontextu) a kde jeho periferie (ojedinělé a řídké kontexty), včetně archaismů či neologismů. Kontext je nejenom nejvyšším vlastním arbitrem při rozhodování, hledání základní, reprezentativní formy a při posuzování konkrétní povahy významu, formy a úzu studované jaz. formy aj., je i arbitrem tenkrát, když ↗taggery (taggovací algoritmy) nejsou dostatečně přesné a narážejí na homonyma. Pak je zapotřebí ↗disambiguace / desambiguace, rozlišení funkce, formy n. významu podle dostatečného kontextu.

Podle informační teorie i výzkumů variability kontextu se obecně a v souladu s intuicí má za to, že tato jeho variabilita se značně zmenšuje v těsné blízkosti sledovaného slova; je to obecně dáno sémantikou slov, která se kombinují podle svého významu, resp. sémantických pravidel, a ta význam jednotlivých slov přirozeně propojují.

Terminologicky termín kontext kolísá a je chápán jen volně. Někdy se do něj zahrnuje i kontext mimojazykový, resp. situace (někdy ho zachycuje termín konsituace), objevuje se proto i snaha oddělit textový kontext alternativním názvem co‑text aj.

Rozšiřující
Citace
František Čermák (2017): KORPUSOVÝ KONTEXT. In: Petr Karlík, Marek Nekula, Jana Pleskalová (eds.), CzechEncy - Nový encyklopedický slovník češtiny.
URL: https://www.czechency.org/slovnik/KORPUSOVÝ KONTEXT (poslední přístup: 19. 4. 2024)

Další pojmy:

korpusová lingvistika

CzechEncy – Nový encyklopedický slovník češtiny

Všechna práva vyhrazena © Masarykova univerzita, Brno 2012–2020

Provozuje Centrum zpracování přirozeného jazyka