MATEMATICKÁ LINGVISTIKA

Základní

Vědní obor, který stojí na pomezí lingvistiky, matematiky a informatiky včetně jejího odvětví zvaného umělá inteligence; lze ji členit na ↗komputační lingvistiku (počítačovou lingvistiku), ↗formální lingvistiku a ↗kvantitativní lingvistiku (statistickou lingvistiku). M.l. je primárně lingvistickou disciplínou, jejíž předmětem je přirozený jaz. (mluvený a psaný) zkoumaný matematickými (formálními, exaktními) metodami. Podstatou těchto metod je jejich explicitnost a přesnost, m.l. se v maximální míře vyhýbá nejasným, vágním formulacím ponechávajícím prostor pro různé interpretace. Z matematických disciplín se m.l. opírá především o odvětví algebraická, zejména pak o teorii formálních gramatik, jazyků a automatů, o teorii svazů, o různé typy algeber (zejm. booleovské, Heytingovy) a o matematickou statistiku a pravděpodobnost (viz ↗Menzerathův-Altmannův zákon, ↗Heapsův zákon, ↗Zipfovy zákony, ↗matematický fraktál, ↗jazykový fraktál, ↗hypotéza fraktální struktury jazyka, ↗entropie, ↗faktorová analýza, ↗slovní bohatství textu aj.). M.l. má řadu styčných bodů s teorií ↗množin a s logickými a formálními systémy (výroková a predikátová logika, teorie modelů a axiomatických systémů (viz ↗množina, ↗Vennovy diagramy, ↗tradiční logika, ↗intenzionální sémantika, ↗hyperintenzionální sémantika, ↗dynamická sémantika, ↗formální sémantika, ↗situační sémantika). V poslední době nastal zejm. v souvislosti s rozvojem elektronických ↗korpusů prudký rozvoj zvl. statistických (pravděpodobnostních, stochastických) metod zpracování přirozeného jaz., které se používají mj. pro morfologické ↗značkování jaz. korpusů, pro ↗parsing, pro řešení problémů morfologické, syntaktické i lexikálně‑sémantické homonymie (viz ↗desambiguace // disambiguace), pro vyhledávání informací v elektronických textech, pro analýzu a syntézu mluveného jazyka (řeči), pro ↗strojový překlad ad. Význam m.l. vzrůstá v souvislosti s možnostmi, jaké poskytuje rozvoj informatiky a počítačů, a to zejm. od konce 80. let 20. stol., kdy v informatice dochází k prudkému rozvoji v oblasti hardwarových i softwarových technologií, které umožňují budovat mj. rozsáhlé elektronické jaz. ↗korpusy a rychle v nich vyhledávat efektivním softwarem.

Hlavním úkolem m.l. je explicitně popisovat, modelovat a zpracovávat přirozený jaz.; ten se vyznačuje některými specifickými vlastnostmi, jež se vzpírají exaktnímu formálnímu popisu a explicitnímu zachycení, jako je např. inherentní homonymie a synonymie výrazů a struktur, vágnost významů a jiné asymetrie na všech úrovních. Automatizace odstraňování víceznačnosti je jedním z prvořadých úkolů m.l. Anotace (značkování) rozsáhlých počítačových korpusů na základě propracovaných metod m.l. přináší nové možnosti pro bohemistiku a další obory, protože umožňuje daleko rychlejší, úplnější a metodologicky jednotnější zpracování nejrůznějších témat z gramatiky, lexika, sémantiky, příp. i literární vědy; takové práce zase přispívají ke zdokonalování anotačních procedur. V oblasti mluveného jaz. jde především o automatickou analýzu (rozpoznávání) a syntézu řeči (speech recognition and synthesis). Významnými aplikacemi m.l., které předpokládají odstranění víceznačnosti, jsou pak ↗strojový překlad a automatické porozumění textu formulovanému v neomezeném přirozeném jaz. (mluveném či psaném) pro komunikaci s inteligentními roboty a databázemi i pro vyhledávání informací v textech. Důležitým odvětvím m.l. je i tvorba elektronických slovníků na základě jaz. korpusů a další oblasti zpracování přirozeného jazyka. Viz také ↗algebraická lingvistika, ↗kvantitativní lingvistika.

Rozšiřující
Citace
Vladimír Petkevič (2017): MATEMATICKÁ LINGVISTIKA. In: Petr Karlík, Marek Nekula, Jana Pleskalová (eds.), CzechEncy - Nový encyklopedický slovník češtiny.
URL: https://www.czechency.org/slovnik/MATEMATICKÁ LINGVISTIKA (poslední přístup: 15. 6. 2019)

CzechEncy – Nový encyklopedický slovník češtiny

Všechna práva vyhrazena © Masarykova univerzita, Brno 2012–2018

Provozuje Centrum zpracování přirozeného jazyka