GRAMATICKÝ KOREKTOR

Autor: Karel Pala
Základní

Program, který kontroluje gramatickou správnost textu a upozorňuje autora textu na zpravidla syntaktické chyby, jichž se při psaní textu dopustil. G.k. (grammar checkers) jsou složitější než ↗korektory pravopisné a v první fázi využívají nejprve ↗morfologického analyzátoru k automatickému rozpoznání jednotlivých slov a jejich přiřazení ke slovním druhům. V druhém kroku se pak uplatní soubor pravidel představujících svého druhu strojovou gramatiku (např. češtiny), která dovede analyzovat struktury vět ve vstupním textu a díky tomu odhalit i případné gramatické chyby, např. ve shodě přísudku s podmětem či uvnitř jmenných a slovesných skupin, ve slovesných vazbách a v interpunkci. Souhrnně lze říci, že jádrem g.k. je fakticky syntaktický analyzátor daného jazyka. Není třeba zdůrazňovat, že vytvořit program spolehlivě rozpoznávající hlavní typy gramatických (syntaktických a interpunkčních) chyb je mimořádně nesnadné, zejména je pak obtížné dosáhnout potřebné přesnosti v rozpoznávání chyb a minimalizovat hlášení o falešných chybách. V současnosti dosahuje úspěšnost (českého) g.k. přibližně 70 %, uživatel proto musí být schopen poradit si s chybami v textu, které korektor neodhalí.

Příkladem úspěšného g.k. pro češtinu je g.k. autorů T. Jelínka, P. Květoně, K. Olivy a V. Petkeviče, který je aktuálně integrován v textovém procesoru Microsoft Word. Pravidla tvořící jádro g.k. (řádově jsou jich stovky) lze také charakterizovat jako kontextová. Kontextem v této souvislosti rozumíme úsek textu (okolí, část věty, celou větu, souvětí), který obsahuje místo, na němž se objevuje daná chyba. Pravidla potom fungují tak, že se porovnávají s nějakým podezřelým úsekem textu, tedy vhodným kontextem. Podle míry shody pravidla s daným úsekem textu lze určit, že jde o chybu a jakého typu. Jinak řečeno, kontextová pravidla obsahují určité podmínky, které např. říkají, že v daném kontextu se musí vyskytovat stanovené slovní druhy (spojka, podstatné jméno, sloveso aj.). Jsou‑li tyto podmínky splněny jen částečně, např. v daném kontextu při splnění ostatních podmínek chybí čárka před spojkou že, provede se potřebná akce, tj. uživateli se doporučí čárku doplnit. Pravidla mohou být formulována i negativně, tj. mohou stanovit, jak některé kontexty nesmějí vypadat. Pokud se při porovnání se vstupním textem zjistí neshoda, je uživatel upozorněn na chybu.

↗Pravopisný korektor dovede opravovat jen jednotlivé tvary, tj. neporadí si s chybnými spojeními, jako třeba aby jsteprogramy pracovali n. pravopisná korektor. Neporadí si tedy ani s chybami interpunkčními, tj. s chybami v kladení čárek či jiných oddělovačů (mezer), např. Řekl že to nevěděl, nebo Muž který se smál odešel. Tyto chyby lze obecně charakterizovat jako gramatické či také syntaktické, protože se týkají skladby daných vět či slovních spojení. Interpunkční chyby mají v zásadě syntaktickou povahu, protože kladení čárek v češtině vychází ze syntaktické struktury vět a v souvětí se čárkami typicky oddělují hlavní věty od vedlejších, a to v kombinaci s jednotlivými spojkami. Interpunkčních chyb se v č. textech vyskytuje dost, podle existujících odhadů představují 20 % všech chyb v nekorigovaných textech. Informace o úspěšném g.k. pro č. lze najít na adrese viz Lit. Viz též ↗pravopisný korektor, ↗stylistický korektor.

Rozšiřující
Citace
Karel Pala (2017): GRAMATICKÝ KOREKTOR. In: Petr Karlík, Marek Nekula, Jana Pleskalová (eds.), CzechEncy - Nový encyklopedický slovník češtiny.
URL: https://www.czechency.org/slovnik/GRAMATICKÝ KOREKTOR (poslední přístup: 13. 8. 2020)

Další pojmy:

komputační lingvistika

CzechEncy – Nový encyklopedický slovník češtiny

Všechna práva vyhrazena © Masarykova univerzita, Brno 2012–2020

Provozuje Centrum zpracování přirozeného jazyka