MORFOLOGICKÁ ANALÝZA

Autor: Zdenka Rusínová (1), Vladimír Petkevič (2)

▲

►

Základní

1. V tradiční gramatice lineární rozklad slova na ↗morfémy, tj. morfematická analýza. Stupně analýzy jsou dány mírou proměnlivosti různých částí slova při odvozování a ohýbání. Největší stálost vykazuje kořenný morfém slova (viz ↗kořen), který se považuje za kategorii stanovitelnou vesměs historicky, tedy z diachronního hlediska (např. uč‑), a je společný nejen všem morfologickým formám slova (např. všem pádovým podobám), ale i slovům od něho odvozovaným (učit, učení, učitel, učitelský, učitelství). Jeho rozšířením o kmenotvorný/é morfém/y vzniká jednoduchý (uč‑i‑), n. vícestupňový (uč‑i‑tel‑stv‑) ↗kmen, v jehož rámci se rozeznává kmen odvozovací (od něhož se tvoří dál) a kmen odvozený. Posledním morfémem je u ohebných slov tvarotvorný morfém / formant neboli koncovka (uč‑i‑tel‑stv‑í, uč‑i‑tel‑k‑y), v základním tvaru morfologická charakteristika (uč‑i‑tel‑k‑a), n. u neohebných slov slovnědruhová charakteristika (mlč‑k‑y). Kořenné i kmenotvorné morfémy podléhají ↗hláskovým alternacím.

Pro poznání slovotvorného procesu se v rámci ↗OTS odvozovací kmen považuje za ↗slovotvorný základ, k němuž se připojuje ↗slovotvorný formant. Analogicky se pro tvarotvornou (morfologickou) analýzu považuje celé slovo kromě ↗tvarotvorného formantu za ↗tvarotvorný základ, což se obvykle u odvozených slov kryje s odvozeným kmenem (v morfologii nazývaným také tvarotvorný kmen). Tvarotvorným formantem rozumíme kmenotvornou příponu + (a) tvarovou (někdy nazývanou pádovou) koncovku jména (žen‑a, kuř‑at+a, zdrav‑é+ho), (b) tvarovou (někdy nazývanou osobní) koncovku určitého slovesného tvaru (nes‑e+š, děl‑ej+me), (c) infinitivní tvarovou koncovku (pros‑i+t, péc‑0+i) a (d) tvarotvornou koncovku participia + koncovku jmenných kategorií rodu+čísla (nes‑0+l+0, uvid‑ě+l+y).

2. V ↗korpusové lingvistice automatický proces, při němž se v užším smyslu každému slovnímu tvaru v (korpusovém) textu přiřadí všechny morfologické údaje včetně slovního druhu v podobě značky (↗tagu), v širším (obvyklém) smyslu navíc všechna jeho ↗lemmata procesem ↗lemmatizace; viz ✍Hajič (2004), ✍Hlaváčová (2009), ✍Čermák & Klímová ad. (2000), ✍Petkevič (2000). Je-li tvar slovnědruhově a/nebo morfologicky homonymní, přiřadí mu m.a. takových údajů více než jeden. Např. (zjednodušená) m.a. věty Sním je místo něho přiřadí jednotlivým slovním tvarům tyto údaje (v prvním sloupci je analyzovaný tvar, ve druhém lemma, ve třetím značka):

Sním	sníst	VpS--1d
	snít	VpS--1n
je	být	VpS--3n
	ono	PPSN4--
	oni	PPPM4--
	ony	PPPI4--
	ony	PPPF4--
	ona	PPPN4--
místo	místo	NNSN1--
	místo	R---2--
něho	něha	NNSF5--
	on	PPSM2--
	on	PPSM4--
	on	PPSI2--
	ono	PPSN2--
.	.	Z------

Symboly ve značce mají tento význam (- znamená: neurčuje se):

1. pozice:		slovní druh: V – sloveso, P – zájmeno, N – substantivum, R – předložka, Z – interpunkce
2. pozice:		poddruh slovního druhu: p – prézens, P – osobní zájmeno, N – apelativum
3. pozice:		číslo: S – singulár, P – plurál
4. pozice:		jmenný rod: M – maskulinum životné, I – maskulinum neživotné. F – femininum, N – neutrum
5. pozice:		pád: 1 – nominativ, 2 – genitiv, 4 – akuzativ, 5 – vokativ
6. pozice:		osoba: 1 – první, 3 – třetí
7. pozice:		vid: d – dokonavý, n – nedokonavý

M.a. se provádí počítačovým programem zvaným morfologický analyzátor a je součástí morfologické ↗anotace, jejíž součástí je typicky i morfologická ↗disambiguace, která operuje obvykle na výstupu m.a. Např. výsledkem správné ↗lemmatizace a morfologické disambiguace, jež následuje po m.a. uvedené věty, jsou interpretace vysázené tučně.

▲

►

Rozšiřující

Literatura

Bosák, J. & K. Buzássyová. Východiska morfémovej analýzy (Morfematika, slovotvorba), 1985.
Čermák, F. Syntagmatika a paradigmatika českého slova II. Morfologie a tvoření slov, 1990.
Čermák, F. & J. Klímová ad. (eds.) Studie z korpusové lingvistiky, 2000.
Český národní korpus, 2010 (http://korpus.cz/).
ČŘJ, 1996, 81–83.
Dokulil, M. Stav a zkoumání morfologické stavby současné češtiny. SaS 29, 1968, 229–246.
Garside, R. & G. Leech ad. Corpus Annotation. Linguistic Information from Computer Text Corpora, 1997.
Hajič, J. Popis morfologických značek – poziční systém, 2000 (http://ucnk.ff.cuni.cz/).
Hajič, J. Disambiguation of Rich Inflection (Computational Morphology of Czech), 2004.
Hlaváčová, J. Formalizace systému české morfologie s ohledem na automatické zpracování českých textů. PhD. dis., FF UK, Praha, 2009.
Hnátková, M. & V. Petkevič ad. Linguistic Annotation of Corpora in the Czech National Corpus. In Trudy meždunarodnoj konferencii „Korpusnaja lingvistika – 2011“ (Proceedings of the International Conference „Corpus Linguistics – 2011“), 2011, 15–20.
Jakubíček, M. & V. Kovář ad. Czech Morphological Tagset Revisited. In Horák, A. & P. Rychlý (eds.), Proceedings of Recent Advances in Slavonic Natural Language Processing 2011, 2011, 29–42.
Jelínek, T. & V. Petkevič. Systém jazykového značkování současné psané češtiny. In Petkevič, V. & A. Rosen (eds.), Korpusová lingvistika Praha 2011 – 3. Gramatika a značkování korpusů, 2011, 154–170.
Leech, G. The State of the Art in Corpus Linguistics. In Aijmer K. & B. Altenberg (eds.), English Corpus Linguistics. Studies in Honour of Jan Svartvik, 1991, 8–29.
Leech, G. Corpus Annotation Schemes. Literary and Linguistic Computing 8, 1993, 275–281.
MČ 1, 1986, 177–178, 215–220.
McEnery, A. & A. Wilson. Corpus Linguistics, 2001.
Neščimenko, G. P. Problema derivacionnoj morfonologii. In Slavjanskoje i balkanskoje jazykoznanije. Problemy morfonologii, 1981, 302–321.
Osolsobě, K. Algoritmický popis české morfologie a strojový slovník češtiny. PhD. dis., FF MU, Brno, 1996.
Osolsobě, K. Formale Beschreibung der tschechischen Morphologie. In Junghanns, U. & G. Zybatow (eds.), Formale Slavistik, 1997, 443–451.
Petkevič, V. Značkování, automatická morfologická analýza a desambiguace. In Kocek, J. & M. Kopřivová ad. (eds.), Český národní korpus – Úvod a příručka uživatele, 2000, 25–34.
PMČ, 1995, 109–110.
The Prague Dependency Treebank 2.0, 2006 (http://ufal.mff.cuni.cz/pdt2.0/).
Sedláček, R. Morphematic Analyser for Czech. PhD. dis., FI MU, Brno, 2004.
Skoumalová, Z. Status tzv. kmenotvorných přípon slovesných v slovanských jazycích, zvláště v ruštině, 1975.
Slavíčková, E. Metoda morfémové analýzy založené na aplikaci teorie pravděpodobnosti. SaS 23, 1962, 94–104.
Slavíčková, E. Některé problémy morfémové analýzy češtiny. SaS 28, 1967, 7–17.
Slavíčková, E. Retrográdní morfematický slovník češtiny, 1975.
Straková, V. Κ morfematické strukturaci sémantických obsahů. Sl 53, 1984, 244–250.
Šmerk, P. K počítačové morfologické analýze češtiny. PhD. dis., FI MU, Brno, 2010.
Šmilauer, V. Novočeské tvoření slov, 1971, 10.
TSČ, 1962, 33, 53, 120, 128, 135.
Viz též Slovotvorný základ, Tvarotvorný základ, Tvarotvorný formant, Slovotvorný formant.

Citace

Zdenka Rusínová (1), Vladimír Petkevič (2) (2017): MORFOLOGICKÁ ANALÝZA. In: Petr Karlík, Marek Nekula, Jana Pleskalová (eds.), CzechEncy - Nový encyklopedický slovník češtiny.
URL: https://www.czechency.org/slovnik/MORFOLOGICKÁ ANALÝZA (poslední přístup: 20. 4. 2024)

CzechEncy – Nový encyklopedický slovník češtiny

Provozuje Centrum zpracování přirozeného jazyka

MORFOLOGICKÁ ANALÝZA

Další pojmy: