LEMMA

Základní

1. Jednotlivý slovníkový vstup. Reprezentativní podoba ↗lexému, charakterizovaná jistou gramatickou formou (u jmen nejčastěji nom.sg., u sloves inf.), jistým pravopisem a jistou výslovností, popř. rozrůzněná dubletou nebo variantností. V klasických slovnících uvádí l. heslový odstavec, v tomto případě se užívá spíše termín heslové slovo.

2. Reprezentativní slovníková podoba, která je při automatickém zpracování jazyka v procesu ↗lemmatizace přidělována každé formě v ↗korpusu. Přístupy k lemmatizaci se mohou v drobnostech lišit, obecně však platí, že l. každého č. substantiva je jeho nom.sg. (tvar lesůml. les), u adjektiv je to nom.sg.mask. (tvar chytroul. chytrý), u sloves je to infinitiv (tvar chodíšl. chodit) atd. L. jako jednotka vzniká abstrakcí morfologických vlastností slovního tvaru (označovaného jako word nebo forma), představuje tedy množinu forem lišících se pouze tvaroslovnými afixy, příp. pravopisnou variantou. V některých koncepcích se k l. řadí i vybrané varianty slovotvorné. V určitých aspektech je tak l. analogické ↗lexému s tím rozdílem, že l. je zatím vždy jednoslovná jednotka a ve většině korpusů koresponduje s výskytem slovního tvaru v poměru 1:1. V každém korpusu je inventář l. menší než inventář slovních tvarů (např. ve stomilionovém korpusu SYN2010 najdeme 1,7 mil. různých slovních tvarů, ale jenom 786 tis. různých l.).

L. by mělo být základním nositelem lexikálního významu jednotky, na základě l. jsou proto sestavovány korpusově založené slovníky. Vedle toho se ovšem stále více akcentuje přístup, který poukazuje na fakt, že význam je úzce spjat s morfologicky vymezeným tvarem a že l. je tak přílišnou abstrakcí zanedbávající důležité sémantické distinkce mezi tvary (srov. význam l. nerv a význam tvarů nervnervy, n. řídký brambůrek a běžné brambůrky).

Rozšiřující
Literatura
  • Baker, P. & A. Hardie ad. A Glossary of Corpus Linguistics, 2006.
  • Biber, D. & S. Conrad ad. Corpus Linguistics: Investigating Language Structure and Use, 1998.
  • Čermák, F. & R. Blatná. (eds.) Manuál lexikografie, 1995.
  • Jelínek, T. & V. Petkevič. Systém jazykového značkování korpusů současné psané češtiny. In Petkevič, V. & A. Rosen (eds.), Korpusová lingvistika Praha 2011 3. Gramatika a značkování korpusů, 2011, 154–170.
  • Kocek, J. & M. Kopřivová ad. (eds.) Český národní korpus: Úvod a příručka uživatele, 2000.
Citace
Zdeňka Hladká (1), Václav Cvrček (2) (2017): LEMMA. In: Petr Karlík, Marek Nekula, Jana Pleskalová (eds.), CzechEncy - Nový encyklopedický slovník češtiny.
URL: https://www.czechency.org/slovnik/LEMMA (poslední přístup: 20. 8. 2019)

Další pojmy:

lexikologie

CzechEncy – Nový encyklopedický slovník češtiny

Všechna práva vyhrazena © Masarykova univerzita, Brno 2012–2018

Provozuje Centrum zpracování přirozeného jazyka