
Počítačový program provádějící morfologickou ↗disambiguaci textu, která je součástí ↗anotace textu (obvykle v ↗korpusu). K dispozici je: (a) stochastický tagger (statistický), který provádí disambiguaci na základě ↗strojového učení (✍Hajič & Hladká, 1997; ✍Hajič & Hladká, 1998; ✍Brants, 2000; ✍Votrubec, 2005), n. (b) tagger založený na lingvistických pravidlech, která buď vytváří lingvista (✍Karlsson & Voutilainen ad. (eds.), 1995; ✍Tapanainen & Voutilainen, 1994; ✍Oliva & Hnátková ad., 2000; ✍Květoň, 2006; ✍Petkevič, 2006), n. se automaticky vyvozují z textů (✍Brill, 1992), n. (c) hybridní tagger, který spojuje výhody přístupů (a) a (b) (✍Hajič & Krbec ad., 2001; ✍Jelínek & Petkevič, 2011). Na výsledky činnosti t. obvykle navazuje program na syntaktickou analýzu textu, ↗parser. Někdy je t. součástí parseru.

  • Brants, T. TnT – A Statistical Part-of-Speech Tagger. In Nirenburg, S. (ed.), Proceedings of the Sixth Applied Natural Language Processing Conference ANLP-2000, 2000, 224–231.
  • Brill, E. A Simple Rule-Based Part-of-Speech Tagger. In Bates, M. & O. Stock (eds.), Proceedings of the Third Conference on Applied Natural Language Processing, 1992, 152–155.
  • Hajič, J. & B. Hladká. Morfologické značkování korpusu českých textů stochastickou metodou. SaS 4, 1997, 288–304.
  • Hajič, J. & B. Hladká. Tagging Inflective Languages: Prediction of Morphological Categories for a Rich, Structured Tagset. In COLING-ACL '98. Proceedings of the 36th Annual Meeting of the Association for Computational Linguistics and 17th International Conference on Computational Linguistics, vol. I, 1998, 483–490.
  • Hajič, J. & P. Krbec ad. Combination of Rules and Statistics: A Case Study in Czech Tagging. In Proceedings of the 39th Annual Meeting of the Association for Computational Linguistics (ACL 2001), 2001, 260–267.
  • Jelínek, T. & V. Petkevič. Systém jazykového značkování současné psané češtiny. In Petkevič, V. & A. Rosen (eds.), Korpusová lingvistika Praha 2011 3. Gramatika a značkování korpusů, 2011, 154–170.
  • Karlsson, F. & A. Voutilainen ad. (eds.) Constraint Grammar. A Language-Independent System for Parsing Unrestricted Text, 1995.
  • Květoň, P. Rule-Based Morphological Disambiguation (Towards a Combination of Linguistic and Stochastic Methods). PhD. diss., MFF UK, Praha, 2006.
  • Oliva, K. & M. Hnátková ad. The Linguistic Basis of a Rule-Based Tagger of Czech. In Sojka, P. & I. Kopeček ad. (eds.), Proceedings of the Text, Speech and Dialogue conference TSD 2000, 2000, 3–8.
  • Oliva, K. & P. Květoň. (Semi-)Automatic Detection of Errors in PoS-Tagged Corpora. In Shu Chuan Tseng (ed.), Proceedings of the 19th International Conference on Computational Linguistics (COLING 2002, Taipei), 2002, 509–515.
  • Petkevič, V. Reliable Morphological Disambiguation of Czech: Rule-Based Approach is Necessary. In Šimková, M. (ed.), Insight into the Slovak and Czech Corpus Linguistics, 2006, 26–44.
  • Samuelsson, Ch. & A. Voutilainen. Comparing a Linguistic and a Stochastic Tagger. In Proceedings of 35th Annual Meeting of the Association for Computational Linguistics and 8th Conference of the European Chapter of the Association for Computational Linguistics, 1997, 246–253.
  • Tapanainen, P. & A. Voutilainen. Tagging Accurately – Don’t Guess if You Know. Technical Report, Xerox Corp., 1994.
  • Votrubec, J. Návrh vhodné sady rysů pro morfologické značkování češtiny. Mgr. dipl., MFF UK, Praha, 2005.
Vladimír Petkevič (2017): TAGGER. In: Petr Karlík, Marek Nekula, Jana Pleskalová (eds.), CzechEncy - Nový encyklopedický slovník češtiny.
URL: https://www.czechency.org/slovnik/TAGGER (poslední přístup: 27. 7. 2024)

Další pojmy:

korpusová lingvistika

CzechEncy – Nový encyklopedický slovník češtiny

Všechna práva vyhrazena © Masarykova univerzita, Brno 2012–2020

Provozuje Centrum zpracování přirozeného jazyka