POSTOJOVÁ ANALÝZA  (sentiment analysis, opinion mining)

Základní

Automatická extrakce subjektivní informace z textu nebo z řeči. Cílem je detekce postojů a emočního naladění pisatele či mluvčího, využívaná např. při průzkumech veřejného mínění, získávání zpětné vazby od zákazníků, monitoringu sociálních sítí či v rámci predikce trendů v marketingu. Základní disciplínou p.a. je tzv. detekce subjektivity, tedy odlišení objektivního sdělení od subjektivně laděného textu. Subjektivně laděné texty mohou být např. hodnotící n. afektivní, tj. zachycující emoční stav autora při produkci textu. Nejčastěji řešenou úlohou v rámci p.a. je klasifikace polarity, tedy určení pozitivní n. negativní orientace hodnocení na úrovni věty, případně na úrovni delšího úseku textu. Hodnoticí konstrukce zahrnují tři participanty: zdroj hodnocení, hodnoticí výraz a cíl hodnocení. Struktura těchto prvků na syntaktické rovině velmi často odpovídá struktuře subjekt – predikát – objekt, sémanticky pak struktuře agens – predikát – patiens, např. Petr nesnáší Pavla. Hodnoticí výrazy bývají sdružovány do slovních hodnoticích výrazů (pro č. ✍Veselovská, 2013). Mezi nejčastější hodnoticí výrazy patří podstatná jména (např. hulvát), slovesa (např. nenávidět), adjektiva (např. špatný) a adverbia (např. dobře). Kromě explicitních výrazů se hodnocení často vyjadřuje evaluativními idiomy (např. Stojí to za houby) či nepřímo (Nemůžu žít bez četby!). Při klasifikaci polarity je nutno zohlednit také negaci, jejíž přítomnost orientaci hodnocení často obrací. Specifické úlohy v rámci p.a. představují např. automatická detekce zdroje a cíle hodnocení (✍Wiegand & Klakow, 2011; ✍Qiu & Liu, 2011), analýza konstrukcí s významem srovnání (✍Jindal & Liu, 2006) n. vztah polarity a struktury diskurzu (✍Somasundaran, 2010).

Mezi první práce věnované postojové analýze patří ✍Turney (2002)✍Pang & Lee (2002), zabývající se klasifikací polarity na materiálu uživatelských a filmových recenzí. Metody a vývoj disciplíny jsou podrobně popsány v ✍Pang & Lee (2008) a především v monografii ✍Liu (2012). Anotací subjektivních textů se zabývá zejména ✍Wiebe & Wilson (2004).

Mezi základní přístupy v p.a. patří detekce klíčových slov a jejich následné využití při určování polarity např. v rámci hlasování s prostou většinou. Klíčová slova lze vygenerovat na základě krátkého ručně připraveného seznamu obohaceného např. pomocí slovníku synonym (✍Kim & Hovy, 2004) n. pomocí korpusu (✍Hatzivassiloglou & McKeown, 1997), případně překladem již existujícího seznamu z jiného jazyka. Pro získání hodnoticích výrazů se dále využívají metody neřízeného učení i metody řízeného učení. V rámci řízeného učení se jako trénovací data často využívají internetová data anotovaná samotnými uživateli. Pro testování lze využít sekundární informaci např. v podobě ordinální škály. Hodnoticí výrazy jsou považovány za doménově závislé, je proto výhodné získávat je pro každou doménu zvlášť (✍Lee & Kim, 2009). Pro č. viz ✍Veselovská (2013).

Rozšiřující
Literatura
  • Hatzivassiloglou, V. & K. McKeown. Predicting the Semantic Orientation of Adjectives. In Proceedings of the Joint ACL/EACL Conference, 1997, 174–181.
  • Jindal, N. & B. Liu. Mining Comparative Sentences and Relations. American Association for Artificial Intelligence (AAAI) 22, 2006, 1331–1336.
  • Kim, S.-M. & E. Hovy. Determining the Sentiment of Opinions. In Proceedings of the 20th International Conference on Computational Linguistics, 2004, 1367–1373.
  • Lee, Y. & J. Kim. Extracting Domain-Dependent Semantic Orientations of Latent Variables for Sentiment Classification. In Wenjie, L. & D. Mollá-Aloid (eds.), Computer Processing of Oriental Languages. Language Technology for the Knowledge-based Economy, 2009, 201–212.
  • Liu, B. Sentiment Analysis and Opinion Mining. Synthesis Lectures on Human Language Technologies, 2012, 1–167.
  • Pang, B. & L. Lee ad. Thumbs up?: Sentiment Classification Using Machine Learning Techniques. In Proceedings of the ACL-02 Conference on Empirical Methods in Natural Language Processing, 2002, 79–86.
  • Pang, B. & L. Lee. Opinion Mining and Sentiment Analysis. Foundations and Trends in Information Retrieval, 2008, 1–135.
  • Qiu, G. & B. Liu ad. Opinion Word Expansion and Target Extraction through Double Propagation. Computational Linguistics 37, 2011, 9–27.
  • Somasundaran, S. Discourse-Level Relations for Opinion Analysis. PhD. diss., University of Pittsburgh, 2010.
  • Turney, P. D. Thumbs up or Thumbs down?: Semantic Orientation Applied to Unsupervised Classification of Reviews. In Proceedings of the 40th Annual Meeting on Association for Computational Linguistics, 2002, 417–424.
  • Veselovská, K. Czech Subjectivity Lexicon: A Lexical Resource for Czech Polarity Classification. In Gajdošová, K. & A. Žáková (eds.), Proceedings of SLOVKO, 2013, 279–284.
  • Wiebe, J. & T. Wilson ad. Learning Subjective Language. Computational Linguistics 30, 2004, 277–308.
  • Wiegand, M. & D. Klakow. The Role of Predicates in Opinion Holder Extraction. In Nakov, P. & Y. Kozareva ad. (eds.), Proceedings of RANLP-Workshop on Information Extraction and Knowledge Acquisition, 2011, 13–20.
Citace
Kateřina Veselovská (2017): POSTOJOVÁ ANALÝZA. In: Petr Karlík, Marek Nekula, Jana Pleskalová (eds.), CzechEncy - Nový encyklopedický slovník češtiny.
URL: https://www.czechency.org/slovnik/POSTOJOVÁ ANALÝZA (poslední přístup: 16. 4. 2024)

CzechEncy – Nový encyklopedický slovník češtiny

Všechna práva vyhrazena © Masarykova univerzita, Brno 2012–2020

Provozuje Centrum zpracování přirozeného jazyka