TEST CHÍ KVADRÁT  (χ2 test, test k určení signifikance)

Základní
Rozšiřující

Test užívaný k určení statistické významnosti kvantitativního rozdílu v datech. V ↗korpusové lingvistice se používá zejména pro porovnání ↗frekvencí jednotky ve dvou textech n. korpusech. Principem χ2t. je porovnání frekvence jednotky naměřené v jednom korpusu (observed) s hodnotou očekávanou na základě pravděpodobnosti zjištěné v druhém korpusu (expected). Takovéto porovnání je v základu identifikace ↗klíčových slov. Pokud je rozdíl těchto hodnot velký, je značná pravděpodobnost, že zkoumaný rozdíl není náhodný a vyjadřuje skutečnou odlišnost mezi daty. χ2t. se ukazuje jako nespolehlivý v případě, že zkoumané jednotky nabývají malých frekvencí (menší než 5); z toho důvodu se užívá analogických testů log‑likelihood n. Fischerova exaktního testu. χ2t. přitom neslouží k určení míry odlišnosti (effect size), měří pouze, zda je k dispozici dostatek dat, abychom významnost rozdílu mohli konstatovat s určitou mírou jistoty. V případě, že poměřované hodnoty jsou velmi vysoké (např. v řádu desetitisíců), vycházejí testy téměř vždy jako statisticky signifikantní, ačkoli relativní rozdíl mezi hodnotami není lingvisticky relevantní, uchopitelný n. interpretovatelný.

Literatura
  • Baker, P. & A. Hardie ad. A Glossary of Corpus Linguistics, 2006.
  • Cvrček, V. & V. Kodýtek. Ke klasifikaci morfologických variant. SaS 74, 2013, 139–145.
  • Čermák, F. (ed.) Slovník Karla Čapka, 2007.
  • Gries, S. T. Null-Hypothesis Significance Testing of Word Frequencies: A Follow-up on Kilgarriff. Corpus Linguistics and Linguistic Theory 1, 2005, 277–294.
  • Kilgariff, A. Language is Never, Ever, Ever, Random. Corpus Linguistics and Linguistic Theory 1–2, 2005, 263–275.
  • Oakes, M. P. Statistics for Corpus Linguistics, 1998.
Citace
Václav Cvrček (2017): TEST CHÍ KVADRÁT. In: Petr Karlík, Marek Nekula, Jana Pleskalová (eds.), CzechEncy - Nový encyklopedický slovník češtiny.
URL: https://www.czechency.org/slovnik/TEST CHÍ KVADRÁT (poslední přístup: 15. 4. 2021)

Další pojmy:

korpusová lingvistika

CzechEncy – Nový encyklopedický slovník češtiny

Všechna práva vyhrazena © Masarykova univerzita, Brno 2012–2020

Provozuje Centrum zpracování přirozeného jazyka