ANONYMIZACE

Základní

V korpusové lingvistice odstranění osobních údajů z korpusových dat. Týká se především korpusů mluveného jaz., ve kterých jsou osobní data ze zvukového záznamu odstraněna a v přepise jsou dohodnutým způsobem kódována. Jedná se zejména o příjmení, přezdívky, místní jména, adresy, telefonní čísla apod. Kódování v přepise může být buď formou číselného či písmenného kódu, n. zde může být použito „univerzální“ příjmení, místní jméno apod. Tento druhý způsob je výhodný pro následnou morfologickou analýzu, protože zachovává gramatické kategorie původního jména.

Rozšiřující
Literatura
Citace
Marie Kopřivová (2017): ANONYMIZACE. In: Petr Karlík, Marek Nekula, Jana Pleskalová (eds.), CzechEncy - Nový encyklopedický slovník češtiny.
URL: https://www.czechency.org/slovnik/ANONYMIZACE (poslední přístup: 25. 2. 2020)

Další pojmy:

korpusová lingvistika

CzechEncy – Nový encyklopedický slovník češtiny

Všechna práva vyhrazena © Masarykova univerzita, Brno 2012–2018

Provozuje Centrum zpracování přirozeného jazyka