SEGMENTACE

Základní

V korpusové lingvistice členění textu nebo obvykle jeho větších částí (popř. celého korpusu) na menší úseky určitého typu či stejné povahy pro účely bližší analýzy, dnes zpravidla automatickými metodami. Nejběžnější je s. na věty n. slova (↗tokenizace), ↗větná segmentace; obecně se však s. textů provádí i na morfémy či grafémy. U ↗mluvených korpusů se s. rozumí vydělení smysluplných úseků v proudu mluvy, tedy mluveného korpusu. Termín s. se užívá i jinde, pro členění událostí, celků v proudu hovoru, pro vydělování mluvčích v dialogu (u konverzační analýzy) aj.

Rozšiřující
Literatura
Citace
František Čermák (2017): SEGMENTACE. In: Petr Karlík, Marek Nekula, Jana Pleskalová (eds.), CzechEncy - Nový encyklopedický slovník češtiny.
URL: https://www.czechency.org/slovnik/SEGMENTACE (poslední přístup: 12. 12. 2024)

Další pojmy:

korpusová lingvistika

CzechEncy – Nový encyklopedický slovník češtiny

Všechna práva vyhrazena © Masarykova univerzita, Brno 2012–2020

Provozuje Centrum zpracování přirozeného jazyka