Nová automatická morfologická analýza češtiny

Varování

Publikace nespadá pod Pedagogickou fakultu, ale pod Filozofickou fakultu. Oficiální stránka publikace je na webu muni.cz.
Autoři

OSOLSOBĚ Klára HLAVÁČOVÁ Jaroslava PETKEVIČ Vladimír ŠIMANDL Josef SVÁŠEK Martin

Rok publikování 2017
Druh Článek v odborném periodiku
Časopis / Zdroj Naše řeč
Fakulta / Pracoviště MU

Filozofická fakulta

Citace
www http://nase-rec.ujc.cas.cz/archiv.php?art=8465
Obor Jazykověda
Klíčová slova automatic morphological analysis; lemmatisation; natural language processing; part-of-speech tagging; tagset
Popis Cílem příspěvku je představit projekt inovace popisu české morfologie pro nástroje automatické morfologické analýzy, zejména změny v pojetí tagsetu. Více než dvacet let je automatická morfologická analýza součástí mnoha nástrojů počítačového zpracování přirozeného jazyka (natural language processing, NLP). Její výsledky užívá lingvistická veřejnost zejména při práci s velkými jazykovými korpusy. Od roku 2012 běží grantový projekt, v jehož rámci se připravují inovace automatické morfologické analýzy češtiny. Ty jsou zaměřeny především na odstranění nedostatků, s nimiž se dosavadní praxe potýká, a zhodnocují zkušenosti, které bylo možné získat pouze na základě praxe.
Související projekty:

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.