Nová automatická morfologická analýza češtiny
Autoři | |
---|---|
Rok publikování | 2017 |
Druh | Článek v odborném periodiku |
Časopis / Zdroj | Naše řeč |
Fakulta / Pracoviště MU | |
Citace | |
www | http://nase-rec.ujc.cas.cz/archiv.php?art=8465 |
Obor | Jazykověda |
Klíčová slova | automatic morphological analysis; lemmatisation; natural language processing; part-of-speech tagging; tagset |
Popis | Cílem příspěvku je představit projekt inovace popisu české morfologie pro nástroje automatické morfologické analýzy, zejména změny v pojetí tagsetu. Více než dvacet let je automatická morfologická analýza součástí mnoha nástrojů počítačového zpracování přirozeného jazyka (natural language processing, NLP). Její výsledky užívá lingvistická veřejnost zejména při práci s velkými jazykovými korpusy. Od roku 2012 běží grantový projekt, v jehož rámci se připravují inovace automatické morfologické analýzy češtiny. Ty jsou zaměřeny především na odstranění nedostatků, s nimiž se dosavadní praxe potýká, a zhodnocují zkušenosti, které bylo možné získat pouze na základě praxe. |
Související projekty: |