Propria (příjmení na -č) - problém automatické morfologické analýzy
Autoři | |
---|---|
Rok publikování | 2008 |
Druh | Článek ve sborníku |
Konference | Jazyk a jeho proměny |
Fakulta / Pracoviště MU | |
Citace | |
Obor | Jazykověda |
Klíčová slova | corpus; proprium; family name; authomatical morphological analysis |
Popis | Ačkoliv se rozsáhlé jazykové korpusy od doby vzniku korpusové lingvistiky budují především pro potřeby lexikografie, mohou sloužit a slouží i pro bádání v řadě dalších lingvistických oborů. V tomto příspěvku jsme se snažili demonstrovat, jak mohou korpusy přispět při zpracování lingvistických podkladů použitelných v oblasti NLP. Na příkladu analýzy vlastních jmen (maskulin životných na č) jsme ukázali, na jaká úskalí mohou narazit pokusy vytvořit automatický modul derivace konkrétně českých deverbativ na -č. Výsledkem je rozsáhlý seznam možných případů přegenerovávání, kterých by se mohl automatický nástroj dopustit v případě, že by nepracoval dostatečně s rozdílem apelativum/proprium. |
Související projekty: |