HOMONYMIE MEZI OIKONYMY A ANTROPONYMY ZAKONČENÝMI NA -SLAV/-SLAVA JAKO PROBLÉM AUTOMATICKÉ MORFOLOGICKÉ ANALÝZY
Autoři | |
---|---|
Rok publikování | 2020 |
Druh | Článek v odborném periodiku |
Časopis / Zdroj | Acta onomastica |
Fakulta / Pracoviště MU | |
Citace | |
www | |
Klíčová slova | anthroponym; oikonym; ending in -slav/-slava; corpus; tagging; disambiguation |
Popis | Homonymie na všech úrovních, která je charakteristickým rysem všech přirozených jazyků, je také jedna z nejvýznamnějších překážek automatického zpracování přirozeného jazyka. V tomto příspěvku poukážeme na morfosyntaktické rozdíly českých antroponym zakončených na -slav (typu Miroslav, mužský rodu) a českých oikonym se stejnou koncovkou (typ Miroslav, ženský rod) a českých antroponym zakončených na -slava (ženský rod typu Miroslava, protože jeho tvary jsou homonymní s oběma: mužskými antroponymy i ženskými oikonymy). Analýza dat z korpusu Syn v8 ukazuje, že slovní forma homonymie významně ovlivňuje výsledky automatické morfologické analýzy. Dokumentujeme chyby v pokrytí morfologického slovníku a především chyby v morfologickém značkování a navrhujeme řešení, jak částečně zlepšit desambiguaci daného typu vlastních podstatných jmen. |
Související projekty: |