HOMONYMIE MEZI OIKONYMY A ANTROPONYMY ZAKONČENÝMI NA -SLAV/-SLAVA JAKO PROBLÉM AUTOMATICKÉ MORFOLOGICKÉ ANALÝZY

Varování

Publikace nespadá pod Pedagogickou fakultu, ale pod Filozofickou fakultu. Oficiální stránka publikace je na webu muni.cz.
Autoři

OSOLSOBĚ Klára ŽIŽKOVÁ Hana

Rok publikování 2020
Druh Článek v odborném periodiku
Časopis / Zdroj Acta onomastica
Fakulta / Pracoviště MU

Filozofická fakulta

Citace
www
Klíčová slova anthroponym; oikonym; ending in -slav/-slava; corpus; tagging; disambiguation
Popis Homonymie na všech úrovních, která je charakteristickým rysem všech přirozených jazyků, je také jedna z nejvýznamnějších překážek automatického zpracování přirozeného jazyka. V tomto příspěvku poukážeme na morfosyntaktické rozdíly českých antroponym zakončených na -slav (typu Miroslav, mužský rodu) a českých oikonym se stejnou koncovkou (typ Miroslav, ženský rod) a českých antroponym zakončených na -slava (ženský rod typu Miroslava, protože jeho tvary jsou homonymní s oběma: mužskými antroponymy i ženskými oikonymy). Analýza dat z korpusu Syn v8 ukazuje, že slovní forma homonymie významně ovlivňuje výsledky automatické morfologické analýzy. Dokumentujeme chyby v pokrytí morfologického slovníku a především chyby v morfologickém značkování a navrhujeme řešení, jak částečně zlepšit desambiguaci daného typu vlastních podstatných jmen.
Související projekty:

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.