Synonymní / variantní tvary verbálního substantiva jako problém konzistentní lemmatizace
Autoři | |
---|---|
Rok publikování | 2022 |
Druh | Další prezentace na konferencích |
Fakulta / Pracoviště MU | |
Citace | |
Popis | Jako východisko pro náš příspěvek z oblasti počítačového zpracování přirozeného jazyka, konkrétně automatické morfologické analýzy, jsme zvolili dva koncepty, které byly propracovány v rámci projektu Novamorf. První z nich představuje koncept vícenásobného lemmatu a druhý vyjadřuje tzv. zlaté pravidlo morfologie, tedy požadavek na systematické zpracování variant, aby se každá varianta lišila dvojicí lemma + tag. Tyto dva požadavky vedou k systematickému korpusovému studiu variací v české morfologii. Cílem našeho příspěvku je podat ucelený obraz o důsledné lemmatizaci slovesných podstatných jmen zakončených na -ní/-tí, a to zejména v těch případech, kdy lze dějové jméno vytvořit od dvou podob kmene minulého, jako například nařčení/nařknutí, vysání/vysátí, zmražení/zmrazení ad. Popis tvarosloví verbálních substantiv v synchronní podobě prezentovaný morfologickou anotací korpusů řady SYN (nejnověji SYN v10) vykazuje nekonzistentní řešení v případě, že verbální substantivum má variantní tvary. Zaměříme se tudíž na interpretace tvarů vebálních substantiv od variant jednoho slovesného kmene, které lze interpretovat jako tvary synonymní / variantní. Také se budeme snažit zaznamenat nedostatky pokrytí morfologického slovníku MorfFlex. |
Související projekty: |