Synonymní / variantní tvary verbálního substantiva jako problém konzistentní lemmatizace

Varování

Publikace nespadá pod Pedagogickou fakultu, ale pod Filozofickou fakultu. Oficiální stránka publikace je na webu muni.cz.
Autoři

OSOLSOBĚ Klára ŽIŽKOVÁ Hana

Rok publikování 2022
Druh Další prezentace na konferencích
Fakulta / Pracoviště MU

Filozofická fakulta

Citace
Popis Jako východisko pro náš příspěvek z oblasti počítačového zpracování přirozeného jazyka, konkrétně automatické morfologické analýzy, jsme zvolili dva koncepty, které byly propracovány v rámci projektu Novamorf. První z nich představuje koncept vícenásobného lemmatu a druhý vyjadřuje tzv. zlaté pravidlo morfologie, tedy požadavek na systematické zpracování variant, aby se každá varianta lišila dvojicí lemma + tag. Tyto dva požadavky vedou k systematickému korpusovému studiu variací v české morfologii. Cílem našeho příspěvku je podat ucelený obraz o důsledné lemmatizaci slovesných podstatných jmen zakončených na -ní/-tí, a to zejména v těch případech, kdy lze dějové jméno vytvořit od dvou podob kmene minulého, jako například nařčení/nařknutí, vysání/vysátí, zmražení/zmrazení ad. Popis tvarosloví verbálních substantiv v synchronní podobě prezentovaný morfologickou anotací korpusů řady SYN (nejnověji SYN v10) vykazuje nekonzistentní řešení v případě, že verbální substantivum má variantní tvary. Zaměříme se tudíž na interpretace tvarů vebálních substantiv od variant jednoho slovesného kmene, které lze interpretovat jako tvary synonymní / variantní. Také se budeme snažit zaznamenat nedostatky pokrytí morfologického slovníku MorfFlex.
Související projekty:

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.