Prague Dependency Treebank Annotation Errors: A Preliminary Analysis

Varování

Publikace nespadá pod Pedagogickou fakultu, ale pod Fakultu informatiky. Oficiální stránka publikace je na webu muni.cz.
Název česky Pražský závislostní stromový korpus: předběžná analýza
Autoři

KOVÁŘ Vojtěch JAKUBÍČEK Miloš

Rok publikování 2009
Druh Článek ve sborníku
Konference RASLAN 2009 : Recent Advances in Slavonic Natural Language Processing
Fakulta / Pracoviště MU

Fakulta informatiky

Citace
www http://nlp.fi.muni.cz/raslan/2009/
Obor Informatika
Klíčová slova error in text; annotation; Prague Dependency Treebank; PDT
Popis Tento článek prezentuje základní analýzu chyb a nekonsistencí v syntaktické anotaci Pražského závislostního stromové korpusu (Prague Dependency Treebank, PDT), největšího českého ručně anotovaného korpusu tohoto druhu. Tento korpus je využíván pro vývoj a vyhodnocení mnoha syntaktických analyzátorů pro češtinu a problémy v anotaci mají zásadní dopad na vyhodnocení kvality a přesnosti těchto analyzátorů. V článku identifikujeme základní anotační problémy a v některých případech nastiňujeme jejich možná řešení.
Související projekty:

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.