Informace o projektu
Projekt LINDAT-Clarin - Vybudování a provoz českého uzlu pan-evropské infrastruktury pro výzkum
(LINDAT-Clarin)
- Kód projektu
- LM2015071
- Období řešení
- 1/2016 - 12/2019
- Investor / Programový rámec / typ projektu
-
Ministerstvo školství, mládeže a tělovýchovy ČR
- Velké infrastruktury pro výzkum, vývoj a inovace
- Fakulta / Pracoviště MU
- Fakulta informatiky
- Spolupracující organizace
-
Akademie věd České republiky
Univerzita Karlova
- Odpovědná osoba prof. RNDr. Jan Hajič, Dr.
Projekt LINDAT-Clarin je koncipován jako český „uzel“ mezinárodní sítě Clarin (Common Language Resources and Technology Infrastructure. Centrum LINDAT-Clarin bude tedy v českém jazykovém prostředí zaměřeno na sběr jazykových dat a především jejich anotaci (tj. formální manuální, poloautomatickou a automatickou jazykovou analýzu). Sběr a anotace budou probíhat v takovém rozsahu, kvalitě a technologické přípravě (specifikace, schémata, formáty), která bude přímo využitelná jak v humanitní oblasti (jazykovědný a mezioborový výzkum, kde přirozený jazyk hraje podstatnou roli), tak i pro výzkum a vývoj v oblasti jazykových technologií za použití moderních statistických a hybridních metod.
Náplň práce centra a jeho výsledky se dotýkají řady oborů – v humanitních vědách to jsou jazykověda obecná a pro jazykověda zabývající se konkrétními jazyky, zejména češtinou, dále překladatelství, lexikografie, sociolingvistika, částečně i obory příbuzné (psychologie, sociologie, knihovnictví, neurovědy, cognitive science) s významným přesahem do informatiky (computer science, computational linguistics), matematiky (statistika a pravděpodobnost), a elektrotechniky (zpracování akustického signálu).
Publikace
Počet publikací: 39
2016
-
English-French Document Alignment Based on Keywords and Statistical Translation
Proceedings of the First Conference on Machine Translation, Volume 2: Shared Task Papers, rok: 2016
-
European Union Language Resources in Sketch Engine
Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC 2016), rok: 2016
-
Graded and Word-Sense-Disambiguation Decisions in Corpus Pattern Analysis: a Pilot Study
Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC 2016), rok: 2016
-
How to Present NLP Topics to Children?
RASLAN 2016 Recent Advances in Slavonic Natural Language Processing, rok: 2016
-
Lexicographic Tools to Build New Encyclopaedia of the Czech Language
The Prague Bulletin of Mathematical Linguistics, rok: 2016, ročník: 2016, vydání: 106, DOI
-
Options for Automatic Creation of Dictionary Definitions from Corpora
Tenth Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2016, rok: 2016
-
RuSkELL: Online Language Learning Tool for Russian Language
Proceedings of the XVII EURALEX International congress, rok: 2016
-
VPS-GradeUp: Graded Decisions on Usage Patterns
Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC 2016), rok: 2016
-
What Do Graded Decisions Tell Us about Verb Uses
Proceedings of the XVII EURALEX International congress, rok: 2016