Current Challenges in Web Corpus Building

Logo poskytovatele

Varování

Publikace nespadá pod Pedagogickou fakultu, ale pod Fakultu informatiky. Oficiální stránka publikace je na webu muni.cz.
Autoři

JAKUBÍČEK Miloš KOVÁŘ Vojtěch RYCHLÝ Pavel SUCHOMEL Vít

Rok publikování 2020
Druh Článek ve sborníku
Konference Proceedings of the 12th Web as Corpus Workshop
Fakulta / Pracoviště MU

Fakulta informatiky

Citace
www článek ve sborníku
Klíčová slova Web corpora; corpus building
Popis In this paper we discuss some of the current challenges in web corpus building that we faced in the recent years when expanding the corpora in Sketch Engine. The purpose of the paper is to provide an overview and raise discussion on possible solutions, rather than bringing ready solutions to the readers. For every issue we try to assess its severity and briefly discuss possible mitigation options.
Související projekty:

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.