Jazyková výzkumná infrastruktura v České republice

lindat-logoLINDAT/CLARIN – webové stránky

Hostitelská instituce: Univerzita Karlova

Partnerské instituce:


LINDAT/CLARIN představuje český národní uzel panevropské výzkumné infrastruktury CLARIN (Common Language Resources and Technology Infrastructure) založené roku 2012 a sdružující 14 zemí. Účelem LINDAT/CLARIN je zprostředkování otevřeného přístupu k jazykovým datům a technologiím, zejména pro humanitní a společenské obory (jazykověda a související interdisciplinární výzkum, např. formální a počítačová lingvistika, translatologie, lexikografie, psychologie, sociologie, historie, neurolingvistika, kognitivní vědy nebo umělá inteligence). LINDAT/CLARIN je rovněž kompatibilní s jazykovou technologickou sítí META-SHARE, která je zaměřená na jazykové technologie a jejich aplikace, čímž tyto dvě oblasti propojuje. LINDAT/CLARIN shromažďuje, zpracovává, anotuje (manuálně i automaticky), veřejně poskytuje a uchovává jazyková data související s českým jazykovým prostředím, a to i z historického hlediska. Tato data jsou nezbytná pro výzkum a vývoj jazykových technologií založených na statistických metodách (zpracování přirozeného jazyka, rozpoznávání a syntéza řeči a kombinovaná analýza obrazu, textu a multimédií). Umožňuje dále všem výzkumným pracovníkům jejich data ukládat pro dlouhodobé uchování, přístup k nim, snadnou citaci a přenos metadat do panevropské výzkumné infrastruktury CLARIN. LINDAT/CLARIN spolupracuje s výzkumnými infrastrukturami CNC a CESNET a s dalšími českými a panevropskými výzkumnými infrastrukturami, jakými jsou DARIAH (Digital Research Infrastructure for the Arts and Humanities), EHRI (European Holocaust Research Infrastructure), ELRA (European Language Resources Association), EUDAT (European Collaborative Data Infrastructure) a LDC (Linguistic Data Consortium).

Budoucí rozvoj

LINDAT/CLARIN je v provozu od roku 2014 a má certifikaci v nejvyšší třídě (CLARIN centrum typu B, A a K). Údržba a rozvoj repozitáře je i nadále zásadní pro kontinuální uchovávání dat. Podstatný rozvoj se předpokládá v oblasti webových služeb a aplikací založených na potřebách uživatelské výzkumné komunity. LINDAT/CLARIN bude dále rozšiřovat svou spolupráci s ostatními národními uzly panevropské výzkumné infrastruktury CLARIN a také s ostatními panevropskými výzkumnými infrastrukturami provozovanými v oblastech humanitních a společenských věd (DARIAH, EHRI, EUDAT a další).

Socioekonomické přínosy

Jazykové technologie prostupují všemi oblastmi evropské ekonomiky vzhledem k jejímu mnohojazyčnému prostředí. Jazyková data a služby zajišťované LINDAT/CLARIN jsou základem, bez kterého by tyto technologie nebylo možné vyvíjet. V humanitních a společenskovědních oborech je jazyk základním prostředkem výměny informací a jejich záznamu. Analýza textů a multimediálních dat pomocí jazykových technologií přispívá k širším možnostem výzkumu nezbytného k zachování národního dědictví a kulturní identity. Otevřený charakter dat a služeb je zárukou širokého využití v navazujícím výzkumu i ve vzdělávání na všech jeho stupních na vysokých školách i v Akademii věd ČR. LINDAT/CLARIN se současně podílí na nezbytných změnách v oblasti evropského právního systému pro snazší využívání jazykových dat ve výzkumu i v aplikacích. Zajišťuje rovněž služby veřejnosti v oblasti jazykové korektnosti (pravopis, gramatika, slovníky).