CNC

Název: Český národní korpus

Instituce: Univerzita Karlova

Koordinátor: Mgr. Michal Křen, Ph.D.; michal.kren@ff.cuni.cz

Webové stránky

CNC se zaměřuje na kontinuální mapování českého jazyka prostřednictvím budování a zpřístupňování rozsáhlých elektronických jazykových korpusů. CNC se jako jediný projekt svého druhu soustředí na širokospektrální a komplexní sběr dat od současné psané češtiny v různých jejích podobách a žánrech, přes češtinu mluvenou (s pokrytím celé ČR), až po češtinu starší a češtinu překladovou. Datové pokrytí CNC dosahuje rozsahu, pestrosti a vyváženosti složení, úrovně zpracování, spolehlivosti metadat a kvality lingvistické anotace srovnatelné s podobnými zdroji pro největší světové jazyky. Mimořádně důležitá je přitom kontinuita sběru dat, která umožňuje provádět longitudinální výzkum nejenom jazykového vývoje, ale také jazykového povědomí či témat veřejného diskurzu v jednotlivých obdobích. Jazykové korpusy CNC slouží jako výchozí výzkumný materiál pro širokou paletu badatelských záměrů hlavně v humanitních a společenských vědách (lingvistika, sociologie, překladatelství, historie, literární věda apod.), ale např. i v počítačovém zpracování přirozeného jazyka. CNC poskytuje uživatelský přístup ke korpusům především prostřednictvím specializovaných analytických nástrojů v podobě webových aplikací, které nabízejí uživatelsky přívětivou a přitom efektivní práci s jazykovými daty. Tyto aplikace jsou spolu s komplexní uživatelskou podporou (on-line poradna, dokumentace a báze znalostí z korpusové lingvistiky) soustředěny do výzkumného webového portálu CNC. Portál CNC pracuje v režimu otevřeného přístupu. Pro jeho plné využití postačuje bezplatná elektronická registrace, řada funkcí je ovšem dostupná i pro neregistrované uživatele. CNC spolupracuje zejména s evropskou výzkumnou infrastrukturou CLARIN ERIC (Common Language Resources and Technology Infrastructure) a jejím českým národním uzlem LINDAT/CLARIAH-CZ (Digitální výzkumná infrastruktura pro jazykové technologie, umění a humanitní vědy). CNC je asociovaným členem národního konsorcia CLARIN-CZ se statutem K-centra CLARIN a udržuje dále i řadu aktivních kontaktů se zahraničními výzkumnými institucemi podobného zaměření.