[zaloguj się]

Korpus polszczyzny XVI wieku

TEIOd 2012 roku w ramach projektu Narodowego Programu Rozwoju Humanistyki nr 0138/FNiTP/H11/80/2011 trwają prace nad utworzeniem elektronicznego korpusu tekstów polszczyzny XVI wieku, opracowanego zgodnie ze specyfikacją TEI (Text Encoding Initiative) w wersji P5. Projekt obejmuje pierwszy etap prac – dygitalizację tekstów wchodzących w skład tzw. kanonu Słownika polszczyzny XVI wieku (wymienianych w każdym tomie Słownika w Skorowidzu skrótów źródłowych I) oraz testowe znakowanie części z nich.

Obecnie wszystkie teksty kanonu są dygitalizowane. Założeniem jest udostępnienie ich w postaci transliterowanej, zachowującej wszystkie cechy oryginału, zgodnie z założeniami przyjętymi dla materiału ilustracyjnego Słownika polszczyzny XVI wieku (patrz: Zasady redakcyjne słownikaSPXVI t. I, s. XL).

Efektem realizacji pierwszego etapu prac będzie najobszerniejsza w zasobach internetowych baza polskich transliterowanych tekstów szesnastowiecznych, która w kolejnych etapach zostanie przekształcona w korpus szesnastowiecznej polszczyzny.

Z założeniami i stanem prac (na listopad 2013) można zapoznać się w prezentacji: korpus_xvi.pdf