Współczesny warsztat językoznawcy -elektroniczne zasoby i narzędzia badawcze 1 )S ł o w a k l u c z o w e: digitalizacja, komputeryzacja, słownik, korpus tekstów, zasoby cyfrowe.
WprowadzenieJęzykoznawstwo przełomu XX i XXI wieku stanęło przed możliwością wykorzystania nowych narzędzi i propozycji badawczych, stanowiących konsekwencję zmian w sposobie gromadzenia i przesyłania informacji. Nowe technologie pozwoliły m.in. na digitalizację i archiwizację danych dostępnych dotychczas tylko w formie druków czy rękopisów, a funkcjonujący w Polsce od lat dziewięćdziesiątych Internet dał możliwość ich upowszechniania. Stworzone w ten sposób bazy danych językowych pozwalają nie tylko na łatwy i szybki dostęp do informacji, ale również dzięki znakowaniu 2 ) tak powstałej bazy umożliwiają jej przeszukiwanie za pomocą zaawansowanych narzędzi komputerowych. Ze względu na liczbę, różnorodność i stały przyrost dostępnych już elektronicznie zasobów niezwykle przydatnych w pracy badaczom polszczyzny dawnej i współczesnej po raz kolejny 3 ) pojawiła się potrzeba zebrania i omówienia zbiorów cyfrowych.Celem artykułu jest więc, po pierwsze, zdanie sprawy z tego, jakie materiały -leksykograficzne, naukowe, dawne teksty literackie czy korpusy językowe -są obecnie dostępne elektronicznie, a w konsekwencji umożliwienie badaczom zorientowania się w nieustannie rosnącym zbiorze zasobów cyfrowych. Ze względu na wielką różnorodność dostępnych elektronicznie materiałów opis ten sprowadza się do prezentacji wybranych tekstów zabytków 1 ) W powstanie artykułu autorki wniosły po 50 procent wkładu każda, wspólnie zbierając i opracowując materiał. Informacje i adresy internetowe podane w tym artykule odzwierciedlają stan z 31 października 2014 r.2 ) Poza terminem znakowanie oznaczającym wzbogacenie tekstów przetworzonych elektronicznie o różnego rodzaju informacje, w tym lingwistyczne, stosuje się także takie pojęcia, jak: anotacja, adnotacja, tagowanie, indeksowanie. Nie zawsze terminy te są używane wymiennie (zob. Bański 2003; Przepiórkowski i in. 2003). Wyróżnia się m.in. następujące poziomy znakowania: segmentacja tekstu na zdania i słowa, znakowanie morfosyntaktyczne i składniowe (zob. Lewandowska-Tomaszczyk (red.) 2005: 61-74; Przepiórkowski i in. (red.) 2012: 49-193).