A pergamen tartósabb, mint egy szövegfájl
Melyek a legjobb kulturális archívumok? Mi a gond a pdf, a jpg és a doc formátumban tárolt szövegekkel? Hogyan változtatta meg a digitalizáció az irodalmárok munkáját? Ki az a Német Máté koma? Többek között ezekről a kérdésekről beszélgettünk a Szegedi Tudományegyetem docensével, Labádi Gergellyel.
Labádi Gergely 2011-ben megkapta a Martinkó András-díjat egyik irodalomtörténeti tanulmányáért
(Fotó: Csörsz Rumen István, http://www.iti.mta.hu)
A Szegedi Tudományegyetem bölcsész karának docense vagy, a felvilágosodás korának magyar irodalmát kutatod és oktatod. Emellett szövegek digitalizálásával is foglalkozol, elméleti és gyakorlati szempontból is. Hogyan kapcsolódott össze pályádon a 18. századi dohos könyvek, kéziratok felkutatása és a modern programnyelv megismerése, használata, oktatása?
A rövid válasz viszonylag egyszerű: én sem a 18. században élek.
És a hosszabb?
Valahogy úgy működtek régebben a humántudományok, hogy bement az ember a könyvtárba, levéltárba, majd tíz év után előjött a monográfiával, a szövegkiadással a kezében. A mai világ máshogy működik, az információs társadalomban megváltozott a tudás formáihoz, intézményeihez, előállításához fűződő viszonyunk. Az ebből fakadó kihívások a humántudományok számára nagyjából a következők, amennyire én látom: előtérbe kerül a csoportmunka kérdése. Azaz ma már nem elegendő, ha egyetlen elkötelezett kutató bemegy a könyvtárba, hanem a közös munka válik fontossá. Például azért, mert a források eleve nem egy-két archívumban vannak. Azaz eltérő felkészültségű és irányultságú, különböző kulturális hagyományokból érkező, nem is egy helyen és nem is feltétlenül ugyanabban az időben dolgozó résztvevők működnek együtt.
A digitális adatbázisokba szervezett adatok egész egyszerűen új dimenziókat nyitnak meg, újfajta kérdések megfogalmazására nyílik lehetőség, amelyek kifejtésére nem is biztos, hogy a könyv- vagy cikkforma a megfelelő. Egy radikálisan fogalmazó tanulmány (persze ez tanulmány) azt mondja, amiből cikket lehet írni, azt kódolni is lehet az értelmezendő szövegbe.
Maga a szöveg fogalma is változik. A számítógép-használat rákényszerít bennünket arra, hogy elgondoljuk, végső soron mi tesz egy szöveget szöveggé, mit kell, mit lehet és mit (lenne) érdemes megőrizni a közegváltással.
Ha már említetted a hozzáférhetőséget: irodalmárként mely adatbázisokat, archívumokat tartod a legjobbnak, leghasználhatóbbnak?
Nyilván attól függ, mire van szüksége az embernek. Vannak olyan projektek, amelyek nemcsak hozzáférhetővé teszik a szövegeket (vagy más objektumokat), hanem elemezni, értelmezni is megpróbálják őket, illetve felkínálják, hogy a felhasználó maga is hozzon létre ilyet. Például ilyen izgalmas vállalkozás az egyik korai digitalizációs kísérlet, ami a mai napig működik, a WomenWriters Project. Egy korábbi fázisban, jó néhány éve szabadon lehetett benne böngészni, ma már korlátozott a külső hozzáférés. De a projekt különböző irányai jól mutatják, mire lehet használni az új technológiákat. A kísérleti laboratórium az értelmezések újfajta megjelenítésén gondolkodik, a kiállítások saját ösvényeket hoznak létre a hatalmas anyagban, de ehhez kapcsolódóan a köz- és felsőoktatásban felhasználható anyagokat is szolgáltatnak. Hasonlóan fontos például a 19. századra koncentráló NINES is.
Ezek elméleti hátterének és megvalósíthatóságának kutatása is izgalmas kérdés, aminek persze hatalmas a szakirodalma. Aztán vannak olyan projektek, amelyek elsősorban a szövegek hozzáférhetőségére helyezik a hangsúlyt: ilyenek a müncheni (http://www.digitale-sammlungen.de/index.html) vagy a göttingeni könyvtár digitalizációs projektjei (http://gdz.sub.uni-goettingen.de/gdz/). De mindannyian használjuk a GoogleBooks-ot, az is jó.
Milyenek ehhez képest a magyar adatbázisok, archívumok?
Ami van, jó, hogy van. Még több még jobb volna. Ami igazán hiányzik, hogy könnyen megtalálhatók legyenek, illetve a felhasználóbarát kivitelezés. Jelentős a Digitális Irodalmi Akadémia, amely fontos szerzőktől egyenletes minőségben közöl szöveget. Nagyon sok írást digitalizál az Arcanum, például a múzeumi adatbázisai rengeteg szöveget és egyéb objektumot tesznek hozzáférhetővé. De az Országos Széchényi Könyvtár különböző digitális szolgáltatásai is hasznosak.
De, mint mondtam, a még több még jobb volna. Például ha nemcsak a szöveg állna rendelkezésünkre, de mondjuk a hozzákapcsolódó értelmezéseket is könnyen elérnénk, vagy akár magunk hozhatnánk létre. A digitális szöveg ugyanis rengeteg meta-, saját magára vonatkozó adatot tartalmazhatna, ami lehetőséget nyújtana arra, hogy ne csak betűsorokra keressünk és találjunk, hanem értelmes/értelmezett adatokat is. Valami ilyesmi volna a szemantikus web.
A másik fontos kérdés az archiválás „nyelve”. Amikor legutoljára egy szemináriumra tévedtem hozzád, a TEI-vel foglalkoztál. Mi az a TEI, és miért fontos az irodalmi szövegek jövőjét tekintve?
Amit egy ember kulturális ismeretei és tapasztalatai nyomán szövegként azonosít, sokféle digitális formátumot ölthet. Lehet például képpontokból álló (befotózott könyv), vagy lehet a képernyő síkjában különböző módon elrendezett, dobozokba pakolt adat (pdf fájl). Mi ezeket is képesek vagyunk szövegként értelmezni, de nem tudnánk a szövegre vonatkozó kérdéseket feltenni velük kapcsolatban. A számítógép nem találja meg nekünk egy jpg képfájlban a vers címét. Ezeket az információkat tehát rögzíteni kell, erre valók a jelölőnyelvek. Például ezzel a megoldással:<verscim>A vers címe</verscim>. Ezután már lehet keresni, mert a keresőkérdés úgy hangzik, hogy találja meg a <verscim></verscim> címke közötti információt. A TEI ilyen, a humántudományokban elfogadott, lényegében szabványként működő jelölőnyelv. Pontosabban a Text Encoding Initiative egy nonprofit szervezet (www.tei-c.org), amely egy ilyen jelölőnyelvet ajánl a szövegkódolási projektek számára. Az irányelv modulokba szervezi ezeket a címkéket. Vannak olyan elemek, amelyek a szövegre vonatkozó információk jelölését szolgálják (szerző, cím, keletkezési idő stb.). Vannak olyanok, amelyek a főbb szövegtípusok tipikus elemeit tartalmazzák (versszakok, bekezdések stb.). Vannak olyanok, amelyek metaszövegtípusokat írnak le, mint például a kritikai kiadások apparátusáét. Végül pedig vannak olyanok, amelyek a szöveg aspektusainak (nevek, helyek) megjelölését támogatják. Kódolásunk tehát nemcsak a látható szerkezeti struktúrákat jelölheti (fejezet, címsor, bekezdés stb.), hanem a szöveghez fűződő elemzéseket és értelmezéseket is. Az említett angolszász digitalizációs projektek ezt használják, ahogy minden külföldi projekt. Tehát a megjelenítés, a vizualizációs kísérletek a szövegkódolás során rögzített adatokon alapulnak. Magyarországon is vannak TEI alapú digitalizált kiadványok, például rögtön a MEK xml-formátumú tételei, de foglalkozik ezzel egy textológiai kutatócsoport is.
Előadás közben Nagyváradon a Partiumi Keresztény Egyetemen
(Fotó: pkemagyarszak.wordpress.com)
Tegyük fel, hogy szépen archiválunk minden fontos irodalmi szöveget a legismertebb formátumokban (rft, doc, docx, pdf, jpg stb.). Mennyire tartósak ezek? Mennyi időt jósolsz a digitalizált szövegeknek? Tartósabbak, mint a pergamen?
Nem, nem tartósabbak. Az említett formátumok alkalmatlanok a tárolásra, arra a TEI-vel kódolt szöveg jó, mivel ez csak olyan információt tartalmaz, amelynek értelmezéséhez nem kell speciális program, ez csak egy egyszerű szövegfájl. Az, hogy abból milyen más formátumot készítünk, mindig az aktuális eszköztől függ. A digitalizáció során sokáig képernyőben gondolkodtunk, pedig ma már egyre kevésbé ez a jellemző. Fontosabb, hogy a különböző hordozható eszközöknek különböző a képernyőmérete, illetve maga a hardver tulajdonságai is eltérők. Mást lehet megjeleníteni egy 4"-es mobiltelefonon, mást egy 6"-es e-inkes e-könyvolvasón és mást egy 10"-es tableten. Nekem személy szerint fogalmam sincs, tíz év múlva milyen digitális kütyüink lesznek.
Akkor ezek szerint az e-könyvvel is szkeptikus vagy?
Attól függ, mit értesz szkepticizmuson.
Azt, hogy a nyomtatott könyvet ezek szerint semmi sem helyettesíti. Tehát a technikai kockázatok miatt mégis jobb megvenni nyomtatva azt a művet, ami fontos. Mert talán már 20-30 év múlva nem tudjuk újraolvasni kedvenc e-könyvünket...
Ez a probléma akkor áll fenn, ha nem tudom a mostani e-formátumomat átkonvertálni egy másikba. Hiszen valamilyen eszköz biztos lesz, amelyen a szöveg megjeleníthető. Az viszont kérdés, hogy a nyomtatott könyv nem szövegbeli jelentéseit (tipográfia, méret, illusztrációk) hogyan lehet egy e-eszközre konvertálni. Illetve hogyan változik az értelmezésünk, ha egy nyomtatott ötszázoldalas könyvtárgy van a kezünkben, vagy ha ugyanezt (ti. betű szerint ugyanezt) az ötszáz oldalt egy pengevékony e-olvasón olvassuk végig.
Legutóbb a Német Máté koma című 1792-es regényt rendeztétek sajtó alá Balázs Péterrel a már korábban is említett csapatmunka és a klasszikus nyomtatott kiadás szellemében. A cselekmény rövid összefoglalása itt olvasható, a könyv is innen rendelhető. A regény ismertetőjében hangsúlyos szerepet kap a „keresztény erkölcsiség leleplezése”. Ennek elég erős az aktuálpolitikai áthallása. Ezen kívül még mi teszi aktuálissá a regényt a jelen olvasójának?
Amennyiben aktuálpolitikai áthallásokat keresünk, fontos észrevennünk, hogy a felvilágosult ész világa sem jár jobban ebben a regényvilágban, a szöveg végtelenül szkeptikus az európai kultúra lehetőségeit illetően. Valójában ez egy nagyon kiábrándult szöveg. A lényeg azonban, hogyha relevánsnak találjuk a kérdést, az azt jelzi, a 18. század talán nem minden értelemben van tőlünk messze. Ma (is) elég sokan gondolkodnak a nyugati kultúra és a felvilágosodás kapcsolatán, hiszen a modernitás valahonnan innen eredeztethető. A regény lehetőséget ad számunkra, hogy elgondolkodjunk alapfogalmainkon. Persze nem feltétlenül a „mondanivaló” a lényeg, mint történet sem rossz, a pikareszk regények általában elég szórakoztatók szoktak lenni, ugyanakkor szövegként is érdekes, mivel az elbeszélő állandóan utal olvasói elvárásaira, hogy aztán állandóan lerombolja ezeket.
Tehát főleg a szakmát céloztátok meg. Pedig a déltengeri szigeten zajló, a hajótörött pap és a bennszülött egzotikus története talán a szélesebb olvasóközönséget is megérinthetné.
Ha szigorúan csak a szakmát céloztuk volna meg, akkor betűhű kiadást készítettünk volna a francia forradalom kaotikus világában sodródó vadember történetéből, és a neten tesszük közzé. A szöveget azonban modernizáltuk, csak a minimálisan szükséges jegyzeteket fűztük hozzá. A Balassi Kiadó szerintem kifejezetten szép és jól olvasható kiadványt készített belőle. Reméljük, hogy a szélesebb olvasóközönséghez is eljut.
Egyébként hogyan bukkan az ember egy 1792-es regényre? Kutat a levéltárban, és rájön, hogy ez a történet nincs benne a felvilágosodás kánonában, és ki kell adni?
Balázs Péter találta, de sokkal banálisabb a történet. Kosáry Domokos alapvető monográfiájának, a Művelődés a XVIII. századi Magyarországon egy újabb kiadását olvasta, amiben talált egy korábban mindkettőnk számára ismeretlen hivatkozást egy tanulmányra. Ez ismerteti a regényt. Az az érdekes, hogy az ismertetés a szakma szempontjából egyáltalán nem eldugott helyen jelent meg, hanem az Irodalomtörténet hasábjain. Ádám Eta tanulmánya azonban a megjelenése idején, 1981-ben – úgy látszik – nem keltette fel az érdeklődést. Ezután mentünk el az Országos Széchényi Könyvtárba, ugyanis ott található a kézirat. A szöveget több szempontból is érdekesnek találtuk. Erről – úgy tűnik – sikerült másokat is meggyőzni, így jelenhetett meg az NKA támogatásával. De nem a kánon az érdekes, hanem az, hogy olvashatunk valamit, amit eddig nem. Eleve nincs sok magyar nyelvű regény a korszakból, bár egy-két (újra)felfedezést is megemlíthetünk. Pálóczi Horváth Ádám regényével is akkor kezdett el a szakma intenzívebben foglalkozni, amikor 1988-ban kiadta Németh József. Vagy éppen a Fanni hagyományainak is jót tett az 1990-es években feltámadt érdeklődés. Azaz nekünk, olvasóknak lett jobb.
Milyen jövő lenne ideális az irodalomtörténetnek és az irodalomtudománynak? A végletekig küzdenie kellene önállóságáért, vagy be kellene olvadnia a kultúratudományok közé, esetleg máshová?
Ahogyan a tudás különböző területeihez, formáihoz való viszonyunk változik, úgy fognak változni a címkék is. Mindig foglalkozunk szövegekkel, úgyhogy ebből a szempontból, úgy gondolom, mindegy.
Boldog Zoltán