Az informatika segítségével fejtettek meg egy titokzatos kéziratot

Módszerében is különlegesnek számít az, ahogy egy amerikai-svéd kutatócsoport megfejtett egy titkosírást, amellyel egy mindeddig elolvashatatlan tartalmú, 105 oldalas 18. századi kézírásos könyv, az úgynevezett Copiale Cipher készült, melyet az egykori NDK-ban fedeztek fel egy akadémiai archívumban. A közös munka végeredményét és a siker alapját biztosító metódust a csapat tagjai (Kevin Knight, a Dél-Kaliforniai Egyetem információtudományi tanszékének számítógépes nyelvészettel és gépi fordítással foglalkozó kutatója, illetve Beata Megyesi és Christiane Schaefer, az Uppsalai Egyetem nyelvészei) nemrég mutatták be egy amerikai számítógépes nyelvészettel foglalkozó konferencián. A team az első 16 oldal megfejtését prezentálta, ez a szöveg egy olyan titkos társaság szertartásainak és politikai nézeteinek a leírása az 1730-as évekből, akik valamilyen oknál fogva le voltak nyűgözve a szemészettől, bár maguk nem voltak szemészek.

A kézirat körülbelül 75 ezer karaktert tartalmaz, a jelek igen szépen rajzoltak és jól olvashatóak, összességében 90 különféle karakter különböztethető meg, ezek közül 26 ékezet nélküli latin betű. Jelentős nehézséget okozott a megfejtésnél, hogy a sorokban nincsenek szóközök.

Copiale
Nagyításhoz klikk! a képre

A kutatás elején természetesen több sikertelen kísérlet zajlott le, eleinte például azt feltételezték, hogy a latin betűk hordozzák az információt, nyolcvan nyelven próbálkoztak eredmény nélkül. Később rájöttek, hogy az átírás minden bizonnyal az úgynevezett homofón, azaz helyettesítő rejtjelzéssel készült. Fontos lépés volt, hogy helyes volt az a kézirat történetére alapozó előfeltevésük, hogy a szöveg német nyelven íródott. Az áttörést akkor érték el, amikor rájöttek, hogy a latin betűk jelzik a szóközöket, a szimbólumok pedig a betűket, illetve az is kiderült, hogy a kettőspont azt jelenti, hogy az előtte lévő mássalhangzó megkettőződik. A továbbiakban alkalmazott módszer újdonsága és a siker egyik titka, hogy felhasználták a gépi fordítástechnológiák új eredményeit, jelen esetben a statisztikai alapú fordítórendszerekét. Erre alapoztak például, amikor a német nyelvet feltételezve szógyakoriság-elemzést végeztek a kódolt szövegen.

Mind a történészek, mind a kriptográfusok elismerően nyilatkoztak Knighték munkájáról, és sokan reménykednek abban, hogy ez a módszer, illetve ennek továbbfejlesztett változatai reményt adhatnak arra, hogy megfejtsenek olyan rejtélyes, ismeretlen tartalmú szövegeket, mint például a hírhedt zodiákus gyilkos néhány máig megfejtetlen levele, vagy az úgynevezett Voynich-kézirat, egy mindeddig ismeretlen tartalmú középkori dokumentum.

Előzmények