A kutatók az AI segítségével digitalizálják a Vatikáni Titkos Archívumot

Körülbelül 35 000 kötet és több mint 80 km hosszú könyvespolcokkal ellátott polcok ad otthont a Vatikán Titkos Levéltárának, amely az emberiség egyik legfontosabb történelmi gyűjteményének ad otthont, a legrégebbi kézirat a 8. század végéről származik. A probléma az, hogy virtuálisan nem érhető el, hanem csak azoknak a tudósoknak érhető el, akik a katolikus egyház központjába költözhetnek.

Az olaszországi fővárosban lévő Roma Tre Egyetem és a La Sapienza Egyetem kutatócsoportja meg akarja változtatni. In Codice Ratio nevű projektet fejlesztenek ki, amelynek célja az archívumokból származó összes tartalom automatikus áttöltése a nyilvánosság számára.

E célból a csapat a mesterséges intelligencia és az optikai karakterfelismerés (OCR) kombinációjával működik. Új technikát alkalmaznak az OCR jelenlegi ismereteinek a kézírásos szövegekhez történő alkalmazására, a szavakat apró darabokra bontva, amelyek a régióban használt tinta mennyiségétől függnek. Ez lehetővé teszi az egyes betűk külön-külön elválasztását és a papír digitális dokumentummá alakítását.

Szövegképernyő.

A bal oldalon a kézzel írt szöveg; közepén a megfelelő szó; és jobb oldalon, amit a program azonosított.

Az ezeket a szövegeket latin ábécé betűként való felismeréséért felelős mesterséges intelligencia oktatást olasz középiskolás diákok végezték. Több kérdőívre válaszoltak, és meghatározták, mely képek képviselik a kívánt betűket.

Mindezt az eredményt kipróbálták, amikor a csapat körülbelül 18 000 oldalas levélből készítette a teszteket az Archívumban. A kutatók szerint a program képes volt a betűk 96% -át helyesen azonosítani, a szavak egyharmadában legalább egy rossz karakter szerepel. Mivel ez a technológia mindig megtudja, hogy hibáit azonosítják, ezek a számok valószínűleg csak javulnak a jövőbeli kísérletek során.

Az In Codice Ray webhelyen megtekintheti az összes, a keresési eredményekkel közzétett cikket.

A kutatók az AI segítségével szkennelik a Vatikán titkos fájljait a TecMundo segítségével