A kutatók az AI segítségével digitalizálják a Vatikáni Titkos Archívumot
Körülbelül 35 000 kötet és több mint 80 km hosszú könyvespolcokkal ellátott polcok ad otthont a Vatikán Titkos Levéltárának, amely az emberiség egyik legfontosabb történelmi gyűjteményének ad otthont, a legrégebbi kézirat a 8. század végéről származik. A probléma az, hogy virtuálisan nem érhető el, hanem csak azoknak a tudósoknak érhető el, akik a katolikus egyház központjába költözhetnek.
Az olaszországi fővárosban lévő Roma Tre Egyetem és a La Sapienza Egyetem kutatócsoportja meg akarja változtatni. In Codice Ratio nevű projektet fejlesztenek ki, amelynek célja az archívumokból származó összes tartalom automatikus áttöltése a nyilvánosság számára.
E célból a csapat a mesterséges intelligencia és az optikai karakterfelismerés (OCR) kombinációjával működik. Új technikát alkalmaznak az OCR jelenlegi ismereteinek a kézírásos szövegekhez történő alkalmazására, a szavakat apró darabokra bontva, amelyek a régióban használt tinta mennyiségétől függnek. Ez lehetővé teszi az egyes betűk külön-külön elválasztását és a papír digitális dokumentummá alakítását.
A bal oldalon a kézzel írt szöveg; közepén a megfelelő szó; és jobb oldalon, amit a program azonosított.Az ezeket a szövegeket latin ábécé betűként való felismeréséért felelős mesterséges intelligencia oktatást olasz középiskolás diákok végezték. Több kérdőívre válaszoltak, és meghatározták, mely képek képviselik a kívánt betűket.
Mindezt az eredményt kipróbálták, amikor a csapat körülbelül 18 000 oldalas levélből készítette a teszteket az Archívumban. A kutatók szerint a program képes volt a betűk 96% -át helyesen azonosítani, a szavak egyharmadában legalább egy rossz karakter szerepel. Mivel ez a technológia mindig megtudja, hogy hibáit azonosítják, ezek a számok valószínűleg csak javulnak a jövőbeli kísérletek során.
Az In Codice Ray webhelyen megtekintheti az összes, a keresési eredményekkel közzétett cikket.
A kutatók az AI segítségével szkennelik a Vatikán titkos fájljait a TecMundo segítségével