LA ZURDA

Un algoritmo que podría reescribir la historia

  • Escrito por Elena Camacho
  • Publicado en Ciencia
Réplica del velero ""Endeavour"" utilizado por el capitán británico, James Cook, para circunnavegar el Océano Pacífico. EFE/Cristobal García/Archivo Réplica del velero ""Endeavour"" utilizado por el capitán británico, James Cook, para circunnavegar el Océano Pacífico. EFE/Cristobal García/Archivo

La "Tierra austral incógnita", lo que hoy conocemos como Australia, fue descrita por un jesuita español casi cien años antes de que el marino británico James Cook la descubriese en 1770, tal y como demuestra un manuscrito que la inteligencia artificial acaba de sacar a la luz.

La carta, dirigida al rey Felipe V, es solo una de las muchas sorpresas que han salido a flote gracias a Carabela, un proyecto de inteligencia artificial y aprendizaje automático (machine learning) desarrollado por científicos de la Universitat Politècnica de Valencia (UPV) y del Centro de Arqueología Subacuática del Instituto Andaluz del Patrimonio Histórico.

El proyecto se ha probado con 125.000 documentos del Archivo General de Indias y del Archivo Histórico Provincial de Cádiz, que junto al Archivo Real de la Marina Española custodian cientos de millones de legajos, cartas y manuscritos relacionados con el comercio naval y la exploración española entre los siglos XVI y XIX.

Aunque actualmente todos estos documentos están en proceso de digitalización, dar con la información deseada a menudo supone años de trabajo para los arqueólogos e historiadores que, primero, deben saber dónde y qué buscar y, después, descifrar los enrevesados estilos de escritura de cada época.

"Hay que ser muy experto para saber lo que pone en esos documentos y, además, muchas veces la calidad de la imagen es tan baja que ni un experto es capaz de saber qué pone", explica a Efe el físico y catedrático en informática Enrique Vidal, investigador del Centro Pattern Recognition and Human Language Technologies (PHRLT) de la Politécnica de Valencia y coordinador del proyecto. La complejidad de estos manuscritos es tal que las técnicas de transcripción disponibles, capaces de convertir una imagen en un texto, no sirven porque son incapaces de leer estos documentos.

UN BUSCADOR COMO GOOGLE

Pero una cosa es transcribir y otra buscar. Los investigadores del proyecto Carabela han conseguido que la inteligencia artificial encuentre en pocos minutos los datos que un historiador tarda años en localizar, y lo han hecho con un buscador que permite que cualquier usuario pueda acceder a la maraña informativa de un archivo, de cualquier temática y antigüedad.

Gracias al desarrollo de esta tecnología, el usuario puede hacer una búsqueda en los archivos similar a la que haría en Google. "El buscador abre unas posibilidades impresionantes: utilizando comandos precisos en cada caso (comillas, corchetes, etc) es posible buscar combinaciones de palabras que aparezcan en el documento (puerto + santa + maría) o que estén juntas o en final india, es decir, en una frase, por ejemplo 'puerto de santa maría' escrito entre corchetes", explica el responsable del proyecto en la UPV.

La precisión o margen de error de la búsqueda depende del grado de confianza que se exija al sistema: "normalmente está al 50% pero se puede subir al 100%, es decir, el algoritmo te dará el máximo número de aciertos pero se perderá mucha información en la búsqueda; o se puede bajar al 0%, opción que dará muchos falsos positivos pero también encontrará la mayor parte de la información buscada. El usuario podrá jugar con esos elementos", según lo que busque.

La precisión de Carabela es "finísima": es "capaz de encontrar una aguja en un pajar en segundos", destaca Vidal, lo que abre unas perspectivas nunca imaginadas para la investigación y para todo aquel que busque algo en un archivo documental. De hecho, solo durante este proyecto, el sistema ha descubierto "unas 400 referencias de naufragios, y la mitad de ellos no los teníamos localizados", subraya en declaraciones a Efe el investigador e historiador Carlos Alonso, del Centro de Arqueología Subacuática del Instituto Andaluz del Patrimonio Histórico.

"Precisamente uno de los objetivos de este proyecto es ver si el uso de las técnicas de la Inteligencia Artificial permite identificar expedientes que, por su contenido o las referencias a cargas valiosas, puede ser de interés para las empresas interesadas en su expolio y explotación comercial para controlar su acceso", explica Alonso.

REESCRIBIR LA HISTORIA

Pero, sin duda, una de los puntos fuertes de la tecnología desarrollada en Carabela será su potencial para "reescribir" la historia en muchos niveles, no solo para identificar naufragios históricos, advierte el historiador.

Y es que uno de los hallazgos más curiosos en estos fondos tuvo lugar cuando, buscando términos relacionados con Australia (antes denominada Tierra Austral Incógnita), apareció una carta de Andrés Serrano, "un jesuita que estaba en Manila, Filipinas, y que le pedía al rey más recursos para ir a colonizar aquella tierra repleta de almas para evangelizar", relata Vidal.

"La carta, escrita 80 años antes del viaje de Cook, describía las coordenadas exactas de localización del continente y su tamaño de este a oeste", asegura el físico de la UPV. Además de esta carta, el proyecto Carabela ha sacado a la luz otras misivas de marinos como Luis Váez de Torres o Pedro Fernandez de Quirós, también enviadas a la corona española y que sugieren la existencia del continente austral incluso 100 años.

El contenido de estas cartas no deja de ser algo anecdótico porque "a lo largo de la historia, Australia ha sido redescubierta probablemente decenas de veces desde los polinesios a los chinos, japoneses, portugueses, holandeses, españoles y, finalmente, Cook. Lo importante es que ha sido posible constatar todo esto muy fácilmente gracias a una herramienta como la inteligencia artificial que podría ayudar reescribir la historia", subraya Vidal.

Esta tecnología se podría aplicar a los millones de legajos que se conservan en los archivos españoles. Hacerlo posible depende solo de que haya voluntad política y financiación: "Extender el proyecto a buena parte de los documentos más significativos de los archivos navales podría costar alrededor de un millón de euros y unos cinco años de trabajo de un equipo similar al de Calabera", concluye Vidal.