La pandemia de imágenes falsas y su detección: al límite de lo imposible
La falsificación intencionada de productos y la elaboración de contenidos fraudulentos no es nueva, pero su distribución masiva en las redes y medios de comunicación está alcanzando la categoría de pandemia. Como respuesta, se multiplican los esfuerzos para limitar el impacto de las denominadas fake news, pero la batalla contra la proliferación de fake pictures (imágenes falsas) es mucho más compleja, y sus efectos culturales son también mucho más devastadores.
Francisco López Cantos - The Conversation
Los sistemas de detección del fraude aplicados a textos obtienen resultados bastante precisos. Por ejemplo, Ithenticate, en el ámbito académico, está integrado en los procesos de evaluación de manuscritos de la mayoría de las publicaciones científicas. Sin embargo, la detección de imágenes falsas resulta mucho mas compleja y requiere de precisos métodos de análisis forense combinados con avanzadas herramientas de software.
A día de hoy, estas no se pueden automatizar con tanta facilidad como ocurre con el análisis textual.
Existen sistemas de reconocimiento de imágenes que utilizan la inteligencia artificial para determinar de qué tipo de imagen se trata y etiquetarla, realizar búsquedas y recuperar imágenes similares, como las desarrolladas por Google. Pero cuando las imágenes son falsificaciones que van más allá de su simple copia o de una manipulación rudimentaria, resulta muy complejo despejar las dudas sobre su originalidad. Entonces se vuelve imprescindible llevar a cabo un análisis forense detallado que certifique si ha sido manipulada.
La metodología de elaboración de un informe pericial sobre la imagen digital está regulada para garantizar su validez jurídica, pero resulta muy difícil detener su proliferación y sus devastadores efectos culturales. Se están produciendo algunos rápidos avances en la investigación, pero todavía son incipientes dada la complejidad propia de la imagen.
En los límites de lo imposible
Toda imagen es siempre una selección de eso que llamamos realidad, por muy preciso que sea el sistema que utilicemos. Su fidelidad depende de la honestidad de quien ha elaborado la imagen. El problema es que hoy casi cualquiera puede falsificar y distribuir masivamente una imagen, y no digamos las agencias gubernamentales, empresas y especialistas con sobrados recursos.
El análisis forense de imágenes puede aplicarse para determinar con precisión las condiciones en las que se registró. Por ejemplo, para evaluar la coherencia espacial de la luz e identificar la cámara con que se tomó, analizando los artefactos característicos que cada equipo produce en el proceso de captura.
También en el proceso de registro de la imagen se incluyen algunos datos de la captura que acompañan al propio archivo, los denominados metadatos, pero no solo no están disponibles en la mayoría de las imágenes en circulación, si no que además son fácilmente manipulabes por un falsificador profesional que lo primero que hace es actuar sobre ellos, por lo que muchas veces pueden ser poco fiables.
La mayoría de las falsificaciones que circulan masivamente son manipulaciones, más o menos sofisticadas, sobre el archivo de la imagen. Muchas veces hacen uso de herramientas que están al alcance de cualquiera, como Photoshop. Algunas pueden ser fáciles de detectar, pero cuando se falsifica con profesionalidad y software diseñado específicamente para eliminar todo rastro de manipulación resulta mucho mas complicado.
Pensemos en la complejidad y la potencia actual de la tecnología y las técnicas de IA para elaborar, por ejemplo, las denominadas deepfakes, en las que lo que se manipula son vídeos. Se están desarrollando herramientas para intentar detectar también este tipo de falsificaciones, como por ejemplo TruePic. Pero aunque se están redoblando los esfuerzos en este sentido tanto en Europa como en América, en la lucha tecnológica contra el fraude las técnicas de análisis forense casi siempre van un paso atrás.
Por activa y por pasiva
En el análisis forense de imágenes digitales se utilizan dos procedimientos básicos de detección de falsificaciones: los activos y los pasivos.
Los métodos activos hacen referencia a las estrategias de autenticación de archivos digitales para su identificación. Esto se consigue, por ejemplo, insertando marcas de agua entre los datos de imagen o utilizando sistemas de firma digital como las cadenas de HASH. Pero la mayor parte de las imágenes en circulación, sean falsas o no, no van acompañadas de ningún dato de identificación, y solo es posible detectar a simple vista si son falsas entre el 30-40 %.
Existe un segundo grupo de métodos de análisis, los denominados pasivos, que utilizan algoritmos específicos y técnicas estadísticas para analizar la coherencia de la estructura de datos del archivo de imagen y determinar si se ha retocado el brillo, contraste y color (el retoque es admisible, pero solo hasta cierto punto). O si se han movido, clonado o transformado algunos elementos. Para ello se están desarrollando algoritmos específicos que son cada vez más efectivos.
Estamos en una carrera en la que se está siempre al límite de la vanguardia tecnológica y, mientras tanto, la pandemia de imágenes falsas se sigue extendiendo a una velocidad imparable. En esta enloquecida lucha sin fin, por ahora gana la falsificación, seguida muy de cerca por las técnicas de detección desarrolladas por los analistas expertos en imagen. Pero hay que correr, y mucho, y al límite de lo imposible.
Francisco López Cantos - Ciencias de la Comunicación, Universitat Jaume I
The Conversation