Los Papeles de Panamá, que obligaron a dimitir al ex ministro José Manuel Soria, son en realidad 11.5 millones de archivos. ¿Cómo se procesaron y analizaron?
Por Alberto Iglesias Fraga
Ciudad de México, 19 de abril (SinEmbargo/TICbeat).- Todos conocemos el escándalo de los Papeles de Panamá, la mayor filtración de información de la historia y que ha hecho temblar los cimientos de la política (dimisiones de presidentes y ministros como el español José Manuel Soria incluidas), el mundo empresarial o las altas esferas del deporte y el espectáculo. Sin embargo, lo que quizás no es tan conocido es el papel fundamental que jugaron las nuevas tecnologías a la hora de destapar todo el escándalo de las sociedades offshore en este paraíso fiscal.
Remontémonos al comienzo de toda la historia. El diario alemán Süddeutsche Zeitung recibió una filtración anónima de aproximadamente 11.5 millones de documentos, con un volumen de 2.6TB de datos, detallando las actividades realizadas por la firma de abogados panameña Mossack Fonseca, la cual ayudaba a sus clientes a establecer empresas anónimas inscritas en paraísos fiscales. Si bien estas entidades offshore son generalmente legales en la jurisdicción donde están registradas, la investigación reveló que algunas empresas fueron utilizadas con fines ilícitos incluyendo fraude, tráfico de drogas y evasión de impuestos.
Obviamente, se trata de una cantidad enorme de información para lo que suele manejarse en periodismo de investigación: aproximadamente diez veces más en volumen de datos y cinco veces más en número total de documentos comparado con la investigación "Offshore Leaks" de 2013, uno de los grandes hitos del International Consortium of Investigative Journalists (ICIJ).
Esta asociación internacional de periodistas de investigación fue a la que recurrió el Süddeutsche Zeitung para pedir ayuda a la hora de manejar toda esta información. Y una de las conclusiones más inmediatas a las que llegaron fue que necesitarían de la ayuda de la tecnología para poder analizar semejante volumen de datos. No en vano, en el mundo del eDiscovery se trabaja con cantidades semejantes a diario, con lo que es fácilmente asumible por las capacidades técnicas actuales.
Así pues, ICIJ y Süddeutsche Zeitung utilizaron un software de la firma Nuix para tratar, indexar y analizar los datos. Concretamente se utilizó el reconocimiento óptico de caracteres, lo que permitió a los redactores hacer búsquedas de texto en el contenido de millones de documentos escaneados. Por otro lado, los investigadores también llevaron a cabo otros procesos como la ‘named entity extraction’ –que permite extraer nombres propios y otros patrones identificables– junto con otras herramientas de análisis para hacer referencias cruzadas entre los nombres de los clientes de Mossack Fonseca y los millones de documentos.
Nuix es un programa de descubrimiento electrónico de datos y de investigación informática con un motor de indexación muy rápido que permite procesar los archivos que se hayan introducido en Nuix para crear una base de datos en la que poder hacer consultas a medida.
“La tecnología de Nuix fue una parte indispensable de nuestro trabajo en la investigación de los Papeles de Panamá, al igual que lo había sido en el 'Offshore Leaks' y muchas de nuestras otras investigaciones a gran escala”, explica Gerard Ryle del Consorcio Internacional de Periodismo de Investigación.
Nuix donó el software a ICIJ y a Süddeutsche Zeitung para esta investigación, además de ofrecer la ayuda de un consultor para resolver las dudas de los investigadores sobre las configuraciones de hardware y flujos de trabajo. Asimismo, y este es un detalle clave para garantizar la independencia y transparencia de la investigación, los trabajadores de Nuix nunca vieron ni manipularon los datos filtrados; esta tarea fue llevada a cabo por los periodistas involucrados en la investigación.
Con todo ello, y gracias a los avances de la tecnología, más de 400 periodistas en 80 países del mundo fueron capaces de investigar los datos antes de publicar los primeros resultados de la investigación el 4 de abril de 2016.