
Miles de documentos en papel en la República Democrática del Congo Archivos meteorológicos ahora se están digitalizando.Crédito: Derrick Muheki/Inera DRC
¿Cómo pueden los países descubrir cómo el cambio climático los afectará a escala regional? ¿Puede la inteligencia artificial (IA) ayudar a pronóstico huracanes y otros Eventos meteorológicos extremos? Y el mundo ya ha pasado el objetivo más ambicioso del acuerdo climático de París, a limitar el calentamiento global a 1.5 ° C por encima de los niveles preindustriales?
La necesidad de abordar estas y otras preguntas es estimular a los investigadores para aprovechar los vastos repositorios no utilizados de registros meteorológicos escritos a mano que abarcan más de dos siglos. Estos tocones de valiosos, pero en algunos casos ilegibles, ahora se vuelven más fáciles de acceder con nuevas herramientas de aprendizaje automático más sofisticadas.
«Todos los servicios meteorológicos en todo el mundo tienen un sótano en el que almacenan datos del siglo XIX que no se han digitalizado», dice Marlies van der Schee, científica climática del Royal Países Bajos del Instituto Meteorológico en De Bilt. «Para muchos institutos, ni siquiera saben lo que está en sus archivos».
Buscando datos
En la búsqueda para recopilar datos climáticos faltantes, el científico climático Derrick Muheki ha viajado más lejos que la mayoría. Para acceder a los archivos meteorológicos de la República Democrática del Congo (RDC), que contiene registros desde cuando la RDC se independizó en 1960 recolectadas de 37 estaciones meteorológicas en todo el país, Muheki tuvo que volar desde Kinshasa a Kisangani en el norte del país, viajar a lo largo del río Congo por bote por bote y luego tomar una carretera sin pavimentar en una motocicleta para llegar a la sucursal de Yangambi de la Rama de la AguriMambi de la Rama de la Aguronia por el Boat por Boat por Boat por Boat por Boat por Boat por Boat por Boat por Boat por Boats para tomar un camino sin pavimentar en una Motor Cypy Cycle para llegar a la sucursal de Yangambi de la Rama de la Dra. (Inera). Allí, pasó dos meses a principios de este año escaneando miles de páginas de registros meteorológicos.
Muheki tuvo que traer suficientes baterías para alimentar su cámara digital durante la duración del viaje, ya que la rama remota de Inera no está conectada a la red nacional de la RDC. Aprendió parte del lenguaje bantú lingala para poder comunicarse con otros miembros del personal de Inera. Él dice que ayudó que muchas de las palabras fueran similares al lenguaje que creció hablando en su Uganda natal.

Informes meteorológicos de los registros de Old Ships, como este documento del siglo XVIII de la embarcación británica HMS Delfín – Contiene datos que pueden alimentarse en modelos climáticos. Crédito: la colección de historial a través de Alamy
Después de regresar a su grupo de investigación en el Vrije Universiteit en Bruselas, Muheki comenzó a extraer datos de las más de 9,000 imágenes escaneadas utilizando una herramienta de aprendizaje automático que diseñó para leer los registros meteorológicos, llamados MeteOsaver1.
En las pruebas iniciales, Meteosaver solo pudo transcribir los datos con una precisión del 75%, pero los refinamientos y capacitación adicionales de su red neuronal, sobre la base de un paquete de código abierto para el reconocimiento de texto escrito a mano llamado Tesseract, lo han llevado al 90%, dice.
Los datos resultantes proporcionarán información crucial sobre cómo las condiciones han cambiado con el tiempo en la segunda selva tropical más grande del mundo. El científico climático Wim Thiery, asesor de Muheki en Vrije Universiteit, dice que debido a la falta de información sobre las temperaturas pasadas, el corazón boscoso del continente africano tenía una gran brecha de datos en el Informe 2021 del Panel Intergubernamental sobre Cambio Climáticoque evaluó la gravedad y la velocidad del calentamiento global en varias partes del mundo. Espera que los esfuerzos como los de Muheki ayuden a rectificar esto.
Figuras olvidadas
Los obstáculos logísticos de Muheki fueron inusuales, pero la RDC no es el único país que aún no ha digitalizado completamente sus registros meteorológicos.
«Hay registros en papel que siguen languideciendo en archivos en todo el mundo», dice Ed Hawkins, un científico climático de la Universidad de Reading, Reino Unido. Estos incluyen millones de observaciones de lluvia no utilizadas en el archivo meteorológico nacional del Reino Unido.
¿Es demasiado tarde para mantener el calentamiento global por debajo de 1.5 ° C? El desafío en 7 gráficos
Hawkins ha administrado varios proyectos que se basaron en científicos ciudadanos para transcribir manualmente los registros climáticos. Hace diez años más o menos, las herramientas de aprendizaje automático no estaban a la altura de la tarea, dice. La parte más difícil para las herramientas de IA es no leer texto escrito a mano, sino reconocer la estructura tabular en los documentos. «Cuando yo y los colegas comenzamos a probar las herramientas (IA), simplemente no funcionaríamos en números tabulados», dice Hawkins. «No estaba en su entrenamiento». Gran parte del trabajo de Muheki consistió en desarrollar algoritmos personalizados para hacer exactamente eso. Ahora, las herramientas finalmente se están volviendo lo suficientemente buenas como para igualar el rendimiento humano, dice Hawkins, quien es coautor en el trabajo de investigación que describe MeteOsaver.
Esfuerzos similares de otros equipos muestran que el aprendizaje automático podría acelerar drásticamente la tasa de recuperación de registros históricos. «Es realmente una revolución en nuestra capacidad de rescatar datos», dice Thiery.





