Los modelos de Inteligencia artificial (IA) parecen ser buenos candidatos para la predicción de caudales y la predicción de eventos extremos, porque resolverían algunos de los problemas presentados por los modelos numéricos basados en la discretización espacio-temporal de las ecuaciones de balance y transporte (flujo de agua).
Principales problemas de los modelos numéricos para la predicción de eventos extremos
Los modelos numéricos basados en la discretización espacio-temporal de las ecuaciones de balance y transporte son herramientas utilizadas para simular y predecir el comportamiento del flujo de agua en ríos, cuencas hidrográficas, acuíferos, etc.
Estos modelos se basan en principios físicos y matemáticos para describir cómo se mueve el agua a través del espacio y el tiempo, y cómo interactúa con su entorno.
Los modelos numéricos para la predicción de eventos extremos presentan problemas que pueden afectar su precisión y confiabilidad y que han impedido su extensión generalizada.
Algunos de los problemas de los modelos numéricos, son los siguientes:
- El conjunto de datos de partida es de costosa obtención y parametrización.
- Los modelos numéricos dependen de datos de entrada precisos, como datos meteorológicos, topográficos y de uso del suelo. La falta de datos o la calidad insuficiente de los datos relacionados con los eventos extremos pueden introducir errores significativos en las predicciones.
- La resolución espacial y temporal de los modelos numéricos puede ser insuficiente para capturar la complejidad y la variabilidad de los fenómenos extremos.
- Los eventos extremos suelen ser localizados y de corta duración, lo que requiere una resolución muy alta para ser correctamente representados.
- Los modelos numéricos precisan de un mecanismo de calibración manual de muchos parámetros (o semiautomática con supervisión manual en el mejor de los casos), con el consiguiente riesgo de “overfitting”.
- En cuencas de pequeña área y alta velocidad (de respuesta rápida, por ejemplo ríos de montaña o torrenciales) es preciso un elevado nivel de detalle espacial que permita diferenciar adecuadamente lluvias locales que no cubran toda la cuenca.
- Los modelos numéricos no son capaces de ajustar simultáneamente situaciones de normalidad, sequía y avenidas.
- El tiempo medio de ejecución suele ser muy elevado, lo cual impide su uso a “tiempo real” en cuencas de respuesta rápida.
El problema fundamental de los modelos de IA
Los modelos de Inteligencia Artificial, en comparación con los modelos numéricos, no requieren costosos datos (más allá del registro temporal de lluvia y caudal en estaciones de aforo), su calibración está implícita en el proceso de entrenamiento y la velocidad de ejecución en fase de simulación suele ser muy rápida.
El problema fundamental de los modelos de IA que ha impedido su uso generalizado es el problema conocido como “problema del marco de referencia”.
El «problema del marco de referencia» en el contexto de la predicción del caudal de un río se refiere a la dificultad de los modelos de inteligencia artificial para capturar y entender correctamente los patrones y relaciones complejas en los datos cuando se enfrentan a cambios en el entorno o en las condiciones de entrada.
Este problema puede manifestarse cuando el modelo se entrena con datos recopilados en un entorno o condiciones específicas, y luego se despliega en un entorno o condiciones diferentes, lo que conlleva una baja precisión y rendimiento del modelo.
¿Un elefante en la habitación?
El ejemplo conocido como «The Elephant in the Room» ilustra este problema. En este ejemplo, un modelo de IA se entrena utilizando datos históricos de mediciones de caudal de un río en un área particular.
Supongamos que estos datos incluyen información sobre la topografía local, la vegetación circundante, las precipitaciones, la temperatura y otros factores relevantes.
El modelo se ajusta bien a estos datos y puede hacer predicciones precisas dentro de ese marco de referencia específico. Sin embargo, cuando el modelo se despliega en un entorno diferente con valores de entrada muy alejados de los que se usaron para entrenarla, el rendimiento del modelo puede deteriorarse significativamente.
Esto se debe a que el modelo puede haber aprendido patrones y relaciones específicos que son válidos solo dentro del marco de referencia en el que se entrenó, y no puede generalizar adecuadamente a nuevas situaciones o situaciones extremas. Principio del formulario
Situaciones atípicas: ¿resultados sin sentido?
Por lo tanto, sólo puede esperarse resultados correctos en la interpolación, no así en la extrapolación:
- Para situaciones “atípicas” el modelo de IA puede dar resultados sin sentido, como por ejemplo un caudal que implique un volumen de agua superior al volumen de agua que ha llovido.
Con el agravante de que, incluso en situaciones de avenidas extremas parecidas a las históricas usadas en la fase de entrenamiento, el modelo puede dar resultados poco fiables, precisamente por su carácter extremo, es decir, poco frecuente y, por consiguiente, con pocos episodios parecidos en la fase de entrenamiento.
Últimos avances en IA para la predicción de eventos extremos
NEURITE Lab solventa este problema de comportamiento errático de las redes neuronales, investigando un proceso que permite a la red neuronal adquirir sentido físico en eventos extremos.
Nuestra metodología hace uso de los últimos avances en Inteligencia Artificial (IA), y consiste en una generación de eventos extremos basados en Generative Adversary Networks (GANs), un proceso que genera, por ejemplo, numerosos mapas de lluvia extremos que, aunque no han existido nunca, pueden considerarse reales, es decir, que se parecen a un mapa de lluvias real.
“Eventos sintéticos” de lluvia
La secuenciación en el tiempo de estos mapas produce unos “eventos sintéticos” de lluvia. Estos eventos deben poder controlarse en magnitud, localización y frecuencia de modo que se cubra el más amplio espectro de futuros eventos.
Los eventos sintéticos se refieren a la generación de datos simulados que imitan las características de eventos reales, como patrones de precipitación, caudales de ríos o series temporales de variables climáticas.
Con la generación de los “eventos sintéticos”, los casos extremos se convierten en casos más numerosos, sin que los casos «normales» pierdan preponderancia.
Estos eventos de lluvia extrema (ahora numerosos) son calculados por un modelo clásico de hidrología que incorpora las ecuaciones físicas clásicas de balance de masas y transporte, para obtener como resultado la evolución del caudal en el punto de medida del río en base a cada secuencia sintética de campos de lluvia.
Dataset de lluvias y caudales extremos físicamente coherentes
De este modo, se obtiene un dataset de lluvias y caudales extremos, físicamente coherentes (por aplicación de las ecuaciones de balance de masas y transporte del modelo clásico) con el que entrenar las redes neuronales.
Si se presentan en el futuro situaciones de las que nunca se ha tenido registro real, la red neuronal responderá con el “sentido físico” de un modelo numérico clásico.
Adicionalmente, esta algoritmia puede abordar tanto eventos de inundación (caudal máximo) como de sequía (caudal mínimo).
NEURITE Lab: Innovación en Inteligencia Artificial
Neurite Lab es una empresa innovadora en el sector de la Inteligencia Artificial aplicada a las predicciones en diferentes sectores, especializada en el modelaje de series numéricas medioambientales, especialmente en el área de la gestión de cuencas hidrológicas.
A lo largo de nuestra trayectoria, hemos sido reconocidos con el SELLO PYME INNOVADORA por el Ministerio de Ciencia e Innovación y con el SELLO DE EXCELENCIA de la Unión Europea.
Si deseas continuar leyendo:
5 comentarios sobre “Modelos de Inteligencia Artificial: Predicción de eventos extremos (4)”