Por qué debería considerar el uso de modelos mixtos en IA

AGI es tan de la vieja escuela

Devansh, 30 abril 2024, MEDIUM

Los modelos Single Expert son tan del 2019. Si está buscando crear una IA poderosa, considere usar modelos mixtos.

La imagen a continuación está tomada de la excelente publicación “ Modelado de distribuciones heterogéneas con una mezcla incontable de laplacianos asimétricos ”. Los autores generaron datos sintéticos de distribución múltiple. Estas distribuciones son muy difíciles para modelos de IA únicos, sin importar cuán buenos sean los modelos. Sin embargo, utilizando una combinación de diferentes modelos se puede modelar esto perfectamente.

“En las tareas de regresión, la incertidumbre aleatoria se aborda comúnmente considerando una distribución paramétrica de la variable de salida, que se basa en supuestos sólidos como simetría, unimodalidad o suponiendo una forma restringida. Estos supuestos son demasiado limitados en escenarios donde están presentes formas complejas, fuertes sesgos o modos múltiples…. Demostramos que UMAL produce distribuciones adecuadas, lo que nos permite extraer conocimientos más ricos y afinar la toma de decisiones”.

Esto tiene utilidad en casos de uso muy importantes del mundo real. Por ejemplo, Google AI pudo aprovechar una combinación de modelos laplacianos combinados con LSTM para mejorar significativamente los pronósticos de inundaciones para 460 millones de personas.

Así es como los investigadores describen su arquitectura:

Nuestro modelo de pronóstico de ríos utiliza dos LSTM aplicados secuencialmente: (1) un LSTM «hindcast» ingiere datos meteorológicos históricos (características dinámicas de pronóstico retroactivo) hasta el momento actual (o más bien, el momento de emisión de un pronóstico), y (2) un » pronóstico” LSTM ingiere estados del LSTM retrospectivo junto con datos meteorológicos pronosticados (características de pronóstico dinámico) para hacer predicciones futuras. Se ingresa un año de datos meteorológicos históricos en el LSTM retrospectivo y siete días de datos meteorológicos pronosticados se ingresan en el LSTM de pronóstico . Las características estáticas incluyen características geográficas y geofísicas de las cuencas hidrológicas que se ingresan en los LSTM de pronóstico y retrospectiva y permiten que el modelo aprenda diferentes comportamientos y respuestas hidrológicos en varios tipos de cuencas hidrológicas.

Los resultados del pronóstico LSTM se introducen en una capa de “cabeza” que utiliza redes de densidad de mezcla para producir un pronóstico probabilístico (es decir, parámetros predichos de una distribución de probabilidad sobre el flujo de la corriente). Específicamente, el modelo predice los parámetros de una combinación de funciones de densidad de probabilidad de cola pesada, llamadas distribuciones laplacianas asimétricas , en cada paso de tiempo de pronóstico. El resultado es una función de densidad de la mezcla, llamada distribución de mezcla contable de laplacianos asimétricos (CMAL), que representa una predicción probabilística del caudal volumétrico de un río particular en un momento particular.

Aquí se utiliza la mezcla contable de laplacianos asimétricos para modelar mejor la incertidumbre. Para leer más sobre cómo Google usa CMAL, consulte el artículo a continuación:

Cómo Google creó una IA de código abierto para proporcionar advertencias precisas de inundaciones para 460 millones de personas…

Así es como se construirá la IA impactante para el futuro. Especialmente los países en desarrollo deberían tomar notas

Comparte en tus perfiles

Facebook
Twitter
LinkedIn

Artículos Relacionados:

Internacionalización con impacto: lo que revela el nuevo estudio sobre empresas multilatinas

Juan S. Blyde, Pablo Marcelo Garcia, Paulo Pascuini y Andrés López. Ene 30, 2026. BID. Un nuevo estudio caracteriza a las multilatinas, identifica sus principales barreras y propone políticas para que su expansión internacional impulse el desarrollo productivo regional. Ideas clave Cada vez más empresas latinoamericanas expanden sus operaciones más allá de sus fronteras. Al presente, las multilatinas cuentan

Seguir leyendo »

La Unión Europea adopta la Agenda Interoperable 2026 para impulsar los servicios públicos digitales

ESMARTCITY. 05/02/2026 La Junta de Interoperabilidad Europea, en estrecha colaboración con la Comunidad Interoperable Europea, ha adoptado la Agenda Interoperable Europea para 2026. Este instrumento, creado en virtud del Acta de Interoperabilidad Europea, constituye la principal herramienta de la Unión Europea para establecer prioridades orientadas a mejorar el intercambio transfronterizo de datos entre administraciones públicas y acelerar

Seguir leyendo »