Cloudflare revela la causa de su mayor interrupción global desde 2019: un error en su sistema de gestión de bots

18 de noviembre de 2025 — Una falla en la configuración de consultas dentro del sistema de gestión de bots de Cloudflare provocó que grandes […]

Actualidad
Tecnología

ESCRITO POR

Comunicación LinkSpace

ACTUALIZADO

22 de noviembre, 2025

18 de noviembre de 2025 — Una falla en la configuración de consultas dentro del sistema de gestión de bots de Cloudflare provocó que grandes sectores de Internet quedaran fuera de servicio durante varias horas, según explicó Matthew Prince, cofundador y CEO de la compañía, en una publicación oficial.

Cloudflare, cuya red soporta aproximadamente el 20% de todo el tráfico web mundial, funciona como una capa crítica para mitigar picos de demanda y ataques DDoS. Sin embargo, esta infraestructura global sufrió su “peor interrupción desde 2019”, afectando a plataformas de alto tráfico como X, ChatGPT y servicios de monitoreo como Downdetector.

El origen del problema: consultas duplicadas y un archivo que creció sin control

El incidente no estuvo relacionado con IA generativa, fallas de DNS o un ataque cibernético, como inicialmente sospechó la compañía.

Según Prince, el sistema de gestión de bots —encargado de puntuar solicitudes automatizadas y permitir o bloquear su acceso— depende de un archivo de configuración que se actualiza constantemente. Un cambio inesperado en el comportamiento de las consultas de su base de datos ClickHouse provocó la generación masiva de filas duplicadas.

Como resultado, el archivo de configuración creció rápidamente hasta superar los límites de memoria establecidos, lo que derribó el sistema proxy principal utilizado para procesar el tráfico de los clientes que dependen del módulo de bots. Los usuarios que no empleaban reglas basadas en puntuación de bots permanecieron online.

Impacto y contexto

La interrupción se suma a una serie de fallas recientes en servicios centralizados como Microsoft Azure y Amazon Web Services, subrayando la vulnerabilidad estructural de Internet ante fallos en grandes proveedores de infraestructura.

Cloudflare ha destacado que sus herramientas de gestión de bots buscan proteger a los sitios web del rastreo no autorizado, incluidos los bots que recolectan contenido para entrenar modelos de IA generativa. Sin embargo, la falla se originó en un problema técnico interno, no en el nuevo sistema de mitigación basado en IA anunciado recientemente.

Las medidas de Cloudflare para evitar futuras interrupciones

La compañía anunció cuatro acciones inmediatas para reforzar la estabilidad de su red:

  • Fortalecer el proceso de ingestión de archivos de configuración internos, tratándolos con el mismo rigor que las entradas generadas por usuarios.
  • Activar interruptores de seguridad globales adicionales para funciones críticas.
  • Evitar que volcados de memoria u otros reportes de error saturen los recursos del sistema.
  • Revisar los modos de falla en todos los módulos proxy principales, para identificar y aislar errores antes de que escalen.

Prince reconoció que, aunque estas medidas fortalecerán la resiliencia del sistema, la creciente centralización del Internet moderno implica que interrupciones de gran escala seguirán siendo un riesgo inevitable.

Guente: The Verge