Fundación Sui ha publicado una autopsia detallada que explica la causa del bloqueo de la red principal que interrumpió el procesamiento de transacciones en 14 de enero. Confirmó que la red se detuvo como medida de seguridad para evitar una finalización estatal inconsistente.
Según la Fundación, la perturbación duró aproximadamente seis horas. Esto lo provocó una divergencia interna en el procesamiento del consenso de los validadores.
Durante el incidente, los validadores no pudieron certificar nuevos puntos de control, lo que provocó que se agotaran los envíos de transacciones mientras la red priorizaba la seguridad.
La divergencia del consenso de Sui provocó una parada de seguridad
La Fundación dijo que el incidente se debió a un error extremo en la lógica de confirmación de consenso que afectó la forma en que se manejaron las transacciones conflictivas bajo ciertas condiciones de recolección de basura.
Como resultado, diferentes validadores obtuvieron diferentes resultados de consenso e intentaron ejecutar puntos de control candidatos incompatibles.
Cuando los validadores detectaron que más de un tercio de la participación estaba firmando un resumen de punto de control diferente, la certificación del punto de control se volvió imposible. Luego, los validadores detuvieron el progreso para evitar finalizar un estado inconsistente.
“Este es el modo de falla previsto para este tipo de problemas”, dijo la Fundación, señalando que la red está diseñada para detenerse de manera segura en lugar de correr el riesgo de bifurcaciones o inconsistencias irreversibles.
Sin bifurcaciones, reversiones ni pérdidas de fondos
Sui enfatizó que el estancamiento no fue causado por la congestión de la red, el volumen de transacciones o amenazas externas. Durante todo el incidente:
- No se produjeron bifurcaciones estatales certificadas
- No se revirtieron transacciones certificadas
- Los fondos de los usuarios nunca estuvieron en riesgo
- Se preservaron las garantías de seguridad y coherencia de la red.
Si bien la ejecución de la transacción se detuvo durante la ventana del incidente, las operaciones de lectura continuaron sirviendo al último estado certificado. Esto aseguró la coherencia de los datos para los usuarios y las aplicaciones.
Mejoras previstas tras el incidente
El Fundación Sui dijo que está implementando varios cambios para reducir el tiempo de recuperación en caso de problemas similares en el futuro.
Las mejoras planificadas incluyen una detección más rápida de inconsistencias en los puntos de control y herramientas de operador más automatizadas para limpiar estados internos divergentes. Además, se ampliaron las pruebas específicas de consenso para reproducir y validar las correcciones antes de la implementación.
La Fundación añadió que, si bien la interrupción fue perjudicial, confirmó que la arquitectura centrada en la seguridad de Sui se comportó según lo diseñado.
Pensamientos finales
- La explicación de Sui confirma que la parada de la red principal fue el resultado de un caso límite de consenso, con mecanismos de seguridad que detuvieron la red para evitar un estado final inconsistente.
- Si bien es disruptivo, el incidente resalta el equilibrio entre disponibilidad y seguridad a medida que las redes de alto rendimiento superan los límites de rendimiento.
