Los investigadores de la empresa descubren cómo mejorar los procesos de información de los centros de datos gracias a una solución poco intuitiva: enchufar cables de forma aleatoria Leer Los investigadores de la empresa descubren cómo mejorar los procesos de información de los centros de datos gracias a una solución poco intuitiva: enchufar cables de forma aleatoria Leer
España ha jugado un papel clave en una de las innovaciones que más rentable puede salir a Amazon Web Services (AWS) en los próximos años, que ya es decir. El grupo estadounidense ha encontrado una nueva forma de diseñar sus centros de datos que le permitirá ahorrar miles de millones al año en costes de una infraestructura clave para el despliegue de la IA.
La tecnológica tiene previsto invertir solo este año 200.000 millones de dólares (172.000 millones de euros) en estas instalaciones para afrontar la insaciable demanda de computación de la IA. Así que, cualquier ahorro en su funcionamiento es más que bienvenido por disparatado que pudiera sonar al usuario común y este es muy relevante.
La solución encontrada por el equipo formado por Giacomo Bernardi, científico de AWS, Seshadhri Comandur y Ratul Mahajan, ambos Amazon Scholars, académicos que colaboran con la empresa, es como mínimo poco intuitiva, pero partía un fuerte fundamento matemático: si el cableado de los centros de datos se distribuye aleatoriamente el rendimiento es mucho mejor que con un sistema jerarquizado, una asunción basada en la teoría de los grafos aleatorios que nadie había conseguido llevar a la práctica.
Para entender esta idea, hay que tener en cuenta dos cosas: un centro de datos puede tener en su interior cientos de kilómetros de cable; estos se conectan a su vez a cientos de routers que son quienes dirigen el tráfico de Internet que llega al centro de datos.
Normalmente, la conexión de todos los elementos está estructurada y jerarquizada. Hay routers a distintos niveles y para llevar la información de un lugar a otro hay que respetar esos ‘caminos’ prefijados. Esto puede generar cuellos de botella que reducen el rendimiento del centro de datos, el objetivo era buscar una estructura más plana, explican los investigadores en una entrevista con EL MUNDO.
«Era algo típico del mundo académico. Todo el mundo se entusiasma, pero luego la realidad llega», señala Berardi. Probar la teoría tenía tres problemas. El primero era crear la red aleatoria de millones de cables con un mínimo de sentido y de una forma que fuera funcional dentro del centro de datos.El segundo es que los routers están programados para pasar la información a través de estas estructuras fijas. Y para finalizar, había que probar que funcionaba antes de implementarlo en un centro de datos de verdad.
«El verdadero reto era que nadie había construido algo así antes», apunta Matt Rehder, vicepresidente de ingeniería de redes de la empresa. «La reacción inicial sí fue un poco como ‘esto es una locura’, hay que hacer muchas pruebas», apuntaron los científicos.
La primera prueba de hecho fue la más dura, ya que se conectó aleatoriamente los cables de forma manual en unas pequeñas instalaciones Irlanda. Pese a que era un proyecto a pequeña escala, tardaron meses en configurar el cento de datos, pero finalmente funcionó.
El problema es que no era asumible repetir el proceso a gran escala y en cada centro de datos que construya Amazon. La solución llegó con otro ingenio, la ShuffleBox, una especie de caja que permite introducir los cables y redigirlos de forma aleatoria, toda una revolución que permitía al mismo tiempo industrializar la aleatoriedad y poder utilizar los componentes que ya usa Amazon.
El segundo invento necesario fue lo que el equipo denomina Spraypoint, un nuevo protocolo con el que configurar los routers que les permita pasar la información de forma diferente. Ahora ya no buscan el camino más corto o la ruta preestablecida, sino que envían la información en muchas direcciones distintas.
Aunque resumido, el proceso necesitó de miles de cálculos, una computación equivalente a 530 años de procesamiento de un ordenador y numerosas conversaciones entre el equipo hasta que llegó el momento de ponerlo a prueba en dos lugares relativamente cercanos entre sí: Alemania y el corazón de Aragón, donde Amazon está llevando a cabo la mayor inversión de la historia en España.
Los resultados publicados en un artículo científico hablan de que los centros de datos pueden tener unos costes hasta un 45% menores. Rehder por su parte los fija en el 27% de media, una cifra muy significativa en una infraestructura que consume millones de euros en luz al año. La reducción del uso de algunos componentes llega hasta el 69%, pero a cambio se consumen más cables que en los centros normales.
Ahora, llega el reto del despliegue de una tecnología que la compañía confía que les pone en la vanguardia a la hora de desplegar su red de centros de datos.
«Esto no habría sido posible sin el control que tiene Amazon de cada elemento de sus centros de datos», explica el vicepresidente de Ingeniería de redes, que apunta a que la tecnológica diseña la inmensa mayoría de elementos presentes en sus centros de datos, lo que les da la capacidad de innovar mayor que la competencia, que no cree que pueda imitarles inmediatamente. «Será difícil de replicar para los otros», apunta el directivo.
Eso sí, no llegará a toda la red, ya que los centros de datos que ya están funcionando no se someterán a una remodelación que supondría pararlos y quitar todos sus cables, pero en las decenas de nuevas instalaciones que Amazon está levantando por el mundo sí se pondrá en práctica esta nueva tesis, así que tocará olvidarse de los diagramas y abrazar el caos de lo aleatorio, para pesar de los electricistas.
Actualidad Económica // elmundo
