[ad_1]
//php echo do_shortcode(‘[responsivevoice_button voice=»US English Male» buttontext=»Listen to Post»]’) ?>
En “Origin”, la novela de Dan Brown de 2017 protagonizada por el profesor Robert Langdon, el Centro de Supercomputación Barcelona (BSC) y su potente superordenador MareNostrum forman parte de la trama. En el libro, Langdon descubre un dispositivo llamado E-Wave, un superordenador MareNostrum con un «cubo cuántico», durante una visita al BSC. El dispositivo debe simular esto. Experimento de Miller-Ureyaprovechando la capacidad de E-Wave para avanzar el tiempo digitalmente.
Simulaciones, ficción y drama a un lado, el BSC y el superordenador MareNostrum son reales, pero la arquitectura y las aplicaciones difieren significativamente de las ideas de Dan Brown.
Desde su fundación en 2005, el BSC ha estado promoviendo activamente la HPC (High Performance Computing) en Europa, como un instrumento esencial para la competitividad internacional en ciencia y tecnología. El centro es miembro fundador y anfitrión de la antigua infraestructura europea HPC PRACE (Partnership for Advanced Computing in Europe). Ahora es la unidad de alojamiento de EuroHPC JU, la empresa conjunta que lidera importantes inversiones e implementaciones de HPC en Europa.
EE Times visitó recientemente el Centro de Supercomputación de Barcelona, donde el director Mateo Valero y el director de Operaciones Sergi Girona nos brindaron una descripción general completa del nuevo MareNostrum 5, áreas de investigación clave y una visión de la estrategia y el futuro de la supercomputación europea.
El BSC finaliza el montaje de MareNostrum 5
El nuevo MareNostrum 5 (MN5), que próximamente sustituirá al MareNostrum 4, está compuesto por dos máquinas diferentes y una enorme memoria de alto rendimiento. Girona nos brindó una descripción general de las nuevas características del MN5 y los desafíos que implica prepararlo para su funcionamiento.
Girona, que lleva casi dos décadas en el BSC, ha supervisado el montaje y funcionamiento de los cuatro superordenadores anteriores y ahora está ultimando el montaje de MareNostrum 5.
Hay dos unidades centrales de procesamiento: una máquina de uso general y una máquina acelerada.
“La máquina de uso general ofrecerá un rendimiento sostenido de más de 35 PetaFLOPS en Linpack. Ese es el rendimiento que hemos incluido en las especificaciones”, afirmó. “Mientras trabajamos con una empresa conjunta para instalar estas máquinas a nivel europeo, el objetivo es lograr el máximo rendimiento general de toda la máquina. Esto se logra utilizando una máquina acelerada con aceleradores de gráficos. Es una máquina con un rendimiento máximo de 260 PetaFLOPS, que HPLinpack garantiza mantener en 163 PetaFLOPS”.
La máquina de uso general consta de 35 bastidores del nuevo Atos BullSequana con 1120 nodos de almacenamiento. Cada uno de ellos tiene dos Sapphire Rapids de 40 núcleos y cuatro Nvidia Hoppers. La máquina acelerada se basa en las CPU Nvidia Hopper y Nvidia Grace.
Conectividad más rápida y almacenamiento potente
Para lograr el máximo nivel de rendimiento, el MN5 está interconectado a través de una red NTR200 con diferentes configuraciones.
«La configuración de red para la máquina acelerada es más poderosa que la de la máquina de uso general», dijo Girona. «En la máquina de uso general, cada nodo está conectado a 100 Gbit/s por segundo, y en la máquina acelerada, cada nodo está conectado a 800 Gbit/s».
«Todo esto viene acompañado de un almacenamiento de alto rendimiento, que es un ingrediente fundamental para nosotros», añadió. “Podemos tener mucha potencia informática y almacenamiento, pero el sistema es inútil si no tenemos capacidad de almacenamiento a corto y largo plazo. También instalamos un sistema de discos duros giratorios de 248 petabytes con una capacidad de 2,8 petabytes en flash para que sirvan como almacenamiento de captura”.
El sistema le dará al MN5 velocidades de escritura y lectura de 1,2 y 1,6 terabits por segundo, respectivamente.
Cuando se le preguntó sobre los discos giratorios, Girona mencionó que el costo y el consumo de energía eran los principales factores.
“Las unidades ocupan 25 racks; «Esos 25 bastidores utilizan entre 22 y 23 kilovatios cada uno», dijo. «Esto tiene un impacto significativo en el costo total de propiedad, plano de planta, distribución de energía y mantenimiento de los UPS para estabilizar sus operaciones».
Detrás, el MN5 también tendrá 400 petabytes de cinta para almacenamiento a largo plazo.
Centrarse en el desempeño sostenible
El sitio web Top500.org publica una clasificación de supercomputadoras basada en su rendimiento y eficiencia. Su Informe de junio de 2023 incluyó a LUMI en el puesto número 3 del mundo en términos de velocidad y en el número 7 en términos de eficiencia. LUMI, considerada la supercomputadora europea más rápida, fue construida cerca del Círculo Polar Ártico en Kajaani, Finlandia, para aprovechar el aire fresco subártico. Esto permite alcanzar una eficacia del uso de energía (PUE) de 1,03. Esto significa que el 97% de la potencia entrante es útil para el cálculo. El PUE no es una medición única. El seguimiento del PUE a lo largo del tiempo muestra su rendimiento en comparación con el cálculo de referencia inicial.
Uno de los aspectos de diseño más importantes del MN5 fue lograr el mayor rendimiento con el menor impacto ambiental. Utilizando los mejores sistemas de refrigeración disponibles, el MN5 tiene un PUE objetivo de 1,08. En comparación, MareNostrum 4, que ha estado en producción desde julio de 1017, tiene un valor PUE de 1,4 a 1,5.
«Alcanzar [a low PUE]»Hay que hacer refrigeración líquida en los sistemas», dijo Girona. “Tenemos una capacidad de refrigeración con redundancia de 13 o 14 megavatios. Disponemos de circuitos que proporcionan agua fría a diferentes niveles. La máquina acelerada tiene un circuito superior que utiliza glicol. Le damos agua tibia a 32 grados y con esta agua enfría el sistema. Por otro lado, el sistema de uso general utiliza directamente el agua de nuestra infraestructura, agua con una temperatura de 32 grados, y con esta agua ya enfría los sistemas”. El agua caliente del sistema luego se reutiliza para calentar el edificio principal del BSC. .
Listo para partir pronto
Debido a problemas en la cadena de suministro, principalmente debido a la escasez de semiconductores durante la pandemia de COVID-19, MareNostrum 5 aún no está operativo. Según Girona, la memoria, todas las redes principales y los núcleos de propósito general ya están instalados.
El resto son los sistemas de la máquina acelerada y la parte lógica, el software, que se espera que esté listo este mes (septiembre). Entonces los usuarios pueden migrar inmediatamente.
“El sistema anterior, MareNostrum 4, entró en producción el 1 de julio de 2017, y ese día llegaron los horarios y la máquina estaba llena”, dijo Girona. “Tan pronto como las máquinas arrancan, garantizamos que hemos preparado la pila de software de los usuarios. Ese es el objetivo. Cuando se acepta la máquina, ya está a plena capacidad”.
Una vez que el MN5 esté operativo, la supercomputadora anterior, la MN4, será desacoplada y dividida en diferentes sistemas que se distribuirán por todo el país. El BSC es el coordinador del Red Española de Supercomputación, y distribuirán la mitad de los 48 racks a diversas instituciones. El BSC se queda con la otra mitad para su propia nube y servicios internos.
Centrarse en la investigación en beneficio del público
Desde sus inicios, el principal objetivo del BSC ha sido la investigación y la innovación. El acceso a las máquinas es gratuito. Casi toda la financiación proviene de gobiernos e instituciones públicas. Sólo una pequeña parte del dinero proviene de las empresas, pero éstas no pueden utilizar las máquinas para desarrollar nuevos productos.
Un panel independiente evalúa las propuestas de acceso a los recursos del Centro. Obviamente hay más sugerencias que recursos disponibles. Hay una sobresuscripción de 3 a 1.
Mateo Valero, director del BSC, se unió a nosotros para hablar más sobre la investigación actual con el MN4 y qué esperar del MN4.
Ingeniero con más de cuatro décadas de experiencia, Valero es uno de los fundadores del BSC y lidera la institución desde entonces.
“BSC comenzó en 2005 con 60 empleados y en julio pasado superamos los 900 empleados”, dijo Valero. “Un tercio de esta fuerza laboral proviene de 53 países diferentes, lo que demuestra el carácter internacional del BSC, que se ha convertido en el centro de supercomputación más grande de Europa, no sólo proporcionando infraestructura técnica para la comunidad científica sino también realizando investigaciones de primer nivel”.
Según Valero, el 80% de los investigadores que trabajan en el BSC reciben financiación de proyectos europeos. En 2022, el BSC participó en 12 de los 15 centros de competencia europeos para aplicaciones HPC y lideró cuatro de ellos.
“La capacidad de computación y almacenamiento masivo de MareNostrum 5 nos permitirá avanzar en el análisis masivo de datos para abordar grandes retos de la sociedad, como la lucha contra el cambio climático (Target Earth), la búsqueda de nuevas fuentes de energía y nuevos materiales y nuevos fármacos contra el cáncer. (gemelo digital del cuerpo humano) o la reciente explosión de la inteligencia artificial”, afirmó.
Trabajo en diseño de chips basados en arquitectura RISC-V
Según Valero, el BSC inició la revolución RISC-V en Europa con la premisa de que RISC-V puede permitir dos cambios significativos: investigación de alta fidelidad con chips desarrollados en Europa y autonomía digital para Europa.
En el ámbito de la investigación, BSC ha sido líder con diseños de procesadores vectoriales en la European Processor Initiative (EPI), MEEP, EUPILOT y eProcessor. BSC comenzó a desarrollar sus chips con la familia de CPU Lagarto, con el primer lanzamiento en mayo de 2019, en 65 nm. «Hoy estamos en la cuarta generación del núcleo Lagarto y apuntamos a 7 nm y más en un futuro próximo», dijo Valero.
La capilla alberga dos ordenadores cuánticos.
Una vez que el MN4 sea desmantelado y la mitad de los racks hayan abandonado las instalaciones, en 2024 se instalarán en la instalación dos ordenadores cuánticos, uno basado en corrientes superconductoras gracias al proyecto QuantumSpain y otro ordenador cuántico cuya arquitectura aún está por definir ante EuroHPC.
Las máquinas cuánticas también se conectarán a MN5, lo que permitirá a los científicos explorar el nuevo campo de la computación cuántica y acceder a una de las supercomputadoras más poderosas del mundo.
MareNostrum 6 pretende utilizar tecnología europea
Valero cree que Europa necesita desarrollar aún más su arquitectura de procesador de código abierto, dijo, y agregó que el misil más pequeño que podría causar el mayor daño a la humanidad hoy será uno dirigido a las fábricas de TSMC en Taiwán. Esto podría retrasar la innovación en más de cinco años.
Valero y Girona ya tienen en la mira el próximo superordenador del BSC, el MareNostrum 6. Quieren que se base principalmente en tecnología europea, en particular en procesadores de arquitectura RISC-V.
Por este motivo, el BSC cuenta con una entidad denominada “ chip abierto, cuyo objetivo es desarrollar núcleos y software RISC-V y compartirlos con el mercado. El objetivo final es desarrollar MareNostrum 6 y reducir su dependencia del resto de arquitecturas.
“El objetivo del proyecto era demostrar que el BSC, que apuesta firmemente por el desarrollo de un procesador fabricado en Europa, es capaz de desarrollar estas tecnologías, y de hecho lo hemos conseguido”, afirma Valero.
[ad_2]