Frontier, la primera supercomputadora Exascale del mundo totalmente impulsada por AMD, ha tenido problemas desde que se encendió

La supercomputadora Frontier del Laboratorio Nacional de Oak Ridge (ORNL) ha capturado la atención del mundo tecnológico y científico por ser la primera computadora Exascale del mundo, impulsada por AMD. Sin embargo, tras su encendido, ha enfrentado serios problemas de funcionamiento que han puesto en duda su confiabilidad y capacidad para cumplir con las expectativas iniciales.

¿Qué es Frontier?

Frontier es un sistema de computación que ha sido diseñado para operar a niveles de exaescala, lo cual implica poder alcanzar velocidades de procesamiento superiores a los un quintillón (1018) de operaciones por segundo (FLOPS). Utilizando procesadores EPYC Trento de AMD y aceleradores MI250X Instinct, se previó que Frontier serviría de plataforma para investigaciones avanzadas en múltiples campos, desde la climatología hasta la biomedicina.

Mejoras en la investigación científica

Se anticipó que, gracias a su potencia, Frontier permitiría a los investigadores manejar simulaciones y modelos de datos que de otra forma serían imposibles. La arquitectura Cray EX de HPE fue diseñada para permitir acceso a gran escala a las aplicaciones, brindando apoyo a los científicos en sus investigaciones desde el Año 2023. Sin embargo, el sistema se enfrenta actualmente a complicaciones técnicas que impiden ruido de fondo en sus operaciones.

Problemas técnicos de Frontier

A pesar de sus capacidades prometedoras, Frontier ha tenido que lidiar con fallos de hardware que han llevado a suspensiones en su funcionamiento. Según informes recientes, el sistema no puede operar un día completo sin experimentar varios fallos en el hardware. Esto plantea inquietudes sobre la estabilidad del funcionamiento y su eficacia en el procesamiento de datos a gran escala.

Interconexiones Slingshot

Uno de los conflictos más significativos parece originarse de las interconexiones Slingshot, que han presentado desafíos de integración con los clústeres HPE. Existen rumores de que las GPU de cómputo AMD y los procesadores EPYC están teniendo dificultad para comunicarse adecuadamente con este sistema de interconexión. En ausencia de detalles específicos sobre estos fallos, las conjeturas continúan. Sin embargo, Mike Bernhardt del Proyecto de Computación Exascale del Departamento de Energía (DOE) indica que la integración completa de Frontier se espera para el próximo año, aunque sin declarar los problemas específicos que están afectando su rendimiento.

Implicaciones futuras de Frontier

La supercomputadora Frontier tiene potencial para revolucionar la investigación científica si logra resolver sus problemas técnicos. A medida que avanzamos hacia un futuro en el cual el procesamiento de datos se vuelve cada vez más crucial para resolver problemas complejos, la capacidad de Frontier para procesar a escalas inmensas será fundamental.

  • Impacto en la climatología: Simulaciones más precisas para modelar el clima.
  • Investigaciones biomédicas: Capacidad para modelar procesos biológicos a niveles sin precedentes.
  • Innovaciones tecnológicas: Acercar tratamientos personalizados en medicina.

Conclusión

Mientras Frontier sigue lidiando con estos desafíos, su importancia en el futuro del computo Exascale no debe subestimarse. Con el apoyo de socios como HPE y AMD, hay esperanzas de que estas dificultades puedan ser superadas y de que Frontier pueda, finalmente, tomar su lugar como un hito tecnológico en la historia de la computación avanzada. Por ahora, los ojos del mundo están puestos en cómo se resolverán estos problemas y qué significará esto para la ciencia y la tecnología en el futuro.

Referencias:

Fuentes de noticias: InsideHPC, Tom’s Hardware

À propos de l'auteur :

Arnaud Chicoguapo

0 0 votes
Article Rating
Subscribe
Notify of
guest
0 Comments
Oldest
Newest Most Voted
Inline Feedbacks
View all comments
0
Would love your thoughts, please comment.x
()
x