- The Role of Security Configuration Management in Achieving Zero Trust
- Did you play Pokémon Go? You didn't know it, but you were training AI to map the world
- “AI 압박 늘었지만 13%만이 준비됐다고 생각”··· 시스코, ‘2024 AI 준비지수’ 발표
- ‘속도 비용·난이도 제각각’··· 기업이 LLM을 도입하는 7가지 방법
- I CIO e le spese ambiziose per l’AI nel 2025. E oltre
HPE, 美 로렌스 리버모어 국립연구소에 DLC 엑사스케일 슈퍼컴퓨터 '엘 캐피탄' 구축
이번 구축으로 HPE는 지금까지 출시된 3개의 엑사스케일 시스템을 모두 담당한 기업이 됐다. 엘 캐피탄은 1.742 엑사플롭스의 성능을 자랑하며, 와트당 58.89 기가플롭스의 성능을 달성한 100% 팬리스 직접 수냉 방식(DLC) 시스템이다. 세계에서 가장 에너지 효율적인 시스템 상위 20위에 이름을 올렸다.
HPE의 HPC 및 AI 인프라 솔루션 부문 수석 부사장 겸 총괄 트리시 댐크로거는 “엘 캐피탄은 엑사스케일 슈퍼컴퓨팅의 중요한 이정표를 세웠다. 엘 캐피탄은 뛰어난 성능과 에너지 효율성을 제공하며, AI 기반 과학적 발견을 가속화하고 국가 안보를 강화하는 동시에 재생 가능 에너지 분야에서 새로운 기회를 창출할 수 있는 역량을 갖추고 있다. 미국 에너지부, 국가핵안보국, LLNL 및 AMD와의 강력한 파트너십과 수년간의 연구개발 결과로 이루어진 이 성과를 자랑스럽게 생각하며, 엘 캐피탄이 이끌어낼 미래의 성과와 엔지니어링 혁신을 기대한다”라고 말했다.
HPE에 따르면 엘 캐피탄은 미국이 국가 안보 분야에서 경쟁력을 유지할 수 있도록 지원하며, 국가핵안보국(NNSA)의 세 연구 기관(LLNL, 샌디아 국립 연구소, 로스앨러모스 국립 연구소)이 증가하는 요구사항을 충족하고, 국가 핵무기 비축의 안전성, 보안 및 신뢰성을 보장하며, 현재를 포함한 향후 비축 현대화 작업을 수행할 수 있도록 한다. 또한, LLNL은 기밀과 비기밀 작업에 인공지능(AI) 모델을 적극적으로 활용할 계획이다.
LLNL의 무기 시뮬레이션 및 컴퓨팅 프로그램 책임자 로브 닐리는 “지난 5년간 HPE 및 AMD와 협력하여 엘 캐피탄을 성공적으로 구축하게 됐다. 오랫동안 기다려온 이 시스템은 고정밀 3D 모델링과 시뮬레이션을 통해 국가 안보 임무를 효과적으로 수행할 수 있는 기반을 제공한다. 많은 팀원들이 전문가 그룹에 속한 HPE의 지원을 받으며 애플리케이션을 준비해 시스템의 성능을 최대한 발휘할 수 있도록 노력했다. 이제 이 시스템의 역량을 후원자와 지지자들에게 선보일 날을 기다리고 있다. 또한, 엘 캐피탄에서 AI에 대한 투자를 지속적으로 확대할 계획이며, 대규모 AI 학습 및 추론을 통해 계산을 더 빠르고 효율적으로, 그리고 잠재적으로 더 정확하게 수행할 것이다. 모델링, 시뮬레이션 및 AI 워크로드를 단일 시스템에서 모두 처리할 수 있는 역량을 갖추게 된 것은 중요한 진전을 이룬 것”이라고 말했다.
엘 캐피탄은 핵 확산 방지 및 대테러 활동 등 국가 안보 유지를 위한 부차적인 임무뿐만 아니라 재료 발견, 핵 데이터, 고에너지 밀도와 같은 과학 분야에서도 활용될 예정이다. 특히, 국가 점화 시설(National Ignition Facility)에서 진행되는 관성 구속 핵융합 연구를 지원할 계획이다. 엘 캐피탄에서 진행된 연구를 통해 확보한 인사이트는 에너지 안보, 기후 변화, 전력망 현대화, 신약 개발 등 다양한 분야의 비기밀 프로젝트에도 폭넓게 활용될 전망이다.
엘 캐피탄의 성능은 HPE의 슈퍼컴퓨팅 솔루션인 HPE 크레이 EX(HPE Cray EX)를 기반으로 한 혁신적인 플랫폼에서 비롯된다. 이 플랫폼은 CPU 코어, GPU 코어 및 고대역폭 메모리(HBM)를 단일 패키지로 통합한 AMD 인스팅트 MI300A APU와 HPE 슬링샷(HPE Slingshot) 인터커넥트, 그리고 맞춤형 스토리지 솔루션을 갖추고 있다. HPE 슬링샷은 시스템의 백본 역할을 하는 이더넷 기반의 고속 패브릭으로, 엘 캐피탄의 11,000개 이상의 노드를 연결해 대규모 계산을 수행할 수 있게 한다.
또한, HPE와 LLNL은 공공-민간 파트너십의 일환으로 맞춤형 근접 노드 로컬 스토리지 솔루션을 공동 개발했다. 지연 시간을 줄이기 위해 만들어진 이 솔루션은 동적으로 구성되며, 모든 컴퓨팅 노드에서 공유되는 글로벌 러스터(Lustre) 기반 파일 시스템에 계층적으로 연결되어 운영 효율성을 극대화한다.
엘 캐피탄은 뛰어난 성능은 물론 에너지 효율성을 최우선으로 고려해 설계되었다. HPE의 업계 최초 100% 팬리스 직접 수냉 방식(DLC) 시스템 아키텍처를 통해 고집적도 설계를 가능하게 했으며, 8개의 냉각 요소를 통해 효율성을 극대화했다.
dl-ciokorea@foundryco.com