- The LG soundbar I prefer for my home theater slaps with immersive audio - and it's not the newest model
- Samsung's new flagship laptop rivals the MacBook Pro, and it's not just because of the display
- Email marketing is back and big social is panicking - everything you need to know
- Revisiting Docker Hub Policies: Prioritizing Developer Experience | Docker
- The most critical job skill you need to thrive in the AI revolution
AI 혁신 플랫폼, 꼭 ‘클라우드 빅3’여야 할 이유 없더라

AWS, 마이크로소프트, 구글이 엔터프라이즈 클라우드 시장을 계속 지배하겠지만, 차상위(second-tier) 클라우드 제공업체의 미래가 암울한 것은 아니다. 이들은 전문적인 워크로드와 사용 사례를 가진 조직들에게 가치 있는 파트너임을 증명해가고 있다. AI가 급성장하는 동향이 이에 힘을 더한다.
아토스 테라퓨틱스(Athos Therapeutics)가 그러한 전문 니즈를 가진 기업 중 하나다. 이 생명공학 기업은 이전에 AI 워크로드를 사내에서 실행했지만 최근 델의 HGX H100 파워엣지 서버에서 실행된는 서비스형 GPU인 벌처 클라우드 GPU(Vultr Cloud GPU)를 선택했다. 자체 개발한 AI 모델을 훈련하고 자가면역 및 암 질환을 해결하기 위한 AI 기반 정밀 의학 플랫폼을 구축하기 위한 용도에서다.
계약을 체결하기에 앞선 작년 여름, 아토스와 벌처, 델 3사는 아토스의 요구를 충족하는 파일럿 프로젝트에 협력했다고 아토스의 AI 및 ML 담당 부사장인 준 구오는 전했다.
구오는 아토스가 소규모 온프레미스 인프라를 포기하고 벌처의 전문 클라우드 플랫폼을 선택한 이유를 몇 가지 언급했다. 온프레미스 인프라 유지에 소요되는 전기 및 인터넷 비용과 대규모 모델을 훈련하기 위한 보안 필요성 등이 그것이다. 그는 벌처로 이전함에 따라 비용 면에서 이득을 기대하고 있다고 밝혔다.
구오는 “AI 알고리즘을 훈련하기 위해 온프레미스 서버를 사용했는데, 전력 공급, 인터넷 대역폭 등의 인프라 문제가 점점 커졌다. 이러한 문제를 해결할 수 있는 벤더를 찾아야만 했다”라며, 서비스형 모델로의 전환이 회사의 정밀 치료 플랫폼 개발에도 도움이 된다고 덧붙였다.
틈새 시장 요구, 틈새 시장 솔루션
차상위 클라우드 IaaS 벤더로는 벌처, IBM, 알리바바, 아카마이, OVH클라우드, 텐센트, 화웨이 등이 있다. 이들은 비용 절감 효과와 AI 모델 훈련, 튜닝, 추론 서비스의 유연성을 내세움으로써 지적 재산, 유전체학 데이터, 독점 AI 알고리즘에 필요한 보안과 기밀성을 제공한다고 애널리스트들은 평가했다.
클라우드 및 AI 전문가인 데이비드 린시컴은 “Vultr, Akamai, IBM, Alibaba, Tencent, Huawei와 같은 차상위 클라우드 업체들은 틈새 시장과 특정 고객 요구에 집중한다는 점에서 차별화된다”라며, “이러한 제공업체들은 전문화, 유연성, 비용 효율성이 중요한 분야를 성공적으로 공략하고 있다”라고 말했다.
구오는 아토스가 벌처의 서비스를 전환한 중요 이유 중 하나로 지적 재산권 보호를 지목했다. 자사의 모델 IP를 더 잘 보호할 수 있을 뿐 아니라 업계 규정과 규정을 준수할 수 있기 때문이라는 설명이다. 또한 서비스형 GPU 모델은 방대한 양의 유전체학 데이터 다운로드, 인터넷 업데이트, 엔비디아 카드 교체 등 AI 인프라의 유지 관리 요구 사항을 최소화한다고 그는 덧붙였다.
아토스는 AWS, 구글 클라우드, 마이크로소프트 애저 등 3대 하이퍼스케일러의 서비스도 검토했다. 그러나 내부 분석 결과 이들 플랫폼에서 알고리즘을 훈련하고 다양한 유형의 과학적 옴니 데이터의 규모를 조정하는 작업의 비용이 높을 것으로 추정됐다.
구오에 따르면 아토스의 데이터는 사람의 혈액, 대변, 조직 샘플에서 추출되기 때문에, 멀티 옴니컬 데이터 구조를 갖추고 있다. 즉 텍스트, 오디오, 비디오와 다른 특성을 가지며, 표준적인 AI 모델을 사용하기 어렵다. 정밀 치료에 사용되는 데이터의 다양성과 양이 너무 많기 때문에, 아토스는 자체적인 AI 알고리즘과 AI 모델을 구축해야 한다. 아토스는 이 모델을 완전히 완성한 후에 다른 생명공학 및 제약 회사에 상용화하는 방안도 검토하고 있다.
또한, 벌처와 델은 대부분의 클라우드 벤더가 제공할 수 있는 것보다 더 비용 효율적인 엔지니어링 지원을 아토스의 자율 AI 분석 플랫폼과 데이터 레이크에 제공할 수 있었다고 구오는 덧붙였다.
이제 벌처의 클라우드 GPU 플랫폼이 아토스의 AI 모델 훈련, 미세 조정, 추론 서비스를 실행한다. 또한, 아토스의 지적 재산, 대규모 유전체 데이터 세트, 독점적인 AI 알고리즘에 필요한 보안과 기밀성을 제공한다.
클리블랜드 클리닉 및 라헤이 병원 & 의료 센터와 파트너십을 맺고 있는 이 기업은 벌처 서비스를 이용한 이후 지금까지 수십억 개의 매개 변수와 멀티 옴니즘 데이터를 가진 여러 모델을 개발했으며, 2만 5,000명 이상의 환자에 대한 분석을 수행했다. 구오는 “이전의 사내 서버와 비교했을 때, 속도가 엄청나게 빨라졌다. 종전의 10배에 달한다”라고 말했다.
풍부한 혁신 도구
AI 골드 러시는 순수 GPU 서비스(pureplay GPU-as-a-service)를 제공하는 틈새 플레이어와 다양한 클라우드 옵션을 호스팅하는 차상위 공급업체의 부상을 이끌었다 후자의 경우 서비스형 GPU를 포함하여, 거대 3대 하이퍼스케일러와 매우 흡사한 서비스를 갖추고 있다. IDC 애널리스트 데이브 맥카티는 GPU 서비스 모델만을 제공하는 스타트업인 코어위브(CoreWeave)의 등장으로 GPU 서비스가 새로운 용어로 등장했다면서도, 사실 AWS, 마이크로소프트, 구글과 같은 대기업들은 이미 수년 전부터 이 서비스를 제공해왔다고 전했다.
맥카시는 벌처가 서비스형 GPU 외에 다양한 클라우드 서비스를 제공하기 때문에 빅3 하이퍼스케일러와 꽤 비슷하다고 설명했다. 2014년에 출범한 벌처는 초기 클라우드 플랫폼을 설계한 개발자들이 설립한 회사로, 고객들이 빠르게 확장할 수 있도록 독특한 제어판과 자동화 기능을 제공한다. 이 플랫폼은 원래 게임 회사와 SaaS 스타트업에서 매우 인기가 있었다.
특히 엔비디아 및 델과 파트너십을 맺으면서 이 회사는 이제 AI 워크로드를 지원하는 유연하고 확장 가능한 글로벌 클라우드 컴퓨팅, 클라우드 GPU, 베어 메탈 및 클라우드 스토리지 솔루션을 통해 전 세계 기업을 대상으로 하고 있다.
예를 들어, 벌처의 서비스형 CPU 상품은 AMD의 인스팅트 MI300X 가속기와 엔비디아 GPU(AI/ML 및 고성능 컴퓨팅용 GH200, HGX H100, A100, L40S, A40, A16 포함)에 대한 액세스를 제공한다.
린시컴은 벌처가 간단한 가격 정책과 단순성으로 개발자, 스타트업, 중소기업에 어필하는 반면, 아카마이는 미디어, 게임, 지연 시간에 민감한 애플리케이션을 위한 엣지 컴퓨팅과 콘텐츠 전달 분야에서 우위를 점하고 있다고 평가했다.
그는 또 IBM이 하이브리드 클라우드 솔루션 분야에서 선두를 달리고 있으며, 미국과 유럽의 의료 및 금융과 같은 규정 준수가 중요한 산업에 중점을 두고 레거시 시스템을 관리하는 기업을 대상으로 하고 있다고 덧붙엿다. 이 밖에 지리적 측면에서는 알리바바, 텐센트, 화웨이가 아시아에서 지배적인 입지를 확보하고 있다는 설명이다.
한편 미국과 유럽의 기업들에게 차상위 클라우드 제공업체의 매력은 공급업체의 다양성, 비용 절감, 그리고 AWS, 구글 클라우드 플랫폼, 또는 애저의 확장성과 복잡성을 필요로 하지 않는 AI와 특수한 작업 부하를 지원할 수 있는 능력이라고 린시컴은 덧붙였다.
액센츄어의 클라우드 퍼스트 애널리스트인 술라브 스리바스타바는 차상위 클라우드 업체들이 중소기업, 지역 기업, 규제 대상 산업을 위한 다양한 전문 서비스를 제공하며, AI/ML 훈련 및 추론 활용 사례에 대한 비용 절감 등의 주요 이점을 제공한다고 말했다. 스리바스타바는 하이퍼스케일러의 GPU 컴퓨팅 인프라를 통한 AI 모델 훈련 비용이 일반적으로 더 높다고 덧붙였다.
그는 “엔비디아 프리퍼드 파트너로서 벌처는 AI 워크로드를 위한 비용 효율적인 대안으로서 돋보이는 존재다. AI/ML 훈련의 문턱을 낮출 존재로 자리매김하고 있다”라고 말했다.
이는 아토스 테라퓨틱스가 자체 개발한 모델을 구축하고 훈련하기 위한 플랫폼을 개발하는 데 있어 벌처-델 솔루션을 선택한 이유이기도 하다. 구오는 “우리에게는 레거시 데이터, 코드, 플랫폼이 전혀 없다. 적어도 유전체학 데이터로 모델을 훈련하는 데 있어서는 벌처와 델의 제안이 매우 합리적이다”라고 말했다.
dl-ciokorea@foundryco.com