- How to find out if an AirTag is tracking you - and what to do about it
- Banco Sabadell evoluciona la experiencia digital de sus clientes
- Microsoft and partners invest $72 million to launch AI Hub in New Jersey
- Scam Alert: Fake Minecraft, Roblox Hacks on YouTube Hide Malware, Target Kids | McAfee Blog
- From fitness to diagnosis: How your wearable's next trick could transform healthcare
AI 방정식 바뀔 수도··· CIO를 위한 '딥시크' 체크포인트
중국 AI 스타트업 딥시크(DeepSeek)가 공개한 오픈소스 버전 추론 모델 딥시크-R1(DeepSeek-R1)의 충격파가 거세다. 이 스타트업은 자사의 모델이 오픈AI의 o1 생성적 사전 훈련 트랜스포머(GPT)보다 성능이 우수하다고 주장했다.
이 소식이 전해준 이후 엔비디아의 시가총액은 27일 6,000억 달러 하락했다. 가트너에 따르면, 딥시크의 혁신적 측면은 훨씬 낮은 수준의 하드웨어와 여타 자원을 사용하면서도 다른 선도적 LLM과 비슷한 성능을 제공한다는 데 있다.
IDC 소프트웨어 시장 조사 및 자문 실무의 그룹 부사장 겸 전 세계 AI, 자동화, 데이터 및 분석 연구 부문 총괄인 리투 조티 도 “딥시크의 등장은 더 접근하기 쉽고 저렴한 AI 솔루션으로 이어질 수 있다. 그러나 전략적, 경쟁적, 품질 및 보안 요소를 신중하게 고려해야 한다”라고 말했다.
해석의 여지
양자 기술, 인공지능, 디지털 R&D, 신흥 기술을 주로 다루는 가트너의 부사장 애널리스트 치라그 데카테는, 시장이 딥시크의 혁신적 측면에 대해 과잉 반응하고 있다고 봤다. “미지의 존재에 대한 감각적 반응들이 있다. 맹목적 애국주의(jingoism), 민족주의적 내러티브가 촉발되기도 한다. 이러한 내러티브는 상상력을 빠르게 자극한다. 그러나 기술 보고서를 열어 세부 사항을 보면 헤드라인들의 문구만큼 자극적이지 않다”라고 말했다.
그렇다고 해서 그가 딥시크의 혁신성을 무시하는 것은 아니다. 가트너는 연구 노트에서 딥시크가 일반적인 생성형 AI 비용 구조와 방법론에 도전한다며, 오늘날 현재 주요 공급업체 가격 모델의 비효율성을 드러낸다고 평가했다.
하리타 칸다바투, 제레미 드호인, 리타 살람, 레이나 라모스, 아룬 찬드라세카란 등 가트너의 연구원들은 29일 연구 노트에서 “딥시크의 R1 모델은 생성형 AI의 미래가 단순한 계산력을 통한 확장이라는 기존 패러다임이 아닌, 혁신적이고 비용 효율적인 접근 방식에 있음을 시사하는 중요한 변화를 나타낸다”라고 기술했다.
IDC의 성능 집약적 컴퓨팅 및 전 세계 인프라 연구 담당 부사장 피터 러튼은 딥시크와 관련해 주목할 점이 있다며, 그것은 더 크고, 더 많고, 더 빠른 아키텍처를 통해서만 AI가 개선될 수 있다는 이론에 기반한 현재의 AI 학습 접근 방식을 뒤흔든다는 점이라고 전했다.
그는 “AI 개발을 위한 알고리즘, 프레임워크, 소프트웨어에 대해 새롭게 접근한다. 결과적으로 최신 버전의 챗GPT와 비슷하거나 더 나은 결과를 더 낮은 인프라 비용으로 구현한다. 이것이 의미하는 바는 AI 학습이 대규모 인프라 구축에 수십억 달러를 투자할 수 있는 하이퍼스케일러의 전유물이 될 필요가 없다는 것이다”라고 말했다.
즉 딥시크의 접근 방식은 비용과 설치 공간 측면에서 일반 기업도 대규모 AI 개발을 할 수 있음을 의미한다고 그는 덧붙였다.
러튼은 이어 “중소 규모의 AI 이니셔티브도 훨씬 더 저렴해질 수 있다. 모델을 사용자 지정하거나 파인튜닝하고 모델을 추론하는 등의 작업이 이에 해당한다. 나는 AI 워크로드가 앞으로 다른 워크로드만큼이나 저렴해질 것이라고 믿는다. 딥시크가 개발한 유형의 기술로 인해서다”라고 말했다.
CIO들의 주요 관심사
데카테는 딥시크 소식이 AI 혁신의 가속화를 반영하는 한 사례라며 CIO들이 빠르게 생성형 AI에 참여하지 않으면 시대에 뒤떨어질 수 있음을 시사한다고 평했다. 그는 “지금 바로 뛰어들어 실험을 시작하고 생성형 AI 전략, 구현 및 배포 전략을 수립하느냐, 아니면 아니면 따라잡을 수 없을 정도로 뒤처지게 되느냐, CIO들이 당면한 선택지다”라고 말했다.
그에 따르면 딥시크가 현재의 생성형 AI 지형을 파괴하는 정도에 대해 시장이 과민하게 반응하고 있을 수 있다. 그러나 CIO가 더 이상 기다릴 여유가 없다는 신호인 것은 분명하다. 데카테는 “생성형 AI의 비용 벡터가 결국 더 효과적이고 더 접근하기 쉬워질 것임을 딥시크는 보여주고 있다”라고 말했다.
IDC의 조티에 따르면, 중국 AI 스타트업들이 효율성 창출에 집중할 것이라는 카이푸 리의 작년 예측에 주목할 만하다. 카이푸 리는 마이크로소프트 리서치 아시아의 창립 이사이자 전 구글 차이나 사장인 시노베이션 벤처스의 회장 겸 CEO다. 조티는 “그들의 비결을 파헤쳐보면 RL(강화 학습)과 이의 사용법으로 귀결되는 듯하다. 대부분의 언어 모델은 사전 학습, 감독을 통한 파인튜닝, 그리고 약간의 RL을 통해 다듬는 과정을 거친다. 딥시크의 접근 방식은 LLM이 오로지 RL만으로 추론 작업을 수행할 수 있음을 보여줬다”라고 말했다.
차별화 꾀하기
딥시크-R1은 딥시크-V3 베이스 모델에 기반한 새로운 오픈 웨이트 LLM다. 딥시크-R1-제로(DeepSeek-R1-Zero)는 RL을 통해서만 학습된 중간 모델이다. 가트너에 따르면 이는 모델 제공자가 순수 RL(pure RL)을 사용하여 특정 영역에서 역량을 향상시킬 수 있음을 입증했다. ‘특정 영역’은 수학이나 코딩과 같이 답을 생성하기는 어렵지만 검증하기는 쉬운 영역을 말한다.
그러나 딥시크 모델이 새로운 모델 패러다임을 대표하는 것은 아니라고 가트너의 연구진은 말했다. 기존의 LLM 학습 아키텍처에 기반하여 학습과 추론의 효율성을 높이기 위해 기술 및 아키텍처 최적화를 계층화했다고 볼 수 있다는 설명이다. 또 딥시크가 모델 성능의 새로운 기준을 제시하지도 않는다. 성능 측면에서 기존의 최신 모델과 비슷하지만 능가하지는 않는다고 연구진은 덧붙였다. 이 밖에 딥시크가 하드웨어와 데이터를 추가 투입해 모델을 확장하는 것이 중요하지 않다는 증거는 아니다. 오히려 더 효율적인 모델을 확장하는 것이 더 효과적이라는 것을 보여준다고 이들은 강조했다.
“딥시크 R1 출시, 그리고 이 모델이 보여주는 오픈AI o1-프리뷰 모델 대비 획기적으로 낮은 추론 가격은 LLM 모델 계층의 광범위한 보급을 시사한다. 더 이상 토큰당 비용으로 효율성을 살펴볼 일이 아니라는 의미이기도 하다. 어떤 모델이 정확도와 지연 시간을 유지하면서 가장 저렴하게 추론할 수 있는지에 관한 것이다. 따라서 앞으로의 초점은 AI의 효율적인 확장을 향할 것이다. 얼마나 많은 컴퓨팅을 조합할 수 있는 지와 비교되는 초점이다”라고 연구진은 기술했다.
가트너의 연구진들은 동료인 데케테의 의견에 동의하면서, 딥시크 발표 이후 메타 같은 다른 모델 구축 업체들이 후속 계획을 숨가쁘게 수립하고 있다고 언급했다. 따라서 CIO는 중단기적으로 LLM의 비용과 가격이 급격히 하락하는 상황을 예상할 필요가 있다.
연구진은 이어 “이러한 소프트웨어 및 알고리즘 중심의 혁신으로 인해 모델 공급업체는 더 강력한 하드웨어로 더 많은 일을 할 수 있다. 그러나 첨단의 새 모델은 여전히 높은 R&D 및 컴퓨팅 비용을 요구할 것이며, 얼리 어답터를 대상으로 할 것”이라고 전했다.
한편 IDC의 조티는 현 국면에서 CIO를 위한 5가지 핵심을 다음과 같이 제시했다.
비용 효율성: 주장에 따르면 딥시크의 AI 모델은 기존 모델에 비해 훨씬 적은 비용으로 높은 성능을 달성한다. 이는 기업이 인프라와 하드웨어에 많은 투자를 하지 않아도 된다는 것을 의미한다. 잠재적으로 고급 AI 기능에 대한 진입 장벽이 낮아질 수 있다.
경쟁 환경: 오픈AI 및 메타와 같은 기존 AI 대기업의 강력한 경쟁자로 딥시크가 부상했다. AI 환경이 더욱 경쟁이 치열해지고 있음을 시사한다. 혁신이 가속화되는 한편, 기존 제품의 개선과 가격 하락을 기대할 수 있다.
오픈 웨이트 모델: 딥시크는 자사의 모델을 ‘오픈 웨이트'(open-weight)로 공개하기로 결정했다. 즉 외부의 개발자와 연구자들이 딥시크의 기술에 액세스하고 이를 기반으로 구축할 수 있다. 이러한 개방성은 AI 커뮤니티에서 보다 협력적인 환경을 조성하여 발전과 응용을 가속화할 수 있다.
전략적 재평가: 딥시크가 더 적은 데이터와 더 낮은 비용으로 고성능 AI를 달성할 수 있음을 입증한 만큼, CIO는 AI 전략을 재평가해야 할 필요가 있다. 여기에는 현재 AI 인프라에 대한 투자를 평가하고 보다 비용 효율적인 대안을 고려하는 것이 포함된다.
데이터 프라이버시 및 보안: 딥시크가 중국에 기반을 두고 있다는 점을 고려할 때 데이터 프라이버시 및 보안에 대한 우려가 있을 수 있다. CIO는 서로 다른 규제 환경에서 운영되는 기업의 기술을 통합하는 것이 어떤 영향을 미치는지 신중하게 고려해야 한다.
포레스터의 수석 애널리스트인 카를로스 카사노바, 미셸 펠리노, 미셸 괴츠는 CIO들이 딥시크가 엣지 컴퓨팅 기술, AI옵스, IT 운영에 영향을 미칠 것으로 예상해야 한다고 덧붙였다. 특히, 딥시크는 기본적으로 답변을 설명할 수 있는 기능을 갖추고 있어 AI 기반 의사 결정에 대한 신뢰와 이해를 구축하는 데 중요한 투명성을 제공한다.
그들은 “엣지 장치에서 실행되는 LLM을 사용하면 AIOps와 가시성을 통해 새로운 수준의 실시간 통찰력과 자동화를 달성할 수 있다. 엣지에서 실행할 수 있는 작은 설치 면적의 LLM(예: 딥시크 R1)을 AI옵스와 통합하면 장치와 인프라를 보다 능동적이고 예측적으로 유지보수하거나 사람의 개입 없이 위험 완화 조치를 취할 수 있다”라고 기술했다.
dl-ciokorea@foundryco.com