AWS, 딥시크 R1 모델 공식 지원··· 생성형 AI 서비스 강화  

중국 AI 기업인 딥시크는 2024년 12월 딥시크 V3를 출시한 이후, 2025년 1월 20일 딥시크 R1, 딥시크 R1 제로, 딥시크 R1 디스틸 모델을 공개했다. 또한, 1월 27일에는 비전 기반 야누스 프로 7B(Janus-Pro 7B) 모델을 공개했다. 딥시크에 따르면, 해당 모델들은 기존 대비 90~95% 비용 절감 및 비용 효율성을 제공하며, 강화 학습 기법을 적용해 우수한 추론 능력을 갖췄다.

AWS는 고객이 딥시크 R1모델을 다양한 방식으로 활용할 수 있도록 지원한다. 아마존 베드록에서는 API를 통해 사전 학습된 모델을 쉽게 통합할 수 있으며, 아마존 세이지메이커 AI를 통해 맞춤형 학습과 배포가 가능하다. 또한, AWS 트레이니움과 AWS 인퍼런시아를 활용하면 딥시크 R1 디스틸 모델을 더욱 경제적으로 운영할 수 있다. AWS는 보안성과 확장성을 강화하기 위해 아마존 베드록 가드레일(Amazon Bedrock Guardrails)을 활용할 것을 권장했다. 아마존 베드록 가드레일은 생성형 AI 애플리케이션의 입력 및 출력 데이터를 모니터링하고 유해 콘텐츠를 필터링을 지원하는 도구다.

딥시크 R1모델은 현재 AWS에서 네 가지 방식으로 배포할 수 있다. 아마존 베드록 마켓플레이스에서는 모델 카탈로그에서 딥시크 R1을 검색하여 배포할 수 있으며, 아마존 세이지메이커 점프스타트를 통해 머신러닝 허브에서 클릭 한 번으로 배포 및 활용이 가능하다. 또한, 아마존 베드록 커스텀 모델 임포트를 활용하면 딥시크 R1 디스틸 모델을 맞춤형 모델로 가져와 활용할 수 있으며, AWS EC2 Trn1 인스턴스(AWS EC2 Trn1 Instance)를 사용하면 딥시크 R1 디스틸 모델을 AWS 트레이니움 및 AWS 인퍼런시아 기반 인프라에서 최적의 성능과 비용 효율성을 제공하며 실행할 수 있다.
dl-ciokorea@foundryco.com



Source link

Leave a Comment