IBM, 새로운 AI 모델 '그래니트 3.0' 발표

  • 범용/언어 모델: 그래니트 3.0 8B 인스트럭트(Instruct), 그래니트 3.0 2B 인스트럭트, 그래니트 3.0 8B 베이스(Base), 그래니트 3.0 2B 베이스
  • 안전 장치 및 안전성 모델: 그래니트 가디언(Guardian) 3.0 8B, 그래니트 가디언 3.0 2B
  • 혼합 전문가 모델: 그래니트 3.0 3B-A800M 인스트럭트, 그래니트 3.0 1B-A400M 인스트럭트, 그래니트 3.0 3B-A800M 베이스, 그래니트 3.0 1B-A400M 베이스

새로운 그래니트 3.0 8B 및 2B 언어 모델은 기업 AI에 최적화된 ‘주력’ 모델로 설계돼, RAG(Retrieval Augmented Generation: 검색 증강 생성), 분류, 요약, 엔터티 추출 및 도구 사용과 같은 다양한 작업에서 고성능을 발휘한다. 이 모델들은 소형이면서도 매우 유연해 기업 데이터를 기반으로 세밀하게 조정할 수 있으며, 다양한 비즈니스 환경과 워크플로우에 손쉽게 통합되도록 설계됐다.

IBM에 따르면 대부분의 대규모 언어 모델(LLM)은 공개 데이터를 기반으로 훈련되며, 기업의 데이터를 활용하는 경우는 아직 많지 않다. IBM은 지난 5월 레드햇(RedHat)과 함께 선보인 정렬 튜닝 기법 인스트럭트랩(InstructLab)을 통해 소형 그래니트 모델과 기업 데이터를 결합하면 더 큰 모델의 성능을 훨씬 낮은 비용으로 구현할 수 있을 것으로 보고 있다(여러 초기 개념 증명 프로젝트에서 대형 모델에 비해 비용이 3배에서 23배까지 절감된 것으로 나타남).

IBM은 그래니트 3.0의 출시가 AI 제품에서 투명성, 안전성, 신뢰성을 더욱 강화하겠다는 의지를 보여준다고 설명했다. 그래니트 3.0 기술 보고서와 사용 가이드는 이 모델들을 훈련하는 데 사용된 데이터 세트, 필터링, 정제 및 큐레이션 과정에 대한 상세 정보와 주요 학술 및 기업 벤치마크에서의 성능 결과를 제공한다.



Source link

Leave a Comment