칼럼 | (그 업무에) LLM이 꼭 필요할까?

조직의 데이터 전략, 거버넌스, 분석에 깊이 관여하는 업무를 수행하는 필자는 데이터 비전 정의부터 고성능 데이터 팀 구축에 이르는 여러 분야에 개입한다. 최근 IASA와 ‘SustainableIT.org’에 참여하면서 이러한 프로젝트를 바라보는 새로운 관점, 즉 지속가능성이라는 관점을 갖게 되었다.

대규모 언어 모델(LLM)의 잠재력은 부인할 수 없다. 이 모델은 인간 수준의 텍스트를 생성하고, 자연어를 이해하며, 우리가 결코 가능하다고 생각하지 못했던 방식으로 데이터를 변환함으로써 데이터와 상호 작용하는 방식을 혁신할 것을 약속한다. 지루한 작업의 자동화에서 비정형 데이터로부터 통찰력을 얻는 것까지, 그 잠재력은 무한해 보인다. 그러나 계속 자문하게 되는 질문이 있다. 대부분의 분석 업무에 이 엄청난 힘이 정말 필요한 것일까?

GPT-3와 같은 LLM은 방대한 데이터 세트에 대해 훈련된 매우 복잡한 딥러닝 모델이다. 챗GPT, 구글 제미나이, 마이크로소프트 코파일럿 등에 대한 데모는 의심할 여지없이 인상적이다. 또 분석 영역에서 LLM을 사용하면, 자연어 쿼리 인터페이스를 이용해 평이한 언어로 질문할 수 있게 된다. 보고서 생성을 자동화하고 전통적인 방법으로는 놓칠 수 있는 미묘한 데이터의 뉘앙스를 해석할 수도 있다. 이 밖에 데이터 시각화로부터 복잡한 콘텐츠를 생성하거나 실시간으로 질문에 응답하는 대화형 BI 도구를 사용하는 것을 상상해볼 수 있겠다.

생명 과학 분야에서는 LLM이 수많은 연구 논문을 분석하여 신약 개발 속도를 높일 수 있을 것이며, 소매업에서는 추천을 개인화하고 마케팅 캠페인을 최적화할 수 있다.

LLM은 자연어 처리, 자동화 및 복잡한 데이터 해석 분야에서 강력하다

그러나 현실을 직시해본다. 대부분의 조직이 분석 업무에 있어 실제로 필요로 하는 것은 무엇일까? 그간의 경험에 비추어 볼 때, 특히 파렉셀(Parexel)에서 근무할 때와 클리어텔리전스(Cleartelligence)에서 다양한 고객들과 일할 때를 떠올려보면 다음의 핵심적인 요구 사항으로 요약되는 경우가 많았다.

• 명확한 데이터 시각화
• 탄탄한 설명적 분석(추세, KPI)
• 신뢰할 수 있는 예측 분석(예측)
• 사용하기 쉬운 대시보드

파렉셀에 있을 때 필자는 임상 시험 데이터를 분석하여 환자 결과의 추세를 파악하고, 과거 성과를 바탕으로 시험기관을 선정하며, 향후 시험의 성공 가능성을 예측하는 데 중점을 두었다. 클리어텔리전스에서는 고객과 함께 일하면서 다양한 요구를 경험했다. 예를 들어, 제조 기술 서비스를 제공하는 회사에서는 판매 기회를 예측하는 것이 우선순위였고, 자동 시험 장비(ATE)를 설계하고 제조하는 회사에서는 예측에 크게 의존하는 장비 생산 자동화 플랫폼을 개발하는 것이 우선순위였다. 상황이 다르기는 하지만, 신뢰할 수 있고 실행 가능한 인사이트에 대한 필요성은 변함이 없다.

그런데 이러한 작업을 위한 훌륭한 도구들이 이미 있다. 태블로, 클릭, 파워BI는 대화형 대시보드와 시각화를 처리할 수 있다. SQL은 숫자를 처리하고 가장 많이 팔리는 제품을 식별할 수 있다. 기본적인 예측 모델링도 파이썬이나 R의 경량 머신러닝으로 수행할 수 있다. 생명과학 분야에서는 간단한 통계 소프트웨어로 환자 데이터를 분석할 수 있을 것이며, 소매업에서는 기본적인 데이터베이스 쿼리를 통해 재고를 추적할 수 있다. 이러한 전통적인 도구는 대부분의 비즈니스에서 기본적인 분석 니즈를 훌륭하게 충족시킨다.

기존 도구와 방법도 대개 훌륭하다

문제는 LLM이 자원 집약적이라는 점이다. 이러한 모델을 훈련하고 실행하려면 막대한 컴퓨팅 성능이 필요하기 때문에 탄소 발자국이 크게 증가한다. 지속가능한 IT를 위해서는 자원 사용을 최적화하고 낭비를 최소화하며 적절한 규모의 솔루션을 선택하는 것이 기본이다. LLM을 사용하여 간단한 평균을 계산하는 것은 바주카포를 사용하여 파리를 잡는 것과 같다.

필자는 이것을 직접 경험했다. 한 고급 가구 판매 업계의 고객사의 사례다. 우리는 처음에는 고객 설문 조사를 분석하여 감정 분석을 수행하고 그에 따라 제품 판매를 조정하기 위해 LLM을 탐색하고 있었다. 최첨단 AI를 사용해본다는 매력에 끌렸지만, 철저한 평가 후에 우리는 보다 실용적인 접근 방식을 권장했다. 파이썬 환경에서 기존의 자연어 처리 라이브러리를 활용함으로써, 우리는 원하는 감정 분석을 적은 컴퓨팅 자원으로 달성할 수 있었고, 비용과 환경에 미치는 영향을 크게 줄일 수 있었다.

일반적으로, ‘최신이자 최고의 기술’에 대한 초기 흥분은 실용성에 대해 눈을 멀게 할 수 있다. 또 다른 고객은 임상 시설의 운영 벤치마킹을 통해 수익을 창출하는 회사였다. 그들의 데이터는 주로 방대한 양의 회원 설문조사로 구성되어 있었다. 설문조사 분석을 생각하면 LLM이 떠오르지만, 스노우플레이크나 dbt 같은 더 간단한 도구를 사용하면 LLM의 리소스 부담 없이도 추세를 효율적으로 분석하고 가치 있는 통찰력을 얻을 수 있다. 검증 작업 이후 고객은 상당한 비용을 절감할 수 있었을 뿐 아니라 지속가능한 운영에 대한 약속도 지킬 수 있었다. 복잡한 솔루션을 사용하기 전에 프로젝트의 실제 요구 사항을 신중하게 평가하는 것이 중요하다는 것을 거듭 깨닫게 한 사례였다.

LLM은 에너지 소비량이 크다

그렇다면 언제 LLM을 고려할 가치가 있을까? 텍스트, 음성, 이미지 등 구조화되지 않은 복잡한 데이터를 다룰 때이다. 고객 리뷰에 대한 감정 분석, 긴 문서 요약, 의료 기록에서 정보 추출 등이 그러한 사례다. 데이터와 요구 사항이 끊임없이 변화하는 동적 상황에서도 유용하다. 그리고 자연어 쿼리의 향상된 사용자 경험도 감안할 수 있는 장점이다.

현실의 예를 살펴본다. 가정용 가구를 디자인하고 제조하는 한 고객은 정교한 모델링 접근법을 사용하여 미래의 판매량을 예측하고 있다. 그들은 약 15가지에 이르는 다양한 모델을 활용한다. 그런 다음, 이 모델들의 결과를 간단한 알고리즘을 사용하여 결합하여 주어진 품목에 대해 가장 적합한 모델을 결정하고, 그 모델을 예측에 사용한다.

이 과정은 복잡하고 많은 양의 데이터를 필요로 하지만, 구조화된 데이터와 전통적인 통계적 방법을 사용한다 이런 유형의 분석에는 LLM이 과할 수 있다. 그러나 이 가구 제조업체가 고객 리뷰, 소셜 미디어의 감정, 심지어는 방 디자인 이미지까지 판매 예측에 포함시키고자 한다면 어떨까? 이 경우, LLM이 매우 유용하게 사용될 수 있다. LLM은 이러한 비정형 데이터를 분석하고 기존의 정형 데이터 모델과 통합할 수 있는 기능을 제공한다. 정형 데이터와 비정형 데이터가 융합되는 복잡한 다중 모드 데이터 분석은 LLM이 빛을 발할 수 있는 분야다.

또 다른 강력한 활용 사례는 자동차 산업이다. 거의 30년 전 북미 혼다 모터스에게 컨설팅하면서 제조업체의 엔지니어링 가이드를 평가하는 일을 담당한 적이 있다. 지금 생각해보면 LLM 기반의 AI 어시스턴트가 오늘날 이 과정을 어떻게 혁신할 수 있을지 쉽게 상상할 수 있다.

이러한 시스템이 과거의 유지보수 기록, 기술자 노트, 결함 보고서, 보증 청구와 같은 비정형 텍스트 데이터를 처리하고, 이를 IoT 판독값, 기계 원격 측정과 같은 정형 센서 데이터와 연관시키면 어떨까? 이를 통해 예측 유지보수 통찰력을 제공하고, 설계상의 결함을 파악하며, 궁극적으로 차량의 신뢰성과 안전성을 향상시킬 수 있을 것이다.

구조화된 데이터와 비구조화된 데이터가 융합되는 이러한 유형의 복잡한 다중 모드 데이터 분석은 LLM이 빛을 발할 수 있는 분야다. 이러한 예는 비구조화된 데이터에 숨겨진 통찰력을 이끌어내는 LLM의 힘을 강조하는 동시에, 이를 전략적으로 활용하는 것의 중요성을 강조한다.

LLM은 복잡한 비구조화 데이터, 동적인 사용 사례, 자연어를 통한 사용자 경험 향상에 적합

그러나 이 경우에도 하이브리드 접근 방식이 바람직한 경우가 많다. 구조화된 데이터에는 전통적인 도구를 사용하고, 정말 복잡한 데이터에는 LLM을 사용하는 식이다. 이 접근 방식을 사용하면 조직이 전통적인 분석 도구와 LLM의 장점을 모두 활용하여 효율성을 극대화하고 리소스 소비를 최소화할 수 있다.

지속가능한 분석의 길은 단순히 최신 트렌드 추종을 의미하지 않는다. 업무에 적합한 도구를 선택하는 것에서 시작한다. 또 숙련된 분석가와 강력한 데이터 거버넌스에 투자하고 지속가능성을 핵심 우선순위로 만드는 것이다. 이는 데이터 해독 능력을 키우고 분석가가 자신이 사용할 수 있는 도구와 기술을 비판적으로 평가할 수 있도록 힘을 실어주는 문화를 조성하는 것을 의미한다. 또한 데이터 품질, 보안 및 윤리적 사용을 보장하기 위해 명확한 데이터 거버넌스 프레임워크를 구축하는 것을 의미한다.

AI 경쟁에 있어 가장 간단한 해결책이 가장 지속가능한 경우가 많다는 사실을 잊지 말아야 한다. 적절한 위치에 가볍게 두드리는 것만으로도 충분할 때, 큰 망치를 사용하지 않을 일이다. IT 리더로서 우리는 이성의 목소리가 되어야 한다. 기술 관련 결정이 비즈니스 요구와 지속가능성 고려 사항에 의해 이뤄지는 상황을 막아낼 책임을 가진다. 분석에 대한 실용적이고 지속가능한 접근 방식을 수용함으로써 환경에 미치는 영향을 최소화하면서 데이터의 진정한 잠재력을 실현할 수 있을 것이다.

Chitra Sundaram클리어텔리전스, Inc.(Cleartelligence, Inc.)의 데이터 관리 실무 책임자로서, 기업 데이터 전략, 거버넌스 및 디지털 혁신 분야에서 15년 이상의 경력을 보유하고 있다. 그녀는 데이터 기반 의사 결정, 클라우드 현대화 및 비즈니스 성공을 위한 확장 가능한 데이터 거버넌스 프레임워크 구축을 전문으로 하며, IASA CAF와 SustainableArchitecture.org 커뮤니티의 회원이다.

이 기사는 IASA 최고 아키텍트 포럼과의 파트너십을 통해 작성됐다. CAF의 목적은 비즈니스 기술 아키텍처의 예술과 과학을 테스트하고, 도전하고, 지원하며, 시간이 지남에 따라 진화하는 것을 지원하고, 업계 안팎에서 최고 아키텍트의 영향력과 리더십을 키우는 것이다. CAF는 비즈니스 기술 아키텍트를 위한 선도적인 비영리 전문 협회인 IASA의 리더십 커뮤니티다.
dl-ciokorea@foundryco.com



Source link

Leave a Comment