Cómo DeepSeek cambia la ecuación de la IA generativa para los CIO

“El modelo R1 de DeepSeek representa, por tanto, un cambio fundamental, que sugiere que el futuro de la IA generativa radica en enfoques innovadores y rentables, en lugar del paradigma tradicional de escalar a través de la mera fuerza computacional”, escribieron los investigadores de Gartner, entre los que se encuentran Haritha Khandabattu, Jeremy D’Hoinne, Rita Sallam, Leinar Ramos y Arun Chandrasekaran.

Peter Rutten, vicepresidente de investigación de Informática de Alto Rendimiento e Infraestructura Mundial en IDC, afirma que la conclusión clave de los resultados de DeepSeek es que el enfoque actual del entrenamiento de la IA, que se basa en la teoría de que la IA solo puede mejorar con una arquitectura más grande, más y más rápida, no está justificado.

“Los nuevos enfoques de algoritmos, marcos y software para el desarrollo de la IA ofrecen resultados comparables o incluso mejores que, por ejemplo, la última versión de ChatGPT, con la misma precisión y a una fracción del coste de infraestructura”, afirma Rutten. “Esto significa que el entrenamiento de la IA no tiene por qué ser dominio exclusivo de los hiperescalares que pueden permitirse invertir miles de millones de dólares en grandes construcciones de infraestructura”.



Source link

Leave a Comment