En el competitivo mundo de la inteligencia artificial, una nueva empresa está cambiando las reglas del juego.
Se trata de DeepSeek, una startup china fundada en 2023, que ha captado la atención global con sus innovadores modelos de código abierto, desafiando el dominio de empresas estadounidenses como OpenAI y Nvidia.
Los modelos más recientes de DeepSeek, el DeepSeek R1 y el DeepSeek V3, han situado a la compañía como una competidora destacada en la industria de la IA. Ambos prototipos ofrecen un rendimiento competitivo a un costo significativamente menor y con menores requerimientos de hardware, lo que ha impactado directamente en los mercados financieros.
Impacto en los mercados tecnológicos
El lanzamiento de estos modelos ha generado incertidumbre entre los gigantes tecnológicos. Las acciones de Nvidia cayeron un 17%, provocando una pérdida de cerca de 600.000 millones de dólares en valor de mercado. Esto llevó a la compañía a ceder su título como la empresa más valiosa del mundo, ahora ocupado por Apple y seguida de Microsoft. Alphabet también registró una caída del 4%, mientras que Microsoft retrocedió un 2%.
El mercado en general no quedó inmune. El Nasdaq se desplomó un 3,77%, mientras que los futuros del Dow Jones y el S&P 500 cayeron un 1,04% y 2,29%, respectivamente.
DeepSeek: innovación con restricciones
A pesar de las restricciones impuestas por Estados Unidos a la venta de chips avanzados a empresas chinas, DeepSeek ha logrado avanzar en sus investigaciones. Según el periodista Holger Zschaepitz, el éxito de la compañía pone en entredicho las gigantescas inversiones en infraestructura que los grandes actores han realizado en esta industria.
El fundador de DeepSeek, Liang Wenfeng, también creador de High-Flyer Capital Management, ha financiado exclusivamente a la startup. Este modelo de financiación única ha permitido a la compañía operar sin presiones externas y enfocarse en proyectos de largo plazo.
Sin embargo, DeepSeek está sujeta a las regulaciones del gobierno chino, que exige que sus tecnologías respeten los “valores socialistas fundamentales”. Por ejemplo, sus modelos no responden a temas considerados sensibles, como las protestas de Tiananmén de 1989.
DeepSeek R1 y V3: revolucionando la IA
El modelo DeepSeek R1, lanzado el pasado 20 de enero en versión abierta, es un modelo de razonamiento que destaca por su capacidad para verificarse a sí mismo y garantizar respuestas precisas mediante un pensamiento profundo. Con 671.000 millones de parámetros y versiones reducidas que requieren menor potencia, este modelo se encuentra disponible en Hugging Face bajo licencia MIT, sin restricciones comerciales.
Por su parte, DeepSeek V3 es un modelo de lenguaje basado en la arquitectura Mixture-of-Experts (MoE). Este enfoque permite dividir tareas entre varios “expertos”, logrando un rendimiento superior en actividades como codificación, traducción y redacción. A pesar de sus impresionantes cifras de entrenamiento (2.788 millones de horas y un costo de 5,5 millones de dólares), V3 es significativamente más económico en comparación con el desarrollo de modelos como GPT-4 de OpenAI.
Ambos modelos están disponibles en plataformas como GitHub y el sitio web de DeepSeek, bajo licencias que permiten su modificación para aplicaciones comerciales.
El futuro de la IA
DeepSeek no solo está redefiniendo el desarrollo de inteligencia artificial con modelos accesibles y de alto rendimiento, sino que también está obligando a los gigantes tecnológicos a repensar sus estrategias. En un panorama donde la innovación y la eficiencia son clave, esta startup china podría ser el catalizador de una nueva era en la industria tecnológica.