El nuevo asistente de Inteligencia Artificial con origen chino está siendo un éxito dentro y fuera de la red. DeepSeek es la Inteligencia Artificial más usada por los usuarios de Apple en Estados Unidos, por lo que ChatGPT se coloca como la segunda app más usada o con mayor éxito en la App Store.
DeepSeek, el asistente de IA con sede en Hangzhou, China, fue fundada en 2023 y encabeza la App Store y funciona con el modelo DeepSeek-V3 y ya gana popularidad entre los usuarios estadounidenses desde su lanzamiento el 10 de enero.
De acuerdo con sus desarrolladores, DeepSeek se entrenó usando los chips H800 de NVIDIA, con un coste total supuestamente inferior a 6 millones de dólares y afirman que el modelo se encuentra entre los mejores modelos de código abierto y compite con los modelos de código cerrado más avanzados a nivel mundial.
Impulsada por el modelo DeepSeek-V3, que según sus creadores “encabeza la clasificación entre los modelos de código abierto y rivaliza con los modelos de código cerrado más avanzados a nivel mundial”, la aplicación de inteligencia artificial aumentó su popularidad entre los usuarios estadounidenses desde su lanzamiento el 10 de enero, según la empresa de investigación de datos sobre aplicaciones Sensor Tower.
Los modelos de inteligencia artificial, desde ChatGPT hasta DeepSeek, requieren chips avanzados para su entrenamiento. Recordemos que en 2021, la administración Biden amplió el alcance de las prohibiciones destinadas a impedir que estos chips se exporten a China y se usen para entrenar los modelos de IA de las empresas chinas. Algo que con este nuevo asistente se pone en duda el tipo de chips que se pueden usar para entrenar a una IA.
El éxito de DeepSeek está impactando a NVIDIA

De acuerdo con Bloomberg el valor bursátil de la compañía sufre un desplome histórico, con más de 400,000 millones de dólares borrados de su capitalización bursátil. Según el diario, esta caída del 13 % es la mayor de la historia bursátil estadounidense, superando el propio récord de NVIDIA de septiembre, cuando la compañía perdió casi 280,000 millones de dólares de valor.
Todo indica que a los inversores les preocupa que el gran éxito de los competidores, como DeepSeek, pueda cambiar la manera en que se forman y usan los LLM modernos. Por lo que el costo de uso y entrenamiento es más económico y sin necesitar el cobro a los usuarios.
Será cuestión de tiempo para que veamos el gran potencial que tiene DeepSeek, por lo pronto es la primera en ser elogiada por la industria tecnológica estadounidense por igualar o incluso superar el rendimiento de los modelos estadounidenses más avanzados.
NVIDIA declara
DeepSeek es un excelente avance de IA y un ejemplo perfecto de escalado del tiempo de prueba. El trabajo de DeepSeek ilustra cómo se pueden crear nuevos modelos usando esa técnica, aprovechando modelos ampliamente disponibles y computación que cumple totalmente con el control de exportación. La inferencia requiere una cantidad significativa de GPU NVIDIA y redes de alto rendimiento. Ahora tenemos tres leyes de escalado: preentrenamiento y postentrenamiento, que continúan, y un nuevo escalado del tiempo de prueba.
No dejes de seguirnos en Google News. También puedes pasar a nuestro Discord para hablar de series y otros temas.