Tecnología

DeepSeek ha engañado al mercado de la IA, su coste real no fue de 6 millones de dólares

DeepSeek ha engañado al mercado de la IA, su coste real no fue de 6 millones de dólares
Avatar
  • Publishedfebrero 3, 2025



Deepseek sorprendió la base de la IA, porque teóricamente, este es un LLM muy alto con un costo total de solo $ 6 millones. Esto suena bien, tal vez es real, y los datos de investigación compartidos por el análisis semiGene confirmaron que todo ha pasado Queremos creer mentiras.

Este desarrollo ha desarrollado una parte importante de la investigación básica, es decir, capacitar los costos de hardware requeridos para Depseek. Para continuar con esta capacitación, GPU Nvidia, especialmente los modelos H800 y H100, el costo total proviene de algunos 1.600 millones de dólares estadounidensesEsencia Con este fin, debemos agregar costos operativos para el mantenimiento y el uso de estos bloques, alrededor de $ 944 millones.

En general, para capacitar a Depseek, utilizará alrededor de 60,000 GPU NVIDIA, y de acuerdo con los datos de semi -salud, el costo final acumulado será $ 2.573 mil millones. Con este fin, debemos agregar algunas cosas muy importantes, que es el costo relacionado con los datos necesarios para «alimentar» un modelo.

Según la información más reciente, aquellos que son responsables de esta IA pueden Datos robados a OpenAiUsarán la destilación de resultados que se les llama para capacitar a Depseek. Estos tipos de prácticas violan la política de uso de API OpenAI, aunque permiten reducir en gran medida los costos de capacitación de la IA.

Estos 6 millones de dólares estadounidenses se atribuyen a A costa del costo del nivel de GPU de la ronda de pre -entrenamiento AI, el precio es el precio.Esto solo representa una pequeña parte del costo total del modelo, que es tan importante como el costo necesario del proceso de I + D y el costo total del hardware propiedad.

En resumen, de una manera simple, no representa el costo real. Por otro lado, Depseek puede ingresar a un entrenamiento de GPU tan impresionante. Hay problemas con la aplicación de restricciones a las políticas. Desde este tipo de hardware hasta China, este tema ha sido investigado.

¿Deepseek es realmente impresionante?

No hay duda de que a nivel técnico, representa un progreso importante en la industria de la inteligencia artificial, pero también lo representa Esto depende de lo que comparamosEsencia En comparación con algunos modelos (como GPT-4O-0513), los costos de relación por millón de tokens son muy altos en comparación con ciertos modelos, pero se queda atrás de GPT-4O-Mini y Flame 3.2 70b.

Veremos cómo este problema continúa desarrollándose, y cómo todas las disputas que surgen en torno a este modelo finalizan, pero una cosa puede ser clara, esta es la llegada de Deepseek y finalmente Esto será muy útil Para aumentar la competencia entre los modelos AI avanzados, esto debería tener un impacto positivo en la industria.

La imagen de portada generada con AI.



Puedes consultar la fuente de este artículo aquí

Compartir esta noticia en: