El desplome de los costes de inferencia de IA

El coste de ejecutar un modelo de IA con calidad equivalente a GPT-3.5 cayó de unos 20 USD por millón de tokens a finales de 2022 a aproximadamente 0,07 USD por millón de tokens en octubre de 2024, una reducción de más de 280 veces en unos 18 meses. La IA capaz se ha vuelto drásticamente más barata de desplegar.

20 $/M tokensNov 20220.07 $/M tokensOct 2024
Coste de consultar un modelo de nivel GPT-3.5, USD por millón de tokens (AI Index de Stanford 2025).

Source: Stanford HAI — AI Index 2025: State of AI in 10 Charts (2025)

What it means

Una caída de 280 veces en el coste de la IA capaz en menos de dos años es la razón por la que aplicaciones que eran antieconómicas en 2023 —analizar cada registro de mantenimiento, cada flujo de sensores, cada imagen de calidad— ahora resulta asequible ejecutarlas de forma continua. Para un operador, el mensaje práctico es que la barrera presupuestaria para aplicar IA en las operaciones ha desaparecido en gran medida.

Context

El AI Index de Stanford registra el precio de alcanzar un umbral de calidad fijo (alrededor del 64,8 % en la prueba MMLU) en lugar del precio de un único modelo concreto. Según la tarea, el informe halla que los precios de inferencia caen entre 9 y 900 veces al año. Como la métrica mantiene fija la calidad mientras mejoran el hardware y los modelos, capta ganancias económicas genuinas y no un simple descuento.

Related charts

Related topics

All industrial data & charts →