L'effondrement des coûts d'inférence de l'IA

AI adoption · Industrial data · Updated 2026-07-15

Le coût d'exécution d'un modèle d'IA d'une qualité équivalente à GPT-3.5 est passé d'environ 20 USD par million de jetons fin 2022 à environ 0,07 USD par million de jetons en octobre 2024 — une réduction de plus de 280 fois en environ 18 mois. Une IA performante est devenue radicalement moins chère à déployer.

Coût pour interroger un modèle de niveau GPT-3.5, en USD par million de jetons (AI Index de Stanford 2025).

Source: Stanford HAI — AI Index 2025: State of AI in 10 Charts (2025)

What it means

Une chute de 280 fois du coût d'une IA performante en moins de deux ans explique pourquoi des applications qui n'étaient pas rentables en 2023 — analyser chaque journal de maintenance, chaque flux de capteur, chaque image qualité — peuvent désormais fonctionner en continu à coût abordable. Pour un exploitant, le message pratique est que la barrière budgétaire à l'application de l'IA dans l'ensemble des opérations a largement disparu.

Context

L'AI Index de Stanford suit le prix pour atteindre un seuil de qualité fixe (environ 64,8 % au benchmark MMLU) plutôt que le prix d'un modèle nommé unique. Selon la tâche, le rapport constate des prix d'inférence en baisse de 9 à 900 fois par an. Comme la métrique maintient la qualité constante tandis que le matériel et les modèles s'améliorent, elle capte de véritables gains économiques plutôt qu'un simple rabais.

Related charts

AI adoption

L'effondrement des coûts d'inférence de l'IA

What it means

Context

Related charts

How widely manufacturers have adopted AI

Industrial robot installations worldwide

Robot density in manufacturing

Related topics