L'effondrement des coûts d'inférence de l'IA
Le coût d'exécution d'un modèle d'IA d'une qualité équivalente à GPT-3.5 est passé d'environ 20 USD par million de jetons fin 2022 à environ 0,07 USD par million de jetons en octobre 2024 — une réduction de plus de 280 fois en environ 18 mois. Une IA performante est devenue radicalement moins chère à déployer.
Source: Stanford HAI — AI Index 2025: State of AI in 10 Charts (2025)
What it means
Une chute de 280 fois du coût d'une IA performante en moins de deux ans explique pourquoi des applications qui n'étaient pas rentables en 2023 — analyser chaque journal de maintenance, chaque flux de capteur, chaque image qualité — peuvent désormais fonctionner en continu à coût abordable. Pour un exploitant, le message pratique est que la barrière budgétaire à l'application de l'IA dans l'ensemble des opérations a largement disparu.
Context
L'AI Index de Stanford suit le prix pour atteindre un seuil de qualité fixe (environ 64,8 % au benchmark MMLU) plutôt que le prix d'un modèle nommé unique. Selon la tâche, le rapport constate des prix d'inférence en baisse de 9 à 900 fois par an. Comme la métrique maintient la qualité constante tandis que le matériel et les modèles s'améliorent, elle capte de véritables gains économiques plutôt qu'un simple rabais.
Related charts
How widely manufacturers have adopted AI
Industrial robot installations worldwide
Robot density in manufacturing
Related topics
Generative AI in Manufacturing: Practical Examples · AI Agents for Industrial Maintenance: What They Are and Where They Help · Large Language Model (LLM) · Generative AI · Machine Learning (Industrial)
Relevant to: Chemicals · Food Processing · Pharmaceuticals