Tekoälyn päättelykustannusten romahdus

Tekoälymallin ajamisen kustannukset GPT-3.5:tä vastaavalla laadulla laskivat noin 20 USD:sta miljoonaa tokenia kohden vuoden 2022 lopussa noin 0,07 USD:iin miljoonaa tokenia kohden lokakuuhun 2024 mennessä – yli 280-kertainen vähennys noin 18 kuukaudessa. Suorituskykyisen tekoälyn käyttöönotto on tullut dramaattisesti halvemmaksi.

20 $/M tokensMarras 20220.07 $/M tokensLoka 2024
GPT-3.5-tason mallin kyselyn kustannus, USD miljoonaa tokenia kohden (Stanford AI Index 2025).

Source: Stanford HAI — AI Index 2025: State of AI in 10 Charts (2025)

What it means

Suorituskykyisen tekoälyn kustannusten 280-kertainen lasku alle kahdessa vuodessa on syy siihen, miksi sovellukset, jotka olivat kannattamattomia vuonna 2023 – jokaisen kunnossapitolokin, jokaisen anturivirran, jokaisen laatukuvan analysointi – ovat nyt edullisia ajaa jatkuvasti. Toiminnanharjoittajalle käytännön viesti on, että budjettieste tekoälyn soveltamiselle koko toiminnassa on suurelta osin kadonnut.

Context

Stanfordin AI Index seuraa kiinteän laatukynnyksen (noin 64,8 % MMLU-vertailutestissä) saavuttamisen hintaa yksittäisen nimetyn mallin hinnan sijaan. Tehtävästä riippuen raportti havaitsee päättelyhintojen laskevan 9–900-kertaisesti vuodessa. Koska mittari pitää laadun vakiona laitteiston ja mallien kehittyessä, se tavoittaa aitoja taloudellisia hyötyjä pelkän hinnanalennuksen sijaan.

Related charts

Related topics

All industrial data & charts →