Dve leti, odkar je družba OpenAI z uvedbo orodja ChatGPT v velikem slogu začela ero generativne umetne inteligence, sta minili v meglici tehnološkega tekmovanja za premoč. OpenAI in njegovi glavni konkurenti, Anthropic, Google in Meta, so na trgu predstavili val najsodobnejših modelov umetne inteligence in vsak naslednji je učinkovitejši od prejšnjega. Silicijeva dolina zdaj sledi mantri, da bo več računalniške moči, več podatkov in več modelov privedlo do tako temeljnih izboljšav v umetni inteligenci, da bo ta tehnologija v naslednjih nekaj letih preoblikovala celotne industrije.
Vendar pa je hitrost razvoja na prve ovire naletela že pred drugim rojstnim dnem orodja ChatGPT. Leta 2024 so se OpenAI in dve drugi vodilni podjetji za umetno inteligenco začeli soočati s težavami. Določena programska oprema podjetij OpenAI in Google ni izpolnila njihovih notranjih pričakovanj, medtem pa se je časovni razpored razvoja dolgo pričakovanega modela podjetja Anthropic (konkurenčnega izdelka, ki so ga zasnovali nekdanji zaposleni iz podjetja OpenAI) zamaknil, potem ko je bil izdelek že napovedan. Če se bo napredek na področju generativne umetne inteligence trajno upočasnil, se poraja vprašanje, ali bo lahko tehnologija kadarkoli izpolnila obsežnejše obljube vodilnih inovatorjev v industriji. Iskanje načinov za napredovanje razcveta umetne inteligence v naslednjo fazo bo leta 2025 na tem področju glavni izziv.
Podjetja so soočena z več ovirami. Za izgradnjo naprednejših sistemov umetne inteligence je vse težje najti nove vire visokokakovostnih podatkov za usposabljanje, ki jih je ustvaril človek. Poleg tega pa skromne izboljšave zmogljivosti umetne inteligence morda ne bodo dovolj za upravičenje ogromnih stroškov, povezanih z ustvarjanjem in delovanjem novih modelov. Dario Amodei, izvršni direktor podjetja Anthropic, je dejal, da usposabljanje najsodobnejšega modela stane približno 100 milijonov dolarjev, poleg tega pa pričakuje, da bo ta znesek v prihodnjih letih zrasel do 100 milijard dolarjev. Finančna direktorica podjetja OpenAI Sarah Friar pravi, da bo razvoj naslednjega najsodobnejšega modela njihovega podjetja verjetno stal milijarde in da je še vedno prisotna potreba po "vedno večjih modelih, ki pa so vedno dražji".
Te težave vzbujajo dvome o milijardah dolarjev, ki so bile že vložene v umetno inteligenco, in o cilju, za katerega si ta podjetja tako agresivno prizadevajo – o tako imenovani splošni umetni inteligenci ali AGI, ki bi se lahko pri številnih nalogah odrezala prav tako dobro kot ljudje ali še bolje. Izvršna direktorja podjetij OpenAI in Anthropic sta že dejala, da nas od modela AGI morda loči le še nekaj let, in oba sta zavrnila vsa namigovanja, da se je napredek v resnici zaustavil. Drugi vodilni akterji v industriji so bolj skromni. "Mislim, da bo napredek vedno težje doseči," je v intervjuju na konferenci New York Timesa v začetku decembra izjavil izvršni direktor Googla Sundar Pichai. Ob pogledu v leto 2025 je dejal: "Lahko dosegljivih ciljev ni več in pot do uspeha je zdaj bolj strma."
V panogi, ki se ponaša z inovativnostjo, podjetja iščejo različne načine za nadgradnjo modelov umetne inteligence. Ti vključujejo programiranje računalnikov tako, da bi ti probleme reševali s premlevanjem možnih rešitev na podoben način kot ljudje, gradnjo modelov, ki so zelo dobri pri določenih vrstah nalog, in usposabljanjem umetne inteligence s podatki, ki jih je ustvarila umetna inteligenca sama.
Podjetje OpenAI prištevamo med prve zgodnje zagovornike umetne inteligence, ki lahko sklepa na človeški način, tako pa se lahko loti bolj zapletenih vprašanj in se s časom izboljšuje, zlasti ko gre za vprašanja, povezana z matematiko, znanostjo in programiranjem. Septembra je podjetje svetu predstavilo zgodnjo različico modela, imenovanega o1, ki tovrstno sklepanje izvaja tako, da porabi več časa za izračun odgovora, preden odgovori na vprašanje uporabnika. OpenAI je decembra napovedal izboljšano različico tega modela, ki ga je izvršni direktor Sam Altman na družbenih omrežjih imenoval "najpametnejši model na svetu".

Podjetje je o uspehu modela o1 tako zelo prepričano, da je začelo ponujati mesečno naročnino v vrednosti 200 dolarjev, ki med drugim vključuje dostop do različice modela, ki lahko za odgovarjanje na vprašanja uporabi še več računalniške moči.
Številna druga podjetja, vključno z Googlom in proizvajalcem programske opreme Databricks, delajo na lastnih različicah tega pristopa, ki se pogosto imenuje izračun s časom za preizkus ali časom za sklepanje. Jonathan Frankle, vodilni znanstvenik za umetno inteligenco v podjetju Databricks, pričakuje, da se bo ta tehnika v industriji precej razširila. Poleg zagotavljanja boljših rešitev bi lahko pozitivno vplivala na ekonomijo razvoja modelov umetne inteligence, in sicer tako, da bi nekatere stroške iz obdobja predhodnega razvoja prenesla v čas, ko so modeli že v uporabi, in tako že ustvarjajo prihodek.
Tehnologija premišljevanja pa ne rešuje vprašanja vedno večje potrebe umetne inteligence po podatkih. Podjetja se vse bolj zatekajo k sintetično ustvarjenim podatkom, ki so na voljo v različnih oblikah, vključno z računalniško ustvarjenim besedilom, ki naj bi posnemalo vsebino, ki jo ustvarjajo resnične osebe. Nathan Lambert, raziskovalec na Inštitutu za umetno inteligenco Allen, pravi, da je pri razvoju modela, imenovanega Tulu 3, s sodelavci model umetne inteligence spodbudil k zastavljanju vprašanj, kakršna bi zastavljale določene osebe. Prosili so ga, na primer, naj se pretvarja, da je astronavt, in si izmisli matematični problem, značilen za ta poklic: model je zastavil vprašanje, koliko bo luna od sonca oddaljena ob določeni uri. Vprašanja so nato vnesli nazaj v model, zatem pa so vprašanja in odgovore uporabili za izpopolnitev lastnega sistema. Ta tehnika je iz nekega razloga izboljšala matematične zmogljivosti modela Tulu 3. "Ne razumemo povsem, zakaj deluje," pravi Lambert, "in to je tista vznemirljiva plat sintetičnih podatkov."
Veliki jezikovni modeli – vrsta programske opreme z umetno inteligenco, ki poganja orodje ChatGPT – so namenjeni posnemanju besed, ki jih ljudje uporabljajo pri komunikaciji, zato zgolj usposabljanje sistema na podlagi vsebine, ki jo proizvaja umetna inteligenca, ne bo privedlo do izboljšav, trdi Frankle. Lambert pravi, da je podatke, ki jih ustvari umetna inteligenca, pomembno filtrirati, da se tako izognemo ponavljanju in se prepričamo, da so ti točni. Nekatere raziskovalce skrbi tudi, da bi lahko neselektivna uporaba takšnih podatkov za usposabljanje ovirala uspešnost modela (to posledico so poimenovali "kolaps modela").
Fei-Fei Li, sodirektorica Inštituta za umetno inteligenco, osredotočeno na človeka, na Univerzi Stanford in soustanoviteljica zagonskega podjetja za umetno inteligenco World Labs, pričakuje, da se bodo podjetja, ki se ukvarjajo z umetno inteligenco, vedno bolj zanašala na sintetične podatke. Poudarila je, da se razvijalci tehnologije samovozečih avtomobilov, na primer, že dolgo zanašajo na simulirane podatke o vožnji. "V tehnološki sestavljanki umetne inteligence so podatki prav tako pomembni kot algoritmi," pravi Li. 2Sintetični podatki igrajo veliko vlogo."
Problemi širjenja ogromnih modelov za splošne namene so še zlasti bistveni, če si za cilj zastavimo razvoj AGI. A zgodovinsko gledano, je bila umetna inteligenca zasnovana tako, da se osredotoča na eno samo nalogo, in Frankle iz podjetja Databricks pravi, da je prostora za inovacije na tem področju na pretek. Na splošno je optimističen. Trenutno dogajanje v industriji umetne inteligence primerja s tem, kar se je zgodilo v razvoju industrije čipov, kjer so razvijalci na neki točki dosegli nekaj, kar je bilo videti kot neizpodbitna končna točka, nato pa so se prebili do različnih inovacij – večjedrnih procesorjev, koprocesorjev, vzporedne obdelave – in tako tehnologijo še naprej nadgrajevali.
"Če se ozremo nazaj na naše obdobje polprevodnikov," pravi, "vidimo, da se pomikamo od ene inovacije do druge in se na poti do napredka preprosto ne ustavimo."
– v sodelovanju s Shirin Ghaffary.