Nvidia je v teh dneh predstavila PersonaPlex kot open source (slovensko bi temu rekli odprtokodni) model za glasovne AI agente. Koda je javna, brezplačna in dostopna vsem – vsak jo lahko uporablja, spreminja in vgrajuje v lastne izdelke.
Na prvi pogled se to zdi kot še en znak podpore AI skupnosti. Na drugi, bolj realen pogled, pa je to lekcija iz moderne tehnološke moči: "open source" kot najučinkovitejši kanal za prodajo infrastrukture.
Zakaj bi podjetje, ki prodaja AI čipe po ceni 40.000 dolarjev, brezplačno delilo modele, ki lahko nadomestijo cele ekipe inženirjev?
Odgovor je preprost: modeli ne služijo denarja – čipi ga.
Pravi razlog: 'open source', ki zaklene uporabnike
PersonaPlex ni običajen glasovni asistent. Gre za sistem, ki hkrati posluša in govori, brez klasične sekvence "govor → besedilo → model → govor". Namesto tega model neposredno obdeluje zvočni signal.
Rezultat je odgovor v približno 170 milisekundah – dovolj hitro, da človeško uho ne zazna premora. To je razlika med "AI asistentom" in pogovorom, ki deluje resnično.
Model ima sedem milijard parametrov in temelji na obstoječih Nvidia arhitekturah, a ključna inovacija ni v velikosti, temveč v nadzoru. Osebnost, stil in glas agenta se lahko spreminjajo z enostavnim besedilnim opisom, brez dodatnega treniranja. Testi kažejo več kot 90-odstotno uspešnost pri naravnem prevzemanju poteka pogovora.
A obstaja podrobnost, ki je Nvidia ne izpostavlja v sporočilih za javnost: PersonaPlex ni samo brezplačen – je tudi izjemno zahteven, če pogledamo, koliko virov in kreditov pri ponudnikih porabi.
Model lahko deluje tudi na drugih procesorjih, a z očitno slabšimi zmogljivostmi. Optimiziran je tako, da na Nvidia čipih deluje na "polno moč", medtem ko na alternativni infrastrukturi pušča vtis sistema, ki se stalno zatika. Pri glasovnih sistemih, kjer se vsaka milisekunda zamude sliši, to hitro postane poslovni problem, ne tehnična podrobnost.
Zakaj strojniška podjetja promovirajo open source
Nvidia danes nadzoruje več kot 80 odstotkov trga AI infrastrukture, in prav tukaj je težava. AMD, Intel, Google, Amazon in Microsoft vlagajo milijarde, da bi razvili alternative – nihče namreč noče strateške odvisnosti od enega samega dobavitelja.
Odgovor Nvidie na to je bil dolga leta CUDA: programska plast, ki prehod na konkurenco naredi drag in tehnično zahteven. PersonaPlex je nadaljevanje iste logike – le elegantnejše.
Pomemben je tudi čas lansiranja. Čeprav je PersonaPlex danes na voljo, je model že optimiziran za arhitekturo Blackwell (nove modele čipov, ki jih bo Nvidia izdala letos), in posredno pripravlja teren tudi za naslednjo generacijo čipov, vključno z Rubin. Z drugimi besedami, open source modeli danes služijo temu, da se jutri napolnijo najdražji sistemi, ki šele prihajajo na trg.
Na januarski CES konferenci je Nvidia predstavila družino open source modelov:
-
Cosmos za fizične AI proizvode;
-
Nemotron za agentske sisteme;
-
Alpamayo za avtonomna vozila;
-
Isaac Groot za robote i
-
Clara za testiranje modela v biomedicini.
Vsi so "odprti". In vsi so globoko optimizirani za Nvidiino strojno opremo.
Jensen Huang. Foto: Bridget Bennett/Bloomberg
Na odru v Las Vegasu je Jensen Huang to povedal brez veliko diplomatike: "Naše delo je, da zgradimo celoten sistem, da boste lahko ustvarjali neverjetne aplikacije." V prevodu: Nvidia ne prodaja več čipov. Prodaja odvisnost od celotnega sistema.
Konkurenca zaostaja – in to je opazno
Google ima TPU in lastne modele. Amazon ima Trainium in partnerstvo s podjetjem Anthropic. Microsoft ima Azure in OpenAI.
Nihče nima kombinacije strojne opreme, programske opreme in razvojnega momenta, ki ga Nvidia že ima. CUDA je standard. Ekosistem je tu. Koda je že napisana.
Prehod na alternativo ne pomeni le nove infrastrukture – pomeni prepisovanje zgodovine.
To ni nova strategija, ampak klasična lekcija industrijske moči: tisti, ki nadzoruje "cev", nadzoruje tudi tisto, kar skozi njo teče. Nvidia tega ne počne preko paketov storitev, temveč preko jezika, orodij in zmogljivosti, brez katerih sodobna umetna inteligenca težko deluje.
Nvidia počne enako kot velja za 5G, le da namesto 5G-omrežja uporablja svetovno AI infrastrukturo.
Kaj to pomeni za regijo Adria in zakaj gre za spremembo pravil igre
Za start-upe in velike korporacije iz regije Adria Nvidia ponuja hiter vstop v ligo velikih.
S PersonaPlexom lahko majhne ekipe brez AI oddelka ustvarjajo glasovne agente, ki se kosajo s korporativnimi rešitvami, z uporabo čipov, dostopnih prek oblaka Amazona, Googla ali Microsofta. Z ostalimi odprtokodnimi rešitvami lahko razvijajo sisteme v robotiki, medicini in avtonomnih vozilih, brez velike ekipe ali visokih stroškov.
A račun pride kasneje.
Model lahko deluje tudi na drugih procesorjih, a z nižjimi zmogljivostmi. Pri glasovnih sistemih se vsak milisekund pozna, kar v praksi pomeni eno: večina AI proračuna se bo dolgoročno stekala v Nvidiino infrastrukturo.
To je bistvo strategije. Nvidia ni vstopila v programsko opremo – programsko opremo je spremenila v podaljšek strojne dominacije. Medtem ko OpenAI zaračunava API klice, Nvidia modele daje brezplačno, a zaračunava čas na čipu.
Open source je vaba. Infrastruktura je posel.