Ameriška podjetja na področju umetne inteligence so v razvoj naprednejših klepetalnih robotov vložila na stotine milijard dolarjev, pri čemer stavijo, da bodo od uporabnikov ustvarila dovolj prihodkov za upravienje te naložbe. Tak pristop pa je izpostavljen tveganju, da jih spodkopljejo tekmeci, ki razvijajo konkurenčne sisteme umetne inteligence za bistveno nižje stroške.
Vedno pogosteje ameriška podjetja obtožujejo kitajske konkurente, da uporabljajo tehniko, znano kot distilacija, s katero naj bi neupravičeno izkoriščali rezultate vodilnih ameriških modelov umetne inteligence za razvoj konkurenčne generacije klepetalnih robotov za delček stroškov in z bistveno manj varnostnimi omejitvami.
Junija je podjetje Anthropic PBC navedlo, da je Alibaba Group nezakonito uporabljala distilacijo za industrijsko pridobivanje rezultatov iz svojega modela Claude, da bi kitajskemu tehnološkemu velikanu pomagala razviti lasten sistem umetne inteligence. Podobne obtožbe proti drugim kitajskim laboratorijem za umetno inteligenco, med njimi DeepSeek in MiniMax, sta podali tudi podjetji Anthropic in OpenAI. Za zdaj se nobeno od kitajskih podjetij, vključno z Alibaba Group, na obtožbe ni odzvalo.
Kaj je distilacija?
Distilacija je metoda, ki jo pogosto uporabljajo laboratoriji za umetno inteligenco za učenje enega velikega jezikovnega modela (LLM) na podlagi izhodov drugega. Razvijalec v večji, zmogljivejši "učiteljski" model vnese niz pozivov, njegove odgovore pa nato uporabi za učenje manjšega "študentskega" modela, ki poskuša posnemati številne sposobnosti učitelja.
Nastali model lahko opravlja številne enake naloge kot izvirnik, vendar pri bistveno nižjih stroških in z manjšo porabo računske moči, kot bi bila potrebna za razvoj in delovanje primerljivega sistema od začetka. Znanje se ne prenese neposredno iz enega modela v drugega, temveč se študentski model uči posnemati vedenje učitelja na podlagi njegovih odgovorov.
Distilacija velja za sprejemljivo, kadar podjetja uporabljajo lastne modele ali ko zunanji razvijalci metodo uporabljajo za razvoj nekonkurenčnih tehnologij. Ta pristop, znan kot dovoljena distilacija, omogoča stiskanje velikih modelov v manjše in učinkovitejše, ki so optimizirani za specifične naloge. Izpeljani modeli običajno nimajo vseh zmožnosti izvirnega modela, vendar delujejo hitreje ter so cenejši za razvoj in uporabo.
Zakaj je distilacija včasih sporna?
Distilacija se lahko uporablja tudi s strani tretjih oseb za podvajanje zmogljivosti lastniškega modela umetne inteligence brez dovoljenja lastnika referenčnega modela. Takšna praksa odpira pravna, ekonomska in varnostna vprašanja.
Vodilna ameriška podjetja na področju umetne inteligence opozarjajo, da jim nepooblaščena distilacija predstavlja poslovno tveganje. Številni kitajski laboratoriji, med njimi DeepSeek, so razvili modele z odprtimi utežmi, kar pomeni, da so deli osnovnega sistema umetne inteligence javno dostopni in jih lahko uporabniki prosto prenesejo ter uporabljajo na svojih platformah.
Nasprotno pa največja ameriška podjetja svoje modele ohranjajo zaprte oziroma lastniške, saj računajo, da bodo uporabniki plačevali dostop do njihovih storitev, s čimer želijo povrniti naložbe v višini več sto milijard dolarjev v podatkovne centre in drugo infrastrukturo. Opozarjajo, da bi lahko tekmeci, če bi lahko njihove modele reproducirali za delček stroškov in jih ponujali poceni ali celo brezplačno, bistveno zmanjšali njihove prihodke. Ameriški uradniki ocenjujejo, da nepooblaščena distilacija ameriškim podjetjem povzroča več milijard dolarjev letne izgube prihodkov.
Ameriška podjetja prav tako opozarjajo na varnostna tveganja nepooblaščene distilacije. Opozarjajo, da bi lahko tuji nasprotniki to tehniko uporabili za razvoj modelov umetne inteligence brez varnostnih omejitev, ki preprečujejo zlorabe, kot so ustvarjanje nevarnih patogenov ali avtomatizirani, obsežni kibernetski napadi.
Kako lahko podjetja zaznajo napad z distilacijo?
Dokazi so pogosto posredni, zato je za zdaj težko z gotovostjo dokazati, da je bil konkurenčni model razvit z uporabo distilacije.
Anthropic je februarja navedel, da so trije vodilni kitajski razvijalci umetne inteligence poskušali "nezakonito pridobiti" rezultate iz njegovih modelov. Po navedbah podjetja so ustvarili več kot 16 milijonov interakcij z uporabo lažnih računov, kar so uspeli zaznati na podlagi podatkov o internetnih protokolnih naslovih in metapodatkih. Dodali so, da so "isti akterji in vzorci vedenja" opaženi tudi na drugih platformah njihovih industrijskih partnerjev.
V pismu, poslanem več ameriškim senatorjem in uradnikom Bele hiše junija, je Anthropic navedel, da naj bi šlo v domnevnem primeru distilacije pri Alibaba Group za 28,8 milijona interakcij s klepetalnikom Claude med aprilom in junijem prek skoraj 25.000 lažnih računov, navajajo viri, ki poznajo dokument, ter kopija, ki jo je videl Bloomberg News.
Ali je mogoče distilacijo preprečiti?
Vodilna ameriška podjetja na področju umetne inteligence sprejemajo ukrepe za omejevanje tako imenovanih "napadov z distilacijo", med drugim z večjim izmenjevanjem informacij o nepooblaščenem pridobivanju izhodov njihovih modelov ter z blokiranjem sumljivih uporabnikov, ki dostopajo do njihovih sistemov.
Zaskrbljenost tehnološke industrije v Silicijevi dolini je dosegla tudi zakonodajalce v Washingtonu in administracijo Donalda Trumpa. Aprila je Bela hiša napovedala, da bo sodelovala z industrijo pri oblikovanju ukrepov za omejevanje distilacije in kaznovanje zlorab. Republikanci v predstavniškem domu so prav tako pozvali k uvedbi sankcij proti kitajskim subjektom, ki to prakso izvajajo v industrijskem obsegu za razvoj konkurenčnih sistemov umetne inteligence.