OpenAI se pripravlja na lansiranje novega "agenta" umetne inteligence (AI) z imenom "Operator", ki lahko uporablja računalnik za izvajanje dejanj v imenu osebe, kot je pisanje računalniške kode ali celo rezervacije potovanj, je pisal Bloomberg pred kratkim.
Operator je del širšega prizadevanja AI-razvijalcev za agente ali programsko opremo z umetno inteligenco, ki lahko izvaja večstopenjske naloge za uporabnike z minimalnim nadzorom. Anthropic je predstavil podobnega agenta, ki lahko v realnem času obdela dogajanje na uporabnikovem računalniku in deluje v njegovem imenu. Microsoft, ki podpira OpenAI, je prav tako pred kratkim lansiral nabor agentskih orodij, zasnovanih za pošiljanje e-pošte in upravljanje arhivskih datotek, še zapisujejo pri Bloombergu.
OpenAI je po besedah več virov delal na več raziskovalnih projektih, povezanih z agenti. Tisti, ki je najbliže zaključku, izvaja naloge v spletnem brskalniku oziroma najverjetneje preko OpenAI platform in je že skoraj pripravljen na testiranje. O tem je verjetno tudi govoril Sam Altman, ki je za konec januarja napovedal nekaj novega.
Preberi še
'Splošna AI bo nastala med vladavino Donalda Trumpa'
Leta 2015 ustanovljeni OpenAI je kljub skeptičnemu okolju in omejenim sredstvom dosegel neverjeten uspeh z lansiranjem ChatGPT-ja, ki je sprožil globalno revolucijo umetne inteligence.
07.01.2025
ZDA Slovencem omejujejo uvoz Nvidijinih čipov
Slovenija se sooča z omejitvami pri dostopu do naprednih AI čipov zaradi novih ameriških pravil o izvozu.
20.01.2025
CES 2025: Nvidia razkrila ambiciozno vizijo novega sveta
Podjetje predstavilo svoj prvi računalnik, nove grafične procesorje ter sodelovanje s Toyoto.
07.01.2025
Programer našel znake, da je skoraj pripravljen
Kyle Wiggers je povzel poročanje Tiborja Blahe, programerja, znanega po tem, da sporoča nove informacije o razvoju različnih platform. Tokrat trdi, da je v ozadju spletne strani našel znake, ki kažejo na to, da je Operator že skoraj pripravljen.
ChatGPT OpenAI za macOS je pridobil možnosti, ki so za zdaj skrite, za definiranje bližnjic do aktivacije ali deaktivacije (ang. Toggle Operator) in prisilne zaustavitve Operatorja (ang. Force Quit Operator), je dejal Blaho, OpenAI pa je na svojem spletnem mestu dodal reference za Operatorja, ki še niso javno vidne.
Skrita tabela
Po besedah Blaha spletno mesto OpenAI vključuje tudi nejavne tabele, ki ocenjujejo učinkovitost Operatorja v primerjavi z drugimi sistemi umetne inteligence, zasnovanimi za uporabo računalnikov. Če so podatki verodostojni, kažejo, da Operator ni popolnoma zanesljiv, saj njegova uspešnost močno variira glede na nalogo.
Na testu OSWorld, ki simulira resnično računalniško okolje, je "OpenAI Computer Use Agent (CUA)" - najverjetneje AI model, ki stoji za Operatorjem - dosegel 38,1 odstotka. To je več kot model Anthropic za upravljanje računalnikov, vendar občutno manj od 72,4 odstotka, kolikor dosegajo ljudje. Kljub temu OpenAI CUA na testu WebVoyager, ki ocenjuje navigacijske sposobnosti umetne inteligence, presega človeško zmogljivost. A na drugem spletnem testu, WebArena, zaostaja za rezultati ljudi, povzema TechCrunch.
Če podatki držijo, Operator prav tako odpove pri nalogah, ki jih ljudje običajno opravijo brez težav. Pri testu, kjer je bilo treba ustvariti račun pri ponudniku oblačnih storitev in zagnati virtualni stroj, je bil uspešen le v 60 odstotkov primerov. Še slabše se je odrezal pri ustvarjanju bitcoin denarnice, kjer je njegova uspešnost znašala zgolj deset odstotkov.