Če lahko umetna inteligenca (AI) danes piše kodo, analizira pravne dokumente in se pogovarja v desetinah jezikov, zakaj je še vedno izjemno težko razviti velik jezikovni model, ki zanesljivo razume lokalni jezik, kulturo in poslovni kontekst?
Odgovor na to vprašanje najbolje ponazarja YugoGPT – največji jezikovni model doslej, razvit za južnoslovanske jezike, in hkrati projekt, ki je bil kljub tehničnemu uspehu postavljen na stranski tir.
YugoGPT: tehnični uspeh brez tržnega nadaljevanja
YugoGPT je velik jezikovni model (LLM) s sedmimi milijardami parametrov, treniran posebej za srbski, hrvaški in bosanski jezik. Razvil ga je Aleksa Gordić, inženir z izkušnjami iz Microsofta in Google DeepMinda.
Preberi še
Priznaj, si v razmerju z umetno inteligenco
Pogovarjate se s klepetalnikom, iščete nasvete, dobite razumevanje brez obsojanja – in se vračate po še. Meja med orodjem in odnosom z umetno inteligenco je vse tanjša, strokovnjaki pa opozarjajo, da AI počasi, a občutno spreminja način, kako gradimo resnične človeške vezi.
10.01.2026
Kitajski Zhipu: cenovna vojna za AI se širi na mednarodne trge
Zhipu AI vstopa na borzo kot prvi kitajski proizvajalec AI programske opreme.
08.01.2026
Razpisi EU za razvijanje AI - koliko denarja je na voljo in kje
Evropska unija pospešuje vlaganja v umetno inteligenco, da bi zmanjšalo odvisnost od ZDA in Kitajske.
05.01.2026
AI v bančništvu: Sme AI odločati o odobritvi kredita in pri tem uporabljati tudi vaše objave s facebooka
Banke se vse bolj podajajo v napredne tehnologije, uporabljajo tudi umetno inteligenco.
02.01.2026
Model je bil objavljen kot odprtokodni projekt na platformi HuggingFace in je v testih pokazal boljše razumevanje lokalnih jezikov kot globalni modeli, kot sta Mistral in LLaMA 2 (jezikovna modela podjetij Mistral.ai in Meta).
Pri nalogah, ki zahtevajo razumevanje lokalnih idiomov, slovničnih odtenkov in kulturnega konteksta, je bil YugoGPT natančnejši od modelov, treniranih predvsem na angleškem jeziku. A prav tu se konča zgodba o tehničnih prednostih – in začne tista o realnih omejitvah.
Za razliko od globalnih podjetij s področja umetne inteligence, ki svoje modele razvijajo z večmilijardnimi naložbami, državno podporo in na ogromnih trgih, je YugoGPT nastajal v povsem drugačnih razmerah.
"Dinamika v svetu umetne inteligence se je spremenila. Konec leta 2023 so se po vsem svetu začeli pojavljati nacionalni igralci, ki so za razvoj lokalnih jezikovnih modelov zbirali od 50 do 100 milijonov dolarjev," za Bloomberg Adria pojasnjuje Gordić. Ob tem dodaja, da imajo takšni projekti prednost, ker prihajajo z večjih trgov, z močnejšo institucionalno podporo in jasnimi komercialnimi cilji. "Balkan pa je majhen in razdrobljen prostor. Večja podjetja pogosto poslujejo v angleščini, pripravljenost trga za plačevanje lokalnih AI-orodij pa je omejena. To močno zoži možnosti, da bi se tehnično kakovosten model preoblikoval v vzdržen izdelek."
"Od izdelave kakovostnega velikega jezikovnega modela do tega, da ta postane za podjetja resnično uporaben, je še več ključnih korakov," poudarja Gordić. Brez stalnega financiranja in jasnega signala s trga ti koraki postanejo težko dosegljivi.
Zato je bil YugoGPT konec leta 2024 postavljen v mirovanje, ob možnosti, da projekt v prihodnje prevzamejo akademske ali civilnodružbene pobude. "To popolnoma podpiram, zato je bila licenca zasnovana kot odprtokodna in permisivna," pravi. "Obstaja tudi možnost, da bom v prostem času ponovno izuril bistveno boljši model," je Gordić še povedal za Bloomberg Adrio.
Glavni jezikovni modeli danes in kako se razlikujejo
Veliki jezikovni model je sistem umetne inteligence, treniran na ogromnih količinah podatkov. Modeli se razlikujejo po velikosti (številu parametrov), količini učnih podatkov in arhitekturi. Model s sedmimi milijardami parametrov razume osnove jezika, medtem ko modeli s stotinami milijard parametrov razumejo jezikovne nianse in kompleksne koncepte.
OpenAI (ChatGPT) je najboljši za splošno rabo in kreativnost. Gre za najbolj prepoznaven in najpogosteje uporabljan model z najbogatejšim ekosistemom dodatkov in integracij. Izstopa pri ustvarjanju kreativnih vsebin in pisanju marketinških besedil. Njegovi slabosti sta višja cena in pogoste težave s kapaciteto – v času največje obremenitve storitve ga včasih sploh ni mogoče uporabljati. OpenAI do konca leta 2026 pričakuje prihodke v višini 29,4 milijarde dolarjev.
Anthropic (Claude) je najboljši za programiranje in poslovno rabo. Odlikuje se pri pisanju kode in analizi tehnične dokumentacije, predvsem zaradi kontekstnega okna z 200.000 žetoni, kar mu omogoča obdelavo dokumentov dolžine cele knjige. Osredotočen je na enterprise stranke, ki iščejo zanesljivost. Podjetje beleži približno tri milijarde dolarjev prihodkov in je nedavno znižalo cene za 66 odstotkov.
Google (Gemini) je najboljši za multimodalne vsebine in integracijo z ekosistemom. Hkrati dela z besedilom, slikami, videom in kodo. Integriran je z orodji Google Workspace, kot so Gmail, Google Docs in Google Photos. Njegova prednost je izjemno veliko kontekstno okno z do dvema milijonoma žetonov. Slabosti sta počasnejši tempo inovacij in zaznava, da zaostaja za ChatGPT-jem in Claudeom.
Kitajski modeli (DeepSeek, Zhipu AI) so najbolj konkurenčni po ceni. DeepSeek V3.2 je od 10- do 50-krat cenejši od zahodnih konkurentov, ob tem pa ponuja zadovoljivo zmogljivost. Model je povsem odprtokoden in objavljen pod licenco MIT. Projekt financira kitajski hedge sklad High-Flyer, vreden približno osem milijard dolarjev. Zhipu AI GLM-4.7 dosega 73,8-odstotno natančnost na testu SWE-bench Verified, kar je najboljši rezultat med odprtokodnimi modeli.
Lekcija YugoGPT
YugoGPT ni dokaz, da lokalna umetna inteligenca ne more delovati. Nasprotno – pokazal je, da so lahko lokalni modeli natančnejši in kontekstualno pametnejši od globalnih sistemov. Hkrati pa je razkril tudi ključno slabost takšnih projektov: tehnična odličnost sama po sebi ni dovolj brez trga, kapitala in institucionalne podpore.
V svetu umetne inteligence, tako kot nekoč v avtomobilski industriji, dober izdelek ne zagotavlja uspeha. Zmagovalci ne bodo tisti, ki najbolje razumejo jezik, temveč tisti, ki jim uspe povezati tehnologijo, trg in dolgoročno strategijo.