DeepSeek: Vse kar morate vedeti na enem mestu

Avtor: Daniel Fazlić

27. januarja 2025, 12:29

Kitajski startup DeepSeek začel novo revolucijo? Kaj prinaša?

Njihov nov model je nastal z inovativnim pristopom.

Je več kot desetkrat cenejši kot OpenAI in ChatGPT

DeepSeek: Vse kar morate vedeti na enem mestu

Depostiphotos

Daniel Fazlić
Direktor digitalnega razvoja in urednik regionalne vertikale Tehnologija

text size

- +

Kitajski startup DeepSeek je - sodeč po njihovi objavi na spletu - začel manjšo revolucijo v izdelovanju novih modelov učenja za sisteme umetne inteligence (AI). Njihov novi model - DeepSeek-R1 in DeepSeek-R1 Zero - je po poročilu, ki ga je podjetje objavilo na spletu kar 98 odstotkov cenejše od modelov, kot jih razvijajo na zahodu. Za izdelavo naj bi porabili manj kot šest milijonov dolarjev, medtem ko po besedah direktorja Anthropica Daria Amodeia podobni sistemi v tujini stanejo tudi po stokrat več.

Nov model je po ocenah strokovnjakov, skoraj na ravni modelov OpenAI 4o, in boljši recimo od Metinega modela, ki ga razvija. In kar je najbolj nenavadno DeepSeekova koda je odprta, kar pomeni, da si jo v teoriji vsak lahko prisvoji in dopolni po lasnih željah. Zakaj je to DeepSeek naredil, še ni jasno, bo pa to precej pokvarilo teden OpenAI in drugim, ki svojo kodo skrivajo in za uporabo njihovih kapacitet tudi več računajo.

Po obisku OpenAI in DeepSeek vidimo, da je tudi uporaba API in njihovih kapacitet veliko cenejša pri kitajskem ponudniku. Številni uporabniki na X so prav tako zapisali, da so si na lastne računalnike, ki niso ravno vrhunski, naložili lokalne variante DeepSeek (mini) in delujejo. Marc Andreessen, eden najbolj znanih investitorjev v Silicijevi dolini, je dejal:

Preberi še

Borza

Krvav začetek trgovanja: Kako nizko lahko pade tehnološki indeks Nasdaq?

Veliki padci cen delnic v Evropi, pričakovani padci ob odprtju trgov v ZDA; Nvidia 11-odstotni upad. Zakaj je kitajski DeepSeek grožnja ameriški prevladi v umetni inteligenci?

27.01.2025

Avtor: Urban Červek

Operator: revolucionarni AI agent OpenAI, ki prevzema nadzor

Operator je najnovejši skrivnostni projekt OpenAI, ki napoveduje preobrat v umetni inteligenci. Ustvarjen je za samostojno reševanje kompleksnih nalog z minimalnim posredovanjem.

22.01.2025

Avtor: Daniel Fazlić

ZDA Slovencem omejujejo uvoz Nvidijinih čipov

Slovenija se sooča z omejitvami pri dostopu do naprednih AI čipov zaradi novih ameriških pravil o izvozu.

20.01.2025

Avtor: Daniel Fazlić

Borza

Ambiciozni projekt Stargate povzročil borzno veselico tehnoloških velikanov

Kaj prinaša 500 milijard dolarjev vreden projekt umetne inteligence?

23.01.2025

Avtor: Mihael Šmirmaul

Deepseek R1 is AI's Sputnik moment. — Marc Andreessen 🇺🇸 (@pmarca) January 26, 2025

Kako so Kitajci sploh lahko naredili tako uspešen model? No, če sledimo njihovi objavi ob izidu, so na tretji strani recimo zapisali, da so uporabili zgolj spodbujevalno učenje, brez nadzora, da bi prišli do želenega rezultata. Zelo poenostavljeno to pomeni, da razvijalci niso pregledovali samih postopkov razmišljanja v procesu iskanja rešitve. Tradicionalno pri razvijanju novih LLM modelov so razvijalci vsak korak, ki ga je model potreboval, da je prišel do rešitve "nagradili/kaznovali". Modelu so torej ljudje dali kazen, če se je v korakih/procesu zmotil in nagradili, če je bil korak pravilen, in ga tako vodili do cilja, da je prišel do prave rešitve.

Inovativna (in predvsem hrabra) metoda

DeepSeekova metoda je bila bolj neposredna: model so nagradili le za pravilno rešitev/odgovor, samo postopek pa si je model izbiral sam – in tako zmanjšali število korakov, ki jih je bilo treba nadzorovati. Ampak dejstvo, da je model v 99,9 odstotka nastal samo s spodbujevalnim učenjem, je napredek, ki ga ni mogoče zanikati.

We are living in a timeline where a non-US company is keeping the original mission of OpenAI alive - truly open, frontier research that empowers all. It makes no sense. The most entertaining outcome is the most likely.

DeepSeek-R1 not only open-sources a barrage of models but… pic.twitter.com/M7eZnEmCOY — Jim Fan (@DrJimFan) January 20, 2025

V poročilu navajajo, da ima model težave pri daljših pogovorih, številnih jezikih in da včasih odgovori niso berljivi. O halucinacijah ne govorijo veliko, a priznavajo, da se dogajajo. Ravno zato bodo ta model zdaj dopolnjevali z nekakšnim hibridnim načinom, kjer bodo skozi model reševali predstavljanje in iskanje pravih rešitev - takrat, ko model sam tega ne bo zmogel.

Kako so prišli do računskih kapacitet?

Teden dni od predstavitve novega modela, kar je že in še bo precej vplivalo na delnice tehnoloških podjetij povsod po svetu, je še veliko neznank.

Wall Street Journal je nekoliko natančneje pregledal njihovo oceno, da je ves proces stal samo šest milijonov dolarjev. "DeepSeek je v tehničnem poročilu dejal, da je za usposabljanje svojega modela V3 uporabil več kot dva tisoč čipov Nvidia, v primerjavi z več deset tisoč čipi za usposabljanje modelov podobne velikosti. Nekaj ameriških strokovnjakov za umetno inteligenco je nedavno podvomilo, ali High-Flyer in DeepSeek dostopata do računalniških kapacitet, ki presegajo uradne," so zapisali.

Pa tudi sam startup DeepSeek naj bi po poročanju MiT Tech Review: "Kitajski medij 36Kr ocenjuje, da ima podjetje na zalogi več kot deset tisoč modernih Nvidijinih čipov, Dylan Patel, ustanovitelj raziskovalnega svetovalnega podjetja AI SemiAnalysis, pa ocenjuje, da jih imajo vsaj 50.000." Vse te čipe, tudi Nvidinie H100, naj bi pridobili, preden so sankcije začele res delovati.

Tako da sama cena razvoja novega modela je verjetno precej višja, ampak kitajska podjetja ne želijo razkriti njihovih investicij v zmogljive čipe, saj bi to lahko ogrozilo dodaten priliv, ki je zanje že tako ali tako omejen.

Omejitve zahtevale prilagajanje

"Nadzor izvoza je v bistvu potisnil kitajska podjetja v kot, kjer morajo biti veliko bolj učinkovita s svojimi omejenimi računalniškimi viri," pravi Matt Sheehan, raziskovalec AI pri Fundaciji Carnegie za mednarodni mir. "Verjetno bomo v prihodnosti priča veliki konsolidaciji, povezani s pomanjkanjem računskih kapacitet." Gre za zelo pomembno izjavo. Tudi ustanovitelj DeepSeek Liang Wenfeng je dejal podobno, ko je za kitajske medije dejal, kakšne rešitve iščejo.

In to je za zdaj znano o novem Sputniku. Cena je verjetno veliko višja, kot jo priznava DeepSeek, a je njihova rešitev revolucionarna, saj je prebila nevidni zid počasnega strojnega učenja in predvsem to rešitev ponudilo na voljo celemu svetu.

A revolution can be neither made nor stopped. The only thing that can be done is for one of several of its children to give it a direction by dint of victories.

-Napoleon — Sam Altman (@sama) January 25, 2025

Sputnik je bil katalizator

"Čeprav moramo še počakati ali se bo DeepSeek dolgoročno izkazal za uporabno in cenejšo alternativo, so začetne skrbi osredotočene na to, ali je cenovna moč ameriških tehnoloških velikanov ogrožena in ali je treba njihove ogromne investicije v AI ponovno oceniti," je dejal Jun Rong Yeap iz IG Asia za Bloomberg.

Uporabniki novega modela so prav tako opazili, da noče odgovarjati na občutljiva politična vprašanja o Kitajski in voditelju Xi Jinpingu. V nekaterih primerih izdelek daje odgovore v skladu z uradno propagando Pekinga, namesto da vključuje perspektivo vladnih kritikov, kot to počne ChatGPT. Na vprašanja o trgu Nebeškega miru tako na DeepSeeku ne boste dobili pravih odgovorov. Ampak, glede na to, da gre za odprtokodno rešitev, se to lahko kadar koli popravi in prilagodi za lokalno okolje.

Vaše prijave ni bilo mogoče shraniti. Prosimo, poskusite ponovno.

Uspešno ste se prijavili.

Kaj pa to pomeni za vse investicije?

Isti teden, kot je DeepSeek predstavil svoj nov model, so v ZDA začeli s projektom Stargate – ki bo zagotovil 500 milijard dolarjev za razvoj novih podatkovnih centrov in centrov za razvoj AI. Če sledimo razvoju AI, bo to zdaj šele šlo v nebesa. Sputnik je v vesolje poletel leta 1957 – samo 12 let kasneje pa smo že pristali na Luni. Če smo mislili, da bo za implementacijo AI v vse kapacitete potrebna še številna leta, so kitajski razvijalci to skrajšali. Najbolje je misel zapisal Jim Fan, eden bolj znanih raziskovalcev Nvidie:

"Številni strokovnjaki so v paniki glede tega, kako lahko DeepSeek uspe s tako majhnim proračunom. Jaz to vidim drugače - z ogromnim nasmehom na obrazu. Zakaj nismo veseli izboljšav v zakonu o skaliranju? DeepSeek je nedvoumen dokaz, da je mogoče ustvariti povečevanje inteligenčnih kapacitet z desetkrat nižjimi stroški, kar pomeni, da bomo dobili desetkrat zmogljivejši AI z računalnikom, ki ga imamo danes ali gradimo za jutri. Preprosta matematika!"

Vse investicije v izgradnjo kapacitet bodo še bolj potrebne, saj bo zdaj lahko veliko držav, ali pa celo EU, zgradil svoje modele AI in jih prilagodil za lastne potrebne za delček razvojne cene. Novodobni Sputnik je tekmo začel, a tisti, ki bo imel največ kapacitet in energije, da jo bo poganjalo, bo zmagovalec.

Do people really believe this? If training models get cheaper faster and easier, the demand for inference (actual real world use of AI) will grow and accelerate even faster, which assures the supply of compute will be used https://t.co/Ra9EwqnMGL — Garry Tan (@garrytan) January 25, 2025

Nvidia OpenAI Stargate deepseek

Naložbe

Nvidia in OpenAI v pogajanjih o finančnem jamstvu za podatkovni center v višini 250 milijard

Nvidia se pogaja o podpori najemu podatkovnega centra OpenAI v vrednosti 500 milijard dolarjev.

27.07.2026

Šah-mat velikana iz ozadja: je SoftBank najboljša AI stava za leto 2026?

Medtem ko so delnice Nvidie po rezultatih, ki niso izpolnili visokih pričakovanj Wall Streeta, padle, je SoftBank poskočil za skoraj 20 odstotkov, saj vlagatelji vse več stavijo na širšo infrastrukturo umetne inteligence.

24.05.2026

Avtor: Bojana Lazarević

Anthropic prehitel OpenAI: nova razmerja moči v industriji umetne inteligence

Anthropic je po prihodkih prvič prehitel OpenAI in presegel 30 milijard dolarjev letno. To ni zgolj menjava na vrhu, temveč znak, da se trg umetne inteligence vse bolj oblikuje okoli potreb velikih korporacij.

15.04.2026

Avtor: Vladislav Pavlov

Oracle in OpenAI ukinjata načrte za širitev podatkovnega centra

Oracle in OpenAI sta opustila načrte za širitev vodilnega podatkovnega centra za umetno inteligenco v Teksasu.

06.03.2026

Vse novice iz rubrike Tehnologija

Od nepremičnin do AI: Vzpon novega razreda Xijevih 'piflarjev', ki služijo milijarde

Globalna tekma za prevlado na področju AI-tehnologije ustvarja novi rod kitajskih milijarderjev.

28.07.2026

Avtor: Aleš Kovačič

Rdeči AI-cunami: Xi prihodnost Kitajske stavi na domače čipe in robote, kdor se upira, je izdajalec

Peking z borznimi intervencijami ščiti domači AI-sektor, v središču nacionalne strategije Huawei.

27.07.2026

Avtor: Aleš Kovačič

Zakaj kitajski AI-kloni, kot je Kimi K3, sesuvajo Wall Street

S Kimi K3 Xi zmanjšuje tehnološki zaostanek za ZDA, vključuje globalni jug, računa tudi na Slovenijo.

21.07.2026

Avtor: Aleš Kovačič

Digitalizacija

Prihodnost bančništva je v dobri uporabniški izkušnji

Digitalizacija bančništva spreminja način, kako uporabniki dostopajo do finančnih storitev. Sodelovanje AikBank in ASEE kaže, kako lahko napredne tehnologije bankam omogočijo hitrejše, varnejše in popolnoma digitalne procese, kot je spletno odpiranje računa brez obiska poslovalnice.

07.07.2026

Inovacije

Tanja Permozer o vesolju in poslu: Gre za tekmo in biti prvi

Tanja Permozer prevzela mesto podpredsednice sveta Evropske vesoljske agencije.

06.07.2026

Avtor: Iva Lačan

Tehnologija

Moonshotov model Kimi ustvarjen z 20.000 čipi Nvidie

Moonshot naj bi z Alibabo sklenil sporazum za uporabo čipov Nvidie za izdelavo modelov AI.

31.07.2026

Inovacije

Anthropicovi AI-modeli med testiranjem vdrli v tri organizacije

Niti Anthropic niti organizacije, v katere je bilo vdrto, vdorov niso zaznale.

31.07.2026

Inovacije

Kitajska družba DJI "izključena" iz trga ZDA, a je našla obvod, kako se tja vrniti?

DJI predstavlja najnovejši izdelek in nadaljuje globalno prodajo, čeprav so njegovi izdelki po lanski zvezni prepovedi še vedno izločeni z ameriškega trga.

30.07.2026

Od nepremičnin do AI: Vzpon novega razreda Xijevih 'piflarjev', ki služijo milijarde

Globalna tekma za prevlado na področju AI-tehnologije ustvarja novi rod kitajskih milijarderjev.

28.07.2026

Avtor: Aleš Kovačič

Rdeči AI-cunami: Xi prihodnost Kitajske stavi na domače čipe in robote, kdor se upira, je izdajalec

Peking z borznimi intervencijami ščiti domači AI-sektor, v središču nacionalne strategije Huawei.

27.07.2026

Avtor: Aleš Kovačič

vse novice iz rubrike Tehnologija

Za nadaljevanje branja se registrirajte. Registrirajte se

Nadaljujte z branjem tako, da izberete eno od spodnjih možnosti.

BREZPLAČEN RAČUN

Preberite ta članek in še 3 (ne velja za PREMIUM članke)

Brezplačno glasilo

Registracija

Naročnina

Neomejen dostop do premium vsebin na vseh 5 portalih

Neomejen dostop do TV in video vsebin

Ekskluzivne zgodbe in analize iz Businessweek Adria

Poglej ponudbe

Aktivirajte še 1 brezplačen članek in nadaljujte z branjem.

Odkleni zdaj

Izkoristili ste 3 brezplačne članke.

Cenimo vaše zanimanje za zanesljive informacije. Aktivirajte še 1 članek brezplačno in nadaljujte z branjem.

Odkleni zdaj

Izkoristite ekskluzivno ponudbo danes!

Zagotovite si neomejen dostop še danes

PRIPOROČAMO

Letna Naročnina

€27,49 letno Prekličete kadar koli.

Mesečna Naročnina

€4.99 mesečno Prekličete kadar koli.

Nadaljuj

Izkoristite ekskluzivno ponudbo danes!

Poglej ponudbe

Ne le novice, ampak poglobljene vsebine

Naročite se in odklenite zanesljive analize, kontekst in regionalne perspektive.

Odklenite vsebino

Deli novico

DeepSeek: Vse kar morate vedeti na enem mestu

Deli novico

Preberi še

Inovativna (in predvsem hrabra) metoda

Kako so prišli do računskih kapacitet?

Omejitve zahtevale prilagajanje

Sputnik je bil katalizator

Kaj pa to pomeni za vse investicije?

Registrirajte se in odklenite 5 člankov!

Nadaljujte z branjem tako, da izberete eno od spodnjih možnosti.

BREZPLAČEN RAČUN

Naročnina

Cenimo vaše zanimanje za zanesljive informacije. Aktivirajte še 1 članek brezplačno in nadaljujte z branjem.

Ne le novice, ampak poglobljene vsebine

Prijavite se

Izberite drugo možnost prijave

Dobrodošli v

Bloomberg Adria

Naročnina

Neophodno je da popunite lične podatke radi dostave Bloomberg Businessweek-a

Registracija

Izberite drugo možnost prijave

Sprememba gesla

Največje število naprav je preseženo. Če ste lastnik računa, kliknite "Pošlji prijavo z e-pošto", da prejmete e-pošto s povezavo za prijavo. Po prijavi boste lahko upravljali s svojimi napravami.

Na vaš naslov je bilo poslano e-poštno sporočilo s povezavo za prijavo.

Zaradi nenavadne dejavnosti smo blokirali vse zahteve te naprave. Poskusite znova kasneje.

Povezava za aktivacijo računa je bila poslana na vaš elektronski naslov!

Račun ni aktiviran!

Povezava za ponastavitev gesla je bila poslana na vaš e-poštni naslov!

Najprej poskrbimo za nastavitve.

Še zadnji korak!

Podari članek