DeepSeek sodeluje z univerzo Tsinghua pri zmanjševanju potrebnega časa za učenje svojih modelov umetne inteligence, s ciljem znižati obratovalne stroške. Kitajski startup, ki je januarja pretresel trg s svojim cenovno ugodnim modelom za sklepanje, je skupaj z raziskovalci iz pekinga pripravil znanstveni članek, v katerem opisujejo nov pristop k utrjevalnemu učenju (reinforcement learning), s katerim želijo povečati učinkovitost modelov.
Novi pristop naj bi AI-modelom pomagal bolje slediti človeškim preferencam, saj za bolj natančne in razumljive odgovore prejmejo nagrade, so zapisali raziskovalci. Utrjevalno učenje se je že izkazalo kot učinkovito pri pospeševanju opravil v ozko usmerjenih aplikacijah. Razširitev na bolj splošne naloge pa ostaja izziv — in ravno ta težava želi ekipa DeepSeeka rešiti s pristopom, ki ga imenuje "samopravila kritična prilagoditev" (self-principled critique tuning). Po navedbah iz članka je strategija presegla obstoječe metode in modele na različnih testih ter dosegla boljše rezultate z manjšimi računalniškimi viri.
DeepSeek svoje nove modele poimenuje DeepSeek-GRM — kratica za "generalist reward modeling" oziroma splošni model nagrajevanja — in jih namerava objaviti kot odprtokodno rešitev, so sporočili iz podjetja. Tudi drugi razvijalci umetne inteligence, vključno s kitajskim tehnološkim velikanom Alibaba Group in OpenAI iz San Francisca, si prizadevajo izboljšati sposobnosti za sklepanje in samopopravljanje modelov med izvajanjem nalog v realnem času.
Preberi še

Trump na misiji: 'iPhone bo izdelan v ZDA!' Toda, zakaj to ni možno
Trump si želi, da bi Apple iPhone proizvajal v ZDA, a je to zaradi pomanjkanja infrastrukture, kadrov in dobaviteljev skoraj nemogoče.
pred 14 urami

Pred eksplozijo DeepSeeka je njegov prihod napovedala Chatbot Arena
Poznavalci področja umetne inteligence najbolje delujoče modele prepoznavajo s pomočjo sistemov množičnega ocenjevanja.
10.04.2025

Evropa lahko izstopi iz sence Silicijeve doline
Če bo rast sektorja umetne inteligence trpel zaradi carin na aluminij, jeklo in baker, bo ameriška tehnologija morda končno dobila konkurenco.
10.04.2025

Združitev XAI in X prinaša izjemne donose vlagateljem v platformo X
Elon Musk je prek svojega AI podjetja xAI ponovno prevzel lastništvo nad družbenim omrežjem X.
01.04.2025

Milijarder Bill Gates: To so poklici odporni na AI
Gates opozarja, da bo veliko poklicev izginilo, vendar nekateri poklici ostajajo nenadomestljivi.
29.03.2025
Meta iz Menlo Parka v Kaliforniji je čez vikend predstavila svojo najnovejšo družino AI-modelov Llama 4, ki so prvi z uporabo arhitekture "Mixture of Experts" (MoE). DeepSeekovi modeli močno temeljijo na arhitekturi MoE za učinkovitejšo rabo virov, Meta pa je svoje modele primerjala prav s startupom iz Hangzhouja. DeepSeek za zdaj še ni razkril, kdaj bo izdal svoj naslednji model.