DeepSeek V3-0324: Prvi odprtokodni model brez razmišljanja

Svet umetne inteligence je dočakal pomemben mejnik: DeepSeek V3-0324 je postal prvi odprtokodni model brez razmišljanja, ki je dosegel najvišjo oceno na indeksu inteligence umetne analize. Ta dosežek ne le postavlja nov standard za odprtokodne rešitve, temveč tudi presega nekatere vodilne lastniške modele, kot so Googlov Gemini 2.0 Pro, Anthropicov Claude 3.7 Sonnet in Metin Llama 3.3 70B. Model je v merilu uspešnosti napredoval za sedem točk, kar ga uvršča v ospredje aplikacij, kjer je hitrost odziva ključnega pomena. Kljub temu pa zaostaja za modeli razmišljanja, kot so DeepSeekov R1 ter ponudbe OpenAI in Alibabe, ki so bolj primerni za kompleksne naloge.

DeepSeek V3-0324 je zasnovan kot model brez sklepanja, kar pomeni, da generira odgovore takoj, brez zamudnega procesa »razmišljanja«, piše AI News. Takšna tehnologija je idealna za uporabo v realnem času, kot so klepetalni roboti, avtomatizacija storitev za stranke ali prevajanje v živo. Najnovejša različica DeepSeeka s tem ne le zasenči konkurenco med odprtokodnimi modeli, temveč tudi dokazuje, da lahko odprtokodne rešitve uspešno tekmujejo z lastniškimi orodji. »To je prvič, da je odprtokodni model prevzel vodstvo med modeli brez razmišljanja. Gre za pomemben trenutek za skupnost,« so zapisali pri Artificial Analysis.

Odprtokodni AI stopa v ospredje

Tehnične specifikacije DeepSeek V3-0324 ostajajo impresivne, čeprav večinoma nespremenjene glede na predhodnika iz decembra 2024. Model ponuja 128.000 kontekstnih oken (omejenih na 64.000 prek DeepSeekovega API-ja), skupno 671 milijard parametrov, ki zahtevajo več kot 700 GB pomnilnika GPE za natančnost FP8, in 37 milijard aktivnih parametrov. Deluje izključno z besedilom, saj ne podpira multimodalnih funkcionalnosti, na voljo pa je pod licenco MIT. »To še zdaleč ni nekaj, kar bi lahko poganjali doma,« so v šali pripomnili pri Artificial Analysis, s čimer so poudarili, da model zahteva infrastrukturo na ravni podjetij.

Kljub temu, da lastniški modeli razmišljanja, kot je DeepSeek R1, še naprej prevladujejo v širšem indeksu inteligence, se razlika med njimi in odprtokodnimi alternativami zmanjšuje. Pred tremi meseci je DeepSeek V3 že nakazal svoj potencial, saj se je približal Anthropicu in Googlu, zdaj pa posodobljena različica V3-0324 ne le vodi med odprtokodnimi modeli, temveč tudi prekaša vse lastniške konkurente brez razmišljanja. »Ta izdaja je morda celo bolj impresivna kot R1,« menijo pri Artificial Analysis.

Napredek DeepSeeka nakazuje širši premik v industriji umetne inteligence, kjer odprtokodni sistemi vse bolj konkurirajo zaprtim. Za razvijalce in podjetja V3-0324 ponuja zmogljivo in prilagodljivo orodje, čeprav bi lahko njegovi računski stroški omejili širšo dostopnost.

Portal24; Foto: Vecteezy