Google razkriva Gemini 2.5: Najnaprednejši model umetne inteligence doslej

Tehnološki velikan Google je s svojim raziskovalnim oddelkom DeepMind predstavil Gemini 2.5, ki ga opisujejo kot “najinteligentnejši model umetne inteligence” v svoji zgodovini. Prvi v tej novi generaciji je eksperimentalni model Gemini 2.5 Pro, ki že postavlja nove standarde na področju zmogljivosti. Po navedbah DeepMinda je model dosegel vrhunske rezultate na številnih merilih uspešnosti, kar nakazuje, da gre za pomemben korak naprej v razvoju umetne inteligence, navaja AI News. Tehnični direktor Google DeepMind, Koray Kavukcuoglu, poudarja, da gre pri Gemini 2.5 za “model razmišljanja”, ki ne le obdeluje podatke, temveč skozi logično sklepanje pride do natančnih in premišljenih odgovorov.

Kavukcuoglu je pojasnil, da zmožnost razumevanja pri tem modelu presega preprosto klasifikacijo ali napovedovanje. Sistem lahko analizira informacije, upošteva kontekst in nianse ter na podlagi tega sprejema odločitve. To je rezultat dolgoletnih raziskav DeepMinda, ki so vključevale tehnike, kot sta okrepljeno učenje in nagovarjanje v verigi misli. Temelji, postavljeni z modelom Gemini 2.0 Flash Thinking, so zdaj nadgrajeni z novo stopnjo zmogljivosti, ki jo prinaša Gemini 2.5. Google namerava te napredne zmožnosti razmišljanja vključiti v vse prihodnje modele, kar odpira vrata reševanju kompleksnejših izzivov in razvoju zmogljivejših kontekstno osveščenih agentov.

Gemini 2.5 Pro na vrhu lestvic in v ospredju tehnoloških dosežkov

Gemini 2.5 Pro že dokazuje svojo superiornost. Na lestvici LMArena, ki meri preference uporabnikov, si je zagotovil prvo mesto z občutno prednostjo pred konkurenco. Model izstopa na področjih, kot so matematika, znanost, kodiranje in sklepanje. Na merilih, kot sta GPQA in AIME 2025, je dosegel vrhunske rezultate brez uporabe dragih tehnik preizkusnega časa, kot je večinsko glasovanje. Prav tako je na izpitu Humanity’s, ki preizkuša meje človeškega znanja in razmišljanja, dosegel impresiven rezultat 18,8 %.

Poleg tega je Gemini 2.5 Pro izjemen na področju kodiranja. Na industrijskem standardu SWE-Bench Verified je z uporabo prilagojenega agentskega sistema dosegel 63,8-odstotni rezultat. Model ne le generira kodo, temveč lahko iz enostavnega poziva ustvari delujočo videoigro ali vizualno privlačne spletne aplikacije. DeepMind je še dodatno izboljšal učinkovitost kodiranja v primerjavi s predhodnikom Gemini 2.0, pri čemer napoveduje nadaljnje nadgradnje.

Gemini 2.5 gradi na prednostih prejšnjih modelov, kot sta multimodalnost in obsežno kontekstno okno. Začenja z enim milijonom žetonov, ki jih nameravajo kmalu razširiti na dva milijona. To omogoča modelu obdelavo ogromnih količin podatkov iz različnih virov – besedila, zvoka, slik, videa in celo celotnih repozitorijev kode. Razvijalci lahko z Gemini 2.5 Pro že eksperimentirajo v Google AI Studio, medtem ko je za uporabnike Gemini Advanced dostopen prek namiznih in mobilnih platform. V prihodnjih tednih bo model na voljo tudi na Vertex AI, kar nakazuje široko uporabnost v poslovnih in razvojnih okoljih.

Portal24; Foto: Freepik