Nadgradnja Google Gemini: Kmalu novi glasovi za bolj naravne pogovore

Google, da bi bolje konkuriral ChatGPT pripravlja nove možnosti glasov za svojega AI pomočnika Gemini. Po nedavnih odkritjih v beta različici aplikacije Google za Android, nova funkcija “Izbor glasu” kmalu omogočila uporabnikom izbiro med več glasovi za glasovne odgovore. Trenutno preizkušana funkcija vključuje dva nova glasu, Ruby in River, čeprav ti glasovi v beta različici še ne delujejo popolnoma.

Gemini je ključen del Googlove strategije umetne inteligence, ki si prizadeva zagotoviti bolj pogovorno in intuitivno izkušnjo. Nedavne posodobitve Gemini so uvedle več naprednih funkcij, vključno z razširjenim kontekstnim oknom, ki lahko obdeluje do 1 milijon enot, kar je največ med široko dostopnimi potrošniškimi klepetalniki. Ta izboljšava Geminiju omogoča analizo obsežnih dokumentov, kot so dolgi raziskovalni članki ali več e-poštnih sporočil, ter celo ustvarjanje vizualizacij iz podatkovnih datotek​​.

Funkcija izbora glasu

Uvedba možnosti glasov je del širših prizadevanj Googla za brisanje meja med Gemini in Google Assistant, od katerih vsak služi različnim potrebam uporabnikov. Medtem ko je Google Assistant dobro uveljavljen za upravljanje pametnih domačih naprav in podporo širokemu spektru naprav, se Gemini osredotoča na razumevanje naravnega jezika in reševanje zapletenih nalog. Če bo funkcija izbora glasu implementirana, verjetno ne bo omejena le na dva glasu, saj bo sledila stopinjam konkurentov, kot je ChatGPT, ki je že pokazal impresivne glasovne zmogljivosti​ (PhoneArena)​.

Poleg novih možnosti glasov je Google predstavil tudi druge pomembne posodobitve v družini modelov Gemini. Te vključujejo uvedbo Gemini 1.5 Flash, lažjega in hitrejšega modela, optimiziranega za naloge z velikim obsegom, ter izboljšave Gemini 1.5 Pro, ki sedaj podpira kontekstno okno do 2 milijona enot. Te posodobitve izboljšujejo učinkovitost in multimodalno sklepanje, kar naredi Gemini bolj sposobnega v aplikacijah, kot so povzemanje, klepet, označevanje slik in videoposnetkov ter ekstrakcija podatkov iz dolgih dokumentov​.

[Vir: Tom’s Guide]; Portal24; Foto: Pixabay