Google förbereder sig för en betydande utvidgning av sina AI-funktioner med den kommande allmänna lanseringen av Gemini 2.5 Pro i juni 2025.
Enligt de senaste meddelandena från Google DeepMind är Gemini 2.5 Flash nu tillgänglig för alla i Gemini-appen, med planer på att göra den allmänt tillgänglig i Google AI Studio för utvecklare och i Vertex AI för företag i början av juni. Den kraftfullare Gemini 2.5 Pro-versionen följer kort därefter.
Den mest framträdande funktionen i 2.5 Pro-modellen är Deep Think, ett experimentellt förbättrat slutledningsläge som gör det möjligt för modellen att överväga flera hypoteser innan den svarar. Denna kapacitet är särskilt utformad för mycket komplexa matematik- och kodningsuppgifter, och Google rapporterar imponerande resultat på svåra riktmärken som 2025 års USA Mathematical Olympiad och LiveCodeBench, ett tävlingsinriktat kodningsbenchmark.
"Genom att utforska gränserna för Geminis slutledningsförmåga börjar vi nu testa ett förbättrat slutledningsläge kallat Deep Think, som använder nya forskningstekniker för att låta modellen överväga flera hypoteser innan den svarar", skrev Google i ett nyligen publicerat blogginlägg.
Säkerhet har varit ett huvudfokus för Gemini 2.5-familjen. Google har infört avancerade säkerhetsåtgärder som avsevärt har ökat Geminis skydd mot indirekta promptinjektionsattacker vid verktygsanvändning. Dessa attacker sker när skadliga instruktioner bäddas in i data som en AI-modell hämtar. Genom automatiserad red teaming och förstärkning av modellen har Google kraftigt minskat framgångsgraden för sådana attacker, vilket gör 2.5-familjen till deras säkraste modell hittills.
Utöver säkerhetsförbättringarna tar Google även in Project Mariners datoranvändningsfunktioner i Gemini API och Vertex AI. Företag som Automation Anywhere, UiPath, Browserbase och andra utforskar redan dess potential för automatisering och förbättrade arbetsflöden.
Ytterligare funktioner som kommer till både 2.5 Pro och 2.5 Flash inkluderar tankesammanfattningar, som organiserar modellens slutledningsprocess i ett tydligt format, samt inbyggda ljudfunktioner med stöd för flera talare på över 24 språk.
När Google fortsätter att konkurrera på den allt mer konkurrensutsatta AI-marknaden utgör dessa förbättringar av Gemini 2.5 Pro betydande framsteg inom slutledningsförmåga, säkerhet och multimodal funktionalitet.