Google значително разшири възможностите си в областта на изкуствения интелект с пускането на Imagen 4 – най-напредналия си модел за генериране на изображения от текст, който вече е достъпен в платен предварителен преглед чрез Gemini API и Google AI Studio.
Imagen 4 представлява съществено подобрение спрямо предишните версии, особено по отношение на качеството на изобразяване на текст в генерираните изображения. Пускането включва два варианта: стандартния модел Imagen 4 на цена от $0,04 на изходно изображение и Imagen 4 Ultra на цена от $0,06 на изображение, който предлага по-висока прецизност при следване на потребителските инструкции. И двата модела използват технологията за воден знак SynthID, която е невидима за човешкото око, но помага за идентифициране на съдържание, генерирано от изкуствен интелект.
Това издание е част от по-широкото разширяване на семейството модели Gemini 2.5 на Google. Компанията направи моделите Gemini 2.5 Flash и Pro общодостъпни след успешни периоди на предварителен преглед, като същевременно представи Gemini 2.5 Flash-Lite в режим на предварителен преглед. Flash-Lite е позициониран като най-икономичния и бърз модел от серията 2.5, оптимизиран за задачи с голям обем и чувствителност към закъснение като класификация, превод и интелигентно маршрутизиране.
Въпреки фокуса си върху ефективността, Gemini 2.5 Flash-Lite запазва основните възможности на семейството 2.5, включително контекстен прозорец от 1 милион токена и поддръжка на вградени инструменти като интеграция с Google Search и изпълнение на код. За разлика от другите модели в семейството, при които мисловните възможности са активирани по подразбиране, Flash-Lite позволява на разработчиците да контролират "мисловния бюджет" чрез параметри на API, като мисленето е изключено по подразбиране за оптимизация на скоростта и разходите.
В допълнение към разширяването на възможностите за разработчици, Google пусна Gemini CLI – отворен AI агент, който предоставя достъп до Gemini директно от терминала. Този инструмент позволява на разработчиците да използват Gemini 2.5 Pro през команден ред за програмиране, решаване на задачи и управление на работни процеси. Отвореният код на Gemini CLI (под лиценз Apache 2.0) дава възможност на разработчиците да преглеждат кода, да проверяват сигурността и да допринасят за развитието на инструмента.
Последните AI решения на Google демонстрират ангажимента на компанията да предоставя на разработчиците все по-мощни и гъвкави инструменти в различни ценови категории и за разнообразни приложения – от висококачествено генериране на изображения до ефективна обработка на текст и AI асистенция през терминал.