Google представи Imagen 4 и разшири гамата Gemini 2.5

Google пусна Imagen 4 – най-усъвършенствания си модел за генериране на изображения от текст, който вече е достъпен в платен предварителен преглед чрез Gemini API и Google AI Studio. Пускането съвпада с общата наличност на моделите Gemini 2.5 Flash и Pro, както и с представянето на Gemini 2.5 Flash-Lite – най-икономичния и бърз модел от серията 2.5. Разработчиците вече могат да използват Gemini директно в терминала си чрез новия отворен инструмент Gemini CLI.

Google значително разшири възможностите си в областта на изкуствения интелект с пускането на Imagen 4 – най-напредналия си модел за генериране на изображения от текст, който вече е достъпен в платен предварителен преглед чрез Gemini API и Google AI Studio.

Imagen 4 представлява съществено подобрение спрямо предишните версии, особено по отношение на качеството на изобразяване на текст в генерираните изображения. Пускането включва два варианта: стандартния модел Imagen 4 на цена от $0,04 на изходно изображение и Imagen 4 Ultra на цена от $0,06 на изображение, който предлага по-висока прецизност при следване на потребителските инструкции. И двата модела използват технологията за воден знак SynthID, която е невидима за човешкото око, но помага за идентифициране на съдържание, генерирано от изкуствен интелект.

Това издание е част от по-широкото разширяване на семейството модели Gemini 2.5 на Google. Компанията направи моделите Gemini 2.5 Flash и Pro общодостъпни след успешни периоди на предварителен преглед, като същевременно представи Gemini 2.5 Flash-Lite в режим на предварителен преглед. Flash-Lite е позициониран като най-икономичния и бърз модел от серията 2.5, оптимизиран за задачи с голям обем и чувствителност към закъснение като класификация, превод и интелигентно маршрутизиране.

Въпреки фокуса си върху ефективността, Gemini 2.5 Flash-Lite запазва основните възможности на семейството 2.5, включително контекстен прозорец от 1 милион токена и поддръжка на вградени инструменти като интеграция с Google Search и изпълнение на код. За разлика от другите модели в семейството, при които мисловните възможности са активирани по подразбиране, Flash-Lite позволява на разработчиците да контролират "мисловния бюджет" чрез параметри на API, като мисленето е изключено по подразбиране за оптимизация на скоростта и разходите.

В допълнение към разширяването на възможностите за разработчици, Google пусна Gemini CLI – отворен AI агент, който предоставя достъп до Gemini директно от терминала. Този инструмент позволява на разработчиците да използват Gemini 2.5 Pro през команден ред за програмиране, решаване на задачи и управление на работни процеси. Отвореният код на Gemini CLI (под лиценз Apache 2.0) дава възможност на разработчиците да преглеждат кода, да проверяват сигурността и да допринасят за развитието на инструмента.

Последните AI решения на Google демонстрират ангажимента на компанията да предоставя на разработчиците все по-мощни и гъвкави инструменти в различни ценови категории и за разнообразни приложения – от висококачествено генериране на изображения до ефективна обработка на текст и AI асистенция през терминал.

Source:

Google представи Imagen 4 и разшири гамата Gemini 2.5

Latest News

Изкуственият интелект става масов: 1,8 милиарда потребители по света, сочи доклад

OpenTools.AI представя AI News Hub за технологични професионалисти

ЕС отлага ръководството за съответствие с Акта за изкуствения интелект за края на 2025 г.

Грузинските съдилища очертават пътя на изкуствения интелект в съдебната система

Суцкевер поема ръководството на SSI след като Meta привлече изпълнителния директор Грос

Чиповете за изкуствен интелект с ултраниска консумация на Ambiq Micro предизвикват IPO на фона на нарастващо търсене

Зукърбърг стартира Meta Superintelligence Labs в смела AI трансформация

Grok 4 на xAI ще бъде пуснат с усъвършенствани възможности за програмиране

Baidu пуска ERNIE 4.5 като отворен код и предизвиква гигантите в изкуствения интелект

Google представи Imagen 4 и разшири гамата Gemini 2.5

Related Articles

Baidu пуска ERNIE 4.5 като отворен код и предизвиква гигантите в изкуствения интелект

Grok 4 на xAI ще бъде пуснат с усъвършенствани възможности за програмиране

Роботизираната армия на Amazon достигна 1 милион, нов AI мозък ги прави по-умни

Зукърбърг стартира Meta Superintelligence Labs в смела AI трансформация

OpenTools.AI представя AI News Hub за технологични професионалисти

Latest News

Изкуственият интелект става масов: 1,8 милиарда потребители по света, сочи доклад

OpenTools.AI представя AI News Hub за технологични професионалисти

ЕС отлага ръководството за съответствие с Акта за изкуствения интелект за края на 2025 г.

Грузинските съдилища очертават пътя на изкуствения интелект в съдебната система

Суцкевер поема ръководството на SSI след като Meta привлече изпълнителния директор Грос

Чиповете за изкуствен интелект с ултраниска консумация на Ambiq Micro предизвикват IPO на фона на нарастващо търсене

Зукърбърг стартира Meta Superintelligence Labs в смела AI трансформация

Grok 4 на xAI ще бъде пуснат с усъвършенствани възможности за програмиране

Baidu пуска ERNIE 4.5 като отворен код и предизвиква гигантите в изкуствения интелект