menu
close

Google розширює портфель ШІ: Gemini 2.5 та Imagen 4

Google посилила свої можливості у сфері штучного інтелекту, зробивши Gemini 2.5 Flash і Pro загальнодоступними, а також представивши економічну модель Flash-Lite. Компанія також випустила Imagen 4 — свою найсучаснішу модель генерації зображень з тексту, яка суттєво покращила якість відтворення тексту. Ці новинки доповнює запуск Gemini CLI — відкритого інструменту, що інтегрує ШІ безпосередньо у термінали розробників для кодування та вирішення задач.
Google розширює портфель ШІ: Gemini 2.5 та Imagen 4

Google суттєво розширила свою екосистему штучного інтелекту, представивши низку важливих новинок і закріпивши лідерство у сфері генеративного ШІ.

Сімейство Gemini 2.5 поповнилося: моделі Flash і Pro тепер стабільні та загальнодоступні для використання у виробничих середовищах. Gemini 2.5 Flash і Pro вже кілька тижнів використовують у продакшені компанії Spline, Rooms, Snap і SmartBear. Зростання популярності та попиту на Gemini 2.5 Pro стало найшвидшим серед усіх моделей Google, що спонукало компанію зробити версію 06-05 стабільною без підвищення ціни. Google очікує, що Pro покаже найкращі результати у завданнях, які вимагають максимальної інтелектуальності та функціональності, зокрема у програмуванні та агентних сценаріях.

Крім того, Google представила Gemini 2.5 Flash-Lite у режимі попереднього перегляду — це найекономічніша та найшвидша модель серії 2.5. Flash-Lite розроблена як бюджетний варіант для масових завдань, таких як класифікація чи масштабне підсумовування, забезпечуючи кращу продуктивність у більшості тестів, швидший час до першого токена та більшу швидкість декодування токенів за секунду. Flash-Lite — це модель для міркувань, яка дозволяє динамічно керувати "бюджетом мислення" через параметр API. На відміну від інших моделей сімейства, режим мислення вимкнено за замовчуванням, адже Flash-Lite оптимізована для швидкості та економії. Незважаючи на це, вона підтримує всі вбудовані інструменти, зокрема Grounding з Google Search, виконання коду, контекст за URL та виклик функцій.

У сфері генерації зображень Google випустила Imagen 4, вперше анонсовану на I/O 2025 минулого місяця. За словами компанії, це їхня "найкраща модель генерації зображень з тексту", яка суттєво покращила якість відтворення тексту порівняно з попередніми версіями. Нова модель забезпечує вражаючу деталізацію дрібних елементів — таких як складні тканини, краплі води чи хутро тварин — і відмінно працює як у фотореалістичних, так і в абстрактних стилях. Серед інших покращень — підтримка роздільної здатності 2K, а також вдосконалена орфографія й типографіка. Imagen 4 і преміальна версія Imagen 4 Ultra вже доступні для платних користувачів у режимі попереднього перегляду через Gemini API, а також для обмеженого безкоштовного тестування у Google AI Studio. Вартість Imagen 4 складає $0,04 за одне зображення, а Ultra-версія — $0,06 за зображення.

Додатково до цих релізів Google представила Gemini CLI — відкритий агент ШІ, який інтегрує можливості Gemini безпосередньо у термінал розробника для кодування, вирішення задач і керування процесами. Користувачі можуть безкоштовно отримати доступ до Gemini 2.5 Pro за допомогою особистого облікового запису Google або використовувати ключі Google AI Studio чи Vertex AI для розширених можливостей. Gemini CLI пропонує найбільший у галузі ліміт використання: 60 запитів до моделі на хвилину та 1000 запитів на день безкоштовно. Інструмент надає потужні можливості ШІ — від розуміння коду та роботи з файлами до виконання команд і динамічного усунення проблем, забезпечуючи якісне оновлення досвіду роботи з командним рядком і дозволяючи писати код, дебажити помилки та оптимізувати робочі процеси за допомогою природної мови.

Усі ці новинки зміцнюють позиції Google на конкурентному ринку ШІ, надаючи розробникам і користувачам потужніші, ефективніші та доступніші інструменти для широкого спектра завдань.

Source:

Latest News