menu
close

Google prezentuje Gemini 2.5 Flash z zaawansowanymi możliwościami rozumowania

Google udostępniło Gemini 2.5 Flash w trybie podglądu, wprowadzając znaczące ulepszenia do swojego szybkiego i ekonomicznego modelu AI. Nowa wersja oferuje hybrydowe możliwości rozumowania, pozwalając deweloperom kontrolować proces myślenia modelu przy zachowaniu wysokiej wydajności i efektywności. Podgląd jest już dostępny w Google AI Studio, Vertex AI oraz aplikacji Gemini, a ogólna dostępność planowana jest na początek czerwca 2025 roku.
Google prezentuje Gemini 2.5 Flash z zaawansowanymi możliwościami rozumowania

Google uruchomiło wersję podglądową Gemini 2.5 Flash – najnowszą odsłonę swojego wydajnego modelu AI, zaprojektowaną z myślą o równowadze pomiędzy wydajnością, szybkością a opłacalnością.

Bazując na fundamentach Gemini 2.0 Flash, nowy model 2.5 Flash oferuje znaczący skok w możliwościach rozumowania, jednocześnie zachowując swoją renomę pod względem efektywności. Google określa go jako „duży krok naprzód w zakresie rozumowania, przy jednoczesnym priorytetowym traktowaniu szybkości i kosztów”.

Najważniejszą cechą Gemini 2.5 Flash jest hybrydowy system rozumowania. To pierwszy w pełni hybrydowy model rozumowania Google, pozwalający deweloperom włączać lub wyłączać myślenie oraz ustawiać budżet myślenia, aby zoptymalizować równowagę pomiędzy jakością, kosztem a opóźnieniami. To innowacyjne podejście daje deweloperom niespotykaną dotąd kontrolę nad sposobem przetwarzania złożonych zadań przez model.

W praktyce oznacza to, że deweloperzy mogą określić „budżet myślenia”, który kontroluje, jak dużo rozumowania wykonuje model. Mogą regulować „liczbę tokenów, które model może wygenerować podczas myślenia” od 0 do 24 576 tokenów za pomocą suwaka w Google AI Studio i Vertex AI lub poprzez parametr API. Gdy budżet myślenia jest ustawiony na zero, model odpowiada kosztom i opóźnieniom Gemini 2.0 Flash.

Cennik odzwierciedla tę elastyczność: tokeny wejściowe kosztują 15 centów za milion, a wyjściowe 60 centów za milion bez rozumowania. Po aktywacji funkcji myślenia koszt wzrasta do 3,50 USD za milion tokenów.

Testy porównawcze pokazują imponujące wyniki. Gemini 2.5 Flash „osiąga bardzo dobre wyniki na trudnych promptach w LMArena, ustępując jedynie 2.5 Pro” i „ma porównywalne wskaźniki do innych wiodących modeli przy ułamku kosztów i rozmiaru”, pozostając „liderem pod względem stosunku ceny do wydajności”.

Google opisuje 2.5 Flash jako swój „najbardziej wydajny model roboczy zaprojektowany z myślą o szybkości i niskich kosztach”, podkreślając, że „uzyskał lepsze wyniki w kluczowych benchmarkach dotyczących rozumowania, multimodalności, kodu i długiego kontekstu, jednocześnie stając się jeszcze bardziej efektywny, zużywając o 20–30% mniej tokenów” w testach.

Nowy model jest obecnie dostępny w trybie podglądu za pośrednictwem wielu kanałów. Jest wdrażany „w Google AI Studio (dla deweloperów), Vertex AI (dla firm) oraz w aplikacji Gemini (dla wszystkich użytkowników)”. Według zapowiedzi Google z I/O 2025, zaktualizowana wersja będzie „ogólnie dostępna w Google AI Studio dla deweloperów oraz w Vertex AI dla firm na początku czerwca”, a Gemini 2.5 Pro pojawi się „niedługo później”.

Wraz z dalszym rozwojem możliwości AI przez Google, Gemini 2.5 Flash stanowi istotny krok naprzód w udostępnianiu zaawansowanego rozumowania deweloperom i użytkownikom w bardziej przystępny i opłacalny sposób.

Source:

Latest News