Google przekształca swój najbardziej zaawansowany model AI, Gemini 2.5 Pro, w tzw. „model świata” – system zdolny do rozumienia i symulowania aspektów rzeczywistości w sposób przypominający funkcjonowanie ludzkiego mózgu.
Według najnowszych zapowiedzi Google DeepMind podczas Google I/O 2025, ta funkcjonalność modelu świata pozwoli Gemini na planowanie i wyobrażanie sobie nowych doświadczeń poprzez zrozumienie i symulowanie elementów otaczającego świata. To znaczący krok naprzód w zdolności AI do rozumowania i interakcji z złożonymi środowiskami.
„Dlatego pracujemy nad rozszerzeniem naszego najlepszego multimodalnego modelu bazowego, Gemini 2.5 Pro, aby stał się ‘modelem świata’, który potrafi planować i wyobrażać sobie nowe doświadczenia poprzez rozumienie i symulowanie aspektów rzeczywistości – tak jak robi to ludzki mózg”, czytamy na oficjalnym blogu Google.
Podejście modelu świata bazuje na szeroko zakrojonych badaniach Google nad szkoleniem agentów AI do opanowywania złożonych gier i tworzenia interaktywnych symulacji. Dowody tych możliwości już pojawiają się w zdolności Gemini do wykorzystywania wiedzy o świecie i rozumowania do reprezentowania środowisk naturalnych, rozumienia intuicyjnej fizyki oraz uczenia robotów wykonywania poleceń i adaptacji w czasie rzeczywistym.
Kluczowym elementem tej ewolucji jest nowa funkcja Deep Think – eksperymentalny tryb rozszerzonego rozumowania dla Gemini 2.5 Pro. Deep Think pozwala modelowi rozważać wiele hipotez przed udzieleniem odpowiedzi, co znacząco poprawia wyniki w złożonych zadaniach matematycznych i programistycznych. Funkcja ta osiągnęła już imponujące wyniki w wymagających testach, takich jak konkurs matematyczny USAMO 2025 czy LiveCodeBench dla programowania.
Gemini 2.5 Pro z Deep Think jest obecnie dostępny dla zaufanych testerów poprzez API Gemini, a Google prowadzi dodatkowe oceny bezpieczeństwa przed szerszym udostępnieniem. Standardowy model Gemini 2.5 Pro ma być ogólnie dostępny pod koniec czerwca 2025 roku, po wcześniejszej premierze Gemini 2.5 Flash.
Ten postęp w kierunku modelowania świata wpisuje się w szerszą wizję Google, zakładającą stworzenie uniwersalnego asystenta AI, który rozumie kontekst, skutecznie planuje i podejmuje działania na różnych urządzeniach – ostatecznie zmieniając sposób, w jaki ludzie wchodzą w interakcję z systemami sztucznej inteligencji.