Gemini Diffusion od Googlu přináší revoluci v generování textu pomocí AI

Google představil Gemini Diffusion, průlomový model pro generování textu, který dokáže převádět náhodný šum na smysluplný text až pětkrát rychleji než předchozí modely. Experimentální model využívá difuzní technologii – podobně jako při generování obrázků – a zvládne produkovat až 2 000 tokenů za sekundu při zachování srovnatelného výkonu v programování. Google také vylepšil řadu Gemini 2.5 o tzv. "rozpočty na přemýšlení", které vývojářům umožňují přesně řídit schopnosti modelu a náklady.

Google DeepMind představil Gemini Diffusion, revoluční přístup ke generování textu pomocí umělé inteligence, který znamená zásadní odklon od tradičních autoregresivních jazykových modelů.

Na rozdíl od běžných modelů, které generují text sekvenčně po jednotlivých tokenech, využívá Gemini Diffusion difuzní technologii – dosud používanou hlavně při generování obrázků a videí – k postupnému zpřesňování náhodného šumu do smysluplného textu. Tento inovativní přístup umožňuje modelu generovat obsah neuvěřitelnou rychlostí až 2 000 tokenů za sekundu, jak uvádějí výzkumníci z DeepMind.

„Namísto přímé predikce textu se model učí generovat výstupy postupným zpřesňováním šumu,“ vysvětluje Google ve svém oznámení. „To znamená, že může velmi rychle iterovat a opravovat chyby už během samotného procesu generování.“

Experimentální demo, které je aktuálně dostupné prostřednictvím čekací listiny, ukazuje, že tato technologie dokáže dosáhnout srovnatelného výkonu v programování jako stávající modely Googlu, přičemž výrazně zkracuje dobu generování. V benchmarcích Gemini Diffusion dosahuje podobných výsledků jako Gemini 2.0 Flash-Lite v úlohách jako HumanEval a MBPP.

Oriol Vinyals, viceprezident pro výzkum a vedoucí deep learningu v Google DeepMind a spolupředseda projektu Gemini, označil vydání za osobní milník a poznamenal, že demo běželo tak rychle, že museli zpomalit video, aby bylo vůbec sledovatelné.

Současně Google rozšířil řadu Gemini 2.5 o nové možnosti. Společnost představila Gemini 2.5 Flash s rozpočty na přemýšlení, které vývojářům dávají bezprecedentní kontrolu nad tím, kolik "uvažování" jejich AI provede. Tato funkce umožňuje uživatelům vyvážit kvalitu, latenci a náklady nastavením limitu tokenů (až 24 576 tokenů) pro proces uvažování modelu.

Google také rozšiřuje rozpočty na přemýšlení na Gemini 2.5 Pro, přičemž obecná dostupnost se očekává v následujících týdnech. Navíc společnost přidala nativní podporu SDK pro definice Model Context Protocol (MCP) v Gemini API, což usnadňuje integraci s open-source nástroji a vývoj agentních aplikací.

Tyto inovace představují další krok Googlu směrem k efektivnější, lépe ovladatelné a dostupnější AI pro vývojáře při zachování vysokých standardů výkonu.

Source:

Gemini Diffusion od Googlu přináší revoluci v generování textu pomocí AI

Latest News

SEC zesiluje zásah proti klamavým tvrzením o umělé inteligenci

Soudce zvažuje dopad AI v boji o nápravná opatření v antimonopolním sporu s Googlem

Nejlepší inovátoři v oblasti AI oceněni na udílení cen Excellence 2025

WildFusion dává robotům lidské smysly pro navigaci v přírodě

Hmatová zpětná vazba na konečcích prstů: Nové haptické nástroje mění bezpečnost průmyslových robotů

VentureBeat upozorňuje na zásadní pokroky v oblasti AI v květnu 2025

Mozky s umělou inteligencí pohánějí revoluci humanoidních robotů v Číně

Roboti zvládají sociální dovednosti bez lidského dohledu

NYT uzavírá první dohodu o AI obsahu s Amazonem pro Alexu

Grammarly získává 1 miliardu dolarů na proměnu z nástroje pro psaní v AI platformu

Gemini Diffusion od Googlu přináší revoluci v generování textu pomocí AI

Related Articles

Soudce zvažuje dopad AI v boji o nápravná opatření v antimonopolním sporu s Googlem

VentureBeat upozorňuje na zásadní pokroky v oblasti AI v květnu 2025

DeepSeek vylepšuje model R1 a vyzývá západní technologické giganty

Google Beam: Revoluční 3D videohovory přicházejí v roce 2025

Google představuje Gemini 2.5 Deep Think na I/O 2025

Latest News

SEC zesiluje zásah proti klamavým tvrzením o umělé inteligenci

Soudce zvažuje dopad AI v boji o nápravná opatření v antimonopolním sporu s Googlem

Nejlepší inovátoři v oblasti AI oceněni na udílení cen Excellence 2025

WildFusion dává robotům lidské smysly pro navigaci v přírodě

Hmatová zpětná vazba na konečcích prstů: Nové haptické nástroje mění bezpečnost průmyslových robotů

VentureBeat upozorňuje na zásadní pokroky v oblasti AI v květnu 2025

Mozky s umělou inteligencí pohánějí revoluci humanoidních robotů v Číně

Roboti zvládají sociální dovednosti bez lidského dohledu

NYT uzavírá první dohodu o AI obsahu s Amazonem pro Alexu

Grammarly získává 1 miliardu dolarů na proměnu z nástroje pro psaní v AI platformu