menu
close

Rebolusyon ng Gemini Diffusion ng Google sa AI Text Generation

Inilunsad ng Google ang Gemini Diffusion, isang makabagong modelo ng text generation na kayang gawing malinaw na teksto ang random na ingay nang hanggang limang beses na mas mabilis kaysa sa mga naunang modelo. Gumagamit ang experimental na modelong ito ng diffusion technology—katulad ng sa image generation—upang makalikha ng hanggang 2,000 token bawat segundo habang tumutugma sa coding performance ng kasalukuyang mga modelo. Pinahusay din ng Google ang Gemini 2.5 lineup nito gamit ang thinking budgets na nagbibigay sa mga developer ng eksaktong kontrol sa kakayahan ng AI na mag-reason at sa gastusin.
Rebolusyon ng Gemini Diffusion ng Google sa AI Text Generation

Ipinakilala ng Google DeepMind ang Gemini Diffusion, isang rebolusyonaryong pamamaraan sa AI text generation na lubos na naiiba sa tradisyonal na autoregressive language models.

Hindi tulad ng mga karaniwang modelo na bumubuo ng teksto paisa-isang token at sunod-sunod, gumagamit ang Gemini Diffusion ng diffusion technology—na dati ay pangunahing ginagamit sa image at video generation—upang pinuhin ang random na ingay at gawing malinaw na teksto sa pamamagitan ng paulit-ulit na proseso. Dahil dito, nagagawa ng modelong ito na makabuo ng nilalaman sa kahanga-hangang bilis na hanggang 2,000 token bawat segundo, ayon sa mga mananaliksik ng DeepMind.

“Sa halip na direktang hulaan ang teksto, natututo silang bumuo ng output sa pamamagitan ng pagpipino ng ingay, hakbang-hakbang,” paliwanag ng Google sa kanilang anunsyo. “Ibig sabihin, mabilis silang makakaulit ng solusyon at makakagawa ng error correction habang bumubuo ng teksto.”

Ang experimental demo, na kasalukuyang available sa pamamagitan ng waitlist, ay nagpapakita kung paano natutumbasan ng teknolohiyang ito ang coding performance ng mga umiiral na modelo ng Google habang malaki ang nababawas sa oras ng pagbuo ng teksto. Sa mga benchmark, ang Gemini Diffusion ay nagpapakita ng halos kaparehong resulta sa Gemini 2.0 Flash-Lite sa mga programming task tulad ng HumanEval at MBPP.

Ayon kay Oriol Vinyals, VP of Research at Deep Learning Lead sa Google DeepMind at Co-Head ng Gemini project, isang personal na milestone ang paglabas ng Gemini Diffusion, at binanggit niyang napakabilis ng demo kaya kinailangan nilang pabagalin ang video para maging masundan.

Kasabay nito, pinahusay din ng Google ang Gemini 2.5 lineup nito gamit ang mga bagong kakayahan. Inilunsad ng kumpanya ang Gemini 2.5 Flash na may thinking budgets, na nagbibigay sa mga developer ng walang kapantay na kontrol kung gaano kalalim mag-reason ang kanilang AI. Pinapayagan ng feature na ito ang mga user na balansehin ang kalidad, bilis, at gastusin sa pamamagitan ng pagtatakda ng token limit (hanggang 24,576 token) para sa reasoning process ng modelo.

Pinalalawak din ng Google ang thinking budgets sa Gemini 2.5 Pro, na magiging available sa publiko sa mga susunod na linggo. Dagdag pa rito, nagdagdag ang kumpanya ng native SDK support para sa Model Context Protocol (MCP) definitions sa Gemini API, na nagpapadali sa integrasyon sa mga open-source na tool at paggawa ng agentic applications.

Ang mga pag-unlad na ito ay sumasalamin sa layunin ng Google na gawing mas episyente, kontrolado, at accessible ang AI para sa mga developer habang pinananatili ang mataas na pamantayan ng performance.

Source:

Latest News