MIT, Sinir Ağı Tokenizer'larının Gizli Gücünü Ortaya Çıkardı

MIT araştırmacıları, sinir ağı tokenizer'larının geleneksel üreticilere ihtiyaç duymadan görüntü oluşturma ve düzenleme yapabildiğini 22 Temmuz 2025'te açıkladı. ICML 2025'te sunulan çığır açıcı araştırma, 1D tokenizer'lardaki bireysel token'ların manipüle edilmesiyle görsel olarak tanımlanabilir değişikliklerin elde edilebildiğini ve bu sayede önemli ölçüde daha düşük hesaplama maliyetiyle verimli görüntü düzenlemenin mümkün olduğunu gösteriyor. Bu yaklaşım, CLIP ile yönlendirilen bir tokenizer-decoder sistemi kullanarak metin tabanlı düzenleme ve üretim sağlıyor.

MIT'li bir araştırma ekibi, daha önce yalnızca kodlayıcı olarak kullanıldığı düşünülen sinir ağı bileşenlerinin, aslında kendi başlarına gelişmiş görüntü oluşturma ve manipülasyon görevleri gerçekleştirebileceğini ortaya koydu.

Vancouver'da düzenlenen Uluslararası Makine Öğrenimi Konferansı'nda (ICML 2025) sunulan araştırma, görsel bilgiyi ayrık token dizilerine sıkıştıran bir boyutlu (1D) tokenizer'ların, geleneksel görüntü üreticilerine olan ihtiyacı ortadan kaldıran kullanılmamış üretici yeteneklere sahip olduğunu gösteriyor.

MIT Bilgi ve Karar Sistemleri Laboratuvarı'ndan (LIDS) yüksek lisans öğrencisi Lukas Lao Beyer liderliğindeki ekip, bu sıkıştırılmış temsillerdeki bireysel token'ların manipüle edilmesinin, ortaya çıkan görüntülerde belirli ve öngörülebilir değişiklikler ürettiğini keşfetti. Lao Beyer, "Bu, daha önce hiç görülmemiş bir sonuçtu; çünkü kimse token'ların manipüle edilmesiyle görsel olarak tanımlanabilir değişiklikler gözlemlememişti," dedi.

Araştırmacılar, tek bir token'ın değiştirilmesinin görüntü kalitesini düşükten yükseğe dönüştürebildiğini, arka plan bulanıklığını ayarlayabildiğini, parlaklık seviyelerini değiştirebildiğini veya görüntüdeki nesnelerin pozunu bile değiştirebildiğini buldu. Bu keşif, doğrudan token manipülasyonu yoluyla verimli görüntü düzenlemesi için yeni olanaklar sunuyor.

Daha da önemlisi, MIT ekibi yalnızca bir 1D tokenizer ve bir decoder (detokenizer olarak da bilinir) ile, hazır bir sinir ağı olan CLIP tarafından yönlendirilen yeni bir görüntü üretim yaklaşımı gösterdi. Bu sistem, bir görüntü türünü başka bir türe dönüştürebiliyor — örneğin, bir kırmızı pandayı kaplana çevirmek — veya rastgele token değerlerinden başlayarak iteratif olarak optimize edilen tamamen yeni görüntüler üretebiliyor.

Bu yaklaşım, Münih Teknik Üniversitesi ve ByteDance araştırmacılarının 2024'te geliştirdiği, 256×256 piksellik görüntüleri yalnızca 32 token'a sıkıştırabilen (önceki tokenizer'ların tipik olarak kullandığı 256 token'a kıyasla) yöntemin üzerine inşa ediliyor. MIT'nin yeniliği, bu yüksek derecede sıkıştırılmış temsillerin yaratıcı uygulamalar için kullanılabilecek zengin anlamsal bilgiler içerdiğini gösteriyor.

Araştırma ekibinde MIT Bilgisayar Bilimi ve Yapay Zeka Laboratuvarı'ndan (CSAIL) Tianhong Li, Facebook AI Research'ten Xinlei Chen, MIT Profesörü Sertac Karaman ve MIT Doçent Dr. Kaiming He yer alıyor. Bulguları, bu on yılın sonunda milyar dolarlık bir endüstri olması beklenen yapay zekâ ile görüntü üretimi için daha hesaplamalı olarak verimli bir gelecek vadediyor.

MIT, Sinir Ağı Tokenizer'larının Gizli Gücünü Ortaya Çıkardı

Latest News

Trump, ABD'nin Küresel Üstünlüğünü Sağlamak İçin Cesur Yapay Zekâ Stratejisini Açıkladı

NVIDIA, OpenUSD ve Otonom Yapay Zekâ Araçlarıyla Pazarlamayı Dönüştürüyor

Google, Gemini 2.5 Ailesini Yeni Modeller ve Geliştirici Araçlarıyla Genişletiyor

Google’ın Yapay Zekâ Destekli Uydu Sistemi İlk Orman Yangını Görüntülerini Paylaştı

Trump, Pensilvanya'yı Dönüştürecek 92 Milyar Dolarlık Yapay Zeka Üssünü Tanıttı

DeepMind'in Yapay Zekası, DNA'nın Gizli Düzenleyici Kodunu Çözdü

NetClass, Küresel Yapay Zekâ Eğitimini Hızlandırmak İçin Singapur Merkezini Açtı

Yapay Zekâ Destekli Uydu, Diğer Sistemlerin Göremediği Küçük Orman Yangınlarını Tespit Etti

H-Net Yapay Zekâ Atılımı Katı Tokenizasyon Kurallarını Ortadan Kaldırıyor

AWS, Kurumsal Yapay Zeka Ajanlarını Dönüştürecek AgentCore Platformunu Tanıttı

MIT, Sinir Ağı Tokenizer'larının Gizli Gücünü Ortaya Çıkardı

Related Articles

NVIDIA, OpenUSD ve Otonom Yapay Zekâ Araçlarıyla Pazarlamayı Dönüştürüyor

DeepMind'in Yapay Zekası, DNA'nın Gizli Düzenleyici Kodunu Çözdü

NetClass, Küresel Yapay Zekâ Eğitimini Hızlandırmak İçin Singapur Merkezini Açtı

Yapay Zekâ Destekli Uydu, Diğer Sistemlerin Göremediği Küçük Orman Yangınlarını Tespit Etti

H-Net Yapay Zekâ Atılımı Katı Tokenizasyon Kurallarını Ortadan Kaldırıyor

Latest News

Trump, ABD'nin Küresel Üstünlüğünü Sağlamak İçin Cesur Yapay Zekâ Stratejisini Açıkladı

NVIDIA, OpenUSD ve Otonom Yapay Zekâ Araçlarıyla Pazarlamayı Dönüştürüyor

Google, Gemini 2.5 Ailesini Yeni Modeller ve Geliştirici Araçlarıyla Genişletiyor

Google’ın Yapay Zekâ Destekli Uydu Sistemi İlk Orman Yangını Görüntülerini Paylaştı

Trump, Pensilvanya'yı Dönüştürecek 92 Milyar Dolarlık Yapay Zeka Üssünü Tanıttı

DeepMind'in Yapay Zekası, DNA'nın Gizli Düzenleyici Kodunu Çözdü

NetClass, Küresel Yapay Zekâ Eğitimini Hızlandırmak İçin Singapur Merkezini Açtı

Yapay Zekâ Destekli Uydu, Diğer Sistemlerin Göremediği Küçük Orman Yangınlarını Tespit Etti

H-Net Yapay Zekâ Atılımı Katı Tokenizasyon Kurallarını Ortadan Kaldırıyor

AWS, Kurumsal Yapay Zeka Ajanlarını Dönüştürecek AgentCore Platformunu Tanıttı