Span Akışı: Dil Modellerini GFlowNets ile Dinamik Span-Kelime Dağarcığına Genellemek

Dil Modellerinde Dinamik Span-Vokabüler: Flow of SpanS ve GFlowNet Yaklaşımı Dil Modellerinde Dinamik Span-Vokabüler: Flow of SpanS ve GFlowNet Yaklaşımı...

Dil Modellerinde Dinamik Span-Vokabüler: Flow of SpanS ve GFlowNet Yaklaşımı

Dil Modellerinde Dinamik Span-Vokabüler: Flow of SpanS ve GFlowNet Yaklaşımı

Flow of SpanS (FoSS) yöntemi, dil modellerinde dinamik span-vokabüler oluşturarak metin üretiminde çeşitlilik ve kaliteyi artırıyor.

Önemli Noktalar

  • FoSS ile metin üretiminde %12,5’e varan MAUVE skoru artışı sağlanıyor.
  • Bilgi yoğun görevlerde %3,5 oranında performans iyileşmesi bildirildi.
  • FoSS, DAG yapısıyla daha çeşitli ve yüksek kaliteli metinler üretebiliyor.

FoSS: Dinamik Span-Vokabüler ve GFlowNet Entegrasyonu

Flow of SpanS (FoSS), geleneksel dil modellerinin sabit vokabüler ve token bazlı üretim yaklaşımını aşarak dinamik span-vokabüler oluşturmayı mümkün kılıyor. Standart modeller, token sampling işlemini bir ağaç yapısı üzerinden gerçekleştirirken, FoSS ile metin segmentleri esnek biçimde ayrılıyor ve yönlendirilmiş akiklik grafiği (DAG) yapısı ortaya çıkıyor. Bu sayede, GFlowNet tabanlı modeller farklı kompozisyon yollarını keşfedebiliyor ve genelleme kapasitesi artıyor.

Teknik Detaylar

FoSS, metin üretimi sırasında geri getirilen (retrieved) metinleri dinamik olarak segmentlere ayırıyor ve bu segmentler üzerinden DAG tabanlı bir durum uzayı oluşturuyor. GFlowNet algoritması ise bu durum uzayında verimli ve çeşitli yolları keşfetmeye olanak tanıyor. Özel ödül modelleriyle, FoSS hem çeşitli hem de yüksek kaliteli metinler üretebiliyor.

Empirik Sonuçlar ve Ölçeklenebilirlik

Yapılan deneylerde FoSS, Transformer tabanlı modellere göre metin üretiminde MAUVE skorunda %12,5’e kadar artış sağladı. Bilgi yoğun görevlerde ise %3,5 oranında performans iyileşmesi gözlemlendi. Ayrıca, FoSS’un daha büyük modeller, daha fazla veri ve zengin retrieval korpuslarıyla avantajını koruduğu belirtildi.

FoSS’un Dil Modeli Alanındaki Katkıları

FoSS yöntemiyle dil modellerinin esnekliği ve üretim kalitesi önemli ölçüde artıyor. DAG yapısının sunduğu çeşitlilik, metin üretiminde yeni yollar açıyor ve bilgi yoğun görevlerde daha iyi sonuçlar alınmasını sağlıyor. FoSS, 2026 yılı içinde dil modeli araştırmalarında öne çıkması beklenen yenilikçi yaklaşımlardan biri olarak değerlendiriliyor.

Kaynak: arxiv.org

Leave a Reply

Your email address will not be published. Required fields are marked *

Leave a comment
scroll to top