LLM Tabanlı Planlayıcılar için Yerelleştirme ve Hata Düzeltme

LLM Tabanlı Planlayıcılarda Hataları Düzeltmek İçin Yeni Yöntem: L-ICL LLM Tabanlı Planlayıcılarda Hataları Düzeltmek İçin Yeni Yöntem: L-ICL Büyük d...

LLM Tabanlı Planlayıcılarda Hataları Düzeltmek İçin Yeni Yöntem: L-ICL

LLM Tabanlı Planlayıcılarda Hataları Düzeltmek İçin Yeni Yöntem: L-ICL

Büyük dil modellerinin planlama hatalarını azaltmak için geliştirilen L-ICL yöntemi, doğruluk oranını %30 artırarak dikkat çekici sonuçlar elde etti.

Önemli Noktalar

  • L-ICL yöntemi, başarısız adımlar için yerelleştirilmiş örneklerle planlama doğruluğunu artırıyor.
  • 8×8 gridworld testlerinde, L-ICL ile geçerli plan üretme oranı %89’a ulaştı.
  • Yöntem, Sokoban ve BlocksWorld gibi farklı alanlarda da etkili oldu.

Yeni Yöntem: Yerelleştirilmiş Bağlam İçi Öğrenme (L-ICL)

Büyük dil modelleri (LLM), matematik ve kodlama gibi alanlarda güçlü akıl yürütme yetenekleri sergilerken, sembolik klasik planlama görevlerinde sıkça başarısız olabiliyor. Özellikle, bu modellerin oluşturduğu planlar çoğu zaman verilen talimatlardaki alan kısıtlamalarını göz ardı edebiliyor; örneğin, bir karakterin duvarların içinden geçmesi gibi hatalar görülebiliyor.

Bu sorunu çözmek için araştırmacılar, Yerelleştirilmiş Bağlam İçi Öğrenme (Localized In-Context Learning, L-ICL) adını verdikleri yeni bir yöntem geliştirdi. L-ICL, başarısız olan adımlar için talimatlara özel, doğru davranışı gösteren minimal bir giriş-çıkış örneği ekliyor. Böylece model, hatalı adımları düzeltmeyi öğreniyor ve sonraki planlamalarında bu hatalardan kaçınabiliyor.

Teknik Detaylar ve Sonuçlar

L-ICL, klasik Bağlam İçi Öğrenme (ICL) tekniklerinden farklı olarak, tüm problem çözüm yollarını eklemek yerine yalnızca hata yapılan ilk adımı hedefliyor. Bu sayede, daha az örnekle daha etkili öğrenme sağlanıyor.

Yapılan testlerde, 8×8 gridworld ortamında L-ICL yöntemiyle geçerli plan üretme oranı %89’a ulaştı. Bu başarı, yalnızca 60 eğitim örneğiyle elde edildi. En iyi geleneksel yöntem ise %59 başarı oranında kaldı; böylece L-ICL, %30’luk anlamlı bir artış sağladı.

L-ICL yöntemi ayrıca maze, Sokoban ve BlocksWorld gibi farklı planlama alanlarında ve çeşitli LLM mimarilerinde de belirgin iyileşmeler gösterdi. Bu, yöntemin genel geçer ve etkili bir hata düzeltme yaklaşımı olabileceğini ortaya koyuyor.

Gelecek Perspektifi

L-ICL’nin 2026 yılı içinde daha fazla planlama uygulamasında ve farklı LLM tabanlı sistemlerde yaygınlaşması bekleniyor. Bu gelişme, yapay zekâ destekli planlama sistemlerinin güvenilirliğini ve doğruluğunu artırabilir.

Kaynak: arxiv.org

Leave a Reply

Your email address will not be published. Required fields are marked *

Leave a comment
scroll to top