ARCANE: Yorumlanabilir ve Yapılandırılabilir Hizalama için Çoklu Ajan Çerçevesi

ARCANE: Yapay Zekâ Sistemlerinde Yorumlanabilir ve Esnek Hizalama Çerçevesi ARCANE: Yapay Zekâ Sistemlerinde Yorumlanabilir ve Esnek Hizalama Çerçevesi Tanı...

ARCANE: Yapay Zekâ Sistemlerinde Yorumlanabilir ve Esnek Hizalama Çerçevesi

ARCANE: Yapay Zekâ Sistemlerinde Yorumlanabilir ve Esnek Hizalama Çerçevesi Tanıtıldı

ARCANE, büyük dil modeli tabanlı yapay zekâ ajanlarının, paydaşlara şeffaf ve uyarlanabilir şekilde hizalanmasını sağlayan yeni bir çoklu ajan çerçevesi sunuyor.

Önemli Noktalar

  • ARCANE, yapay zekâ ajanlarının paydaş tercihlerine şeffaf şekilde uyumunu hedefliyor.
  • Yorumlanabilir ve anlık olarak güncellenebilen ödül modelleriyle esnek hizalama sağlanıyor.
  • Çerçeve, çok adımlı muhakeme ve araç kullanımı gerektiren karmaşık görevlerde test edildi.

ARCANE Nedir?

ARCANE, büyük dil modeli tabanlı yapay zekâ ajanlarının uzun vadeli ve karmaşık görevlerde paydaşların beklentilerine uygun hareket etmesini sağlamak için geliştirilen yeni bir çoklu ajan çerçevesidir. Bu sistem, hizalamayı çoklu ajan iş birliği problemi olarak ele alıyor ve paydaş tercihlerini doğal dilde oluşturulan ağırlıklı kriterler (rubrikler) aracılığıyla dinamik biçimde temsil ediyor.

Teknik Detaylar

ARCANE, fayda teorisinden esinlenerek rubrik öğrenimini bir yeniden yapılandırma problemi olarak tanımlıyor. Çerçevede, yorumlanabilirlik, doğruluk ve hesaplama verimliliği arasında denge kuran düzenlemeli Grup-Sıra Politika Optimizasyonu (GSPO) yöntemi kullanılıyor. Bu sayede, ödül modelleri hem şeffaf hem de test sırasında kullanıcı tercihlerine göre kolayca ayarlanabilir hale geliyor.

Deneyler ve Sonuçlar

ARCANE, GDPVal benchmark’ından türetilen 219 etiketli rubrik içeren bir veri kümesiyle, çok adımlı muhakeme ve araç kullanımı gerektiren zorlu görevlerde test edildi. Elde edilen sonuçlar, rubrik tabanlı ödül modellerinin kompakt ve anlaşılır değerlendirmeler ürettiğini ve yeniden eğitime gerek kalmadan doğruluk ile kısalık gibi tercihler arasında yapılandırılabilir denge sağladığını gösteriyor.

Gelecek Perspektifi

Çalışmanın bulguları, yorumlanabilir ve test sırasında uyarlanabilir ödül modellerinin, uzun vadeli ve karmaşık görevlerde çalışan yapay zekâ sistemlerinin güvenli ve etkili şekilde hizalanması için umut vadeden bir yol sunduğunu ortaya koyuyor.

Haberin kaynağı: arXiv:2512.06196v1

Kaynak: arxiv.org

Leave a Reply

Your email address will not be published. Required fields are marked *

Leave a comment
scroll to top