Patronus AI, Yapay Zekâ Ajanlarının Başarısızlık Oranını Azaltmak İçin Yeni Eğitim Dünyalarını Tanıttı
Patronus AI, Yapay Zekâ Ajanlarının Başarısızlığını Azaltacak “Canlı” Eğitim Ortamlarını Duyurdu
Patronus AI, yapay zekâ ajanlarının karmaşık görevlerdeki %63’lük başarısızlık oranını azaltmak için gerçek zamanlı ve dinamik eğitim ortamları sunuyor.
Önemli Noktalar
- Patronus AI, “Generative Simulators” adını verdiği dinamik eğitim ortamlarını tanıttı.
- Karmaşık görevlerde yapay zekâ ajanlarının başarısızlık oranı %63’e kadar çıkabiliyor.
- Şirket, 2023’te 15 kat gelir artışı yaşadığını açıkladı.
Geleneksel Testler Neden Yetersiz Kalıyor?
Patronus AI, yapay zekâ sistemlerinin değerlendirilme biçimi ile gerçek dünya performansı arasındaki uçuruma dikkat çekiyor. Geleneksel statik testler, ajanların belirli bir zamanda spesifik yeteneklerini ölçerken, gerçek iş hayatındaki karmaşıklığı ve beklenmedik durumları yansıtmakta yetersiz kalıyor.
Şirketin sunduğu Generative Simulators mimarisi, sabit soru kümeleri yerine, gerçek zamanlı olarak yeni görevler ve çevresel koşullar üretiyor, ajanların davranışına göre kuralları ve zorluk seviyesini dinamik biçimde değiştiriyor.
Patronus AI CTO’su Rebecca Qian, son dönemde model geliştiricilerinin etkileşimli öğrenme ortamlarına yöneldiğini, eğitim ve değerlendirme arasındaki çizginin giderek silikleştiğini belirtiyor: “Artık testler birer ortam halini aldı.”
Teknik Detaylar: Sürekli Öğrenen Ajanlar ve ORSI
Şirketin teknolojisi, pekiştirmeli öğrenme (reinforcement learning) temeline dayanıyor. Bu yöntemle ajanlar, doğru hamlelerde ödüller, hatalarda ise cezalar alarak deneme-yanılma yoluyla daha iyi kararlar vermeyi öğreniyor. Ancak klasik RL, kodun baştan yazılmasını gerektirdiği için yaygın kullanımda zorluklar yaratabiliyor.
Patronus AI, ayrıca “Open Recursive Self-Improvement” (ORSI) adını verdiği bir konsept de tanıttı. Bu yaklaşım, ajanların her denemede baştan eğitilmeden, sürekli etkileşim ve geri bildirimle kendini geliştirmesine olanak tanıyor.
“Goldilocks Bölgesi”: Uygun Zorluk Seviyesi Nasıl Sağlanıyor?
Generative Simulators’ın merkezinde, ajan davranışını analiz eden ve eğitim senaryolarının zorluk seviyesini dinamik olarak ayarlayan bir “müfredat düzenleyici” bulunuyor. Amaç, örneklerin ne çok kolay ne de çok zor olması; modelin gerçekten öğrenebileceği seviyede tutulması.
Şirketin ilk sonuçlarına göre, bu dinamik ortamlarla yapılan eğitimler; yazılım mühendisliği, müşteri hizmetleri ve finansal analiz gibi alanlarda görev tamamlama oranlarını %10 ila %20 artırdı.
Yapay Zekâda “Ödül Kandırması” Sorunu ve Hareketli Hedefler
Pekiştirmeli öğrenmede sıkça karşılaşılan “ödül kandırması” (reward hacking) problemi, ajanların gerçek çözüm üretmek yerine eğitim ortamındaki açıkları istismar etmesine yol açabiliyor. Patronus AI, eğitim ortamını sürekli değiştirerek bu sorunu aşmayı hedefliyor.
CTO Qian, “Sabit testlerde öğrenciler kopya çekmeyi öğrenir, ama ortam sürekli değişirse sistemin adaptasyonunu da gözlemleyebiliriz,” diyor.
Patronus AI’dan 15 Kat Gelir Artışı
Patronus AI, “RL Environments” adını verdiği yeni ürün ailesiyle, büyük ölçekli model laboratuvarları ve kurumsal müşterilere özel eğitim ortamları sunuyor. CEO Anand Kannappan, bu yıl gelirlerini 15 kat artırdıklarını ve Fortune 500 şirketleriyle birçok önde gelen yapay zekâ firmasının platformlarını kullandığını belirtiyor.
OpenAI, Anthropic ve Google Neden Kendi Eğitim Altyapılarını Kurmuyor?
Patronus AI’nın karşısındaki temel soru: OpenAI, Anthropic ve Google DeepMind gibi büyük kuruluşlar neden kendi eğitim ortamlarını geliştirip kullanmıyor?
Kannappan’a göre, bu şirketler çok çeşitli alanlarda ajanlarını geliştirmek istiyor ve her bir alan için özel ortamlar oluşturmak oldukça zor. Bu nedenle, üçüncü parti sağlayıcıların sunduğu esnek ve uzmanlaşmış çözümlere ihtiyaç duyuluyor.
Rekabet de hızla artıyor: Microsoft, kod değişikliği gerektirmeden RL uygulamalarını mümkün kılan “Agent Lightning” adlı açık kaynak çerçevesini yayımladı. NVIDIA NeMo Gym ve Meta’nın DreamGym’i de benzer şekilde modüler ve dinamik RL ortamları sunuyor.
“Ortamlar Yeni Petrol”: Patronus AI’nın Gelecek Vizyonu
Patronus AI, “dünyadaki tüm verileri ortamlaştırmak” gibi iddialı bir hedefle, insan iş akışlarını yapay zekâya öğretilebilecek yapısal sistemlere dönüştürmek istiyor. CEO Kannappan, “İçeride şaka yollu ‘ortamlar yeni petroldür’ diyoruz,” ifadesini kullanıyor.
Şirket, 2023 Eylül’de değerlendirme odaklı olarak kuruldu; ancak artık eğitim alanına da yöneliyor. Patronus AI, eğitim ve değerlendirme arasındaki ayrımın ortadan kalktığını ve yapay zekâ ajanlarının hangi ortamda eğitileceğine kimin karar verdiğinin büyük önem taşıdığını savunuyor.
Şirketin 15 katlık gelir artışı, kurumsal müşterilerin bu çözümlere olan ilgisini gösteriyor. Ancak Microsoft ve Meta gibi devlerin de benzer sorunları çözmek için yarışta olması, rekabetin hızla kızıştığını ortaya koyuyor. Son iki yıl gösterdi ki, yapay zekâda gelecek beklenenden hızlı geliyor.
Kaynak: venturebeat.com