Olimpiyat Seviyesinde Geometri Sorularında Yeni Otomatik Çözüm Yöntemi
Olimpiyat Seviyesinde Geometri Sorularında Yeni Otomatik Çözüm Yöntemi
Araştırmacılar, yeni geliştirdikleri HAGeo yöntemiyle, olimpiyat düzeyinde geometri problemlerini insan üstü başarıyla çözüyor.
Önemli Noktalar
- HAGeo yöntemi, 30 IMO geometri sorusundan 28’ini başarıyla çözdü.
- Yöntem, AlphaGeometry gibi sinir ağı tabanlı yaklaşımları geride bıraktı.
- Yeni HAGeo-409 benchmark’ı, 409 zorluk derecesi belirlenmiş geometri problemiyle daha kapsamlı bir değerlendirme sunuyor.
Özet ve Arka Plan
Öklidyen geometride otomatik teorem ispatı, özellikle Uluslararası Matematik Olimpiyatı (IMO) seviyesindeki problemler için, Yapay Zeka alanında hâlâ çözülmesi zor bir konu olarak öne çıkıyor. Bu alanda yapılan yeni bir çalışma, CPU üzerinde çalışan ve sinir ağı tabanlı çıkarım yöntemlerine ihtiyaç duymayan verimli bir çözüm öneriyor.
Teknik Detaylar
Araştırmacıların geliştirdiği HAGeo adlı yöntem, geometri ispatlarında yardımcı noktaların eklenmesi için sezgisel (heuristic) bir strateji kullanıyor. İlk testlerde, rastgele yardımcı nokta ekleme stratejisinin bile IMO düzeyinde insanlara yaklaşan bir performans sergilediği görüldü. HAGeo ise, bu yaklaşımı daha da ileri taşıyarak, IMO-30 benchmark setindeki 30 sorudan 28’ini doğru şekilde çözerek altın madalya seviyesinde bir başarıya ulaştı.
HAGeo’nun başarısı, sinir ağı tabanlı AlphaGeometry yöntemine karşı da ciddi bir üstünlük sağladı. Ayrıca, yöntemin değerlendirilmesi için zorluk dereceleri insan uzmanlar tarafından belirlenmiş 409 sorudan oluşan yeni HAGeo-409 benchmark’ı oluşturuldu. Bu yeni benchmark, mevcut IMO-30 setine kıyasla daha geniş ve zorlu bir test ortamı sunuyor.
Sonuç ve Gelecek Perspektifi
HAGeo’nun elde ettiği sonuçlar, otomatik geometri teorem ispatında sinir ağına dayalı olmayan yaklaşımların da üst düzey başarıya ulaşabileceğini gösteriyor. Yeni oluşturulan HAGeo-409 benchmark’ı ise, bu alandaki ilerlemeleri daha hassas ve kapsamlı şekilde değerlendirmek için önemli bir kaynak sunuyor.
Kaynak: arxiv.org