Makine Öğrenmesi, Tıbbi Sınıflandırmada Temel Modelleri Geride Bıraktı
Makine Öğrenmesi, Tıbbi Sınıflandırmada Temel Modelleri Geride Bıraktı
Yeni bir araştırma, tıbbi metin ve görüntü sınıflandırmasında klasik makine öğrenmesi yöntemlerinin, modern temel modellere kıyasla daha yüksek başarı sağladığını ortaya koydu.
Önemli Noktalar
- Klasik makine öğrenmesi modelleri, çoğu tıbbi sınıflandırma görevinde en iyi performansı sergiledi.
- LoRA ile ince ayar yapılan temel modeller, tüm deneylerde en düşük başarıyı gösterdi.
- Gemini 2.5, metin tabanlı görevlerde zayıf, çoklu sınıflı görüntü görevlerinde ise rekabetçi sonuçlar elde etti.
Araştırmanın Özeti
2026 yılı içinde yayımlanan yeni bir çalışma, metin ve görüntü tabanlı tıbbi sınıflandırma görevlerinde klasik makine öğrenmesi (ML) yöntemleri ile modern temel modellerin (foundation models) karşılaştırmalı analizini sundu. Araştırmacılar, dört farklı açık veri seti ile hem ikili hem de çoklu sınıflandırma senaryolarını test etti.
Teknik Detaylar
Deneylerde üç model sınıfı kullanıldı:
- Klasik ML: Lojistik Regresyon (LR), LightGBM, ResNet-50
- Prompt Tabanlı LLM/VLM: Gemini 2.5
- İnce Ayarlı PEFT Modelleri: LoRA ile uyarlanmış Gemma3 varyantları
Tüm deneylerde veri bölünmeleri ve değerlendirme metrikleri tutarlı şekilde uygulandı. Sonuçlara göre, klasik makine öğrenmesi modelleri özellikle yapılandırılmış metin veri setlerinde istikrarlı biçimde en iyi başarıyı gösterdi. Buna karşılık, LoRA ile ince ayar yapılan Gemma3 varyantları, tüm metin ve görüntü deneylerinde en düşük performansı sergiledi ve sınırlı ince ayarın genelleştirme yeteneğini olumsuz etkilediği gözlendi.
LLM/VLM ve Klasik Yöntemlerin Karşılaştırılması
Gemini 2.5 gibi sıfır atış (zero-shot) LLM/VLM yaklaşımları ise metin tabanlı görevlerde zayıf sonuçlar verirken, çoklu sınıflı görüntü görevlerinde klasik ResNet-50 ile benzer performansa ulaşabildi. Bu bulgular, tıbbi sınıflandırma alanında yerleşik makine öğrenmesi yöntemlerinin hâlâ güvenilirliğini koruduğunu gösteriyor.
Sonuç ve Öneriler
Araştırma, temel modellerin her zaman üstün olmadığını ve PEFT gibi ince ayar tekniklerinin başarısının uygulama stratejisine bağlı olduğunu ortaya koyuyor. Özellikle sınırlı ince ayarın, model başarısı üzerinde olumsuz etkiler yaratabileceği vurgulanıyor. Tıbbi sınıflandırma uygulamalarında, klasik makine öğrenmesi teknikleri hâlâ en güvenilir seçenek olarak öne çıkıyor.
Kaynak: arxiv.org