LLM Yeterli Değil: Metin ve Görüntü Tabanlı Tıbbi Sınıflandırmada ML ile Foundation Modellerinin Sistematik Değerlendirmesi

Makine Öğrenmesi, Tıbbi Sınıflandırmada Temel Modelleri Geride Bıraktı Makine Öğrenmesi, Tıbbi Sınıflandırmada Temel Modelleri Geride Bıraktı Yeni bi...

Makine Öğrenmesi, Tıbbi Sınıflandırmada Temel Modelleri Geride Bıraktı

Makine Öğrenmesi, Tıbbi Sınıflandırmada Temel Modelleri Geride Bıraktı

Yeni bir araştırma, tıbbi metin ve görüntü sınıflandırmasında klasik makine öğrenmesi yöntemlerinin, modern temel modellere kıyasla daha yüksek başarı sağladığını ortaya koydu.

Önemli Noktalar

  • Klasik makine öğrenmesi modelleri, çoğu tıbbi sınıflandırma görevinde en iyi performansı sergiledi.
  • LoRA ile ince ayar yapılan temel modeller, tüm deneylerde en düşük başarıyı gösterdi.
  • Gemini 2.5, metin tabanlı görevlerde zayıf, çoklu sınıflı görüntü görevlerinde ise rekabetçi sonuçlar elde etti.

Araştırmanın Özeti

2026 yılı içinde yayımlanan yeni bir çalışma, metin ve görüntü tabanlı tıbbi sınıflandırma görevlerinde klasik makine öğrenmesi (ML) yöntemleri ile modern temel modellerin (foundation models) karşılaştırmalı analizini sundu. Araştırmacılar, dört farklı açık veri seti ile hem ikili hem de çoklu sınıflandırma senaryolarını test etti.

Teknik Detaylar

Deneylerde üç model sınıfı kullanıldı:

  • Klasik ML: Lojistik Regresyon (LR), LightGBM, ResNet-50
  • Prompt Tabanlı LLM/VLM: Gemini 2.5
  • İnce Ayarlı PEFT Modelleri: LoRA ile uyarlanmış Gemma3 varyantları

Tüm deneylerde veri bölünmeleri ve değerlendirme metrikleri tutarlı şekilde uygulandı. Sonuçlara göre, klasik makine öğrenmesi modelleri özellikle yapılandırılmış metin veri setlerinde istikrarlı biçimde en iyi başarıyı gösterdi. Buna karşılık, LoRA ile ince ayar yapılan Gemma3 varyantları, tüm metin ve görüntü deneylerinde en düşük performansı sergiledi ve sınırlı ince ayarın genelleştirme yeteneğini olumsuz etkilediği gözlendi.

LLM/VLM ve Klasik Yöntemlerin Karşılaştırılması

Gemini 2.5 gibi sıfır atış (zero-shot) LLM/VLM yaklaşımları ise metin tabanlı görevlerde zayıf sonuçlar verirken, çoklu sınıflı görüntü görevlerinde klasik ResNet-50 ile benzer performansa ulaşabildi. Bu bulgular, tıbbi sınıflandırma alanında yerleşik makine öğrenmesi yöntemlerinin hâlâ güvenilirliğini koruduğunu gösteriyor.

Sonuç ve Öneriler

Araştırma, temel modellerin her zaman üstün olmadığını ve PEFT gibi ince ayar tekniklerinin başarısının uygulama stratejisine bağlı olduğunu ortaya koyuyor. Özellikle sınırlı ince ayarın, model başarısı üzerinde olumsuz etkiler yaratabileceği vurgulanıyor. Tıbbi sınıflandırma uygulamalarında, klasik makine öğrenmesi teknikleri hâlâ en güvenilir seçenek olarak öne çıkıyor.

Kaynak: arxiv.org

Leave a Reply

Your email address will not be published. Required fields are marked *

Leave a comment
scroll to top