Zoom’un Yapay Zekâda Elde Ettiği Rekor Sonucu Tartışma Yarattı
Zoom, Yapay Zekâ Sınavında Rekor Kırdı: Sektör Yenilik mi, Kopya mı Tartışıyor
Zoom, Humanity’s Last Exam adlı zorlu yapay zekâ testinde 48,1% skorla rekor kırdı. Ancak sektörde bu başarının yenilik olup olmadığı tartışılıyor.
Önemli Noktalar
- Zoom, Humanity’s Last Exam benchmarkında 48,1% ile en yüksek skora ulaştı.
- Şirket, kendi modelini eğitmek yerine mevcut büyük dil modellerini bir arada yöneten bir sistem geliştirdi.
- Uzmanlar, bu yaklaşımın gerçek bir yenilik mi yoksa mevcut teknolojinin entegrasyonu mu olduğu konusunda ikiye bölündü.
Zoom’un Rekor Sonucu: Nasıl Gerçekleşti?
Zoom Video Communications, pandemi döneminde uzaktan çalışanları bir arada tutma rolüyle tanınırken, geçtiğimiz hafta yapay zekâ alanında önemli bir başarıya imza attığını duyurdu. Şirketin yapay zekâ sistemi, uluslararası uzmanlarca geliştirilen ve en gelişmiş modelleri bile zorlayan Humanity’s Last Exam adlı benchmarkta 48,1% skor elde etti. Bu sonuç, daha önce Google’ın Gemini 3 Pro modelinin elinde tuttuğu 45,8% rekorunu geride bıraktı.
Zoom’un baş teknoloji sorumlusu Xuedong Huang, bu skoru şirket blogunda duyurdu ve Zoom, Humanity’s Last Exam benchmarkında %2,3’lük bir gelişmeyle yeni bir üst düzey sonuca ulaştı ifadelerini kullandı.
Zoom’un Stratejisi: Kendi Modelini Eğitmedi
Zoom, bu başarıyı kendi büyük dil modelini eğiterek değil, mevcut büyük modelleri (OpenAI, Google, Anthropic gibi) bir arada çalıştıran “federated AI” yaklaşımıyla elde etti. Şirket, “Z-scorer” adını verdiği bir sistemle farklı modellerin yanıtlarını değerlendirip, en iyi sonucu seçiyor ve birleştiriyor. Bu yapı, Zoom’un kendi küçük dil modelleri ile açık ve kapalı kaynaklı modellerin uyumlu şekilde çalışmasını sağlıyor.
Kısacası, Zoom sıfırdan bir yapay zekâ modeli geliştirmek yerine, mevcut teknolojileri akıllıca entegre eden bir “trafik kontrolcüsü” rolü üstlendi.
Yenilik mi, Mevcut Teknolojiyi Kullanmak mı?
Zoom’un açıklaması sonrası yapay zekâ topluluğunda hararetli bir tartışma başladı. Bazı uzmanlar, farklı modellerin entegrasyonunu akıllıca bulurken, Zoom’un kendi modelini eğitmemesine rağmen başarıyı sahiplenmesini eleştiriyor.
Örneğin, AI mühendisi Max Rumpf, sosyal medyada Zoom, Gemini, GPT ve Claude gibi modelleri birleştirerek benchmarkı biraz geliştirdi ve SOTA (state-of-the-art) iddiasında bulundu dedi. Ancak çoklu model kullanımının akıllıca olduğunu da ekledi.
Diğer taraftan, geliştirici Hongcheng Zhu, Zoom’un yaklaşımını veri bilimi yarışmalarında yaygın olan model birleştirme (ensemble) yöntemine benzeterek, bunun endüstri standardı olduğunu savundu.
Başarıda Xuedong Huang Etkisi
Zoom’un bu alandaki atılımında, baş teknoloji sorumlusu Xuedong Huang’ın geçmişi önemli rol oynuyor. Huang, Microsoft’ta onlarca yıl geçirerek konuşma teknolojileri ve dil işleme alanında insan seviyesine ulaşan projelere liderlik etti. Ayrıca IEEE, ACM gibi prestijli kuruluşlara üyeliğiyle tanınıyor.
Huang, Zoom’un federatif yaklaşımının sınırları aşan bir sistem kurduğunu ve tek bir modelden daha iyi sonuçlar elde ettiklerini vurguluyor. Zoom’un amacı daha iyi bir model değil, modelleri daha iyi kullanan bir sistem inşa etmek.
Humanity’s Last Exam: Zekâ Sınırlarını Zorlayan Benchmark
Tüm tartışmaların merkezindeki Humanity’s Last Exam, yapay zekâların insan düzeyinde çok adımlı akıl yürütme ve karmaşık bilgi sentezi gerektiren sorularla test edildiği bir benchmark. 48,1%’lik skor, geleneksel not sistemlerine göre düşük görünse de, bu sınavda makine zekâsının mevcut sınırını temsil ediyor.
Zoom’un Google’a kıyasla 2,3 puanlık artışı küçük gibi görünse de, rekabetin bu kadar yoğun olduğu bir alanda dikkat çekici bir gelişme olarak öne çıkıyor.
Zoom’un Yaklaşımı Şirketler İçin Ne Anlama Geliyor?
Zoom, tek bir modeli geliştirmek yerine, en iyi modelleri bir arada kullanabilen ve ihtiyaçlara göre entegre edebilen bir orkestrasyon katmanı sunmayı hedefliyor. Bu sayede, hangi modelin gelecekte daha iyi olacağını öngöremeyen şirketler için esnek ve güncel bir altyapı sağlıyor.
OpenAI’nin GPT-5.2 modelinin duyurulmasında Zoom’un partner olarak yer alması da, şirketin hem büyük model sağlayıcılarıyla iş birliğini hem de benchmark rekabetini aynı anda sürdürebildiğini gösteriyor.
Ancak, Zoom’un bu entegrasyon yeteneğinin gerçek bir fikri mülkiyet olup olmadığı veya başkaları tarafından kolayca kopyalanıp kopyalanamayacağı henüz net değil.
Gerçek Test: Milyonlarca Kullanıcı Karar Verecek
Zoom, AI Companion 3.0 gibi yeni nesil yapay zekâ çözümlerini yüz milyonlarca kullanıcısına sunmaya hazırlanıyor. Şirketin AI laboratuvarı gibi öne çıkması eleştirilse de, asıl değerlendirmeyi kullanıcılar yapacak. Toplantı özetlerinin doğruluğu, alınan aksiyonların anlamlılığı ve zaman kazandırıp kazandırmadığı gibi pratik sonuçlar, Zoom’un gerçek başarısını belirleyecek.
Sonuç olarak, Zoom’un en iddialı söylemi, bir benchmarkı geçmekten ziyade, yapay zekâ çağında en iyi modelin değil, en iyi kullanılan modelin öne çıkacağı yönünde.
Kaynak: venturebeat.com