Yapay Zeka 'Şov'u Bırak, Gerçek Sorunları Çöz: Surge AI'dan Uyarı

Surge AI CEO'su Edwin Chen, yapay zeka şirketlerinin yüzeysel "AI slop"a odaklanmasını eleştiriyor. Yapay zeka yarışında yanlış hedefler mi var?

Emrah Aladağ Editör

08.12.2025 - 12:52 Yayınlanma

20.01.2026 - 15:25 Güncelleme

4 Dk Okuma Süresi

Yapay Zeka 'Şov'u Bırak, Gerçek Sorunları Çöz: Surge AI'dan Uyarı

Surge AI'nin CEO'su Edwin Chen, yapay zeka (AI) şirketlerinin, gerçek dünya sorunlarını çözmek yerine gösterişli ve yüzeysel AI yanıtlarına odaklandığını belirtti. Bu durumun, yapay zeka gelişiminin yönünü saptırabileceği endişesini dile getirdi.

Yapay Zeka Yarışında Yanlış Hedefler Mi Var?

Edwin Chen, katıldığı bir podcast yayınında, yapay zeka endüstrisindeki mevcut eğilimleri eleştirdi. Chen, şirketlerin, kanseri tedavi etmek veya yoksulluğu çözmek gibi insanlığa fayda sağlayacak büyük hedeflere odaklanmak yerine, "AI slop" olarak nitelendirdiği yüzeysel ve anlamsız yapay zeka çıktılarını optimize etmeye çalıştığını vurguladı.

Chen, "İnsanlığı ileriye taşıyacak, kanseri tedavi edecek, yoksulluğu çözecek, evrensel soruları anlayacak yapay zeka inşa etmek yerine, AI slop için optimizasyon yapıyoruz," dedi.

Surge AI, 2020 yılında Edwin Chen tarafından kuruldu. Chen daha önce Twitter, Google ve Meta gibi büyük teknoloji şirketlerinde çalışmıştı. Surge AI, yapay zeka modellerini eğitmek için bir milyon serbest çalışanı görevlendiren Data Annotation platformunu işletiyor. Şirket, Scale AI ve Mercor gibi veri etiketleme girişimleriyle rekabet ediyor ve Anthropic'i müşteri olarak sayıyor.

Liderlik Tabloları mı Yanıltıyor?

Chen, şirketlerin AI slop'u önceliklendirmesinin nedenlerinden birinin, LMArena gibi endüstri liderlik tabloları olduğunu belirtti. Bu platformlarda, kullanıcılar yapay zeka yanıtlarına oy vererek sıralamaları etkiliyor.

"Sektör şu anda LMArena gibi berbat liderlik tablolarıyla oynuyor," diyen Chen, insanların yanıtları dikkatle okumadığını veya gerçekleri kontrol etmediğini, sadece en gösterişli olanı seçtiğini ifade etti.

"Modellerinizi, bakkalda gazete alan insanların tipine göre optimize ediyorsunuz," şeklinde konuştu.

Ancak Chen, yapay zeka laboratuvarlarının bu liderlik tablolarına dikkat etmek zorunda olduğunu, çünkü satış toplantılarında sıralamalarıyla ilgili sorularla karşılaşabildiklerini de sözlerine ekledi.

Uzmanlardan Eleştiriler ve Meta'nın Benchmark Sorunları

Chen gibi, araştırma bilimcileri de karşılaştırma ölçütlerini yüzeysel özelliklere aşırı değer vermekle eleştirdi.

ZeroPath'in kurucu ortağı ve CEO'su Dean Valentine, Mart ayında yaptığı bir blog gönderisinde, "Son yapay zeka modeli ilerlemesi çoğunlukla saçmalık gibi geliyor" dedi.

Valentine ve ekibinin, Haziran 2024'te Anthropic'in 3.5 Sonnet sürümünden bu yana "bir tür iyileşme" olduğunu iddia eden farklı modellerin performansını değerlendirdiğini söyledi. Ekibinin denediği yeni modellerin hiçbiri, şirketinin dahili kıyaslamalarında veya geliştiricilerin yeni hatalar bulma yeteneklerinde "önemli bir fark" yaratmamıştı.

Daha "eğlenceli" olsalar da, "ekonomik kullanışlılığı veya genelliği yansıtmıyorlardı."

Avrupa Komisyonu Ortak Araştırma Merkezi'ndeki araştırmacılar, Şubat ayında yayınladıkları "Yapay Zeka Kıyaslamalarına Güvenebilir miyiz?" başlıklı bir makalede, günümüzün değerlendirme yaklaşımında büyük sorunlar olduğu sonucuna vardı.

Araştırmacılar, kıyaslamanın "kültürel, ticari ve rekabetçi dinamikler tarafından şekillendirildiğini ve genellikle daha geniş toplumsal kaygılar pahasına son teknoloji performansa öncelik verdiğini" söyledi.

Şirketler de bu kıyaslamaları "oynamakla" suçlandı.

Nisan ayında Meta, Google ve Fransız yapay zeka laboratuvarı Mistral'in karşılaştırılabilir büyüklükteki modellerinden "daha iyi sonuçlar" verdiğini söylediği Llama ailesine iki yeni model yayınladı. Daha sonra bir kıyaslamayı manipüle etmekle suçlandı.

LMArena, Meta'nın test formatı için daha iyi performans göstermek üzere "özelleştirilmiş" bir Llama 4 Maverick sürümünü sunduğunu "daha açık hale getirmesi gerektiğini" söyledi.

LMArena bir X gönderisinde, "Meta'nın politikamızı yorumlaması, model sağlayıcılardan beklediğimizle eşleşmedi" dedi.

Surge AI

Editör: Emrah Aladağ

İlgili Konular:

Yapay Zeka

Senin de fikrin var mı?

İlk yorumu sen yap! Düşüncelerini bizimle paylaş.

Yapay Zeka 'Şov'u Bırak, Gerçek Sorunları Çöz: Surge AI'dan Uyarı

Surge AI CEO'su Edwin Chen, yapay zeka şirketlerinin yüzeysel "AI slop"a odaklanmasını eleştiriyor. Yapay zeka yarışında yanlış hedefler mi var?

Yapay Zeka Yarışında Yanlış Hedefler Mi Var?

Liderlik Tabloları mı Yanıltıyor?

Uzmanlardan Eleştiriler ve Meta'nın Benchmark Sorunları

İlgili Konular:

Yorum Yap

Haber Akışı

Gazze'deki Saldırıların Bilançosu: 961 Ölü, 3 Bin 20 Yaralı

Koçalan: Sağlık Çalışanları Toplumun Gerçek Kahramanlarıdır

Eşsiz bir tatil için Çökertme Tekila (Tequila) Karavan Park'ta konaklayın

Putin St. Petersburg Forumu'nda Ekonomiyi ve Ukrayna'yı Değerlendirdi

Ankara Kent Konseyi'nden Dünya Çevre Günü Etkinlikleri

Şehir Seçin

Yapay Zeka Yarışında Yanlış Hedefler Mi Var?

Liderlik Tabloları mı Yanıltıyor?

Uzmanlardan Eleştiriler ve Meta'nın Benchmark Sorunları

İlgili Konular:

Bakmadan Geçme

Çin Otomobil Pazarı: NEV'lerin Yükselişi ve Benzinli Araçların Düşüşü

Harvard Üniversitesi'nin Yeni Araştırması Yapay Zekanın Sinir Ağlarının Matematiksel Temelini Aydınlatıyor

Meta'nın Threads'teki Yeni Yapay Zeka Özelliği Kullanıcıların Tepkilerini Topladı

Türkiye'de Futbol Liglerinde Çipli Top Teknolojisi Uygulanıyor

Martta Türkiye'de şarj tüketimi 67.547.488 kWh, soket sayısı 41.938'e çıktı

Montoya: McLaren Mercedes Ünitesini Kullanmayı Öğrenecek

Yorum Yap

Yorumu Bildir

Yorum Kullanım Koşulları ve Gizlilik

1. Genel Hükümler

2. Kişisel Verilerin İşlenmesi

3. Kullanıcı Yükümlülükleri (TCK ve İlgili Kanunlar)

4. Platform Sorumsuzluğu (5651 sayılı Kanun)

5. İçerik Moderasyonu

6. Hukuki Süreçler

7. Çerez (Cookie) Kullanımı

8. Veri Sahibi Hakları (KVKK m.11)

9. Uyuşmazlık Çözümü

10. Yürürlük ve Değişiklikler

ASELSAN'ın Otonom Deniz Araçları: TUFAN ve KILIÇ 200'ün Özellikleri

Savunma Sanayi Ekonomik Kalkınmanın Temel Taşı Oluyor

Harvard Üniversitesi'nin Yeni Araştırması Yapay Zekanın Sinir Ağlarının Matematiksel Temelini Aydınlatıyor

Gazze'deki Saldırıların Bilançosu: 961 Ölü, 3 Bin 20 Yaralı

Koçalan: Sağlık Çalışanları Toplumun Gerçek Kahramanlarıdır

Eşsiz bir tatil için Çökertme Tekila (Tequila) Karavan Park'ta konaklayın

Putin St. Petersburg Forumu'nda Ekonomiyi ve Ukrayna'yı Değerlendirdi

Ankara Kent Konseyi'nden Dünya Çevre Günü Etkinlikleri