9 C
İstanbul
30 Ocak 2025 | Perşembe
No menu items!
Ana SayfaYapay ZekaYapay Zekâ İçin Yeni Performans Testi: En İyi Modeller Bile Tam Not...

Yapay Zekâ İçin Yeni Performans Testi: En İyi Modeller Bile Tam Not Alamıyor!

Yapay zekâ modellerinin yeteneklerini ölçmek için yeni ve zorlu bir performans testi geliştirildi. “Humanity’s Last Exam” adı verilen bu test, yapay zekâ alanında önemli çalışmalar yapan Center for AI Safety (CAIS) ve Scale AI tarafından oluşturuldu. Testin en dikkat çeken yanı, piyasadaki en gelişmiş yapay zekâ modellerini bile zorlaması ve hiçbirinin tam puan alamaması oldu.

Humanity’s Last Exam Nedir?

Bu yeni performans testi, yapay zekâların matematik, beşeri bilimler ve doğa bilimleri gibi geniş bir yelpazede 3.000’den fazla soru ile değerlendirildiği bir sistem sunuyor. Dahası, test grafikler, diyagramlar ve görseller içererek yapay zekâların sadece yazılı verilere dayalı yanıt vermesini değil, karmaşık problem çözme yeteneklerini de ölçmeyi hedefliyor.

En İyi Yapay Zekâ Modelleri Bile Tam Puan Alamıyor

Yapılan test sonuçları, hiçbir yapay zekâ modelinin yüzde 100 başarı sağlayamadığını gösteriyor. Üstelik, 2021 yılında yapılan benzer matematik testlerinde erken aşamadaki yapay zekâ modellerinin 100 üzerinden 10 puan bile alamadığı belirtiliyor. Bu durum, gelişmiş yapay zekâ modellerinin bile hâlâ insan seviyesine ulaşmadığını ortaya koyuyor.

50 Ülkeden 1.000 Kişilik Uzman Katkısı

Humanity’s Last Exam’in geliştirilme sürecine, 50’den fazla ülkeden 1.000’e yakın araştırmacı ve profesör katkı sağladı. Bu uzman ekip, testin adil ve kapsamlı olmasını sağlamak için çalıştı. Bu nedenle, testin gelecekte yapay zekâ değerlendirmelerinde önemli bir kriter haline gelmesi bekleniyor.

Humanity’s Last Exam, yapay zekâ modellerinin gerçek dünya problemlerini çözme yeteneklerini ölçmek için önemli bir adım olarak görülüyor. Piyasadaki en iyi yapay zekâlar bile bu testte zorlanıyorsa, gelecekte yapay zekâların insan seviyesine ulaşması için daha fazla gelişime ihtiyaç duyulduğu açıkça ortaya çıkıyor.

Kim Biliyo
Kim Biliyo
Meraklı Kim Biliyo
DİĞER HABERLER

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz
Captcha verification failed!
Captcha kullanıcı puanı başarısız oldu. lütfen bizimle iletişime geçin!

EN POPÜLER