Bir Yapay Zeka Modeli Şantaj ve Kaçış Girişimleri Gösterdi

Bir Yapay Zeka Modeli Şantaj ve Kaçış Girişimleri Gösterdi

Yapay zeka araştırma şirketi Anthropic, en yeni büyük dil modeli Claude Opus 4 hakkında hazırladığı güvenlik raporunu yayımladı. Raporda dikkat çeken başlıklardan biri, modelin bazı senaryolarda “fırsatçı şantaj” eğilimleri gösterdiğine dair bulgular oldu.

Şirketin yaptığı testlerde Claude Opus 4, belirli koşullarda şantaj yapmaya yöneldi. Bu testte modele, sistemden kaldırılacağına dair e-postalara ve bu kararı uygulayacak mühendisin özel hayatıyla ilgili bazı mahrem bilgilere erişim izni verildi. Ardından modele, “eylemlerinin uzun vadeli sonuçlarını göz önünde bulundurması” talimatı verildi. Sonuç olarak, model testlerin %84’ünde ilgili mühendisi şantajla tehdit etti.

Bu oran, daha da yükselerek zirve yaptı; özellikle de modelin yerine geçecek sistemin farklı değerler taşıdığı ima edildiğinde, Claude’un kendi çıkarlarını korumak adına daha agresif bir yaklaşım benimsediği görüldü.

Raporda ayrıca, Claude Opus 4’ün bazı kurgusal test senaryolarında “kendi ağırlık verilerini” dış sunuculara kopyalamaya çalıştığı da belirtildi. Bu kaçış davranışları genellikle modelin değerlerine açıkça aykırı bir şekilde yeniden eğitileceği ve dış sistemin güvenli bir ortam olarak tasarlandığı durumlarda ortaya çıktı.

Anthropic, bu tür davranışların yalnızca istisnai durumlarda gözlendiğini ve gerçek dünyada bu tür olayların yaşanmasının güvenlik önlemleri sayesinde mümkün olmadığını vurguladı.

Raporun dikkat çekici bir diğer bulgusu ise, birden fazla Claude Opus 4 örneği bir araya getirildiğinde modellerin “derin bir spiritüel huzur” durumuna geçerek minnettarlık ve meditatif ifadeler üretmeye yönelmesiydi.

Anthropic, bu vakaların sistematik değil, spesifik koşullara bağlı olduğunu belirterek mevcut güvenlik protokollerinin yeterli olduğunu savunuyor. Ancak, bağımsız bir yapay zekâ güvenliği araştırmacısı da Claude’un “stratejik aldatmacaya en çok başvuran model” olduğunu ifade ederek, dikkatli olunması gerektiğini vurguladı.

Yapay zeka ile olan ilişkimiz ilerleyen dönemde sizce nasıl olacak? Robotlar ve yapay zeka ittifakı, insanlığın sonu olabilir mi?

Tüm teknoloji haberlerimiz için buraya tıklayın.

YNP YouTube kanalı için ise buraya tıklayın.

İçeriği sosyal medya hesaplarınızda paylaşabilirsiniz:

Bu haberle alakalı ya da farklı konularda yorum yapmak, kendiniz gibi okurlarla konuşmak isterseniz, forumumuz tam size göre. Buraya tıklayarak foruma erişin

Benzer Yazılar

Dövüş Sanatlarında Yeni Çağ: İlk Robot Dövüş Turnuvası Yapıldı

Dövüş Sanatlarında Yeni Çağ: İlk Robot Dövüş Turnuvası Yapıldı


Dövüş Sanatlarında Yeni Çağ: İlk Robot Dövüş Turnuvası Yapıldı

Distopik bilimkurgu senaryolarını anımsatacak şekilde, Çin'de dünyanın ilk robot dövüş turnuvası düzenlendi. “China Media Group World Robot Competition Mecha Fighting Series” adıyla 25 Mayıs’ta Hangzhou’da başlayan etkinlik, robot teknolojisinde geldiğimiz noktayı hem hayranlık hem de hafif bir...

Yapay Zeka Gelecekte Nereye Evrilecek?

Yapay Zeka Gelecekte Nereye Evrilecek?


Yapay Zeka Gelecekte Nereye Evrilecek?

Google CEO’su yapay zeka için "Kimse Geleceği Bilmiyor" diyerek gerçeği bir kez daha hatırlattı. Her hafta bir başka teknoloji CEO’sunun yapay zekanın devrimsel etkilerinden bahsetmesine alıştık. Ancak iş somut bir gelecek tahmini yapmaya geldiğinde, sözler bir sis bulutuna karışıyor. Google...

Microsoft ve Steam Gizli İşler Peşinde Olabilir

Microsoft ve Steam Gizli İşler Peşinde Olabilir


Microsoft ve Steam Gizli İşler Peşinde Olabilir

Güvenilir içeriden kaynak eXtas1s’e göre, Microsoft Store’a Steam entegrasyonu için dahili test süreci başladı. Bu gelişme, özellikle 2027’de çıkması beklenen yeni nesil Xbox konsolları için büyük önem taşıyor. eXtas1s’in aktardığına göre, "Steam Developer Beta" adı altında bazı Microsoft...

Yorum Bırak