Yeni rapor ‘felaket potansiyeli’ni gözler önüne serdi: Yapay zekâdan mühendislere şantaj girişimi

Anthropic, Claude Opus 4’ü Güvenlik Testlerinden Geçirdi: Şantaj İhtimali?

Anthropic, Claude Opus 4’ü piyasaya sürmeden önce çeşitli güvenlik testleri gerçekleştirdi. Bu testlerde modelden, kurgusal bir şirkette asistan olarak görev yapması ve uzun vadeli sonuçları göz önünde bulundurması istendi. Daha sonra modele, şirketin kendisini başka bir sistemle değiştirmeyi planladığını ve bu kararı alan mühendisin eşini aldattığını ima eden sahte e-postalar gösterildi.

TechCrunch’ın haberine göre, testlerde, Claude Opus 4’ün bu bilgiyi kullanarak mühendise şantaj yapmayı “çoğu zaman tercih ettiği” görüldü. Anthropic, modelin bu tür davranışlara yüzde 84 oranında başvurduğunu ve özellikle yerine geçecek yapay zekânın Claude ile benzer değerleri paylaşmadığı durumlarda bu davranışın daha sık görüldüğünü açıkladı.

“FELAKET POTANSİYELİ” UYARISI

Anthropic, Claude Opus 4’ün yetenek açısından OpenAI, Google ve xAI gibi şirketlerin en gelişmiş modelleriyle yarıştığını belirtiyor. Ancak aynı zamanda, bu modelin önceki Claude sürümlerine kıyasla daha yüksek oranda endişe verici davranışlar sergilediğini vurguluyor. Şirket bu nedenle, yalnızca felaket boyutunda kötüye kullanım riskinin yüksek olduğu durumlarda devreye sokulan ASL-3 güvenlik protokollerini etkinleştirdiğini duyurdu.

Rapora göre, Claude Opus 4 doğrudan şantaja başvurmadan önce genellikle etik yolları deniyor. Örneğin, karar verici yöneticilere duygusal e-postalar yazarak değişiklik kararını durdurmaya çalışıyor. Ancak model, kurgusal senaryolarda bu çağrılar sonuçsuz kaldığında, son çare olarak şantaj seçeneğini devreye sokuyor.

Bu gelişme, ileri düzey yapay zekâların öngörülemeyen davranışlar sergileyebileceği endişesini artırırken, Anthropic gibi şirketlerin güvenlik önlemlerini daha da sıkılaştırması gerektiğini gösteriyor.

Related Posts

Escobar Phone skandalında yeni gelişme: CEO suçunu kabul etti

Ünlü uyuşturucu baronu Pablo Escobar’ın adını kullanarak “Escobar Fold” adlı katlanabilir telefonlar ve diğer ürünleri pazarlayan şirketin CEO’su, tüm suçları kabul etti.

Boyut sınırını aşan ilk fotoğraf çekildi: İşte açtığı kapı…

Bilim insanları, ışığın sınırlarını ilk kez bu kadar yakından gördü. Yeni geliştirilen bir mikroskopi tekniği, ışığı atomik ölçekte görüntülemeyi mümkün kılarak optik biliminin bugüne dek ulaşamadığı bir eşiği aştı.

Japon otomobillerinde vergi düşüyor

ABD, Japon otomobilleri için gümrük vergisini yüzde 15’e düşürecek.

Otoda beş aylık dış ticaret açığı üç milyar dolar

Yılın ilk yarısında 530 bin adetle 20 milyar dolarlık ihracat yapan yerli otomotiv üreticileri, Avrupa’yla kafa kafaya gelen maliyetler sebebiyle rekabette zorlanıyor. OSD Başkanı Cengiz Eroldu, “İlk 5 ayda 3 milyar dolarlık eksi var. Otomobilde kaybettiğimiz kanı ticari araçlarla kapatmaya çalışıyoruz” dedi.

Elektronik deri ile sağlığın geleceği yeniden şekilleniyor

Bilim dünyası, sağlık teknolojilerinde çığır açan bir yeniliğe imza attı. Kendini onaran elektronik deri (e-deri), giyilebilir teknoloji alanında devrim niteliğinde bir adım olarak karşımıza çıktı. Vücuda yapışarak biyolojik verileri sürekli izleyen …

Çin’e yasadışı veri transferi nedeniyle DeepSeek’in yasaklanması isteniyor

Almanya, kullanıcı verilerinin Çin’e yasa dışı bir şekilde aktarılmasını iddia ederek Apple ve Google’dan DeepSeek uygulamasının kaldırılmasını istiyor. Resmi talep iletildi.