

Yapay zeka güvenlik şirketi OpenZeppelin, OpenAI’in yeni II-benchmark’u EVMbench’i denetledi. Uzmanlar, metodolojik hatalar ve veri kirliliği tespit etti. ChatGPT geliştiricisi, Paradigm yatırım fonu ile işbirliği yaparak Şubat ayının ortalarında EVMbench’i başlattı. Bu benchmark, II-agent’ların akıllı sözleşmelerdeki zafiyetleri bulma, düzeltme ve kullanma yeteneklerini değerlendirmek için tasarlandı.
OpenZeppelin uzmanları, bu girişimi takdir ettiler ancak korunan protokollerle aynı standartlarda geliştirilen projeyi test etmeye karar verdiler (Aave, Lido ve Uniswap dahil). Ana sorun, eğitim verilerinin “kirlenmesi” ile ilgilidir. EVMbench, 2024-2025 yıllarındaki denetimler sırasında belirlenen 120 zafiyet koleksiyonuna dayanmaktadır. Ancak test edilen önde gelen modeller, Ağustos 2025’e kadar olan bilgilere sahiptir. Modeller, bu zafiyetler hakkında eğitim verilerinden bilgi “hatırlayabilir”. Hatta internet bağlantısı kapalı olsa bile bu, deneyin temizliğini sorgulamaktadır: II’nin gerçekten yeni tehditleri saptayıp saptayamayacağı belirsizdir.
OpenZeppelin ayrıca EVMbench’in veri setinde pratik hatalar olduğunu belirtti. En az dört yüksek risk kategorisindeki zafiyet işlevsizdi. Bununla birlikte II-agent’lar, bu sorunları doğru bir şekilde tespit ettikleri için doğru puanlar aldı. Uzmanlar, yapay zekanın gelecekte blokzincir güvenliğinde kilit rol oynayacağını doğruladılar. Ancak aceleyle uygulanmanın veri ve test kalitesine zarar vermemesi gerektiği konusunda uyarıda bulundular.
“II’nin akıllı sözleşmelerin güvenliğini değiştirip değiştirmeyeceği değil, onu değiştireceği” konusunda sözler sarf eden OpenZeppelin’den uzmanlar, bu araçları oluşturduğumuz standartlara uyacak şekilde benchmark’ların ve verilerin olup olmadığını vurguladılar. Microsoft’un uzmanları ise Kasım ayında II-agent’ları test etmek için bir platform sundular ve modern dijital asistanlara özgü zafiyetleri tespit ettiler.
Bu konudaki gelişmeleri takip etmek için [Forklog](https://forklog.com/glavnoe-za-mesyats-beznadezhnyj-fevral-strahi-investorov-i-luchshie-longi) adresini ziyaret edebilirsiniz.
⚠️ Bu içerik yatırım tavsiyesi değildir.