Anomali Tespiti
Yüksek boyutlu ve karmaşık veri kümelerinde anomalilerin saptanması için yeni bir yaklaşım olabilir. Özellikle görüntü ve tablo gibi farklı veri türleri üzerinde çalışarak, “Adversarially Learned Anomaly Detection” (ALAD) “Saldırgan Anomali Tespiti” adı verilen bir yöntem ümit verici. Bu yöntem, Generative Adversarial Networks (GAN) temelli olup, veri uzayı ve gizli uzay (latent space) arasında çift yönlü bir eşleştirme yaparak normal verinin dağılımını daha doğru şekilde modellemeyi hedefler. Ardından, bu modeli kullanarak anomalilik derecesini hesaplamak için yeniden inşa (reconstruction) temelli bir skor geliştirilir. Bu yazıda, ALAD’ın geleneksel ve derin öğrenme tabanlı anomalilik tespiti yöntemlerine kıyasla daha etkili ve gerçek zamanlıya yakın bir şekilde çalıştığını göstermektedir.
İçindekiler
Anomali tespiti, siber güvenlik, üretim, finansal dolandırıcılık ve tıbbi görüntü analizi gibi birçok alanda kritik öneme sahiptir. Yüksek boyutlu verilerdeki karmaşıklık arttıkça, etkili bir anomalilik tespiti yapmak zorlaşır. Geleneksel yöntemler düşük boyutlu veya belirgin özelliklere sahip veriler için iyi sonuç verse de, karmaşık dağılımlara sahip veriler üzerinde yetersiz kalır.
Derin öğrenme, son yıllarda karmaşık veri dağılımlarını modellemede büyük başarı elde etmiştir. Özellikle Generative Adversarial Networks (GAN), gerçek verilerin istatistiksel dağılımını taklit edebilecek üretici (generator) ve ayırt edici (discriminator) ağlara sahiptir. Bu doğrultuda, makale, GAN’lerin bu kapasitesini kullanarak daha güçlü bir anomali tespiti yaklaşımı sunar.
İlgili Çalışmalar
Klasik anomalilik tespiti yöntemleri arasında mesafe tabanlı, tek-sınıf sınıflandırma (örneğin One-Class SVM) ve PCA gibi indirgeme tabanlı teknikler bulunur. Bunun yanı sıra, derin öğrenme tabanlı metodlar da son dönemde yaygınlaşmıştır. Otomatik kodlayıcı (autoencoder) ve varyasyonel otomatik kodlayıcılar gibi yaklaşımlar, veri uzayını temsil eden düşük boyutlu bir latent uzay öğrenerek yeniden inşa hatası üzerinden anomali belirlemeye çalışır. Ayrıca, enerji tabanlı modeller (DSEBM) ve GMM ile birleştirilmiş derin ağlar (DAGMM) da anomali tespitinde kullanılmıştır.
GAN tabanlı anomalilik tespitinde daha önce “AnoGAN” isimli yöntem sunulmuştur. Ancak AnoGAN, test aşamasında her veri örneği için ayrı bir optimizasyon yaparak latent değişkenleri geri kazanır, bu da büyük veri setlerinde veya gerçek zamanlı uygulamalarda pratik değildir. Bu nedenle makale, bu sorunu aşarak çift yönlü GAN modellerine dayanan, encoder’ı da eğitim sürecinde öğrenen bir yaklaşım (ALAD) önerir. Böylece test sırasında tek adımlık öngörü (feed-forward) ile latent temsil elde edilebilir.
Arka Plan: GAN’ler
Standart GAN’lerde bir üretici ağ (G) rastgele gürültü girdisinden gerçekçi veri örnekleri üretirken, bir ayrıştırıcı ağ (D) gerçek veri ile üretilen veriyi ayırt etmeye çalışır. Eğitim, G’nin ürettiği veriyi D’nin ayırt edemeyeceği şekilde iyileştirmeye, D’nin ise üretilmiş veriyi gerçek veriden ayırmaya çalışmasıyla bir min-max optimizasyon problemine dönüşür.
BiGAN veya AliGAN adı verilen bazı GAN varyantları, aynı anda bir encoder (E) de öğrenerek veri uzayından latent uzaya bir projeksiyon sağlar. Bu sayede, test zamanında her veri örneği için latent temsil bulmak için ek optimizasyona gerek kalmaz. Encoder, G ve Dxz arasındaki rekabet, E’nin gerçek verilerin latent dağılımını yakalamasına, G’nin ise bu latent uzaydan gerçekçi örnekler üretmesine yardımcı olur.
ALAD: Yöntemin Tanıtımı
ALAD, çift yönlü GAN mimarisi üzerine inşa edilir. Temel fikir, hem veri-uzayında hem de latent-uzayda çevrim tutarlılığını (cycle consistency) sağlamaktır. Bu, ek ayrıştırıcılar (Dxx ve Dzz) ekleyerek ve spektral normalizasyon gibi stabilizasyon teknikleri kullanarak yapılır. Böylece, E ve G’nin birlikte çalışarak veriyi ve latent uzayı eşleştirmesi geliştirilir.
Çevrim Tutarlılığı
Cycle-consistency, her x veri örneği için G(E(x)) ≈ x ve her z latent örneği için E(G(z)) ≈ z koşullarının sağlanmasıdır. Bu, encoder ve generator’ın birbirini desteklemesini sağlar. Bu amaçla, ALAD, orijinal BiGAN/AliGAN yapısına ek olarak Dxx ve Dzz ayrıştırıcılarını kullanır. Dxx, (x, x) gerçek çiftleri ve (x, G(E(x))) yeniden inşa çiftleri arasında ayrım yaparken, Dzz, (z, z) gerçek latent çiftleri ile (z, E(G(z)))) çiftlerini ayırmayı öğrenir.
Spektral Normalizasyon ve Eğitim Stabilizasyonu
GAN eğitimi genellikle kararsız olabilir. Spektral normalizasyon (SN), GAN içindeki ağ parametrelerinin Lipschitz sabitini kontrol ederek eğitimi istikrarlı hale getirir. Bu çalışma, spektral normalizasyonu ayrıştırıcılara ve gerekiyorsa encoder’a da uygular, eğitimin daha kararlı gerçekleşmesini sağlar.
Anomali Tespiti Süreci
Anomali tespiti için ALAD, veri örneklerini yeniden inşa eder ve yeniden inşa hatasını kullanır. Ancak basit L1 veya L2 yeniden inşa hataları her zaman etkili olmayabilir. Bu nedenle, ALAD geri dönüş ayrıştırıcısı Dxx’in özellik uzayında bir hata metriği tanımlar:
A(x) = ||fxx(x, x) – fxx(x, G(E(x)))||1
Burada fxx, Dxx ayrıştırıcısının (x, x’) ikili girişi için son logits katmanından önceki özellikleri temsil eder. Bu özellik uzayında ölçülen mesafe, verinin manifolduna daha duyarlı bir anomali skorudur. Eğer bir örnek iyi yeniden inşa edilemiyorsa veya modelin alışık olmadığı yapısal farklılıklar sergiliyorsa, bu skor yüksek çıkar ve örnek anomali olarak sınıflandırılır.
Deneysel Sonuçlar
ALAD, çeşitli veri kümeleri üzerinde test edilmiştir:
- Tablolu Veriler: KDD99 (ağ trafiği) ve Arrhythmia (tıbbi veriler) setleri üzerinde ALAD, DAGMM, DSEBM, IF (Isolation Forest) ve OC-SVM gibi yöntemlerle karşılaştırılmıştır. KDD99 verisinde ALAD, derin öğrenme tabanlı en iyi yöntemlere benzer veya daha iyi sonuçlar vermiş, Arrhythmia setinde ise küçük veri boyutu nedeniyle IF gibi daha basit yöntemlerin biraz gerisinde kalabilmiştir. Yine de ALAD, derin öğrenme tabanlı yöntemler arasında oldukça rekabetçidir.
- Görüntü Verileri: SVHN ve CIFAR-10 veri setlerinde, her sınıfı sırayla normal varsayıp diğer 9 sınıfı anomali sayacak şekilde toplam 10 senaryo kurgulanmıştır. Sonuçlar, ALAD’ın çoğu görevde AnoGAN, DSEBM ve OC-SVM gibi yöntemlerden daha iyi AUROC değerlerine ulaştığını göstermiştir. Bazı sınıflarda ALAD, benzer veya biraz daha düşük performans sergilese de genel olarak istatistiksel üstünlük sağlamıştır.
Hız ve Verimlilik
AnoGAN gibi önceki GAN tabanlı yöntemler, test aşamasında her örnek için ek optimizasyon gerektirirken, ALAD anında latent temsil üretir. Test zamanında ALAD, AnoGAN’dan yüzlerce kat daha hızlıdır, bu da gerçek zamanlı anomalilik tespiti açısından büyük bir avantajdır.
Ek Deneyler ve Tartışma
Çalışmada, ALAD yapısının bileşenlerinin her birinin (spektral normalizasyon, latent ceza vs.) anomali tespiti performansına etkisi araştırılmıştır. Bu ablatif deneyler, spektral normalizasyon ve ek ayrıştırıcıların eklenmesinin genellikle performansı iyileştirdiğini göstermiştir.
Ayrıca, farklı anomali skor yöntemleri (L1, L2, logits çıkışı ve özellik uzayı) kıyaslandığında, özellikle tablo verilerinde ve bazı durumlarda görüntü verilerinde, özellik tabanlı mesafenin (ALAD’ın kullandığı yöntem) genellikle daha güçlü bir ayırt edicilik sağladığı gözlemlenmiştir.
Bu makale, karmaşık ve yüksek boyutlu veri kümelerinde anomali tespiti için GAN tabanlı bir yaklaşım olan ALAD’ı tanıtmaktadır. ALAD, çift yönlü GAN mimarisi ile hem gerçek veri dağılımını hem de latent uzayı modelleyerek, test aşamasında hızlı ve etkili anomali tespiti yapar. Deneysel sonuçlar, ALAD’ın hem tablolama hem de görüntü verilerinde birçok son teknoloji (state-of-the-art) yönteme denk veya üstün performans sergilediğini ve özellikle büyük veri setlerinde önemli avantajlar sağladığını göstermektedir. Gelecekte, konuşma verisi veya sensör verisi gibi diğer veri modlarında ALAD’ın uygulanması potansiyel araştırma konularıdır.
Örnek Tablo: Karşılaştırılan Yöntemler ve Temel Özellikler
Yöntem | Temel Yaklaşım | Test Zamanı Maliyeti | Veri Türleri | Avantaj/Dezavantaj |
---|---|---|---|---|
OC-SVM | Tek-sınıf sınıflandırma, çekirdek hileleri | Düşük | Tablo, basit veri | Küçük veride fena değil, karmaşık veride zayıf |
IF (Isolation Forest) | Rastgele ağaçlarla izolasyon | Düşük | Tablo | Basit, hızlı, bazen karmaşık veri için yetersiz |
DSEBM | Enerji tabanlı derin model | Orta | Tablo ve Görüntü | Daha karmaşık veri için uygun ama performans sınırlı |
DAGMM | Autoencoder + GMM | Orta | Tablo | Kompleks dağılımlarda başarılı |
AnoGAN | GAN tabanlı, tek yönlü | Yüksek (her test örneği için optimizasyon) | Görüntü | Doğruluk yüksek olabilir, ancak yavaş |
ALAD | Çift yönlü GAN, çevrim tutarlılığı | Çok Düşük (tek geçiş) | Tablo ve Görüntü | Hızlı, stabil, yüksek performans |
Tüm soru, öneri ve görüşleriniz için İletişim linkini kullanabilirsiniz.