Veri varsa yapay zeka vardır. Peki ya veri paylaşamıyorsak?
Dijital dünyada veri her şeydir. Ancak veri sadece değerli değil, aynı zamanda tehlikelidir. Özellikle finans, sağlık ve kamu gibi yüksek gizlilik gerektiren alanlarda verinin işlenmesi, yasal ve etik sorumluluklarla çevrilidir. Bu noktada devrimsel bir soru karşımıza çıkar: Veriyi hiç açmadan makine öğrenmesi mümkün mü?
Bu yazıda, bu sorunun peşine düşen bir araştırmanın detaylarını paylaşıyoruz. Homomorfik şifreleme teknolojisi kullanılarak, makine öğrenmesi modelleri veriye bakmadan eğitiliyor. Evet, doğru duydunuz. Model veriyle “görmeden” çalışıyor.
Problemin Kökeni: Güven mi Performans mı?
Geleneksel yapay zeka sistemleri, verinin düz bir şekilde işlenmesini gerektirir. Ancak veri üçüncü taraf bir serviste işlenecekse, bu durum hem güvenlik hem de gizlilik açısından büyük bir risk oluşturur. Kurumlar çoğu zaman bu yüzden dış hizmet sağlayıcılar veya bulut servisleriyle çalışmaktan çekinir. Özellikle finansal veriler söz konusu olduğunda, “veri dışarı çıkamaz” ilkesi hâkimdir.
Oysa ki yapay zekâya ihtiyaç duyulan tam da bu alanlardır. Çözüm? Veriyi şifrele, ama işlemeden geri kalma.
Homomorfik Şifreleme: Bilgiyi Açmadan Hesap Yapmak
Tam Homomorfik Şifreleme (FHE), şifrelenmiş veriler üzerinde doğrudan matematiksel işlemler yapılmasına olanak tanır. Yani:
- Veriyi çözmeden model eğitilebilir.
- Gizlilik ihlali yaşanmaz.
- Dış servis sağlayıcılar güvenle kullanılabilir.
Bu çalışmada Zama AI’ın Concrete ML kütüphanesi kullanılarak iki farklı veri seti üzerinde çeşitli makine öğrenmesi algoritmaları eğitildi. Hem şifreli hem de açık veri kullanılarak doğruluk, işlem süresi ve genel uygulanabilirlik kıyaslandı.
Uygulanan Modeller ve Veriler
Kullanılan algoritmalar:
- Random Forest
- XGBoost
- Karar Ağaçları
- Doğrusal Regresyon
Veri setleri:
- Dünya Mutluluk Endeksi & Enflasyon Göstergeleri (2015–2023)
→ Hedef: Yolsuzluk Algısı - Yaşam Beklentisi & Sağlık Göstergeleri (2000–2015)
→ Hedef: Yaşam Beklentisi
Veri setleri medyan doldurma, normalizasyon gibi önişleme adımlarından geçirildi ve homomorfik şifrelemeye uygun hale getirildi.
Sonuçlar: Şifreli Öğrenme Ne Kadar Başarılı?
Doğruluk (MSE & R²):
- Açık veride Random Forest ve XGBoost en başarılı modeller oldu.
- Şifreli veride de bu iki model yüksek doğruluk sağladı.
- Fark: ±%5 sapma ile sınırlı.
İşlem Süresi:
- Açık veride tahminler milisaniyelerle ölçülürken,
- Şifreli veride dakikalar hatta saatler sürdü.
- Örn: XGBoost → Şifresiz: 0.3 sn | Şifreli: 18.000+ sn
Özetle:
- Doğruluk korunuyor.
- İşlem süresi maliyeti artıyor.
Ne Anlatıyor Bu Araştırma?
Bu çalışma şu önemli mesajı veriyor:
“Gizliliğin bedeli doğruluk değil, süre olabilir. Ama gizlilik olmadan hiçbir şey olmaz.”
Özellikle veri gizliliğinin yasal zorunluluk olduğu finans, sağlık, hukuk gibi sektörlerde bu yaklaşım oyunun kurallarını değiştirebilir. Gelişmiş donanım, optimizasyon teknikleri ve paralel hesaplama ile bu süre problemi de zamanla aşılabilir.
İleriye Dönük Düşünceler
- Gerçek zamanlı sistemler için işlem süresi optimizasyonu kritik.
- Derin öğrenme mimarileriyle entegrasyon çalışmaları artırılmalı.
- Hibrit çözümler (ön-analiz açık, karar motoru şifreli) denenebilir.
- Edge AI + FHE birleşimi, mobil güvenlikte devrim yaratabilir.
Veriden habersiz makine öğrenmesi artık bir teori değil, pratikte uygulanabilir bir gerçek. Homomorfik şifreleme sayesinde veriniz hiç açılmadan model eğitilebiliyor, tahmin üretilebiliyor ve güvenlik endişesi minimize ediliyor.
Geleceğin güvenli yapay zekası artık sadece performansa değil, gizliliğe de odaklanıyor.
*Bu blog yazısı 11th International Symposium on Intelligent Technologies in Engineering and Science (ISITES 2025)’te sunulmuş ve dünya mutluluk indeksi ve enflasyon verilerinin ilişkisini anlamı hedeflemiştir. Academic Perspective Procedia Journal’dan yayına erişilebilir.
