İçeriğe geç

Araştırmacılar, 2 Milyar Discord Mesajını Paylaştı: Kamuya Açık Veri, Gizlilik Endişelerini Tetikledi

Araştırmacılar, 2 Milyar Discord Mesajını Herkese Açık Şekilde Yayınladı: Gizlilik ve Etik Tartışmaları Büyüyor

Brezilya’daki Minas Gerais Finans Üniversitesi’nden bir grup araştırmacı, Discord’un açık API’sini kullanarak 3.167 sunucudan topladıkları 2 milyardan fazla Discord mesajını anonimleştirdiklerini iddia ederek kamuya açtı. 2015’ten 2024’e kadar olan dönemden alınan bu mesajlar, neredeyse on yıllık bir sohbet geçmişini gözler önüne seriyor.

Veriler Anonim mi, Gerçekten Güvende mi?

Araştırmacı ekip, mesajları anonimleştirdiğini ve Discord’un kullanım koşulları çerçevesinde yalnızca herkesin erişimine açık sunuculardan veri çektiğini belirtiyor. Elde edilen devasa veri setinde, 4.7 milyondan fazla kullanıcıya ait toplam 2 milyar mesaj yer alıyor. Bu veri seti, “Discord Unveiled: A Comprehensive Dataset of Public Communication (2015 – 2024)” başlıklı bir akademik makale ile duyuruldu.

Ancak, başka bir geliştirici tarafından anonimleştirilmeyen sohbet geçmişlerini içeren “Searchcord” adında farklı bir Discord aracı da yayınlandı. Bu gelişmeler, Discord topluluklarında ciddi bir paniğe neden oldu; hem sunucu yöneticileri hem de sıradan kullanıcılar gizlilik konusunda endişelerini dile getirdi.

Etik Tartışmalar ve Discord Politikaları

Araştırmacılar, etik kurallara önem verdiklerini ve yalnızca Discord’un “kamuya açık” olarak nitelendirdiği sunucuları incelediklerini vurgulasa da, bu yaklaşımın yeterliliği tartışma konusu. Çünkü Discord kullanıcılarının çoğu—özellikle gençler ve çocuklar—üyelik sırasında sunulan kullanım koşullarını genellikle okumuyor. Ayrıca, Discord’un 2020 sonrası hizmet şartlarında, API ile veri kazımanın (scraping) açıkça yasaklandığı belirtiliyor:

“Discord hizmetlerinde veya bu hizmetler aracılığıyla erişilebilen hiçbir veriyi, içeriği veya bilgiyi çıkarmayın veya kazımayın.”

Araştırmacılar yine de, kullanıcı adlarını takma isimlerle değiştirdiklerini, mesaj ve kullanıcı kimliklerini kısalttıklarını ve diğer tanımlayıcı tüm detayları sildiklerini belirtiyor.

Veri Setinin Kapsamı ve Kullanım Amacı

Yayınlanan veri tabanı, sunucu bazında organize edilmiş büyük JSON dosyalarından oluşuyor ve sıkıştırılmış haliyle 118 GB’a ulaşıyor. Araştırmacılar bu veri setini, dijital platformlarda siyasi söylem, yanlış bilginin yayılması ve moderasyon stratejilerinin etkisi gibi konuları araştırmak isteyen akademisyenler için hazırladıklarını savunuyor. Ayrıca, platformlardaki zararlı davranış kalıplarını tespit etmek ve alana özgü sohbet botlarının geliştirilmesine katkı sunmak da amaçlanıyor.

Discord’un Genel API’si ve Sunucu Keşif Özelliği

Discord’da kullanıcılar, sunucularını herkese açık veya özel olarak ayarlayabiliyor. Araştırmacılar, 31.673 herkese açık sunucudan rastgele seçtikleri %10’luk bir bölümü (3.167 sunucu) veri kazıma işlemi için kullandıklarını belirtiyor. Discord’un bot entegrasyonlarına izin vermesi ve API’sinin açık yapısı, bu kadar büyük çaplı veri toplanmasını mümkün kıldı.

Gizlilik ve Etik Sorgulaması Devam Ediyor

Tüm önlemlere rağmen, bu tarz toplu veri yayınlarının hem etik hem de hukuki sınırları bir kez daha tartışmaya açtığı ortada. Kullanıcıların büyük çoğunluğu mesajlarının kamuya açık olarak toplanabileceğini bilmiyor ya da önemsemiyor. Özellikle gençlerin ve çocukların yoğun olarak bulunduğu platformlarda, gizlilik ve etik ilkelerin çok daha hassas yönetilmesi gerektiği açıkça görülüyor.

Kategori:GüvenlikHaberSiber GüvenlikTeknoloji
Gizliliğe genel bakış

Bu web sitesi, size mümkün olan en iyi kullanıcı deneyimini sunabilmek için çerezleri kullanır. Çerez bilgileri tarayıcınızda saklanır ve web sitemize döndüğünüzde sizi tanımak ve ekibimizin web sitesinin hangi bölümlerini en ilginç ve yararlı bulduğunuzu anlamasına yardımcı olmak gibi işlevleri yerine getirir.