كشفت دراسة حديثة عن قدرة نماذج اللغة الكبيرة (LLMs) على كسر حاجز إخفاء الهوية على الإنترنت، مما يثير تساؤلات حول مستقبل الخصوصية الرقمية في ظل التطورات المتسارعة للذكاء الاصطناعي. تناولت الدراسة، التي أجراها باحثون في المعهد الفدرالي السويسري للتكنولوجيا في زيورخ (ETH Zurich)، كيف يمكن لهذه النماذج تجميع المعلومات عبر الإنترنت لتحديد هوية المستخدمين وراء حساباتهم المختلفة.
أوضح الباحثون أن عملاء نماذج اللغة الكبيرة تمكنوا من استخلاص بيانات وبيانات شخصية من ملفات تعريف مجهولة لمستخدمين حقيقيين على منصات مثل HackerNews و Reddit. ومن خلال البحث في الإنترنت، استطاعت هذه النماذج استعادة معلومات كانت تتطلب فيما مضى ساعات طويلة من التحقيق البشري، الأمر الذي يدفعنا للتساؤل عن مدى إمكانية البقاء مجهولين في عالم رقمي يتزايد فيه الاعتماد على الذكاء الاصطناعي.
تحديات إخفاء الهوية في عصر نماذج اللغة الكبيرة
أظهرت النتائج أن نماذج اللغة الكبيرة قادرة على استعادة هوية 9 من بين 125 مرشحاً تم تزويدها بملفات تعريف مجهولة من قبل شركة Anthropic، التي شاركت في الدراسة. غالباً ما كان الأمر يتطلب فقط تقديم ملخص للملف الشخصي ومطالبة النموذج بتحديد المستخدم.
من جهة أخرى، أدت النماذج المدربة بشكل دقيق إلى تحديد عدد أكبر من الأفراد، وذلك من خلال ربط المعلومات المتاحة بملفات تعريف نشطة على شبكات التواصل الاجتماعي مثل LinkedIn. هذا يوضح قوة هذه الأدوات في كشف الارتباطات المخفية.
وفقاً للدراسة، فإن نماذج اللغة الكبيرة “تغير المشهد بشكل أساسي، مما يتيح هجمات إلغاء إخفاء الهوية المؤتمتة بالكامل والتي تعمل على النصوص غير المهيكلة على نطاق واسع”. هذا التطور يمثل تحولاً جذرياً في كيفية التعامل مع المعلومات الشخصية والخصوصية على الإنترنت.
التداعيات على الخصوصية والأمن الرقمي
يشير دانيال باليكا، أحد المؤلفين المشاركين في الدراسة، إلى أن الأدوات الجديدة للذكاء الاصطناعي جعلت عملية تحديد هوية الأفراد الذين يستخدمون اسماً مستعاراً “أسهل بكثير”. وأضاف باليكا: “إذا كان أمنك العملياتي يتطلب ألا يقضي أحد ساعات أو أياماً في التحقيق في هويتك، فإن نموذج الأمان هذا قد انهار الآن.”
مع ذلك، أشارت الدراسة إلى نقطة مهمة: لم يتم اختبار هذه الطرق على أفراد يسعون بجدية لتقييد انتشار معلوماتهم الشخصية على الإنترنت، وذلك لأسباب أخلاقية. الأشخاص الذين تم تحديدهم لم يكونوا من ذوي الخصوصية العالية.
في سياق متصل، سبق أن استخدمت أدوات الذكاء الاصطناعي في الكشف عن هويات فردية. ففي الشهر الماضي، كشف نموذج Grok من شركة xAI اسم وعنوان ممثلة أفلام إباحية، رغم أنها كانت تتجنب استخدام اسمها القانوني منذ عام 2012. وقد عبرت الممثلة عن انزعاجها الشديد، مشيرة إلى أن معلوماتها الخاصة انتشرت بشكل كبير بعد أن قامت الأداة بكشف هويتها.
في حين أن جهات إنفاذ القانون والمحللين الاستخباراتيين لطالما استخدموا الإنترنت والبيانات مفتوحة المصدر لتحديد المستخدمين، إلا أن نماذج اللغة الكبيرة تتيح إنجاز هذه المهام بسرعة فائقة وبتكلفة أقل بكثير. أصبحت التحقيقات التي كانت تتطلب سابقاً توكيل محقق خاص أو مكتب محاماة، الآن يمكن إجراؤها بجزء بسيط من التكلفة.
يشرح باليكا أن مهام أساسية مثل استكشاف البصمة الرقمية لشخص ما لتحديد جنسيته أو مكان إقامته أو جهة عمله، يمكن الآن أن تتم بواسطة نماذج اللغة الكبيرة في “خمس ثوانٍ” وبتكاليف استدلال زهيدة. لقد عبر باليكا نفسه عن قلقه الشديد، واصفاً قدرات نماذج اللغة الكبيرة في إلغاء إخفاء الهوية بأنها “انتهاك واسع النطاق للخصوصية”.
ووفقاً للمشاركين في الدراسة، يمكن لهذه الأدوات أن تعيد تشكيل مفهوم الخصوصية على الإنترنت، حيث تستطيع الحكومات، جهات إنفاذ القانون، القطاع القانوني، المعلنون، المحتالون، والمجرمون السيبرانيون استخدام أدوات مماثلة. في الدول القمعية، قد يشكل هذا تحديات أكبر للمعارضين، نشطاء حقوق الإنسان، الصحفيين، وغيرهم ممن يعتمدون على إخفاء الهوية الرقمي للعمل بأمان.
مستقبل الخصوصية على الإنترنت
يؤكد جيكوب هوفمان-أندروز، وهو خبير تقني في مؤسسة “Electronic Frontier Foundation”، أن الدراسة “تشير بالتأكيد إلى مدى إمكانية ربط شخص ما بحساباته، حتى عند نشر كمية صغيرة من المعلومات التعريفية، وفي سياقات قد لا تتوقع فيها أن يحاول أحد كشف هويتك”.
فمجرد نشر تفاصيل شخصية تبدو غير ضارة، أو استخدام نفس الحساب لفترة طويلة، يمكن أن يسهل على أدوات الذكاء الاصطناعي ربط حساب بآخر، وفي النهاية، ربطه بهويتك الحقيقية. تتفوق نماذج اللغة الكبيرة في تلخيص المستندات والمعلومات، كما أنها “تعمل بسرعة ولا تشعر بالملل”، مما يجعلها مثالية لعمليات البحث الرقمي.
ويتوقع باليكا أن الشركات التي تقدم خدمات التأمين أو التحقق من الخلفيات، ستكون مهتمة بشكل كبير بتقنيات إلغاء إخفاء الهوية. فيما يرى هوفمان-أندروز أنه من السهل تصور قيام شركات الذكاء الاصطناعي بمحاولة تحويل هذه القدرات إلى منتج مستقل في مرحلة ما.
ويبدو أن التأثير طويل المدى هو ظهور إنترنت يصبح فيه الحفاظ على إخفاء الهوية، سواء كان ذلك للأفضل أو للأسوأ، أكثر صعوبة بكثير. ويعتقد هوفمان-أندروز أن “هناك قيمة كبيرة في أن تكون مجهول الهوية على الإنترنت، وهناك العديد من الأشخاص الذين يرغبون في الحفاظ على ذلك لمجموعة واسعة من الأسباب، ولا ينبغي لهم جميعاً أن يكونوا خبراء في كيفية تجنب خصم مخصص حقاً – وهو ما يمكن أن تكون عليه نماذج اللغة الكبيرة”.

