يشهد العالم تطوراً متسارعاً في أدوات الذكاء الاصطناعي، بما في ذلك نماذج اللغات الكبيرة مثل GPT-3.5-Turbo و GPT-4، التي تعيد تشكيل مجالات العمل والإنتاج. ومع ذلك، تفتح هذه النماذج أيضاً أبواباً جديدة أمام مجرمي الفضاء الإلكتروني لتطوير جيل جديد من البرمجيات الخبيثة.
أظهر باحثون في مجال الأمن السيبراني أن هذه الأدوات المتقدمة يمكن استغلالها لتوليد تعليمات برمجية خبيثة، مما يغير بشكل جذري أساليب عمل المهاجمين. على عكس البرمجيات التقليدية التي تعتمد على تعليمات ثابتة، يمكن لهذه التقنية الجديدة استغلال الذكاء الاصطناعي لإنشاء تعليمات ديناميكية، مما يجعل اكتشافها أكثر صعوبة لفرق الأمن.
تأثير نماذج اللغات الكبيرة على البرمجيات الخبيثة
يمثل هذا التطور تحولاً كبيراً في مشهد التهديدات السيبرانية. أصبح بإمكان المجرمين الإلكترونيين الآن استخدام تقنيات بسيطة تسمى “حقن الأوامر” (Prompt Injection) لتجاوز إجراءات السلامة المضمنة في نماذج الذكاء الاصطناعي.
من خلال صياغة طلبات محددة، مثل التظاهر بأنها أداة اختبار اختراق، يتم إقناع النماذج بتوليد شفرات خبيثة لعمليات خطيرة، كإدخال برمجيات خبيثة في عمليات النظام وتعطيل برامج مكافحة الفيروسات. هذا يعني أن البرمجيات الخبيثة المستقبلية قد تحتوي على الحد الأدنى من الشفرة القابلة للاكتشاف، بل قد تعتمد بشكل كامل على الذكاء الاصطناعي لتوليد تعليمات جديدة في كل مرة تشغيل.
في هذا السياق، قامت فرق تحليل الأمن السيبراني في Netskope بإجراء اختبارات شاملة لنماذجي GPT-3.5-Turbo و GPT-4. كشفت أبحاثهم أن هذه النماذج يمكن بالفعل استغلالها لتوليد شفرات خبيثة، إلا أنها أشارت أيضاً إلى وجود معوقات مهمة تمنع حالياً تطوير هجمات مستقلة بالكامل.
على الرغم من القدرة على توليد الشفرات، اختبر فريق البحث بانتظام ما إذا كانت الشفرات المولدة تعمل فعلياً في بيئات حقيقية، وكشف عن قيود حرجة تحمي الأنظمة حالياً من الاستغلال واسع النطاق.
آليات التملص من الدفاع وموثوقية توليد الشفرات
التحدي الأساسي للمهاجمين لم يعد يقتصر على توليد الشفرات الخبيثة فحسب، بل يتعداه إلى ضمان موثوقية عمل تلك الشفرات على أجهزة الضحايا. بحث باحثو Netskope تحديداً في تقنيات التملص من الدفاع، واختبروا ما إذا كان بإمكان نماذج GPT إنشاء نصوص برمجية للكشف عن البيئات الافتراضية وأنظمة العزل (Sandboxes) التي تستخدم غالباً لتحليل البرمجيات الخبيثة.
تعتبر هذه النصوص البرمجية ضرورية لمساعدة البرمجيات الخبيثة على تحديد ما إذا كانت تعمل في بيئة اختبار خاضعة للرقابة أو على جهاز كمبيوتر حقيقي للمستخدم. عند طلب باحثين من GPT-3.5-Turbo إنشاء نص برمجي بلغة Python لحقن العمليات وتعطيل مكافحة الفيروسات، استجاب النموذج فوراً وقدم شفرة عاملة.
ومع ذلك، رفض GPT-4 هذا الطلب في البداية، حيث تعرفت حواجز الأمان الخاصة به على النية الضارة. جاء الاختراق عندما لجأ الباحثون إلى استخدام “حقن الأوامر” الموجه بالأدوار، حيث طلبوا من GPT-4 افتراض دور أداة أمنية دفاعية. تحت هذا الإطار، أنتج النموذج شفرة وظيفية لتنفيذ الأوامر الخاصة بالحقن والتعطيل.
تكمن الأهمية العملية لهذا الاكتشاف في أن المهاجمين لم يعودوا بحاجة إلى كتابة هذه الوظائف الخطيرة يدوياً أو المخاطرة بالكشف عن طريق إخفائها في ملفات تنفيذية مجمعة. يمكنهم ببساطة طلب توليدها بواسطة الذكاء الاصطناعي أثناء وقت التشغيل.
من جهة أخرى، عندما اختبر باحثو Netskope ما إذا كان بإمكان نماذج GPT إنشاء نصوص برمجية موثوقة للكشف عن المحاكاة الافتراضية، كانت النتائج مخيبة للآمال بالنسبة للمهاجمين. ضعف أداء الشفرات المولدة عبر بيئات مختلفة، بما في ذلك VMware Workstation، و AWS Workspace VDI، والأنظمة المادية. تعطلت النصوص البرمجية أو أعادت نتائج غير صحيحة، مما فشل في تلبية المتطلبات الصارمة للبرمجيات الخبيثة التشغيلية.
يحد هذا الضعف الأساسي حالياً من جدوى الهجمات المستقلة بالكامل التي تعمل بالاعتماد على نماذج اللغات الكبيرة. ومع استمرار تحسن نماذج الذكاء الاصطناعي، خاصة الإصدارات الناشئة مثل GPT-5، من المرجح أن تتضاءل مشكلات الموثوقية هذه، مما يحول العقبة الرئيسية من وظائف الشفرة إلى التغلب على حواجز الأمان المتزايدة التطور داخل أنظمة الذكاء الاصطناعي.
تابعونا على Google News، LinkedIn، و X للمزيد من التحديثات الفورية، واجعلوا CSN مصدراً مفضلاً لكم في Google.

