تحديثات لحماية تشات جي بي تي من الصور غير اللائقة
اكتشف باحثون ثغرة في نظام تشات جي بي تي تسمح بإنشاء صور غير لائقة أو عنيفة. تعمل الشركة المطورة على إصلاح هذه المشكلة لضمان سلامة المستخدمين ومنع إساءة الاستخدام.
اكتشف باحثون ثغرة في نظام تشات جي بي تي تسمح بإنشاء صور غير لائقة أو عنيفة. تعمل الشركة المطورة على إصلاح هذه المشكلة لضمان سلامة المستخدمين ومنع إساءة الاستخدام.
أفاد باحثون بأن أحدث نسخة من نظام الذكاء الاصطناعي "تشات جي بي تي" يمكن أن تنتج صوراً غير لائقة أو مشاهد عنف مروعة بتوجيهات بسيطة. وقد اكتشفت شركة "مايندغارد" البريطانية هذه الثغرة.
بعد إبلاغ الشركة المطورة "أوبن إيه آي" بالمشكلة، قامت بإضافة إجراءات حماية جديدة. تهدف هذه الإجراءات إلى منع روبوت الدردشة من الاستجابة لطلبات توليد الصور التي تخالف سياساتها.
لكن الباحثين في أمن الذكاء الاصطناعي أشاروا إلى أن تعديلات طفيفة على التعليمات لا تزال تسمح بإنتاج محتوى يثير القلق. وهذا يعني أن التحدي مستمر في حماية النظام بشكل كامل.
يعمل الباحثون في مجال "الاختبار الهجومي" على البحث عن نقاط ضعف في أنظمة الذكاء الاصطناعي لمساعدة الشركات على تحسينها. ويشعرون بالقلق لأن النماذج قد تنتج صوراً غير لائقة حتى دون تعليمات واضحة.
تؤكد "أوبن إيه آي" أنها تعتمد طبقات متعددة من الحماية وتواصل مراقبة الوضع. وتهدف الشركة إلى منع المستخدمين من إنشاء محتوى ينتهك شروطها، مع إدراك صعوبة منع هذه النماذج بالكامل.