علامات مائية على النصوص المولدة بالذكاء الاصطناعي بـ ChatGPT

رصدت شركة Rumi، المتخصصة في تطوير حلول تعليمية معتمدة على الذكاء الاصطناعي، سلوكاً جديداً في بعض نماذج ChatGPT الحديثة، وتحديداً GPT-o3 وGPT-o4 mini، يتمثل في تضمين علامات مائية رقمية داخل النصوص المُولدة. ووفقاً لما كشفه تقرير الشركة المنشور عبر مدونتها، فإن هذه العلامات تهدف إلى إثبات أن النص قد تم إنشاؤه باستخدام هذه النماذج.
العلامات المائية التي تم رصدها تأخذ شكل رموز Unicode تُعرف بـ "المسافة الضيقة غير القابلة للكسر" (Narrow No-Break Space) وتحمل الرمز (Unicode U+202F). من النظرة الأولى، تبدو كأنها مسافات عادية، إلا أنها تختلف عن المسافات التقليدية في تركيبتها البرمجية.
الفريق البحثي أشار إلى أن هذه العلامات تظهر غالباً في الردود المطولة والمقالات الطويلة، بينما لم يتم رصدها في النسخ الأقدم من ChatGPT مثل نموذج GPT-4o.
آلية التحقق
وأوضح فريق Rumi أنه يمكن للمستخدمين التحقق من وجود هذه العلامات عبر لصق النص في أدوات تحرير متقدمة مثل Sublime Text أو محررات الشيفرة البرمجية، والتي تُظهر الرموز الخفية بوضوح.
كما يمكن الاستعانة بأدوات إلكترونية مثل SoSciSurvey، المختصة بكشف الأحرف غير المرئية داخل النصوص.
وأكد التقرير أن وجود هذه الرموز ليس عشوائياً بل يتم بطريقة ممنهجة، ما يشير إلى أنها مضافة بشكل مقصود بهدف تتبع مصدر النصوص التي يتم توليدها.
سياسة عامة جديدة
هذا الاكتشاف يأتي ضمن سلسلة خطوات تعمل عليها شركة OpenAI لتعزيز تقنية "العلامات المائية"، والتي تم تطبيقها سابقاً في الصور المولدة عبر الذكاء الاصطناعي.
ورغم أن الشركة لم تصدر بياناً رسمياً يؤكد إضافة هذه العلامات داخل النصوص، إلا أن بعض الخبراء رجّحوا أن السبب يعود إلى الرغبة في الحفاظ على سرية التقنية، تجنباً لإضعاف فاعليتها إذا تم الكشف عنها علناً.
لكن في المقابل، يرى فريق Rumi أن هذه العلامات يمكن تجاوزها بسهولة عبر عمليات بسيطة من البحث والاستبدال داخل محررات النصوص، ما يجعل هذه الخطوة مؤقتة ولا يمكن الاعتماد عليها بشكل كامل.
وأشار التقرير إلى أنه بمجرد معرفة المستخدمين بوجود هذه العلامات، يمكنهم إزالتها بسهولة، مما يجعل التقنية غير فعالة على المدى الطويل.
أهمية التوقيت
يتزامن الكشف عن هذه التقنية مع إعلان OpenAI عن إتاحة ChatGPT مجاناً للطلاب حتى نهاية مايو الجاري عبر الرابط (chatgpt.com/students).
هذا القرار من شأنه أن يعزز استخدام النماذج المتقدمة في تنفيذ الواجبات والمشاريع النهائية، وهو ما قد يحمل آثاراً سلبية على بعض الطلاب الذين لا يدركون وجود هذه العلامات، حيث يمكن للمدرسين رصدها باستخدام أدوات مخصصة، مما قد يضع الطلاب تحت طائلة المساءلة الأكاديمية.
وفي المقابل، فإن الطلاب الذين لديهم معرفة بهذه التقنية يمكنهم إزالة العلامات بسهولة، ما يخلق فجوة في تكافؤ الفرص داخل المؤسسات التعليمية.
مشكلات إضافية في النماذج الجديدة
أشار التقرير أيضاً إلى أن نماذج الاستدلال الحديثة o3 وo4 mini وo4 high تعاني من عدة مشكلات، من أبرزها تكرار أسماء المستخدمين عند الإجابة على الأسئلة، وزيادة نسبة المعلومات الخاطئة أو "الهلاوس" مقارنة بالنماذج الأقدم. وحتى اللحظة، لم تحدد شركة OpenAI سبباً دقيقاً لهذه المشكلات.