طوّر فريق بحثي بجامعة السلطان قابوس، بقيادة الدكتور أحمد شحاته من كلية الآداب والعلوم الاجتماعية، إطار عمل متكاملًا قائمًا على التعلم العميق، يحمل اسم "ArabFake"، يهدف إلى اكتشاف الأخبار المزيفة في وسائل الإعلام العربية، بما في ذلك منصات التواصل الاجتماعي، وتصنيف المعلومات الواردة فيها، ومحاولة التنبؤ بدرجة خطورتها المحتملة جراء انتشارها، في ظل ما يمثله هذا النوع من المحتوى من تحدٍّ كبير لسلامة المعلومات وثقة الجمهور.
ويعمل "ArabFake"، الذي بُني على نموذج MARBERTv2 المتخصص في معالجة التغريدات العربية متعددة اللهجات، على التعامل بكفاءة مع تعقيد اللغة العربية، من خلال أداء ثلاث مهام رئيسية موحّدة، تتمثل في: اكتشاف الأخبار المزيفة، وتصنيف المحتوى الإخباري، وتقييم مستوى مخاطره.
واعتمد الباحثون القائمون على تطوير الخوارزمية على تدريبها باستخدام مجموعة بيانات مكوّنة من 2495 عنصرًا إخباريًا، جرى تصنيفها يدويًا، مع تسميات تم التحقق منها بدقة من قبل خبراء متخصصين في تصنيف الأخبار وفق فئات الأخبار المزيفة ومستويات المخاطر. كما جرى تطبيق النموذج على مجموعتي بيانات ANS Corpus Dataset وAraNews Dataset، حيث بلغ حجم البيانات المستخدمة نحو 199,331 خبرًا باللغة العربية، شملت أخبارًا صحيحة وأخرى مزيفة، ما أتاح قاعدة بيانات متينة لتقييم كفاءة النموذج بدقة وموثوقية عالية.
وأثبت "ArabFake" فعاليته بصورة لافتة، إذ حقق دقة بلغت 94.12% في الكشف عن الأخبار المزيفة، و84.92% في تصنيف المحتوى، و88.91% في تقييم المخاطر. وتعكس هذه النتائج موثوقية الخوارزمية وقدرتها على التعامل مع مهام متعددة بكفاءة عالية، ويرى الباحثون أن هذا الأداء المتقدم قد يحمل آثارًا عملية كبيرة للمؤسسات الإخبارية ومشروعات التحقق من المعلومات، بما يسهم في تعزيز مصداقية الأخبار وتقليل انتشار المعلومات المضللة.
كما كشف التحليل التجريبي للبيانات التي جُمعت عن أنماط بارزة في توزيع الأخبار المزيفة باللغة العربية، حيث بلغت نسبة القصص الملفقة 60.4%، والمعلومات الاقتصادية المضللة 22.4%، بوصفها الأشكال الأكثر انتشارًا في وسائل الإعلام العربية. وذكر الباحثون أن ما يقرب من ثلثي محتوى الأخبار المزيفة المصنفة يشكّل مستوى خطورة عالٍ على المجتمع، ما يؤكد الحاجة الملحّة إلى أنظمة كشف فعّالة ومتقدمة تحمي الجمهور من التضليل الإعلامي.
وبيّن الفريق البحثي أن تنفيذ آلية تسجيل التكافؤ في الخوارزمية الجديدة أثبت فعاليته بصورة خاصة في تحديد الأنماط اللغوية المرتبطة بالأخبار المزيفة، ما يوفر رؤى جديدة حول خصائص المحتوى المضلل. وتقدّم الخوارزمية تقييمًا متزامنًا للأخبار المنشورة، من خلال تحديد ما إذا كان المحتوى صحيحًا أم لا، وتقدير مستوى المخاطر المتوقعة، مع إعطاء أولوية للتدخل السريع ودحض المعلومات المضللة عالية المخاطر.
وأشار الباحثون إلى أن "ArabFake" يفتح المجال أمام استخدامات عملية واسعة في وسائل الإعلام ووكالات الأنباء، وأنظمة تعديل المحتوى، ومبادرات محو الأمية الإعلامية، إضافة إلى دعم المحللين والباحثين في دراسة أنماط التضليل في المحتوى العربي، بما يعزز قدرة المؤسسات والمجتمع على مواجهة تحديات الأخبار المزيفة والمعلومات المضللة بكفاءة وفاعلية.