فريق بحثي يثري المحتوى العُماني في منصات معالجة اللغات حاسوبيا
"عمان": تعد اللهجات العُمانية جزءًا أصيلًا من الهوية الثقافية في سلطنة عُمان؛ إذ تعكس تنوّع المجتمع العُماني وثراءه التاريخي والجغرافي، وتمتاز اللهجات في سلطنة عمان بتعددها واختلافها نتيجة تنوّع التضاريس من سواحل وجبال وصحار، وتأثرها بالتجارة والهجرات والعلاقات التاريخية مع مناطق عربية وشرقية وإفريقية، وهذا التنوّع اللغوي منح سلطنة عُمان طابعًا لغويًا مميزًا، وشكل ثروة ثقافية تستحق الدراسة والتوثيق لما تحمله من شواهد على تاريخ البلاد وتواصلها الحضاري عبر العصور. ومن أجل هذا التوثيق عكف فريق بحثي بإشراف الدكتور عامر بن أزاد الكثيري، وفريق من جامعة التقنية والعلوم التطبيقية بصلالة على تنفيذ مشروع بحثي بعنوان "إثراء المحتوى العُماني في منصات معالجة اللغات الطبيعية حاسوبيًا"، وبتمويل من الجامعة ذاتها.
وقال الدكتور عامر الكثيري: إن هذه المبادرة البحثية انطلقت من إدراك أهمية اللهجات المحلية في سلطنة عُمان كمكون ثقافي ولغوي أساسي، ورغبة الباحثين في مواكبة التطورات المتسارعة في تقنيات الذكاء الاصطناعي ومعالجة اللغات الطبيعية. وتعد اللهجات العُمانية ضمن اللغات منخفضة الموارد على مستوى العالم، الأمر الذي يجعلها خارج اهتمام كثير من النماذج اللغوية العالمية؛ لذا سعى الفريق البحثي في جامعة التقنية والعلوم التطبيقية بصلالة إلى جمع وتوثيق البيانات اللغوية الخاصة بهذه اللهجات صوتيًا ونصيًا؛ بهدف إثراء المحتوى المحلي، وتسهيل تطوير تطبيقات الذكاء الاصطناعي.
وأكد أن المشروع هدف إلى تجميع وتوثيق موارد لغوية في قاعدة بيانات صوتية ونصية للهجات العُمانية المختلفة؛ لاستخدامها في أبحاث الذكاء الاصطناعي، ومعالجة اللغات الطبيعية، وبناء نموذج لغوي للهجات العمانية بالتعاون مع الشركات المحلية المتخصصة في هذا المجال. كما عمل المشروع على تعزيز القدرات البحثية من خلال تأهيل مجموعة من طلاب الجامعة بالمهارات والأدوات اللازمة لدراسة اللهجات المحلية وتحليلها، وزيادة الوعي بأهمية اللغات منخفضة الموارد.
وعن آلية تنفيذ المشروع البحثي قال الباحث الرئيس في المشروع: اعتمدت آلية التنفيذ على شراكات وتعاون فعال بين الجامعة والقطاع الخاص والمجتمع البحثي الدولي؛ حيث تم توقيع مذكرة تعاون مع شركة "إبانة" العُمانية المتخصصة في تقنيات معالجة اللغة؛ للعمل معًا على تدريب نموذج لغوي للهجات العُمانية، وتأهيل أكثر من (10) طلاب من جامعة التقنية والعلوم التطبيقية بصلالة ممن يتحدثون بلهجات عمانية مختلفة للانخراط في هذا المشروع البحثي، ثم الاعتماد عليهم في ترشيح شخصين من لهجاتهم الخاصة، فتجمع لدينا حوالي (30) مشاركاً من طلبة الجامعة والمجتمع المحلي القادرين على تمثيل لهجاتهم بعد إخضاعهم لورش متخصصة ومنهجيات صارمة بالتعاون مع شركة "إبانة"، وفي الخطوة التالية عملنا على جمع بيانات صوتية لعشر لهجات عُمانية محلية مختلفة بواقع لا يقل عن ثلاث ساعات تسجيل لكل لهجة (أي أكثر من 35 ساعة صوتية إجمالًا) من خلال جلسات تسجيل ميدانية دقيقة مع تنظيم وتصنيف البيانات الصوتية والنصية المجمعة بما يشمل تنقية النصوص المكتوبة، وترميز اللغات المحلية وتجهيزها للاستخدام في نماذج الذكاء الاصطناعي.
وشارك أعضاء من الفريق في مشروع بحثي بعنوان "Alexandria MT Community Project" التابع لجامعة كولومبيا البريطانية؛ حيث ساهم الفريق بثلاث لهجات عُمانية لبناء مدونة ضخمة للهجات العربية بالجامعة.
ويقود الفريق البحثي الدكتور عامر بن أزاد عدلي الكثيري، ومن جامعة التقنية والعلوم التطبيقية بصلالة شارك كل من الدكتور بدري عبدالحكيم مدهش، والدكتور غصاب بن منصور الصقر، والأستاذ طارق عبد الرزاق فطناسي، والأستاذ عمر بن سعيد الشحري من معهد العلوم الإسلامية بديوان البلاط السلطاني.
وحول نتائج الدراسة وقال الدكتور عامر الكثيري: أسفرت المرحلة الحالية من المشروع عن تحقيق مجموعة من النتائج الأولية، وتهيئة الأرضية للمرحلة الآتية، مثل: قاعدة بيانات صوتية متكاملة، مما يشكل خطوة نوعية في بناء الموارد اللغوية اللازمة.
وأضاف: من النتائج أيضا إنشاء نماذج أولية قيد التطوير؛ حيث يعمل الباحثون حاليا على تدريب نموذج لغوي مخصص للهجات العُمانية باستخدام البيانات المجمعة، مما يسهم في تحسين التعرف الآلي على الكلام ومعالجة اللهجات المحلية، وفي موضوع النشر العلمي تم قبول ورقة بحثية حول التعريف بالمشروع، وعرض نتائجه في مؤتمر الرابطة الدولية لدراسة اللهجات العربية (AIDA16) في جامعة كاتانيا بإيطاليا في يونيو 2026م، كما يجري إعداد ورقة بحثية مشتركة لعرضها في أحد مؤتمرات جمعية اللغويات الحاسوبية (ACL)، تستعرض منهجية جمع البيانات ومعالجتها، والعمل على إعداد ورقة علمية أخرى تركز على الجانب اللغوي الصرف للنشر في مجلة علمية محكمة، ويجري التخطيط لإعداد ورقة بحثية إضافية بناء على مشروع جامعة كولومبيا البريطانية حول بناء نموذج لغوي للهجات العُمانية.
ويتطلع الدكتور عامر الكثيري إلى توسيع نطاق المشروع ليشمل جميع اللهجات واللغات المحلية في سلطنة عمان من خلال بيانات تغطي أكثر من (65) لهجة عُمانية و(10) لغات محلية بما يدعم التنوع اللغوي الكبير في سلطنة عُمان، وتطوير نماذج لغوية متقدمة قادرة على التعامل مع المفردات والأساليب المحلية بكفاءة أكبر عبر استخدام تقنيات الذكاء الاصطناعي والتعلّم العميق.
