أفكار وآراء

نماذج الذكاء الاصطناعي التوليدية

كثُر الحديث عن نماذج اللغات الكبيرة المعروفة بالتوليدية منذ عدة أشهر، وتصاعد الحديث -مؤخرا- بعد احتدام المنافسة بين أشهر هذه النماذج «ChatGPT» التابع لشركة «OpenAI» المنبثقة من ميكروسوفت «Microsoft» وبين نموذج «Bard» التابع لشركة «Google» خصوصا بعد تحديثاته الأخيرة مثل إضافة لغات أخرى لهذا النموذج التوليدي ومنها اللغة العربية بعدة لهجات.

أحدثت هذه النماذج الذكية الخاصة باللغات الكثير من الصخب الإعلامي، وباتت حديث الناس، وتباينت الآراء -حتى بين العلماء- فيما يخص هذه النماذج؛ فهناك المتفائل والمتشائم، وهذا أمر طبيعي يحدث مع بداية كل ثورة علمية ومستجداتها، ولا عجب أن نرى هذا التباين نظرًا للقدرات الرقمية غير المعهودة المصاحبة لهذه النماذج الذكية؛ حيث اقتحمت هذه النماذج حقل ما يُعرف باللغات الكبيرة؛ ولهذا ارتبطت بما يُسمى بنماذج اللغات الكبيرة «Large Language Models» المختصرة بـ«LLM». يتناول هذا المقال تعريفًا بهذه النماذج وآلية عملها الداخلية، ونطاق مهامها، ثم حدود قدراتها ونقاط ضعفها.

تعمل نماذج اللغات الكبيرة وفق خوارزميات رياضية خاصة بتشغيل أنظمة الذكاء الاصطناعي، وتُغذّى بالبيانات الكبيرة التي تستعين بها في عملية التدريب، وتتعلق مهام هذه النماذج بالتعامل مع اللغات الكبيرة وتحديدًا النصوص؛ حيث تعمل على نظام التنبؤ بالنص الآتي بعد كل نص يسبقه؛ حتى تكتمل العملية وفقًا لرغبة المستخدم. يظن البعض أن هذه النماذج تقوم بتأليف النص، والبعض يظنها تقوم بعملية البحث، والواقع أن هذه النماذج تقوم بالتنبؤ بالنص عبر آلية نموذجها الذكي الذي يُعرف بالمحولات «Transformers»، والذي يملك قدرة على معالجة اللغات الطبيعية «Natural Language Processing»، ويعمل هذا النموذج تحت مظلة نماذج التعلّم العميق في الذكاء الاصطناعي. تعمل المحولات في النماذج التوليدية عبر نظامين رئيسين وهما: التشفير (المُشفّر) «Encoder» الذي يتعامل مع المدخلات، وكاسر التشفير «Decoder» الذي ينتج المخرجات، ولضمان التواصل الملائم بين المدخلات مع بعضها بعضًا؛ هناك آلية معتمدة في المحولات تعرف بالانتباه الذاتي «Self-Attention».

كذلك تقوم الشبكات العصبية بدورٍ مهمٍ في عملية التعلّم العميق من حيث الربط بين المدخلات والمخرجات، ومن أهم أنواع هذه الشبكات المستعملة ما يُعرف بالشبكات العصبية الأمامية «Feedforward Neural Network» ويتفرع منها أنواع أخرى -لها مميزاتها الخاصة- إلا أنّ النموذج المعتمد في جميع أنواع النماذج التوليدية مثل «ChatGPT» هو الشبكات العصبية المتكررة «Recurrent Neural Network» الذي يتعامل مع النصوص، ويعمل كذلك نموذج الشبكات العصبية الالتوائية «Convolutional Neural Network» في الجيل الرابع «ChatGPT-4» بحكم قدرته على التعامل مع المرئيات مثل الصور، وهذا من ضمن ما يميّز الجيل الرابع عن الجيل الثالث لـ«ChatGPT». تعمل الشبكات العصبية على إنجاح مهمة التعلّم التي يقوم بها النموذج التوليدي عبر تدربه على البيانات الكبيرة، وعملية التعلّم تحدث وفق خوارزمية الانتشار الخلفي «Back-Propagation»، وهي خوارزمية سبق شرحها في مقالات سابقة.

تعتمد نماذج اللغات التوليدية على عدة أسس لا يمكن أن تعمل هذه النماذج بدونها، وأحد أهم هذه الأسس البيانات الكبيرة التي تأتي في صيغة نصوص من مصادر متعددة مثل الكتب ومواقع الإنترنت ووسائل التواصل الاجتماعي، وتأتي الخوارزميات -التي عرضتها في فقرات سابقة- لتكون من الأسس المهمة في تشغيل هذه النماذج كونها تعتبر دماغها الرقمي، وعدد الخلايا العصبية «الرقمية» وما يرتبط به من أوزان أو معايير رياضية «Parameters/Weights» هو ما يحدد قوة هذه الخوارزمية وسرعة استجابتها.

شهدت نماذج الذكاء الاصطناعي التوليدية قفزات تطويرية متسارعة؛ إذ نرى -مثلا- حجم البيانات المستعملة في تدريب «ChatGPT-3» تقدّر بـ575 جي بي بايت»GB»، بينما تقدّر بعض المصادر حجم البيانات في «ChatGPT-4» تصل إلى 45 تيرا بايت»TB»، وهنا نجد الفرق الشاسع في حجم البيانات بين جيلين متعاقبين من نفس النماذج التوليدية الذكية؛ فالفترة الزمنية الفاصلة بين ظهور الجيل الرابع بعد الجيل الثالث عدة أشهر فقط.

نرى كذلك الفرق الشاسع بين الجيلين الثالث والرابع لنموذج «ChatGPT» في عدد الأوزان المستعملة في ربط الشبكات العصبية وتدريبها؛ فعدد الأوزان في الجيل الثالث يصل إلى 175 مليار وزن، بينما تشير بعض المصادر إلى أن عدد الأوزان في الجيل الرابع يصل إلى تريليون بل ويزيد، وتعرض مصادر -كثيرة- أن عدد الأوزان في هذا الجيل سيصل في غضون سنوات إلى 100 تريليون، وهذا رقم «مخيف» في حال تحققه سواء في الجيل الرابع أو ما يتبعه من أجيال لاحقة؛ إذ أنّ عدد الخلايا العصبية في دماغ الإنسان يتراوح ما بين 80 و100 مليار خلية، وترتبط بمشابك عصبية «Synapses» يقدّر عددها بـ100 تريليون، وهي تناظر الأوزان في الشبكات العصبية «الرقمية». هنا يكمن التساؤل: كيف يمكن للإنسان التحكم بكائن رقمي يساويه في معدل القدرات الدماغية بل قد يفوقه -يومًا-، كون عدد الأوزان في الدماغ الرقمي بات يقترب من عدد المشابك التي في الدماغ البشري، بل -من المتوقع- أن تتجاوزها عددًا في المستقبل؟ وهنا يكمن ما يمكن أن يعتبره الخبراء «الخطر الوجودي» الذي يهدد الإنسان ومستقبله.

استعمالات النماذج التوليدية الذكية كثيرة فيما يخص اللغات ومتعلقاتها من إنشاء النصوص بكل أنواعها والترجمة، وهذا أمر معلوم لدى معظم من يستعمل هذه النماذج. أما نقاط ضعف هذه النماذج فهي كثيرة -أيضا- منها المعلومات الخاطئة التي تضلل المستخدم وتشمل معلومات علمية وتاريخية، وكذلك لغات البرمجة بحيث يوحي للمستخدم المصداقية العالية للنموذج التوليدي في حين أنّ هذا النموذج الذكي يعمل وفق خاصية الاحتمالات «اللايقينية» التي تحاول التنبؤ بالرد الأكثر مواءَمة، وهنا ثمَّة قصص كثيرة متعلقة بهذه المشكلة، منها تجربة أخبرني بها أحد الأصدقاء الذي حاول اختبار أحد هذه النماذج في مساعدته في اختبار تجريبي؛ فكانت النتيجة رسوبه في الاختبار، وأجرى الاختبار بعدها دون مساعدة النموذج التوليدي؛ لتكون النتيجة حصوله على نتيجة عالية. بدأت مثل هذه المشكلات تقل في النسخ الأحدث لهذه النماذج، وأظهرت قدرات أكثر احترافية وذكاء، وأرى أن تطويرات الذكاء الاصطناعي القادمة بما فيها نماذج اللغات التوليدية ستكون أقرب إلى المظاهر البشرية من حيث سلوكها الرقمي وتفوقها التفكيري.

د. معمر بن علي التوبي كاتب وباحث عُماني