البيانات.. الوقود الرقمي الحديث
دخولنا إلى الحقبة الرقمية الحديثة الذي يرافق تغيّر أدواتنا المعرفية؛ ينقلنا إلى ثورة معرفية تشكّل نظامًا اقتصاديًا متطورًا؛ حيث لم يعدْ الوقود الأحفوري «النفط» - مع الانتشار الشامل لهذه الثورة الرقمية - المعيار الرئيس لقياس ثروة الشعوب واقتصادهم، وستحل البيانات محل النفط الأحفوري؛ لتكون النفط الجديد الذي تتنافس به الدول في السباق الاقتصادي. باتت البيانات الكبيرة «Big Data» حديثَ عمالقة الاقتصاد والاستثمار وشغلهم الشاغل لما تحويه من أهمية في المرحلة الاقتصادية الحديثة؛ إذ تشكّل البيانات وقودًا يحرّك النظام الاقتصادي بكل قطاعاته بما فيه القطاع الصناعي والصحي والعسكري.
تُعبّر البيانات بمضمونها العام عن معلومات تُستخرج من مصادرها المختلفة؛ فهناك البيانات الخاصة بالقطاع الصناعي منها بيانات تشغيل الآلات وأعطالها التي يمكن مراقبتها وتسجيلها وتخزينها والاستفادة منها في تحديد أفضل طرق التشغيل والصيانة. كذلك بيانات القطاع الصحي التي تأتي في صيغ متعددة منها بيانات المرضى وأمراضهم وطرق علاجهم وتفاعلهم مع العلاج والأدوية وصور الأشعة والتحليل الطبية التي إنْ حُللتْ ساهمتْ في تحسين النظام الصحي وزادت من مستويات أدائه. هناك كذلك البيانات العامة التي يمكن جمعها من الشوارع حيث بيانات الحركة المرورية وتجاوزاتها «المخالفات والحوادث» التي تساهم في حال تحليلها تحديد معوقات الحركة المرورية من ازدحام ومخالفات؛ ليزيد من فرص معالجتها وتقليل مشكلاتها. كذلك البيانات الشخصية للمستهلكين سواء في الأسواق الواقعية أو الإلكترونية التي يمكن جمعها بطرق متعددة؛ لتساهم في تحديد أفضليات المستهلك وطرق جذبه للمنتجات التي تلائم خياراته. هذه مجرد أمثلة بسيطة لبعض أنواع البيانات الموجودة في عالمنا الحالي.
تأتي أهمية البيانات في كونها تعكس الواقع الحقيقي لعالمنا الديناميكي، ويمكن بواسطة البيانات قياس المستويات الحالية وتحديد أفضل التوجهات المستقبلية. باتت البيانات أو الوقود الحديث للاقتصاد علمًا مستقلًا إلا أنّه يكاد يعمل مع كل العلوم الأخرى بلا استثناء بما فيها الإنسانية والطبيعية، ويشمل ذلك الذكاء الاصطناعي الذي لولا البيانات لم يكن لهذا الكائن الرقمي وجودٌ في حياتنا؛ حيث تعتبر البيانات وقوده وسرّ تفوقه، وتقوده إلى المستويات القصوى من التطور؛ وكلما زادت هذه البيانات «كمًا وكيفًا» لتصل إلى ما نعرفه بالبيانات الكبيرة؛ زادت قدرات الذكاء الاصطناعي وسرعة تطوره؛ كون البيانات كلما زادت وتنوعت مصادرها؛ زادت فائدتنا في الوصول إلى معلومات مفيدة مثل التي تعطي تحليلًا دقيقًا للمستقبل الاقتصادي بناءً على ممارسات اقتصادية ومالية سابقة وحالية، وتحليل هذه البيانات باستعمال الذكاء الاصطناعي يساعد في حل مشكلة الفترة الزمنية الطويلة للعمليات التحليلية وتعقيد البيانات؛ ليساهم في بلوغ الدقة المطلوبة.
هناك 3 عناصر رئيسة يمكن أن تقاس بها مستويات البيانات، وهي: الكمية «Volume» التي تعبّر عن حجم هذه البيانات، والسرعة «Velocity» التي تعبّر عن سرعة تدفق البيانات وسرعة التعامل مع هذه البيانات وتحليلها، والتنوع «Variety» الذي يشير إلى أنواع هذه البيانات وتعدد صيغها ومصادرها. تأتي البيانات -من حيث أنواعها وفقًا لفائدتها واستعمالاتها- في 3 تفرعات وهي: البيانات المنظمة «Structured Data» التي تكون مرتبةً ترتيبًا متوافقًا مع نوع البيانات المطلوبة؛ واستعمالها يكون سهلًا، ويمكن معالجتها بأدوات التحليل التقليدية، والنوع الثاني هو البيانات شبه المنظمة «Semi-Structured Data» التي تأتي أقل ترتيبًا وتنسيقًا من حيث أنواعها عن النوع الأول، ومعالجتها تتطلب أساليب أكثر احترافية، أما النوع الثالث هو البيانات غير المنظمة «Unstructured Data» التي تأتي غير مرتبة، وفيها عشوائية وعدم انتقائية للبيانات حسب النوع؛ لهذا أفضل أساليب التعامل مع هذا النوع من البيانات عبر نماذج الذكاء الاصطناعي وأقرب مثال لهذا النوع من البيانات هي البيانات التي تُغذي نماذج الذكاء الاصطناعي التوليدية مثل Chat GPT وأقرانه من النماذج التوليدية الأخرى. عادة تنسب البيانات الكبيرة «Big Data» إلى وحدات ذاكرة حاسوبية عالية السعة مثل «زيتابايت» «Zettabyte»؛ أي تكون السعة التخزينية بكميات كبيرة جدا، ولهذا هذه القدرات التخزينية الكبيرة مكلفة، وتحتاج إلى معالجة وتنقية دقيقة لبلوغ أقصى درجات الاستفادة منها. لهذا أحد التحديات التي تقف عائقًا أمام قدرة الدول ومؤسساتها من استحواذ النفط الحديث «البيانات الكبيرة» هو القدرات التخزينية الهائلة وتوفير أقصى درجات الأمن السيبراني؛ لمنع أي محاولات لسرقة هذه البيانات وتسخيرها لمصالح ضارة.
هناك طرق كثيرة ومتعددة لجمع البيانات منها أجهزة الاستشعارات والأجهزة الإلكترونية التي يرتبط أغلبها بأنظمة إنترنت الأشياء حيث ترتبط هذه الأنظمة الإلكترونية والاستشعارية بعضها ببعض عبر الإنترنت؛ لتزيد من سرعة انتقال هذه البيانات وجودتها. تتعدد أشكال هذه الأنظمة (الاستشعارات) واستعمالاتها منها التي في القطاعات الصناعية والصحية والشوارع -كما ذكرتها في فقرات سابقة-. كذلك يمكن جمع البيانات عبر المعلومات التي يعرضها المستخدم «المستهلك» في وسائل التواصل الاجتماعي وفي البريد الإلكتروني وزيارات صفحات الإنترنت، وهذه البيانات يمكن أنْ تتعدد في صيغها لتشمل النصوص والصور والمرئيات ومواقع التصفح والمشاهدات؛ حيث تملك كبرى شركات التقنية المالكة والمشغلة لهذه المنصات الرقمية القدرة على الولوج إلى هذه البيانات الشخصية، وهنا تُطرح قضايا وتساؤلات أمنية وأخلاقية كثيرة.
أحاول عبر هذا المقال عرض ملخص مقتضب لفكرة البيانات وأهميتها في حياتنا - وإلا فهناك تفاصيل كثيرة خاصة بعلم البيانات-؛ لجذب انتباه القارئ والمهتم بالشأن الرقمي -خاصة- والاقتصادي -عمومًا-؛ إذ سبق هذا المقال مقالات عن الذكاء الاصطناعي الذي بات حديث العالم -في وقتنا-، ووجدت من الضرورة -أيضا- الحديث عن وقود الذكاء الاصطناعي «البيانات» لقوة الارتباط فيما بينهما، وإلى التوعية بأهمية الاهتمام بالبيانات من حيث جمعها وتخزينها واستغلالها الأمثل للمساهمة في بناء اقتصاد رقمي كبير ومتسارع، وكما ركزنا -سابقًا- على أهمية حجز موقعنا العالمي البارز في تطبيقات الذكاء الاصطناعي؛ تأتي البيانات سابقة للذكاء الاصطناعي من حيث الأولويات الرقمية، وسبق أنْ اقترحت -قبل ما يقرب من عام- لإحدى المؤسسات الحكومية المعنية بالشأن الرقمي في تأسيس ما يمكن تسميته «بنك البيانات»؛ ليكون بمثابة الجهة الرسمية المعنية بجمع البيانات وتخزينها، شاملةً كل البيانات الضرورية من جميع القطاعات المنتجة والمستفيدة للبيانات؛ وليكون رصيدًا «رقميًا» للباحثين والمؤسسات -الحكومية والخاصة-، مساعدًا في عمليات التحليل والإحصاء وفي تدريب نماذج الذكاء الاصطناعي مع مراعاة كل الجوانب الأمنية والحقوقية والقانونية والأخلاقية؛ وذلك بضمان وجود حوكمة وإدارة واضحة لهذه البيانات لا تقل عن الحوكمة المطلوبة للذكاء الاصطناعي.
د. معمر بن علي التوبي كاتب وباحث عُماني
