الدراسات الإعلامية

“البيانات الضخمة”.. الاستثمار في كنز المعلومات

في ظل الثورة التكنولوجية التي سيطرت على العالم، والتحوّل نحو الرقمية، أصبحت مواقع الإنترنت وشبكات التواصل الاجتماعي والمدوّنات، تتداول ملايين البيانات يومياً، وهو ما أُطلق عليه “البيانات الضخمة Big data”، التي أصبحت محلّ اهتمام المؤسسات الحكومية والخاصة، باعتبار الإمكانيات الهائلة التي تحتوي عليها تلك البيانات، في عصر أصبحت فيه المعرفة هي القوة.

تحليل بيانات شعب ما على شبكات التواصل الاجتماعي، بمثابة كنز معلوماتي ثمين، يمكن من خلاله التعرّف على سمات وخصائص هذا الشعب السياسية والثقافية والمجتمعية

وأضحت نتائجُ تحليل البيانات وخاصة الضخم منها، سبيلاً لتحقيق أهداف الدول والمؤسسات في شتى المجالات، سواء السياسية أو الاقتصادية أو الاجتماعية، إضافة إلى ميادين الصحة والإعلام والتسويق والإعلان وصناعة الترفيه.. إلخ.

ومعالجة البيانات الضخمة، لمن يملكها، تمثل ثروةً معرفية هائلة، يمكن استخدامها وتوظيفها إيجاباً أو سلباً، فتحليل بيانات شعب ما على شبكات التواصل الاجتماعي، بمثابة كنز معلوماتي ثمين، يمكن من خلاله التعرّف على سِمات وخصائص هذا الشعب السياسية والثقافية والمجتمعية، واتجاهات الرأي العام ورغبات الجماهير ومشاكلهم وصراعاتهم وأحلامهم وتطلّعاتهم، وأنماط وطرق تفكيرهم واهتماماتهم، وذلك الكنز المعلوماتي مثلما يمكن أن يُستخدم في جهود التنمية والنهضة والتقدّم، قد يقع في أيدي الأعداء ليمثّل أكبر تهديد للأمن القومي، كما قد تتمّ المتاجرة به واستثماره من قبل الشركات المُعلِنة.

وهنا يظهر السؤال الذي يطرح نفسه حول ماهية البيانات الضخمة وأهميتها، والمجالات المستخدمة فيها، مع التركيز على أهميتها في المجالات الإعلامية.

تعريف البيانات الضخمة

لا يوجد تعريفٌ محدّد يمكن إطلاقه على البيانات الضخمة، لكن يمكن وصفها بأنها كمية هائلة من بيانات معقّدة يَفوقُ حجمُها قدرةَ البرمجيات والحواسب التقليدية على تخزينها ومعالجتها وإرسالها، مما أدى إلى وضع حلولٍ بديلة أكثر تطوراً، حتى يَتمّ التمكّن من التحكّم في عملية تدفّقها والسيطرة عليها.

تتولد البيانات أيضاً عند إجراء عمليات اعتيادية تَستخدم التقنية الرقمية، مثل تحويل الأموال أو شراء الملابس، وغيرها من النشاطات الرقمية

وتتولّد البيانات الضخمة من خلال الزيادة في الأجهزة الرقمية والحاسبات وكل ما يتصل بشبكة الإنترنت، ففي كل لحظة يَستخدم ملايين الأفراد في أنحاء العالم الهواتفَ المحمولة، التي يُقدَّر عددُها بأكثر من ثمانية مليارات هاتف، لعمليات مختلفة، وتتولد البيانات أيضاً عند إجراء عمليات اعتيادية تستخدم التقنيةَ الرقمية، مثل تحويل الأموال أو شراء الملابس، وغيرها من النشاطات الرقمية، وبالتالي تتشكل البيانات الضخمة.

ولا يمكن اعتبار أي كمية كبيرة من البيانات بأنها “ضخمة”، إنما يُطلق عليها ذلك إذ انطبقت عليها شروط متعلقة بعدّة نواحي، وهي:

الحجم

حتى يمكن وصف نوعٍ مُعيّنٍ من البيانات بأنه “ضخم”، فلابدّ له أن يجتاز حاجزاً معيناً، لكنّ ضخامة البيانات أمرٌ نسبيٌّ في نهاية المطاف، تختلف من زمن لآخر، فما كان يُعتبر ضخماً بالأمس قد لا يعتبر كذلك اليوم.

يمكن وصف البيانات التي تُنشَر يومياً على الفيسبوك وتويتر وواتس آب بأنها “ضخمة”

فمثلاً لا يمكننا حالياً أن نصف حجمَ البيانات على أجهزتنا بأنها ضخمة، فهي لا تتعدى في أفضل الأحوال 1 تيرابايت، في حين أنه من سنوات قليلة كان 100 جيجابايت يُعتبر حجماً ضخماً، وحتى وقتٍ قريب كان الجيجا بايت والتيرا بايت، معياراً لوصف البيانات الضخمة، أما الآن فقد أصبح البيتا بايت والإكسا بايت والزيتا بايت واليوتا بايت هي المعايير الأكثر استخداماً لقياس حجم البيانات الضخمة.

لذلك يُمكن وصف البيانات التي تنشر يومياً على الفيسبوك وتويتر وواتس آب، بأنها ضخمة، إذ إن الصور المتداولة فقط، تزيد عن 350 مليون صورة على “فيسبوك” يومياً، وكان عدد الصور المخزنة عام 2015 وصل إلى أكثر من 250 مليار صورة، أما تويتر فيصل عدد تغريداته يومياً حوالي 150 مليون تغريدة، أما واتس آب فلديه أكثر من مليار مستخدم، ويتم عبره تداول أكثر من 42 مليار رسالة وحوالي 1.6 مليار صورة بشكل يومي.

ويقدر أنه بحلول عام 2020 سيصبح الإنترنت محتوياً على ما يقرب من 44 زيتابايت من البيانات التي ستكون جاهزة للاستخدام، ويتوقع أن يصل هذا الرقم إلى ما يقرب من 180 زيتابايت بحلول عام 2025.

ولا يجب أن تكون البيانات بهذا الكمّ حتى نطلق عليها وصف “ضخمة”، إنما يمكن أن تكون أصغر شيئاً ما عن هذا الحد.

السرعة

تأتي السرعة معياراً ثالثاً لما يمكن أن نطلق عليه “بيانات ضخمة”، ففي السابق كان يتمّ تحليلُ كلِّ مجموعةِ بيانات واحدة تلو الأخرى في انتظار وصول النتائج، وباعتبار السرعة عنصراً حاسماً في اتخاذ القرار بناءً على هذه البيانات، فقد أصبحت من الشروط الواجب توافرها في البيانات الضخمة.

يستقبل تويتر حوالي 150 مليون تغريدة يومياً، أي بمعدل 2.5 مليون تغريدة في الساعة، وما يزيد على 41 ألف تغريدة في الثانية

ويقصد بها هنا سرعة التدفّق في إنتاج واستخراج البيانات وإرسالها وقت طلبها مباشرة، وهو ما يُعرف بـ “Real Time”، وأدى ذلك لظهور معالجات خاصة لذلك النوع من البيانات مثل Apache و SAP HANA و Hadoopوغيرها.

فعلى سبيل المثال يَستقبل تويتر حوالي 150 مليون تغريده يومياً، أي بمعدل 2.5 مليون تغريدة في الساعة، وما يزيد على 41 ألف تغريدة في الثانية، وهذه الأرقام في تزايد مستمرّ، فلذلك يمكن اعتبارها بيانات ضخمة لسرعة تدفّقها.

 التنوّع

يأتي التنوّع شرطاً ثالثاً وأخيراً من شروط البيانات الضخمة، فمع ازدياد أعداد مستخدمي الإنترنت والهواتف النقالة وشبكات التواصل الاجتماعي، تباينت طرقُ تخزين البيانات، من وجودها في قواعد بياناتٍ تقليدية، إلى بيانات مُخَزَّنةٍ عشوائياً، وبامتدادات متنوّعة مثل الصور ومقاطع الصوت والفيديو والرسائل القصيرة.

ويمكن تصنيفُ البيانات المتنوعة إلى مُهَيْكَلة، وغيرِ مهيكلة، ونصفِ مهيكلة، فالبيانات المهيكلة تكون على هيئة جداول أو محفوظة في قواعد بيانات بطريقة منظمة، مما يسهّل عملية التعامل معها، ويوجد ذلك النوع في قواعد البيانات التقليدية.

أما البيانات غير المهيكلة فهي التي يقوم الإنسان بتكوينها، مثل النصوص الكتابية أو الصور أو الفيديو أو الملفات الصوتية، أو يتم توليدها عن طريق أجهزة كأجهزة الاستشعار أو الأجهزة الطبية وغيرها، ويُعدّ هذا النوع من البيانات الأكثر تعقيداً في المعالجة والتحليل، وتأتي البياناتُ نصف مهيكلة، كمزيجٍ بين النوعين السابقين من البيانات.

ويشكل الجزءُ غيرُ المهيكل من البيانات الحَيِّزَ الأكبر منها، ما يجعل التعامل معها أكثر صعوبة، وتحتاج – بالتالي – لأدوات غير تقليدية في حَلِّها.

البيانات الضخمة ومجالات الاستخدام

في عصر أصبح فيه امتلاك المعلومة هو مصدر قوة المؤسسات والدول، اكتسبت البياناتُ الضخمة أهميةً قصوى، حيث أنها تقدّم ميزة تنافسية عالية للمؤسسات التي تستخدمها إذا استطاعت الاستفادة منها ومعالجتها، فهي تقدّم فهماً أعمق لعملائها وطلباتهم، مما يساعد على اتخاذ القرارات المناسبة والملائمة داخل تلك المؤسسات بطريقة أكثر فعالية، وذلك بناءً على المعلومات المستخرجة من قواعد بيانات العملاء، وبالتالي زيادة الكفاءة والفعالية في العمل.

استُخدمت البياناتُ الضخمة في شتى المجالات، فدخلت مجالَ الصناعة، وأصبحت تساعد في تعزيز جودة وكفاءة الإنتاج مما يعزّز الأرباح، وفي مجال الصحة أصبحت تسهّل معرفة الوضع العام للصحة في أي بلد أو مؤسسة لتطويره ومعرفة عيوبه.

بالإضافة إلى المجال المصرفي، حيث صارت المؤسسات المصرفية تتجه لتجميع بياناتها، لتطوير خدماتها وتعزيز الأمن السيبراني لديها، كما تستخدم في المجال الأمني وتعزيز القدرات الأمنية لدى الدول، وكذلك في التعليم وكافة المجالات الأخرى.

تساعد البيانات الضخمة في تعزيز جودة وكفاءة الإنتاج، مما يعزّز الأرباح، وفي مجال الصحة أصبحت تسهّل معرفة الوضع العام للصحة

البيانات الضخمة وعلاقتها بالإعلام

أصبح الإعلام الحديث يَعتمد نجاحُه بشكل كبير على عملية تحليل البيانات الضخمة، وأصبحت صناعة الإعلام تبتعد عن النهج التقليدي في بث الرسائل، واستُخدمت التقنياتُ التي تصل إلى المستهلك مباشرة في الوقت المحدّد والمكان الموجود فيه.

نتائج تحليل البيانات الضخمة تسهّل عملية تحديد المحتوى الإعلامي والفئات المستهدفة

فالهدف النهائي هو تقديم أو نقل رسالة أو محتوى يتماشى مع عقلية المستهلك، وعلى سبيل المثال، تعمل بيئاتُ النشر بشكل متزايد على تصميم الإعلانات والمحتوى، لجذب المستهلكين الذين تمّ تحديدُهم من خلال أنشطة تحليل البيانات المختلفة.

وبالتالي صارت نتائج تحليل البيانات الضخمة تسهّل عملية تحديد المحتوى الإعلامي والفئات المستهدفة، ما يجعل الرسالة الإعلامية قادرةً على الوصول إلى المستهدفين بفعالية، ويظهر ذلك جلياً في مواقع التواصل الاجتماعي.

مواقع التواصل الاجتماعي

مثلت مواقع التواصل الاجتماعي أرضاً خصبة للمؤسسات والشركات الكبرى، في المجالات المختلفة، حيث تقوم هذه المواقع بتجميع حجم ضخم من البيانات المتاحة من العملاء بشكل مباشر، من حيث ردود أفعالهم، والانطباع الذي يتركونه حول الخدمات والمنتجات.

وبالتالي تكون قادرةً من خلال تحليلات هذه الكميات الضخمة من البيانات، على التنبّؤ بمطالب العملاء، من خلال اكتشاف الأذواق والتفضيلات وردود الأفعال والمشاركات التي تتمّ على تلك المواقع.

ويبرز هنا مثالٌ واضح على ذلك، وهو قضية شركة “كامبريدج أناليتكا” البريطانية للاستشارات السياسية، حيث استخدمت بياناتِ مواقع التواصل الاجتماعي خلال الحملة الانتخابية للرئيس الأمريكي دونالد ترامب، وزوَّدت حملتَه بمعلوماتٍ عن أكثرَ من 50 ألف حساب في موقع فيسبوك، بهدف معرفة اتجاهات الناخب الأمريكي، ومن ثم استهدافه والتأثير عليه.

بالإضافة إلى ذلك، فإن عملية تحليل البيانات الضخمة على مواقع التواصل الاجتماعي، تسمح للشركات والمؤسسات باكتشاف المشكلات سريعاً والعمل على حلّها، ما يوفر وقتاً وجهداً كبيراً على المُستهلِك والمنتج.

تحليل البيانات الضخمة على مواقع التواصل الاجتماعي يسمح للشركات والمؤسسات باكتشاف المشكلات سريعاً والعمل على حلّها

فعلى سبيل المثال وَجَدَت شركة Delta Air Lines من خلال تحليل هذه البيانات، أن أغلب علمائها يشتكون من فَقدِ الأمتعة أثناء سفرهم، فقامت بإضافة خاصية جديدة لتطبيقها، تمكّن العملاءَ مِن تَتبُّع ومراقبةِ حقائبهم، هذا لم يُمكِّن الشركةَ فقط من حَلِّ المشكلة، بل أضاف لها ميزةً تنافسية أخرى ضد منافسيها في مجال الطيران.

الإعلانات والتسويق

إذا أرادت المؤسساتُ الحصولَ على ميزة تفضيلية على منافسيها، فإن استخدام البيانات الضخمة يُساعدها على تقديم استنتاجات حول اتجاهات المستهلكين، وتحسين الخدمات عبر الإنترنت، مما يزيد من المبيعات وتوسيع قاعدة العملاء.

فعلى سبيل المثال، تعطي شركة “أمازون” توصياتٍ متجددةً واقتراحات لمنتجات، لكلّ مستخدميها، مما يزيد من نسبة مبيعاتها، ولا تقوم بخلق تلك التوصيات بشكل عشوائي، إنما من خلال استخدام بيانات تاريخ سلوكيات العميل على الموقع، بالإضافة إلى معلومات أخرى، تستطيع من خلالها الفهمَ العميق لعادات التسوّق للمستهلك عبر الإنترنت.

ومثال آخر، ما فعلته سلسلة فنادق “Red Roof Inn” عندما بدأت في 2016 بتحليل البيانات، حيث قارنت الظروفَ الجوية بإلغاء الرحلات الجوية، وخلص المُسَوِّقون في السلسلة، إلى أن الرحلات التي يتمّ إلغاؤها بشكل مفاجئ بسبب الطقس العاصف، تؤدي إلى وجود أشخاص يحتاجون إلى مساكن فجائية، وبالتالي أصبحوا “زبائن” محتملين للفنادق.

وقامت السلسلة بإنشاء الإعلانات الخاصة بذلك، خاصة في المواقع القريبة من المطارات، مما زاد في نسبة الحجوزات بأكثر من 10% بسبب تحليلات البيانات الضخمة.

وبالتالي فإن استخدام البيانات الضخمة وتحليلاتِها في المجال الإعلامي، قد أثر وبشكل كبير على الرسالة الإعلامية، وأصبح شكلها ومضمونها وطريقةُ إيصالها تختلف من ناحيةٍ إلى أخرى، كما أصبحت الوسائل الإعلاميةُ المجالَ الخصب لشركات التسويق، لترويج منتجاتها بالشكل المثالي.

ثروة هائلة

وفي النهاية نجد أن البيانات الضخمة تمثّل ثروةً معرفية هائلة، ليس لمن يمتلكها، بل لمن هو قادرٌ على تحليلها واستخلاص النتائج منها، ثم تحقيق الاستفادة القصوى من تطبيق النتائج بشكل مثالي، في وقت أصبحت فيه الثورة الرقمية تستحوذ على العالم.

البيانات الضخمة تمثل ثروة معرفية هائلة، ليس لمن يمتلكها، بل لمن هو قادر على تحليلها واستخلاص النتائج منها

من أجل ذلك اتخذت الدولُ والمؤسسات طريقاً نحو تطوير عملية تحليل البيانات الضخمة، حتى يتسنى لها الحفاظ على أفضليتها بين منافسيها، وصارت تلك المنافسةُ حرباً معلوماتيةً باردة، في ظلّ القدرة التي تتمتع بها البيانات الضخمة من تأثير، وهذا ما اتضح – خاصة – في تجارب سياسية، مثل انتخابات الرئاسة الأمريكية 2016 التي سبقت الإشارة إليها.

زر الذهاب إلى الأعلى