تقارير

هل يوفر تحليل بيانات وسائل التواصل الاجتماعي نظرة ثاقبة على السلوك البشري؟

بعد ظهور وسائل التواصل الاجتماعي، كانت هناك حماسة شديدة حول كيفية استغلال آثار البيانات الناجمة عن استخدام الأشخاص لتلك المنصات في دراسة السلوك البشري، حيث لم يعد الباحثون مقيدين بالاستطلاعات أو التجارب في البيئات المختبرية للوصول إلى كميات هائلة من بيانات “العالم الحقيقي”، بل يمكنهم الوصول إليها من خلال هذه المواقع.
ورغم أن فرص البحث التي أتاحتها البيانات الناتجة عن وسائل التواصل الاجتماعي لا يمكن إنكارها، فإن أغلب الباحثين يحللون هذه البيانات بأدوات لم يتم تصميمها لإدارة هذا النوع من البيانات الضخمة، فالمعايير الحالية لاختبار أهمية الفرضية الصفرية والإحصاءات الارتباطية تبدو غير مناسبة لمجموعات البيانات الصاخبة على تلك المنصات، وهو ما يسلط الضوء على مخاطر استخدام الأدلة الارتباطية البحتة من مجموعات بيانات المراقبة الكبيرة، فضلًا عن التحذير من دمج علم النفس مع البيانات الضخمة.
تأثير العدوى الأخلاقية في ظل رقمنة المجتمع
وفرت رقمنة المجتمعات فرصًا منهجية لإجراء الأبحاث في مجال العلوم الاجتماعية من خلال التفاعلات التي تتم بين الأفراد عبر شبكة الإنترنت، ومن أبرزها الاتصالات بين مستخدمي وسائل التواصل الاجتماعي، التي تتيح بيانات هائلة الحجم تلتقط السلوكيات الطبيعية للمستخدمين، الأمر الذي جعل نظريات مثل منطق الفعل الجماعي وديناميكيات الرأي العام قابلة للتطبيق بسهولة من الناحية الكمية، ولكن مع نمو الاتجاه الأكاديمي الذي يستخدم بيانات وسائل التواصل الاجتماعي لاختبار نظريات بشأن السلوك البشري، باتت هناك حاجة ملحة للباحثين لفهم قوة الاستنتاجات المستخلصة من هذه البيانات بشكل أفضل، والنظر في المعايير المنهجية المستخدمة لبلوغ ذلك الهدف.
وقد قدمت إحدى الدراسات التي تجمع بين بيانات وسائل التواصل الاجتماعي والنظرية النفسية تحت عنوان “تشكيل المشاعر لانتشار المحتوى الأخلاقي في الشبكات الاجتماعية” عام 2017، نتائج بشأن تأثير “العدوى الأخلاقية-moral contagion”، عبر القيام بتحليل نصي قائم على القاموس لتحديد اللغة الأخلاقية والعاطفية في مئات الآلاف من التغريدات التي تعكس التفاعلات والاتصالات التي تحدث بشكل طبيعي بين مستخدمي تويتر.
وظهر من خلال نموذج الانحدار أن مجرد وجود العبارات الأخلاقية والعاطفية يزيد من عدد إعادة التغريد للرسائل بنسبة 20%، بغض النظر عن جودة المعلومات الخاصة بالرسائل.
وتعتبر الآثار المترتبة على ظاهرة العدوى الأخلاقية (تعني أن التعرض للمشاعر الأخلاقية يؤدي إلى انتشار المعلومات) مهمة بلا شك، إذ ثبت أن استدعاء الأخلاق في التفكير يقوي هياكل المعتقدات القائمة ويؤدي إلى توجيه السلوك الأخلاقي.
وتجدر الإشارة هنا إلى أن التبريرات الأخلاقية لها وزن في بعض المجالات دون غيرها، فعلى سبيل المثال، قد يكون تحميل النقاش لغة أخلاقية – عاطفية استراتيجية فعالة في حديث حول السياسة الاجتماعية وحقوق الإنسان، لكنه لا يكون فعالًا في مناقشة حول الرياضيات.
إعادة النظر في أدلة العدوى الأخلاقية عبر الشبكات الاجتماعية
وفي خطوة نقدية لتلك الدراسة وافتراضاتها، نشرت مجلة”Nature Human Behaviour” دراسة بعنوان “إعادة النظر في أدلة العدوى الأخلاقية في الشبكات الاجتماعية عبر الإنترنت” استهدفت تقييم الأساليب شائعة الاستخدام لتحليل بيانات الوسائط الاجتماعية -“اختبار الفرضية الصفرية-null hypothesis” و”الإحصاءات الارتباطية”- من خلال طرح سؤال بحث غير منطقي.
وقد حاولت الدراسة تحديد العوامل التي تؤثر على قرارات مستخدمي تويتر بإعادة تغريد التغريدات الأخرى، وهو أمر مثير للاهتمام كنافذة على الفكر البشري لأن إعادة مشاركة المنشورات آلية رئيسية يتم من خلالها تضخيم الرسائل أو نشرها على وسائل التواصل الاجتماعي.
واعتمدت الدراسة على عينة من البيانات المستمدة من موقع التدوينات القصيرة “تويتر” تتمثل في 380,471 تغريدة توزعت موضوعيًا عبر 6 مجموعات على النحو التالي: فيروس كورونا المستجد (172,697 تغريدة)، هاشتاق #أنا_أيضًا (151,035 تغريدة)، تقرير المحقق الخاص روبرت مولر في قضية التدخل الروسي في الانتخابات الأمريكية لعام 2016 (39,068 تغريدة)، الانتخابات الأمريكية لعام 2016 (8,233 تغريدة)، ومرحلة ما بعد البريكست (5,660 تغريدة)، وهاشتاق #مسيرة النساء (3,778 تغريدة).
وجرى تحليل التغريدات باستخدام الأساليب القياسية المذكورة آنفًا لمعرفة ما إذا كان التأثير غير المنطقي الذي يسمى “عدوى XYZ” يؤثر على إعادة التغريد، من خلال طرح التساؤل التالي: هل عدد (X) و(Y) و(Z) في التغريدة يزيد من احتمالية انتشارها؟ وجاءت الإجابة بنعم، فعلى سبيل المثال في مجموعة التغريدات عن فيروس كورونا المستجد، بدا أن وجود (X) أو(Y) أو(Z) في التغريدة يزيد من وصول الرسالة بنسبة 8%.
توصيات للدراسات المستقبلية للعدوى الأخلاقية على تويتر
وخلصت الدراسة إلى أن “التنبؤ خارج العينة-Out-of-sample prediction” و”المقارنات النموذجية-model comparisons” وتحليل “منحنى المواصفات- (SCA) Specification Curve Analysis “، يشكك في الدليل على أنه تم تحديد تأثير “العدوى الأخلاقية- moral contagion” ذات مغزى على تويتر.
وأوضحت الدراسة أن العدوى الأخلاقية قد تكون موجودة وتدعمها البحوث المعتمدة على المختبرات، لكن لا يمكن الاستناد لمثل هذا الاستنتاج فقط من خلال بيانات واسعة النطاق يتم رصدها عبر منصات التواصل الاجتماعي، كما تحذر الدراسة من القول بأن هذه البيانات توفر أدلة أقوى من الدراسات القائمة على المختبر بسبب زيادة الصلاحية البيئية.
ورأت الدراسة أنه لإجراء تحليلات بيانات التتبع الرقمية التي تم جمعها من منصات وسائل التواصل الاجتماعي والتوصل لاستقصاءات نفسية فعالة، يوجد اقتراحان للبحث المستقبلي باستخدام هذه البيانات وهما:
عدم قبول الأدلة الارتباطية وحدها:
أوضحت الدراسة أن كُلاً من هشاشة العدوى الأخلاقية و”النجاح” الظاهري لعدوى XYZ في بيانات الدراسة يسلط الضوء على كيفية تقييد الاستنتاجات التي توفرها الإجراءات الإحصائية القياسية، مثل نماذج الانحدار الخطي واختبار الأهمية، عند تطبيقها على مجموعات بيانات وسائل التواصل الاجتماعي واسعة النطاق.
وبالتالي يبدو من الضروري للباحثين المهتمين بفهم السلوك البشري إما أن يطبقوا تقنيات إحصائية بديلة، مثل نمذجة المعادلة الهيكلية أو الرسوم البيانية الحلقية الموجهة؛ أو استخدام طرق تصميم أخرى للاستدلال السببي ببيانات المراقبة، إذا كان لا بد من الاعتماد على بيانات المراقبة واسعة النطاق.
المرونة التحليلية:
سلطت الدراسة الضوء أيضًا على الحاجة إلى معالجة المرونة التحليلية عند استخدام بيانات الوسائط الاجتماعية، حيث تُظهر نتائج تحليل منحنى المواصفات (SCA) كيف أن القرارات المبررة بشأن المتغيرات المشتركة والقيم المتطرفة هي قرارات تبعية تجريبية، وقادرة على إحداث نتائج متضاربة بشكل مباشر على نفس العلاقة التنبؤية في نفس مجموعة البيانات.
وتتطلب الأبحاث التي ترتكز على النصوص كبيانات أن يتم إجراء معالجة مسبقة لتلك البيانات والتي لا يوجد لها معيار متفق عليه، فعند تحليل التغريدات، قد يقرر الباحث أولاً إزالة أسماء المستخدمين والهاشتاقات، وإزالة الغموض عن الكلمات المتطابقة باقتطاع جزء من الكلام يسبق الكلمة أو يليها لإظهار اختلاف المعنى، كما يمكن أن يؤدي قرار استخدام نهج القاموس (أو مجموعة الكلمات) مقابل استراتيجية التعلم الآلي لتصنيف النص إلى قياسات مختلفة للتعبيرات الأخلاقية داخل نفس المجموعة، ويمكن أن يختلف أيضًا توظيف الهاشتاق عبر السياقات.
وفي هذا الإطار، تتمثل الاستراتيجية المحورية لإدارة المرونة التحليلية حاليًا في التسجيل المسبق، حيث يتم تشجيع الباحثين على تسجيل فرضياتهم وخطط التحليل مسبقًا قبل بدء الدراسة لمنع نوع من انتقاء البيانات يسمى “p-hacking” (التلاعب غير المناسب في تحليل البيانات لتمكين تقديم نتيجة مفضلة على أنها ذات دلالة إحصائية)، ولكن هذا لا يكفي لضمان أن النتائج ستكون مفيدة في نهاية المطاف. إذ إنه من المهم أيضًا تقييم ما إذا كان يمكن العثور على النتائج التي تم الحصول عليها في التجربة مرة أخرى عند تكرارها في ظل ظروف مماثلة.
وتأسيسًا على ما سبق، يمكن القول بأنه في حين أن استخدام البيانات الضخمة التي يتم رصدها يعد أسلوبًا جديدًا نسبيًا في العلوم النفسية، إلا أن العقبات سالفة الذكر ليست جديدة بشكل خاص في المجالات الأخرى، فعلى سبيل المثال، كانت مجموعات البيانات الطولية الكبيرة جزءًا لا يتجزأ من دراسة الصحة العامة وعلم الأوبئة، حيث ثبت سابقًا أن الاستخدام القياسي لنماذج الانحدار يمكن أن يؤدي إلى نتائج غير معقولة، مثل الإحصاءات التي تشير إلى أن حب الشباب والصداع وطول القامة “مُعدٍ”!
ولذلك إذا كانت تحليلات وسائل التواصل الاجتماعي وآثار البيانات الرقمية الأخرى تساهمان في دراسة علم النفس البشري، فمن غير المرجح أن تكفي الممارسات القياسية لاختبار أهمية الفرضية الصفرية، لأن الاستنتاجات والتعميمات التي يمكن إجراؤها من النتائج الارتباطية البحتة في بيانات وسائل التواصل الاجتماعي تقوم على ملاحظة هشة في كثير من الأحيان.

زر الذهاب إلى الأعلى