بحثًا عن لغة مشتركة: البيانات الضخمة تُسهم في تطوير الدراسات السلوكية
دورية Nature
2022-01-12 06:42
لماذا يتردد الناس في تلقي اللقاحات؟ كيف نشجعهم على أن يكونوا أكثر إقبالًا على ممارسة الرياضة؟ يرصد باحثو العلوم الاجتماعية الذين يتناولون هاتين المسألتين، وما إليهما من مسائل، طريقة تصَرُّف الأفراد، ويسجِّلون البيانات حول تلك السلوكيات، ثم يعزِّزون تلك المعرفة بمقابَلات مع الأشخاص المرصود سلوكهم، أو من خلال الاستبيانات، أو بالوسيلتين كلتيهما. غير أنَّ إجراء الأبحاث بهذه الطريقة مكلِّف من ناحية الوقت والجهد، إلى جانب أنه يتعذَّر تحصيل كميات ضخمة من البيانات بصورة متزامنة.
وفي مقابل ذلك، نجد أنَّ الباحثين يستطيعون الآن الدخول إلى كميات غير مسبوقة من البيانات المفيدة للعلوم الاجتماعية، التي تتخَلّق كل ثانية بفضل التفاعل المستمر بين مستخدمي الأجهزة والمنصات الرقمية. جانبٌ من هذا الفيض الهادر من البيانات يتمثل في البيانات المتولدة من تتبُّع تحركات الأفراد، ومشترياتهم، وتفاعلاتهم الاجتماعية، وكلها بيانات ثبتت أهميتها الشديدة للأبحاث. ونتيجةً لذلك، شهدَتْ الأبحاث التي تدمج تحليل البيانات الضخمة مع الأسئلة الاجتماعية نموًا هائلًا في الآونة الأخيرة، ويُطلَق على الدراسات التي تحقق هذا النوع من الدمج «العلوم الاجتماعية المُحوسَبة» computational social science.
خلال جائحة «كوفيد-19» وحدها، أتيح للباحثين الدخول إلى سجلَّات الهواتف المحمولة الخاصة بملايين المستخدمين، والاستفادة من هذه البيانات في دراسة تغيُّر أنماط حركة الأفراد خلال الجائحة، وأثر ذلك التغير على مسارات انتشار عدوى فيروس «سارس-كوف-2». وأتيح للباحثين أيضًا الدخول إلى بيانات الشراء عبر بطاقات الائتمان (مع بقائها بيانات مجهَّلة، أي غير دالةٍ على هوية صاحبها)، ليدرسوا أنماط الإنفاق إبَّان الجائحة، وهي معلومات يمكن أن تكون مفيدة في الوقوف على مدى تأثر القطاعات الاقتصادية المختلفة بالجائحة.
سلطة ومسؤولية
في الوقت نفسه، ينبغي على الباحثين الانتباه إلى أن تجميع تلك البيانات للأغراض البحثية، ومشاركتها - وهما من الممارسات التي تحدث غالبًا في ظل غياب الإجراءات الرقابية والتنظيمية حتى هذه اللحظة - هو أمر يفرض على المجتمع تحديات حقيقية. من بينها مخاطر إخضاع الأفراد لدرجة أعلى من الرصد والمراقبة، وكذلك خطر الإفصاح عن هوية المستخدمين في البيانات المجهَّلة.
ومما يثير القلق أيضًا أن الأفراد الذين تُستخدم بياناتهم لم يوافقوا بالكُلية على إتاحة تلك البيانات. يُضاف إلى ذلك المخاوف المتعلقة بالاحتكار الاقتصادي الذي تمارسه شركات التكنولوجيا، باعتبارها المالكة لأغلب تلك البيانات. ومن الملاحَظ أن الجانب الأكبر من تلك الآثار الرقمية يتولد في العادة من رصد سلوك أفرادٍ على درجة من الثراء، يعيشون في بلدان مرتفعة الدخل؛ ما يُضفي صبغة التحيُّز على محاولات العلماء بلوغ استنتاجات عامة، يمكن سحبها على جميع البلدان والشرائح الاجتماعية. ومن ثم، فإن الإقرار بهذه التحديات، والتعامل معها، يمثلان أساسًا لتطوير مجال أخلاقيات البحث في العلوم الاجتماعية المحوسَبة بشكل يُسهم في تحقيق تطور مجتمعي حقيقي.
نحتاج إذن إلى الجمع بين الخبرات في مجال العلوم الاجتماعية، والمهارات اللازمة لجمع البيانات الضخمة، وتنقيتها، وتحليلها. وهذا يعني أن إجراء أبحاث العلوم الاجتماعية المحوسَبة سيتطلب فِرَقًا من الباحثين تتوفر لديهم خبرات ومهارات بالغة التنوع. إلا أن التعاون بين أصحاب التخصصات المتمايزة يفرض طائفةً أخرى من التحديات.
وقد نشرت دورية Nature مؤخرًا ملفًّا خاصًّا من المقالات البحثية التي تهدف إلى مد الجسور بين الرؤى والتخصصات المعرفية ذات الصلة بإجراء البحث العلمي في مجال العلوم الاجتماعية المحوسَبة. وسوف نلقي الضوء على الطرق التي يمكن للمجتمعات العلمية أن تتبناها في مجالات العلوم الاجتماعية والطبيعية والحاسوبية للوصول إلى أفضل تعاون وتكامل ممكنين، وتجاوز التحديات المشتركة.
جسورٌ أقوى
بدايةً، يتعين على التخصصات المعرفية المختلفة أن تعمل على تجاوز الإشكالية اللغوية المتمثلة في تعدُّد مدلولات المصطلح للواحد. فالكلمة الإنجليزية «prediction»، على سبيل المثال، غالبًا ما تستخدَم في سياق العلوم الاجتماعية للإشارة إلى «ارتباط سببي» (correlation) بين متغيِّرين؛ أما في العلوم الطبيعية، فتُستخدَم عادةً بمعنى «تنبؤ» (forecast). ولذا، فإن أول ما يتطلَّبه البحث العلمي متعدد التخصصات هو أن يكون باحثو كلِّ فرع ملمِّين بالمصطلحات التي يستخدمها أقرانهم من أصحاب الفروع الأخرى، ومدلولاتها، بحيث يتسنَّى لهم تحصيل فهمٍ مشترك لتلك المصطلحات.
على أنَّ الاختلافات يمكن أن تتجاوز المسائل اللغوية، لتمسَّ أمورًا أعمق غورًا وأبعد أثرًا، مثل كيفية تنقية البيانات وتحليلها، ثم تأويلها لتفسير ظاهرة بعينها. ويذهب جيك هوفمان، من مركز أبحاث مايكروسوفت في مدينة نيويورك، وزملاؤه، إلى أن العلوم الاجتماعية المحوسَبة يمكن أن تصبح قادرة على التصدِّي للأسئلة البحثية بفاعليةٍ أكبر إذا ما ضمَّت مقاربات يتكامل بعضها مع بعض. فلو أن لدينا فريقًا يعكف على تطوير نماذج للتنبؤ بأسباب الزحام المروري، على سبيل المثال، فسوف يجمع الفريق بيانات حول الانسياب المروري، ثم تُدمَج هذه البيانات مع مخرَجات مقابلات يجرونها مع قائدي المركبات، ليتعرَّفوا منهم على سبب اختيارهم طرقًا بعينها.
إن نتائج أي دراسة لا تتحدَّد اعتمادًا على استراتيجيات التحليل المستخدَمة فحسب، وإنما تتحدد أيضًا بجودة البيانات التي اعتمدت عليها؛ وهذا أمر يتطلب الكثير من الحصافة عند التعامل مع البيانات المتصلة بالسلوك الاجتماعي. فالبيانات الغزيرة المتاحة، التي تجعل العلوم الاجتماعية المحوسَبة أمرًا قابلًا للتحقُّق (مثل التغريدات على موقع التدوينات القصيرة «تويتر»، أو بيانات حركة مستخدمي الهواتف المحمولة)، لا تُجمع في الغالب لأغراض بحثية، ومن ثم يسهُل الوقوع في الخطأ عند محاولة تأويلها.
ومن هذا المنطلَق، يرى ديفيد ليزر، الباحث بجامعة نورث إيسترن في مدينة بوسطن بولاية ماساتشوستس، وزملاؤه، أنه ينبغي على الباحثين الذين يتعاملون مع مجموعات بيانات ضخمة ألا يستجيبوا لإغراء الخروج باستنتاجات استنادًا إلى ما يلحظون في البيانات من اتجاهات وأنماط عددية فقط، إذ يتعيَّن رصد العوامل التي قد تؤثر على النتائج أيضًا. ولاستخلاص المعنى الحقيقي للبيانات، ينبغي على الباحثين أن يتوثقوا من أنهم قد حددوا بدقة العوامل التي يخضعونها للقياس، وفقًا للنهج النظري المطروح، وتحققوا من صحة العلاقة بين تلك العوامل والنتيجة، وفسروها على نحو منضبط.
وكذلك فإن التوسع في الاعتماد على الخوارزميات، ومن ثم تنامي تأثيرها، يمكن أن يمثل مصدرًا آخر للأخطاء في الدراسات، بحسب كلاوديا فاجنر، من معهد لايِبْنِتْس للعلوم الاجتماعية بمدينة مانهايم في ألمانيا، وزملائها. يقول الباحثون إن الخوارزميات الشائعة في مجتمعاتنا تؤثر بطرق شتَّى على سلوك الأفراد والجماعات. والمقصود هنا أن أي مشاهدات أو بيانات تنتجها الخوارزميات لا تعبر عن السلوك البشري فحسب، ولكن عن تأثيرات تلك الخوارزميات ذاتها على هذا السلوك كذلك. ويرى الباحثون أن النظريات التي تقوم عليها العلوم الاجتماعية في حاجة للتحديث، من أجل الوقوف على تلك التأثيرات التي تُسببها الخوارزميات، والإقرار بها. فبغير ذلك التحديث، وبغير إدراك تأثير الخوارزميات على البيانات المتاحة، لن يستطيع الباحثون الخروج من دراساتهم باستنتاجات ذات بال.
ومما يزيد الأمور تعقيدًا في مجال العلوم الاجتماعية المحوسَبة أنَّ قواعد البيانات الكبيرة هي – في الغالب الأعمّ – ملكية خاصة لشركات تجارية؛ وهو ما يستلزم من الباحثين الأكاديميين التواصل مع تلك الشركات حتى يتسنَّى لهم الوصول إلى البيانات، وهذا ينطوي على صورةٍ أخرى من صور الانحياز. ومردُّ ذلك، في جانبٍ منه، إلى أن الشركات تُولِي البيانات أهمية بالغة، وإتاحتُها لأفرادٍ من خارج الشركة قد يهدِّد أرباحها. ويُعتبر هذا من بين الأسباب التي إليها يُعزَى ميل تلك الشركات إلى تقييد ما تتيحه للغير، بحسب جوناثان ساداوسكي، من جامعة موناش في مدينة ملبورن الأسترالية، وزملائه. ولكن في ضوء ما تحمله تلك البيانات من فُرصٍ لخدمة المجتمع، ينبغي على الشركات، جنبًا إلى جنبٍ مع الباحثين الأكاديميين والجهات الحكومية، أن تتعاطى مع تلك الأسئلة، وأن ترسي معايير لجودة البيانات، وضوابط لإتاحتها، وامتلاكها.
الطريق قُدُمًا
ثمة طُرق لتحصيل بيانات موثوقة ومفيدة، بحسب مقال ميترا جاليستش، من معهد سانتا في بولاية نيو مكسيكو، وزملائها، حول ما يطلقون عليه "التقاط الإشارات الاجتماعية البشرية". يهدف هذا النهج البحثي إلى دراسة الطريقة التي يجمع بها الأفراد المعلومات عن أقرانهم في دوائرهم الاجتماعية. يمكن للباحثين، مثلًا، التكهن بحدوث تغيُّر في الآراء السياسية عند إجراء مقابلات مع أفراد، وسؤالهم عن الموضوعات التي تشغَل أصدقاءهم. وتحصيل البيانات عن الأفراد اعتمادًا على آخرين يمكن أن يساعدنا على تحاشي بعض التحيُّزات التي تظهر في البيانات التي يقدمها الأفراد عن أنفسهم. كما أن لهذه الطريقة مَيزة إضافية، تتمثل في توليد بيانات مُجَهَّلة، دون الكشف عن هوية أصحابها؛ ومن شأن ذلك تجنيب الباحثين الحاجة إلى معرفة التفاصيل الخاصة أو الحساسة عن الأفراد الذين يتلقَّون معلومات عنهم.
وثمة ميدان بحثي آخر مرشح للنمو، يقع عند تقاطع النماذج الحاسوبية للأمراض المُعدية مع العلوم السلوكية. تشير كارولاين باكي، الباحثة بكلية تي إتش تشان للصحة العامة بجامعة هارفارد في بوسطن، ومعها زملاؤها، إلى أن إنشاء نموذج دقيق لمصدر العدوى، ثم انتشارها، يتطلب من الباحثين فهم الخلفية الثقافية والسلوكية للأفراد المصابين بالعدوى، أو المعرَّضين للإصابة بها؛ إذ يصعُب التنبُّؤ بمسار مرض معيَّن بغير التنبُّه لتلك وغيرها من العوامل الاجتماعية التي قد تُسهم في انتشاره. ومن هنا، فإن التعاون المنهجي الواسع، الذي يستفيد من التخصصات المعرفية المختلفة، سيلعب دورًا محوريًا في تحقيق ذلك الهدف.
أثبتت الجائحة أن الاستفادة من قواعد البيانات الضخمة في أغراض علمية يمكن أن تنقذ أرواحًا. وقد تجلَّت هذه الإمكانية – أوَّل ما تجلَّت – في تعاوُن باحثين من مجالَي علوم الحاسوب والرياضيات التطبيقية مع أقرانهم في العلوم الاجتماعية. وينبغي العمل على تعميق ذلك التعاون، وتوسيع نطاقه، ليشمل باحثين من مجالات أكثر (ومنها أخلاقيات البحث العلمي، والبحث العلمي المسؤول، ودراسات العلوم والتكنولوجيا)، لضمان تلافي المزالق التي أسلفنا الإشارة إليها، واستخدام البيانات بطريقة تعظِّم المعرفة المكتسبة، مع تقليص ما يمكن أن ينجُم عن هذا الاستخدام من ضرر.