تقنيات توليد النصوص بالذكاء الاصطناعي ربما تُغيّر المشهد العلمي

دورية Nature

2022-07-27 05:21

معلوماتية

بقلم: ريتشارد فان نوردين

خوارزميات التعلُّم الآلي، القادرة على لغة سلسة وفصيحة استنادًا إلى كمٍّ هائل من النصوص، يمكن أن تُغيِّر من طرق ممارسة العلم، غير أنه ليس تغييرًا إيجابيًّا بالضرورة، وفق ما تشير شوبيتا بارثاساراثي، اختصاصية حوكمة التقنيات الناشئة بجامعة ميشيجان، ومقرُّها مدينة آن آربر الأمريكية.

في تقريرٍ نُشر بتاريخ السابع والعشرين من أبريل الماضي، حاولت بارثاساراثي -بمشاركة باحثِين آخرِين- توقُّع التأثيرات الاجتماعية المترتبة على تقنيات الذكاء الاصطناعي الناشئة، التي تُدعى «النماذج اللغوية الكبيرة» (LLMs)، هذه النماذج قادرة على إنتاج مقطوعات نثرية تبلغ من الفصاحة والإقناع حدًّا مدهشًا، والترجمة بين اللغات المختلفة، والإجابة عن الأسئلة، وحتى إنتاج الأكواد البرمجية، وتهدف الشركات المطوِّرة لتلك النماذج –مثل «جوجل»، و«فيسبوك»، و«مايكروسوفت»- إلى استخدامها فيما يُعرف بالروبوتات المتكلمة (chatbots)، ومحركات البحث، إلى جانب مهمات تلخيص الوثائق، (تعكف شركة واحدة على الأقل -هي شركة «أوت» Ought، ويقع مقرها في مدينة سان فرانسيسكو بولاية كاليفورنيا الأمريكية– على اختبار النماذج اللغوية الكبيرة في مجال البحث العلمي؛ إذ تصمم برنامج «إيليسِت» Elicit، الذي يجيب عن الأسئلة بالاستعانة بالمؤلفات العلمية).

على أنَّ النماذج اللغوية الكبيرة محل خلاف بالفعل؛ ذلك أنها ربما تُكرِّر الأخطاء والقوالب النمطية الإشكالية التي تشتمل عليها ملايين أو مليارات الوثائق التي دُربت باستخدامها، ويخشى الباحثون أن يقود تدفق النصوص المُنتَجة حاسوبيًّا، التي تحظى ظاهريًّا بالموثوقية ولا يمكن تمييزها عن كتابات البشر، إلى تقويض ثقة القارئ فيما يقرأ، وبثِّ حالةٍ من الالتباس.

وإذا كان من الجائز أن يكون لهذه النماذج اللغوية دورٌ في تعزيز الجهود الهادفة إلى فهم الأبحاث العلمية المعقدة، فإنها قد تجعل عموم القرَّاء أكثر تشكُّكًا في العلم، وفق ما تضيف بارثاساراثي، التي أجْرَتْ معها دورية «نيتشر» Nature الحوار التالي، حول التقرير الذي شاركت في تأليفه.

يمكن للنماذج اللغوية الكبيرة أن تدعم العلم أو تُعوِّقه.. كيف؟

كنت أعتقد في بادئ الأمر أن هذه النماذج اللغوية قد تتمخض عن تأثيرات إيجابية، من شأنها أن تمكِّن فئات المجتمع، وتدعم الديموقراطية، وإذا قَصَرنا النظر على العلوم، فقد تتيح تلك النماذج للشخص استخلاص الأفكار من المعلومات سريعًا، كأن يستعلم عن أعراض مرضٍ ما، على سبيل المثال، أو يحصل على ملخصاتٍ لموضوعات تقنية.

لكن الملخصات التي تصنعها الخوارزميات قد تتضمن أخطاء: يمكن أن تحوي معلومات غير محدَّثة، أو تُغفل الفروق الدقيقة بين المعاني، أو تُسقط التعبيرات التي تُفيد عدم اليقين، دون أن يعي المستخدمون ذلك، وإذا أصبح في وسع أي شخص استخدام النماذج اللغوية الكبيرة لجعل الأبحاث العلمية المعقدة مستساغة، فسوف يكون عُرضةً لخطر الحصول على صورة للعلم مختزَلة ومسطَّحة، لا تتناسب مع تعقُّد العالَم الواقعي، ولا يبعُد أن يأتي ذلك على قيمتَي المهنية والمرجعية العلميتين، وربما يؤدي هذا إلى تفاقُم المشكلات المتعلقة بالثقة في العلم عمومًا، وأودُّ هنا الإشارة إلى أن التعامل مع تلك الأدوات سيأخذ منحىً فرديًا تمامًا، بحيث يحصل كل مستخدم على معلومات تختلف عما يحصل عليها غيره.

قد تعتمد النماذج اللغوية الكبيرة على أبحاث علمية غير محدَّثة أو غير موثوق بها.. ألا يمثل ذلك مشكلةً معتبرة؟

أجل، لكن ذلك لن يردع الناس عن استخدامها؛ فهي جذابة، وتتلبَّس قناعًا من الموضوعية، اعتمادًا على ما تتصف به مُخرجاتها من فصاحةٍ وتدفُّق، فضلًا عن ترويج البعض لها باعتبارها تقنياتٍ جديدةً مثيرةً للاهتمام، ومما قد يغيب عن وعي المستخدم العادي أنها -في نهاية المطاف- ذات إمكانيات محدودة، بالنظر إلى أنها قد تستند إلى قواعد بيانات جزئية أو غير محدَّثة.

ليس من الصعب على الباحثين أنْ يروا كيف أنّ هذه التقنيات ذكية حقًّا، ويدركوا أنها أدوات مفيدة، وإن لم يكن من الممكن الاعتماد عليها اعتمادًا كاملًا في إعداد عرض للدراسات السابقة، على سبيل المثال، إلا أنه على الجانب الآخر، قد تتسبب هذه التقنيات في تضييق مجال رؤيتهم، بما قد يجعل من الصعب عليهم الوقوف على مواضع الخطأ فيما تنتجه النماذج.

قد تكون النماذج اللغوية الكبيرة ذات نفع في مجال الإنسانيات الرقمية، على سبيل المثال؛ إذ يمكن استخدامها في تلخيص المعلومات التي يوردها نصٌّ تاريخي حول موضوع معين، لكن العمليات التي تدور بداخل تلك النماذج مبهمة، فضلًا عن أنها لا تعرض المصادر التي استخدمتها بجانب النتائج التي تُخرجها، ومن ثم يجب على الباحثين التفكير مليًّا في كيفية استخدامها، لقد اطَّلعت على عدد من الاستخدامات المقترحة لهذه النماذج في مجال علم الاجتماع، وهالني حجم الثقة التي أولاها بعض الباحثين لمنتَج تلك النماذج.

ما الجهات التي قد تتصدى لتطوير تلك النماذج من أجل استخدامها في مجال العلوم؟

أظن أن كُبريات دور النشر العلمية هي المؤهلة لتطوير نماذج لغوية ضخمة متخصصة في المجالات العلمية (بالاعتماد على النماذج العامة)، وستكون تلك النماذج قادرةً على معالجة النصوص الكاملة للأبحاث العلمية التي تصدُر عن الدار، وربما عرَّجت كذلك على أتمتة بعض جوانب عملية مراجعة الأقران لديها، كأن تُفحص النصوص العلمية آليًّا، لتحديد الباحث الذي ينبغي أن تُسند إليه المراجعة، وقد يُستعان بتلك النماذج أيضًا في محاولة انتقاء النتائج المبتكرة في مسودات الأبحاث أو براءات الاختراع، وربما تساعد كذلك في تقييم تلك النتائج.

وليس من المستبعَد أن يطور الناشرون أيضًا برامج تقوم على النماذج اللغوية الكبيرة لتكون عونًا للباحثين في البلدان التي لا تتحدث الإنجليزية على تحسين كتابتهم.

وبطبيعة الحال، يستطيع الناشرون عقد صفقات لمنح ترخيص استخدام النصوص التي بحوزتهم للشركات الكبيرة التي ترغب في إضافتها إلى مكتبتها، لكني أرجح أن يحاول الناشرون الاحتفاظ بسيطرتهم على تلك النماذج، وفي هذه الحالة، أظن أن العلماء الذين يعانون إحباطًا متزايدًا بسبب احتكار الناشرين للمعرفة سوف يعارضون هذا الأمر، ثمة إمكانية لتطوير نماذج لغوية كبيرة قائمة على الأبحاث مفتوحة المصدر، وملخصات الأبحاث التي يمكن الاطلاع عليها عبر شرائها، أو الاشتراك فيها، لكن قد يصعُب الحصول على ما يكفي من النصوص العلمية المحدّثة بهذه الطريقة.

هل يمكن استغلال النماذج اللغوية الكبيرة في إنتاج أبحاث مزيفة تبدو حقيقية؟

أجل، البعض سيلجأ إلى النماذج اللغوية الكبيرة لإنتاج أبحاث مزيفة أو تكاد، إذا ما تيسَّر لهم ذلك، وإذا ارتأوا أنها قد تدعم مسارهم المهني، لكن هذا لا يمنع جمهور العلماء -الذين ينطوون على شعورٍ حقيقيٍّ بالانتماء إلى المجتمع العلمي- من وضع ضوابط ومعايير لاستخدام هذه النماذج.

كيف ينبغي تنظيم استخدام النماذج اللغوية الكبيرة؟

مما يدعو إلى العجب أن جميع البرامج المعتمدة على الذكاء الاصطناعي تقريبًا لم تُخضع لأي ضوابط منهجية، أو آليات تضمن استيفاء المعايير الخاصة بها، وهذا ما يصدُق على النماذج اللغوية الكبيرة أيضًا؛ فالأساليب التي تستند إليها تتسم بالغموض، وتختلف من مطور إلى آخر، لذا أوصينا الجهات الحكومية، في التقرير الذي أعددناه، بالتدخل ووضع لوائح تنظيمية عامة.

فإذا انتقلنا إلى الحديث عن الاستخدام المحتمل للنماذج اللغوية الكبيرة في العلوم على وجه الخصوص، وجدنا أن الشفافية تحتل موقعًا محوريًّا، يتعين على مطوري هذه النماذج توضيح النصوص التي استعانوا بها، والمنطق الذي تتبعه الخوارزميات المستخدمة، والإفصاح عما إذا كانت برامج حاسوبية قد استُخدمت في توليد نتائج، كما يتعين على مؤسسة العلوم الوطنية الأمريكية -من وجهة نظرنا- دعم تطوير واحد من هذه النماذج اللغوية الكبيرة، على أن يكون مُدربًا باستخدام جميع الأبحاث العلمية المتاحة للكافة، في طيفٍ عريض من المجالات.

وإلى ذلك، يجدُر بالعلماء والباحثين أن يتوخَّوا الحذر من الدوريات أو ممولي الأبحاث الذين يعتمدون على النماذج اللغوية الكبيرة لتحديد المراجعين من الأقران، أو يوسعون من نطاق استخدامها لتشمل جوانب أخرى من عملية المراجعة، على غرار تقييم مسودات الأبحاث أو المِنَح؛ ذلك لأن هذه النماذج تنزع بطبيعتها ناحية البيانات القديمة، ومن ثم، فأكبر الظن أن توصياتها سوف تميل إلى الإفراط في التحفظ.