بصمة للذكاء الاصطناعي في 14% من ملخصات أبحاث الطب الحيوي للعام الماضي

Nature Masterclasses

2025-07-27 04:24

تضمنت ملخصات الأبحاث من ذاك العام عبارات كاشفة لاستخدام الذكاء الاصطناعي، منها عبارتا "منقطع النظير"، و"لا يُقدر بثمن"، اللتان شاع ظهورهما في النصوص المستحدثة بالنماذج اللغوية الكبيرة.

وفقًا لتحليل واسع النطاق للأدبيات البحثية1 يرجح أن ملخصًا واحدًا تقريبًا من كل سبعة ملخصات بحثية نُشرت في مجال الطب الحيوي خلال العام الماضي، قد كُتب بالاستعانة بـالذكاء الاصطناعي. فمن أصل 1.5 مليون ملخص بحثي أُدرج عام 2024 على فهرس قاعدة بيانات المؤلفات البحثية «بب ميد» PubMed، تضمن أكثر من 200 ألف ملخص كلمات شاع اقتراح النماذج اللغوية الكبيرة لها لدى إنتاج النصوص.

نُشرت الدراسة على الإنترنت كمسودة بحثية 2 في يونيو عام 2024 بدايةً، وقدرت آنذاك أن واحدًا من كل تسعة ملخصات بحثية نُشرت في النصف الأول من ذاك العام قد كُتب بمساعدة الذكاء الاصطناعي . وفي الثاني من يوليو من العام الجاري، نُشرت النسخة المحدثة من تحليل الدراسة في دورية «ساينس أدفانسز» Science Advances1.

تعقيبًا على نتائج الدراسة، يقول آندرو جراي، اختصاصي دعم دراسات تحليل الاستشهادات المرجعية في كلية لندن الجامعية: "تواصًل ارتفاع إجمالي عدد الأوراق البحثية المُنقحة بالنماذج اللغوية الكبيرة بخطى مطردة". وهو يرى أن الباحثين حتى اليوم لم يستوعبوا تمامًا حجم الاعتماد والتعويل على هذه الأدوات في إنتاج الأبحاث. من هنا يضيف: "يؤمل أن تسهم هذه الورقة البحثية في خلق اهتمام بهذه المشكلة".

كلمات "مرتفعة التكرار"

في الوقت الراهن، تسعى العديد من الفرق البحثية إلى الوقوف على أثر النماذج اللغوية الكبيرة في حركة النشر العلمي، غير أنها ليست بالمهمة اليسيرة، نظرًا لأن كثيرًا من مستخدمي هذه الأدوات لا يفصحون عن لجوئهم لها. لذا، تعتمد هذه الجهود عادة على تدريب نماذج الذكاء الاصطناعي على التمييز بين النصوص المستحدثة بشريًا وتلك المُنتجة باستخدام النماذج اللغوية الكبيرة، لتوظف بعد ذلك الرؤى المستقاة من هذه العملية في تقييم الأدبيات البحثية. بيد أن الآلية التي تُميز بها هذه النماذج بين كلا نوعي النصوص تبقى غير واضحة، كما أن مجموعات البيانات التي تتدرب عليها لا تعبر دائمًا عن أحدث الاتجاهات في النصوص المنُتجة بالنماذج اللغوية الكبيرة.

لهذا، سلك ديميتري كوباك، اختصاصي علم البيانات من جامعة توبينجين بألمانيا، مع فريقه البحثي مقاربة أكثر مرونة. فبحثوا في ملخصات الأبحاث عن الكلمات "مرتفعة التكرار" (التي أخذت تظهر بوتيرة أكبر من المتوقع) بعد نوفمبر من عام 2022، أي بعدما أصبح نظام الذكاء الاصطناعي «تشات جي بي تي» متاحًا على نطاق واسع. استلهم الفريق هذه الفكرة من دراسة تقدر "الزيادة في عدد الوفيات" خلال جائحة «كوفيد-19».

ووقف على 454 كلمة ظهرت خلال عام 2024 بوتيرة أعلى كثيرًا مما ظهرت في الأعوام بدءًا من عام 2010. كانت هذه الكلمات "أسلوبية" في الغالب وغير ذات صلة بموضوع البحث، ومالت إلى أن تكون من الأفعال والصفات. كما أن بعضها كان شائعًا مثل كلمة Findings (النتائج)، وCrucial (حاسم)، وPotential (محتمل)، في حين أن بعضها الآخر كان أقل شيوعًا، مثل الفعل delves (يسبُر)، والمضارع showcasing (يعرض). أما الكلمات مرتفعة التكرار التي شاع ظهورها في الملخصات البحثية المنشورة في النصف الثاني من العام الماضي، فقد تضمنت، بحسب ما يفيد كوباك، كلمات مثل heighten (بمعنى يعزز درجة أو شدة)، ولفظة hinder (بمعنى يعرقل)، وصيغ تفضيل مثل unparalleled (منقطع النظير)، و invaluable (لا يُقدر بثمن).

تجدر الإشارة إلى أن المفردات العلمية تختلف بمرور الوقت، وقد تشهد تحولات كبيرة بالتزامن مع الأحداث المهمة، كما حدث خلال جائحة «كوفيد-19» التي اندلعت عام 2020. فبعد الجائحة، شهد عام 2021 ظهور 190 كلمة مرتفعة التكرار، كانت في الغالب من الأسماء ذات الصلة بمضمون الأبحاث، مثل كلمة "الكمامات". إلا أن الاختلاف الذي طرأ على المفردات العلمية منذ رواج استخدام النماذج اللغوية الكبيرة كان أكثر وضوحًا وأخذ طابعًا سلوبيًا في المقام الأول.

اختلافات جغرافية

أظهر تحليل الدراسة أنه في بعض الدول مثل الصين وكوريا الجنوبية، وفي بعض المجالات مثل الحوسبة ونظم المعلومات الحيوية، كُتب أكثر من ملخص بحثي واحد من كل خمس ملخصات بحثية بمساعدة النماذج اللغوية الكبيرة. ويفيد كوباك بأن العدد الإجمالي للملخصات البحثية المكتوبة بمساعدة هذه النماذج تزايد على الأرجح خلال العام الماضي. فيضيف: "استخدام النماذج اللغوية الكبيرة لا يزال يشهد ارتفاعًا".

ويُحتمل أن الوتيرة التي يُستخدم بها الذكاء الاصطناعي في كتابة الأبحاث أعلى مما أشارت إليه الدراسة الأخيرة. ففي مسودة بحثية، 3 نُشرت على خادم «آركايف» arXiv في فبراير الماضي، يفيد مينجمينج جينج اختصاصي دراسة تأثيرات النماذج اللغوية الكبيرة في المجتمع بمدرسة المعلمين العليا (PSL) في باريس مع فريقه البحثي أن بعض الكلمات والعبارات الكاشفة لاستخدام الذكاء الاصطناعي مثل "يسبر" أخذت تظهر بوتيرة أقل مع اقتراب نهاية عام 2024. والسبب، بحسب ما يوضح جينج، قد يكون أن الدراسات التي تحذر من هذه الكلمات والعبارات بوصفها تعابير كاشفة لاستخدام الذكاء الاصطناعي دعت مؤلفي الأوراق البحثية إلى حذف هذه التعابير من نصوص أبحاثهم أو إلى تعديل أوامرهم للنماذج اللغوية الكبيرة لإنتاج نصوص تتحاشى هذه التعابير.

وحسبما يشير جينج، تزايدت صعوبة تقييم أثر الذكاء الاصطناعي في المؤلفات الأكاديمية مع أخذ مؤلفي الأوراق البحثية بهذه التحذيرات.

ومما يعزز هذه الصعوبة، بحسب جراي، أن الدراسات، بما فيها دراسة كوباك وفريقه البحثي، لا يمكنها الوقوف على الكيفية التي تُستخدم بها أدوات الذكاء الاصطناعي في كتابة المؤلفات البحثية. فكما يقول، لربما استخدمها مؤلفو الأوراق البحثية لأسباب مقبولة، على سبيل المثال، لصقل كتابة النصوص البحثية أو للمساعدة في الترجمة، أو لاستخدامات أكثر إثارة للشكوك الأخلاقية، مثل كتابة أجزاء كبيرة من النص البحثي دون إشراف. وهو ما يعقب عليه جراي قائلًا: "هذا يثير مخاوف حقيقية إزاء النزاهة البحثية"

ذات صلة

الفجوة الكهربائية في العراق.. من أزمة مزمنة الى قطاع قائداحذر الباطل حين يبتسم!مدننا التي لا يريدون أن تُرىموت الصحفيين في غزة جوعاً.. انهيار قواعد القانون الدوليسلعنة التعليم أم أنسنته؟