هيمنة بودكاست الـ يوتيوب.. كيف ابتلع الفيديو الصوت وأعاد تشكيل الوعي؟

شبكة النبأ

2025-12-14 03:54

يقدم هذا المقال مختصرا لحلقة من بودكاست "Galaxy Brain" بعنوان "كيف التهمت يوتيوب البودكاست والتلفزيون" (How YouTube Ate Podcasts and TV). الحلقة من إعداد وتقديم تشارلي وارزل (Charlie Warzel)، الكاتب في مجلة The Atlantic. يناقش النص ظاهرة تحول البودكاست من وسيط صوتي حميم إلى محتوى مرئي يهيمن عليه يوتيوب ، مستعرضاً التحولات الاقتصادية والثقافية التي جعلت الفيديو يبتلع الوسائط الأخرى تحت شعار "كل شيء أصبح تلفزيوناً الآن"

يشرح تشارلي وارزل، مضيف برنامج "جالاكسي برين"، كيف تحول البودكاست إلى شيء أشبه بالتلفزيون، مُبررًا سبب ظهور وجهه الآن على يوتيوب بدلًا من التركيز على الصوت فقط. يشارك ضيوف مثل راشيل مارتن وأشلي كارمان وديريك طومسون في النقاش حول الجوانب الثقافية والتجارية لهذا التحول، بما في ذلك انهيار "الاندفاع نحو ذهب البودكاست" القائم على السرد الباهظ، وصعود يوتيوب كمنصة مهيمنة. يُشير النص إلى أن الفيديو يُعزز الثقة في عصر انخفاض مصداقية الإعلام، ويُغذي العلاقات شبه الاجتماعية، مما يدفع الإعلام بالكامل نحو أن يُصبح "تلفزيونًا"، مما يثير تساؤلات حول تأثير ذلك على الانتباه والثقافة.

مقدمة: سؤال الوجه في عصر الشاشات المتداخلة

في ديسمبر 2025، يفتتح الصحفي التقني تشارلي وارزل حلقته بسؤال يبدو للوهلة الأولى بسيطاً، لكنه يحمل في طياته دلالات عميقة حول التحول الجذري في بنية الإعلام المعاصر: "لماذا ترون وجهي؟". هذا السؤال لا يطرحه وارزل بصفته مقدماً تلفزيونياً تقليدياً، بل بصفته صحفياً كان يعتمد القلم، ثم تحول إلى الصوت، والآن يجد نفسه مضطراً للظهور بوجهه عبر يوتيوب لتقديم محتوى كان يُفترض أن يكون مسموعاً فقط.

إننا نشهد لحظة مفصلية في تاريخ الوسائط، حيث لم تعد الحدود الفاصلة بين "المقرؤ"، و"المسموع"، و"المشاهد" واضحة. لقد التهمت منصة يوتيوب عالم البودكاست، وحولت البرامج الصوتية إلى ما يشبه التلفزيون النهاري (Daytime TV) والبرامج الحوارية الليلية. هذا التحول ليس مجرد تغيير في التقنية، بل هو "محورية نحو الفيديو" (Pivot to Video) تختلف كلياً عن تلك التي حدثت في العقد الأول من القرن الحادي والعشرين والتي كانت مدفوعة بنزوات منصات مثل فيسبوك. التحول الحالي في عام 2025 مدفوع بسلوك الجمهور نفسه ورغباته.

تُظهر البيانات الحديثة لعام 2024 من شركة "Edison Research" حقيقة هذا الانقلاب: صعد يوتيوب ليصبح الخدمة الأكثر شعبية للاستماع إلى البودكاست في الولايات المتحدة، حيث يختار 31% من المستمعين الأسبوعيين يوتيوب كمنصة أساسية، متفوقاً بذلك على سبوتيفاي (27%) وأبل بودكاست (15%). والأخطر من ذلك هو التوجه المستقبلي، إذ يشير التقرير إلى أن 84% من مستمعي الجيل Z (Gen Z) يفضلون البودكاست الذي يحتوي على عنصر فيديو.

ويمكن تفكيك هذه الظاهرة من خلال أربعة محاور رئيسية: التحول الحسي والنفسي في العلاقة بين المذيع والجمهور، التاريخ الاقتصادي لصعود وسقوط إمبراطوريات الصوت، النظرية الثقافية التي ترى أن "كل شيء هو تلفزيون"، وأخيراً الآثار الوجودية لهذا التحول على النفس البشرية والمجتمع.

المحور الأول: التحول الحسي.. من حميمية الصوت إلى مصداقية الصورة

لطالما اُعتبر الراديو والبودكاست وسائط "أُذنية" (Ear mediums) تتميز بحميمية فائقة. 

1. رومانسية الصوت وسقوط "الذات المثالية"

تتحدث مارتن بشغف عن "حميمية الصوت"، واصفة إياه بأنه تجربة خالية من المشتتات، حيث لا يوجد سوى المضيف والضيف وصوتيهما. في النموذج الإذاعي التقليدي، مثل نموذج "تيري غروس" في برنامج Fresh Air، كان يتم تفضيل المقابلات عن بعد لتجنب أي تشتت بصري، وللحفاظ على تلك العلاقة النقية بين صوت وصوت. في عصر الصوت فقط، كانت عمليات التحرير (Montage) تتدخل لتنقية الحوار. يتم إزالة التلعثم، واختصار الإجابات الطويلة، ليظهر الجميع في "أفضل نسخة من أنفسهم"؛ نسخة موجزة، احترافية، ولكنها -كما يعترف وارزل ومارتن- "غير حقيقية".

2. الفيديو كأداة للتحقق وبناء الثقة

مع الانتقال إلى الفيديو، تغيرت المعادلة. تضطر مارتن الآن للقلق بشأن الإضاءة، والماكياج، وعدم ارتداء ملابس النوم. لكن في المقابل، حصلت على "مدخلات" (Inputs) جديدة لم تكن متاحة سابقاً. تجادل مارتن بأننا نعيش في "عالم إعلامي منخفض الثقة" (Low-trust media world). المؤسسات الإخبارية التقليدية تعاني من أزمة مصداقية، والجمهور يشكك في "صوت الإله" السلطوي الذي يأتيهم عبر الأثير دون وجه. هنا يأتي دور الفيديو:

أنسنة الراوي: رؤية وجه المحاور تجعله بشرياً أكثر، مما يسهل على الضيف والجمهور منحه الثقة.

إثراء المعنى: لغة الجسد، الابتسامة، نقر القدم بتوتر، وطريقة استيعاب الضيف للسؤال، كلها عناصر بصرية تضيف طبقات من المعنى كانت تضيع في الصوت المجرد.

الشفافية: رؤية المحاور وهو يصارع الأفكار أو يتعثر في الحديث تجعل التجربة أكثر واقعية وصدقاً، وهو ما يتطلبه الجمهور اليوم.

3. العلاقات "شبه الاجتماعية" (Parasocial Relationships) وتعميق الارتباط

أحد أهم مخرجات هذا التحول هو تعميق ما يسمى بالعلاقات "شبه الاجتماعية". عندما يشاهد الجمهور المضيفين لساعات طويلة، يرون مساحات عملهم، ويلاحظون تعبيرات وجوههم الدقيقة، يتولد لديهم شعور بأنهم يعرفون هؤلاء الأشخاص معرفة شخصية. تعترف مارتن بأن برنامجها، الذي يتناول قضايا شخصية مثل الحزن والعلاقات العائلية، مصمم لتعزيز هذا النوع من العلاقات. في عالم يزداد عزلة، يوفر هذا الارتباط البصري بديلاً اجتماعياً، حيث يشعر المشاهدون بالاتصال ليس فقط بالمحتوى، بل بالشخص الذي يقدمه. الفيديو، بهذا المعنى، ليس مجرد تنسيق للنشر، بل هو نافذة تطل على ثقافة أكثر وحدة وتجزؤاً.

المحور الثاني: الاقتصاد السياسي للبودكاست.. صعود وسقوط "حمى الذهب"

لفهم كيف وصلنا إلى هذه اللحظة، تقدم "آشلي كارمان"، مراسلة بلومبرغ المتخصصة في اقتصاديات البودكاست، تتبعاً زمنياً دقيقاً لتحولات الصناعة. يمكن تقسيم هذا التاريخ إلى ثلاث حقب رئيسية:

1. حقبة "سيريال" (The Serial Era) - البدايات الثقافية

بدأ العصر الذهبي للبودكاست مع برنامج "Serial" في عام 2014. قبل ذلك، كان الاستماع للقصص الصوتية الطويلة حكراً على جمهور الإذاعة العامة. نجاح "Serial" حول البودكاست إلى ظاهرة ثقافية عامة (Watercooler talk) وتمت محاكاته في برامج مثل SNL. هذه اللحظة هي التي نبهت الوكلاء والشركات إلى وجود سوق محتملة.

2. حقبة الفقاعة والاستثمار المؤسسي (2019-2022)

بحلول عام 2019، دخلت شركات التكنولوجيا الكبرى (Spotify, Amazon, SiriusXM) السوق بقوة. قادت سبوتيفاي هذه الموجة، حيث أنفقت أكثر من مليار دولار على الاستحواذات والصفقات، مراهنة على أن البودكاست سيكون "النفط الجديد". كان الرهان الاقتصادي يعتمد على نموذج الإنتاج السردي عالي الجودة (Narrative Series)، مثل أعمال استوديوهات "Gimlet"، والتي أطلق عليها "HBO للبودكاست". هذه الأعمال تتطلب مراسلين، وسفراً، وأشهراً من التحرير، مما يجعل تكلفتها باهظة جداً. صدمت الصناعة بـ "وادي خيبة الأمل" (Trough of disillusionment) بدءاً من عام 2022. لم تحقق الاستثمارات العائدات المتوقعة، وفشلت فرضية أن خوارزميات الموسيقى في سبوتيفاي ستنجح في اكتشاف البودكاست بنفس الكفاءة. تبين أن اكتشاف محتوى صوتي جديد أمر صعب تقنياً وسلوكياً للمستخدِم.

3. حقبة يوتيوب: العملاق النائم واقتصاد "المقاطع" (The Clipper Economy)

بينما كانت المنصات الصوتية تعاني، كان يوتيوب ينمو بصمت كـ "عملاق نائم". خلال الجائحة، أدرك يوتيوب أن الناس يستهلكون البودكاست عبر الفيديو، فبدأ بدعم ذلك تقنياً. السر في تفوق يوتيوب يكمن في "الخوارزمية البصرية". اكتشف صناع المحتوى أن نشر مقاطع قصيرة (Clips) على تيك توك وYouTube Shorts هو الوسيلة الأنجع لجذب الجمهور. أدى هذا إلى ظهور اقتصاد جديد بالكامل: اقتصاد "القاصين" (Clippers). توظف القنوات الكبرى مثل Mr. Beast، وحتى شركات التسجيلات، أشخاصاً لاستخلاص أفضل اللحظات من الفيديوهات الطويلة ونشرها، مقابل مبالغ تصل إلى 50 دولاراً لكل 100 ألف مشاهدة. هذا الواقع الاقتصادي الجديد دفع نحو تغيير شكل المحتوى: من الوثائقيات الصوتية المكلفة (Narrative) إلى "برامج الدردشة" (Chat shows) التي تعتمد على شخصيات جالسة أمام ميكروفونات وكاميرات. إنه نموذج أقل تكلفة إنتاجياً (رغم تكلفة الفيديو)، ولكنه الأنسب لخوارزميات الانتشار الفيروسي.

المحور الثالث: النظرية الثقافية الكبرى.. "كل شيء هو تلفزيون"

ينقل "ديريك طومسون"، الكاتب ومضيف بودكاست "Plain English"، النقاش من المستوى الاقتصادي إلى مستوى التنظير الثقافي الشامل. يطرح طومسون نظريته الجريئة: "كل شيء أصبح تلفزيوناً" (Everything is television).

1. التلفزيون كـ "حالة جاذبة" (Attractor State)

يجادل طومسون بأن التلفزيون يمثل نقطة النهاية الحتمية أو "الحالة الجاذبة" لأي وسيلة إعلامية.

ميتا (Facebook): بدأت كدليل للطلاب، لكن عندما واجهت دعوى احتكار، دافعت عن نفسها أمام الحكومة الأمريكية بالقول إنها ليست شركة تواصل اجتماعي، بل شركة تتنافس مع التلفزيون، لأن معظم ما يشاهده الناس هو فيديو من غرباء.

الذكاء الاصطناعي: حتى الشركات التي تهدف لبناء "ذكاء خارق" (Superintelligence)، انتهى بها المطاف لإنتاج أدوات مثل "Sora" لتوليد الفيديو.. أي المزيد من التلفزيون.

البودكاست: بدأ كراديو للإنترنت، وانتهى كبرامج مصورة على يوتيوب ونتفليكس.

يستند طومسون إلى تعريف "ريموند ويليامز" للتلفزيون عام 1974 بأنه "تدفق مستمر للفيديو العرضي" (Continuous flow of episodic video). وفقاً لهذا التعريف، فإن تيك توك وريلز ويوتيوب هم "تلفزيون أكثر من التلفزيون نفسه".

2. التلفزيون كـ "ورق حائط" (Wallpaper Media) وتجربة الشاشة والنصف

لم يعد التلفزيون نشاطاً يتطلب التركيز الكامل (Lean-forward)، ولا حتى استرخاءً كاملاً (Lean-back). لقد أصبح "ورق حائط"؛ شيئاً يملأ الخلفية بينما نقوم بأشياء أخرى. يصف وارزل هذا الوضع بأنه تجربة "شاشة ونصف" (One-and-a-half-screen experience). الناس يشغلون يوتيوب على التلفزيون، لكنهم يتصفحون هواتفهم في نفس الوقت. وصل هذا التحول إلى درجة أن المديرين التنفيذيين في نتفليكس يطلبون من كتاب السيناريو جعل الشخصيات تشرح أفعالها بصوت عالٍ (Dialogues describing actions)، لكي يتمكن المشاهد الذي يعبث بهاتفه من متابعة القصة دون النظر للشاشة. المحتوى أصبح مصمماً ليكون "مسموعاً" بقدر ما هو "مشاهد"، لكن بطريقة سطحية تسمح بالتشتت.

3. المحاكاة الطفولية للتلفزيون

يرصد طومسون تغيراً في سلوك الأطفال يعكس هذا التحول. سابقاً، كان الأطفال يلعبون دور "الوحش والضحية". الآن، الأطفال الذين نشأوا على مشاهدة جون أوليفر ومذيعي الأخبار الساخرين، يلعبون دور "المذيع". إنهم يقلدون أسلوب الحديث المباشر للكاميرا، مستخدمين تيك توك كمنصة لبث نشراتهم الخاصة. هذا الجيل "ما بعد القراءة" (Post-literate) لا يرى الكتابة كوسيلة أساسية للتعبير، بل يرى الفيديو والظهور الكاريزمي أمام الكاميرا كطريقة وحيدة للتواصل.

المحور الرابع: الآثار الوجودية.. القرن المعادي للمجتمع ومستقبل "غريب وهائج"

في الختام، يناقش وارزل وطومسون التبعات النفسية والاجتماعية الخطيرة لهذا التحول، واصفين المستقبل بأنه "غريب وهائج" (Weird and berserk).

1. موت العزلة الحقيقية والخوف من الوعي الذاتي

يطرح طومسون سؤالاً مرعباً: "هل تحتاج حقاً للجلوس ساكناً بمفردك والاستماع لأفكارك؟". يبدو أن البشرية تتجه نحو إجابة بالنفي. لقد غيرت الوسائط مفهوم العزلة. عندما تكون وحيداً، أنت لست وحيداً فعلياً، بل أنت منخرط في شجار على وسائل التواصل الاجتماعي (وحدة اجتماعية مصطنعة). وعندما تكون مع الناس، يمكنك الانسحاب إلى هاتفك لتكون وحيداً. الأخطر من ذلك هو استخدام "تلفزيون الخلفية" (Wallpaper TV) كوسيلة للهروب من الذات. نحن نختار "تحميل أفكار أشخاص آخرين داخل أدمغتنا" بشكل مستمر لتجنب مواجهة "الأسئلة تحت الصوتية لوعينا الخاص" (Subvocal questions of our own consciousness). هذا القصف المستمر بأفكار الآخرين قد يكون له آثار مدمرة على الصحة العقلية.

2. هوس البث (Broadcasting) والنرجسية الجماعية

تشير الدراسات التي استشهد بها طومسون إلى أن طبيعة المحادثة تتغير عندما تنتقل من "واحد لواحد" إلى "واحد لآلاف". عندما نتحدث لشخص واحد، نسأل عنه. عندما نتحدث لآلاف (البث)، نتحدث عن أنفسنا. العالم الذي يدفع الجميع ليكونوا "صناع محتوى" أو "مذيعين" هو عالم يدفع نحو التمحور حول الذات. استطلاعات الرأي تظهر أن الجيل Z يرغب بشدة في أن يكون "مؤثرين" (Influencers). هذا يخلق بيئة ثقافية تفضل الكارثة، والمؤامرة، والسلبية، لأن هذه هي العملات الرابحة في "اقتصاد الانتباه".

3. السياسة كترفيه كارثي

انتقال هذا النموذج إلى السياسة يعني أن السياسيين أصبحوا يتصرفون كمؤثرين على تيك توك، مما يحول النقاش السياسي من مداولات رصينة إلى استعراضات تهدف لجذب الانتباه عبر إثارة الجدل. البودكاست السياسي المصور أصبح ساحة المعركة الجديدة، حيث يتم تشكيل الحجج وتحويلها إلى حركات سياسية، غالباً في سياق منعزل ومستقطب.

خاتمة: هل نحن "قردة شفهية" عائدة؟

تخلص المقالة إلى تساؤل جوهري حول طبيعة التطور البشري. ربما كانت "حقبة القراءة" (The literate world) مجرد فقاعة تاريخية قصيرة، ونحن الآن نعود لطبيعتنا كـ "قردة شفهية" (Oral apes)، حيث التلفزيون والفيديو هما الوسيط الطبيعي للتواصل. ورغم النظرة التشاؤمية لـ "القرن المعادي للمجتمع"، يتركنا طومسون مع بصيص أمل تاريخي. فكما أحدثت المطبعة حروباً واضطرابات في أوروبا قبل أن تستقر فوائدها، قد نكون نمر الآن بمرحلة "زعزعة الاستقرار" الخاصة بتكنولوجيا الفيديو القصير. في النهاية، الإجابة على "لماذا ترون وجهي؟" ليست تقنية فقط. نحن نرى الوجوه لأننا نبحث عن الثقة في عالم مكسور، ولأننا نهرب من وحدتنا، ولأن الخوارزميات الاقتصادية وجدت أن "الوجه" هو السلعة الأكثر رواجاً في سوق الانتباه البشري. نحن نتجه نحو مستقبل حيث الفيديو ليس مجرد تنسيق، بل هو الغلاف الجوي الذي نتنفسه، في ثقافة متشرذمة، وحيدة، وتلفزيونية بالكامل.

* المصدر: theatlantic.com

ذات صلة

البصيرة التي أقنعت العقول.. قراءة تحليلية في كتاب (كيف ولماذا أسلموا؟)التركيب المعنوي في منهج الكتاب والعترةمشاريعنا: باب غير قابل للغلقعلم اقتصاد المعنى: بين القلم والممحاةماذا يأتي بعد محور المقاومة؟