تقارير صحفيه

الذكاء الاصطناعي من معالجة النصوص لإنتاج الفيديو – تجربة واقعية

سلوي احمد

محرر تقني • مارس 25, 2026

ثورة الذكاء الاصطناعي التوليدي - من كتابة النصوص إلى صناعة الفيديو السينمائي

في الأوساط التقنية اليوم، لا صوت يعلو فوق الحديث عن الذكاء الاصطناعي. البعض يراه عصا سحرية ستنجز كل أعمالنا، والبعض الآخر يروج له كبديل كامل للبشر. بصفتي مراجعاً تقنياً أقضي ساعات طويلة في اختبار هذه الأدوات لموقع uptoz، وكاتباً يحاول إيجاد وقت لإكمال مقالاته، قررت أن أضع هذه التقنيات تحت المجهر بعيداً عن ضجيج التسويق.

في إحدى الليالي، كنت أعمل على كتابة مقال، وكنت أواجه صعوبة في وصف تجربة معينه بدقة. جربت استخدام أدوات الذكاء الاصطناعي للمساعدة في صياغة التجربه وتوليد صورة تقريبية لها. النتيجة كانت مفيدة، لكنها لم تكن السحر الذي تروج له الإعلانات؛ بل كانت أداة تحتاج إلى توجيه دقيق، وتعديل بشري مستمر، وفهم واضح لحدود التقنية. في هذا الدليل الشامل والمبسط، سأشارككم تجربتي الواقعية في استخدام أدوات الذكاء الاصطناعي، بدءاً من كتابة النصوص وحتى محاولات توليد الفيديو، لنتعرف على ما يمكن لهذه الأدوات فعله حقاً، وما تفشل فيه بوضوح.

1. النماذج اللغوية (LLMs): المساعد الآلي وليس الكاتب البديل

لنبدأ بالأساسيات: معالجة النصوص. الأدوات الشهيرة تعتمد على ما يُعرف بـ “النماذج اللغوية الكبيرة”. الفكرة التقنية ببساطة هي أن المبرمجين قاموا بتغذية أجهزة كمبيوتر عملاقة بملايين النصوص من الإنترنت، لتقوم الآلة بتحليل احتمالات الكلمات وتوقع الكلمة التالية في الجملة بناءً على السياق.

الكثير من المسوقين يخبرونك أن هذه الأدوات يمكنها كتابة مقالات حصرية لموقعك أو تأليف كتاب كامل بضغطة زر. من واقع تجربتي، هذا الطرح غير دقيق ونتائجه سيئة جداً.

الاستخدام الواقعي والفعلي:

  • تجاوز حاجز البداية: عندما أبدأ في التخطيط لمقال جديد في موقعنا، أحياناً أواجه صعوبة في ترتيب الأفكار. هنا يكون الذكاء الاصطناعي مفيداً لاقتراح هيكل للمقال (عناوين رئيسية وفرعية)، أستخدمها كمسودة أولية قابلة للتعديل.
  • التلخيص واستخراج البيانات: إذا كان لدي تقرير تقني طويل باللغة الإنجليزية عن معالج هاتف جديد، يمكنني إدخال النص للأداة والطلب منها استخراج أهم 5 مواصفات فنية. هذه الميزة توفر وقت القراءة الروتيني.
  • المراجعة اللغوية: أستخدمه أحياناً للتدقيق الإملائي أو لاقتراح مرادفات لبعض الكلمات أثناء صياغة فصول من مسودة مقال، لكي لا يتكرر نفس اللفظ في فقرة واحدة.

العيوب التي لا يخبرك بها أحد:

هذه النماذج تعاني مما يسمى بالـ “هلوسة”. في كثير من الأحيان، إذا سألت الأداة عن معلومة تقنية دقيقة أو مواصفات هاتف غير معروف جيداً، ستقوم بتأليف أرقام ومواصفات تبدو مقنعة جداً لكنها خاطئة تماماً. لذلك، ككاتب محتوى، الاعتماد الأعمى على هذه الأدوات دون مراجعة الحقائق هو أسرع طريق لتدمير مصداقية موقعك.

2. توليد الصور: بين بساطة الأوامر وتعقيد النتائج

المرحلة الثانية من التطور كانت قدرة الآلة على فهم النص وتحويله إلى صورة. التقنية المستخدمة هنا تُعرف باسم “نماذج الانتشار” باختصار شديد دون تعقيد هندسي: الآلة لا ترسم الصورة، بل تبدأ بصورة مليئة بالتشويش ، وتقوم بتصفية هذا التشويش تدريجياً بناءً على الكلمات التي كتبتها في الأمر (Prompt) حتى تظهر الملامح المطلوبة.

تجربتي العملية مع توليد الصور:

كثيراً ما أحتاج إلى صور توضيحية خالية من حقوق الطبع والنشر لمقالات uptoz، أو أحاول تخيل غلاف مبدئي لرواية. عند كتابة أمر مثل: “صورة لمكتب خشبي عليه هاتف قديم في غرفة إضاءتها خافتة”، يمكنني الحصول على نتيجة مقبولة لاستخدامها كصورة بارزة للمقال.

صوره من تجربة جيمناي

أين تكمن المشكلة الحقيقية في الصور المولدة؟

  • التفاصيل الدقيقة: الذكاء الاصطناعي حتى الآن يواجه مشاكل ملحوظة في فهم تشريح الجسم البشري. كثيراً ما تظهر الصور بأيادي تحتوي على ستة أصابع، أو عيون غير متناسقة.
  • النصوص داخل الصور: إذا طلبت من الأداة تصميم صورة تحتوي على كلمة معينة، كأن أطلب كتابة “رسائل من المجهول” على غلاف كتاب، فإن النتيجة غالباً ما تكون حروفاً مشوهة ولا معنى لها، مما يضطرني للجوء لبرامج تعديل الصور التقليدية لإضافة النص بنفسي.
  • غياب الاستمرارية: إذا قمت بتوليد صورة لشخصية معينة، من شبه المستحيل أن تجعل الأداة تولد نفس الشخصية بنفس الملامح في وضعيات مختلفة بضغطة زر واحدة. كل صورة هي نتيجة عشوائية جديدة.
صوره من تجربة جيمناي

3. محاولات توليد الفيديو: الحقيقة وراء المقاطع القصيرة

الخطوة الأحدث التي تملأ شبكات التواصل الاجتماعي هي توليد الفيديو. الإعلانات توحي بأنك تستطيع كتابة سيناريو كامل وسيقوم الذكاء الاصطناعي بإخراج فيلم سينمائي لك. الحقيقة التقنية أبعد ما تكون عن ذلك.

توليد الفيديو هو امتداد لتوليد الصور، ولكنه يتطلب معالجة عشرات الصور المتعاقبة  مع محاولة الحفاظ على ترابطها. التحدي الأكبر هنا هو ما يسمى بـ “الاتساق الزمني”

واقع استخدام أدوات الفيديو اليوم:

قمت باختبار العديد من هذه المنصات. عندما أكتب أمراً لتوليد فيديو مدته 3 أو 4 ثوانٍ، قد أحصل على نتيجة مبدئية جيدة، مثل “لقطة مقربة لكوب قهوة يتصاعد منه البخار”. أستخدم هذه المقاطع أحياناً كفواصل بصرية بسيطة.

لماذا لا يزال توليد الفيديو في مراحله الأولى؟

  • تشوه الحركة: بمجرد أن يتحرك العنصر الأساسي في الفيديو، تبدأ الأبعاد في التشوه. الشخص الذي يسير قد تندمج قدمه مع الأرض، أو تتغير ملامح وجهه من إطار لآخر.
  • التكلفة المرتفعة ووقت المعالجة: هذه العملية تتطلب قوة حوسبة سحابية هائلة. توليد مقطع من 5 ثوانٍ قد يستغرق دقائق من الانتظار، ومعظم هذه المنصات تقدم خدماتها بأسعار مرتفعة لا تناسب صناع المحتوى المبتدئين.
  • الافتقار للتحكم الدقيق: لا يمكنك تحديد زاوية الكاميرا بدقة، أو التحكم في توقيت حركة معينة. أنت تصف المشهد عامة، والآلة تعتمد على التخمين، مما يعني أنك قد تضطر لتكرار المحاولة (ودفع تكلفة المحاولة) عشرات المرات للحصول على لقطة واحدة قابلة للاستخدام.

4. الأجهزة المطلوبة: هل هاتفك قادر على تشغيل هذه الأدوات؟

بصفتي أستخدم هاتف بسيط في عملي،  هل أحتاج لكمبيوتر بمواصفات عالية أو هاتف غالي الثمن لاستخدام الذكاء الاصطناعي؟

الإجابة التقنية هي: لا. معظم هذه الأدوات (سواء لتوليد النصوص أو الصور أو الفيديو) لا تعمل فعلياً على معالج هاتفك. هي تعتمد على ما يسمى بالمعالجة السحابية (Cloud Computing). وظيفة هاتفك أو حاسوبك تقتصر فقط على إرسال الأمر (النص الذي كتبته) عبر الإنترنت، واستقبال النتيجة النهائية التي تمت معالجتها على خوادم الشركات الكبرى.

الشيء الوحيد الذي تحتاجه هو اتصال مستقر بالإنترنت، ومتصفح ويب محدث، لتتمكن من استخدام هذه التقنيات دون القلق بشأن استنزاف بطارية جهازك أو ارتفاع حرارة معالجه.

صوره من تجربة جيمناي

5. الجانب القانوني والعملي: حقوق الملكية الفكرية

ككاتب في موقع يهتم بسلامة المحتوى من المخالفات، هذه هي النقطة الأكثر أهمية وحساسية. أدوات الذكاء الاصطناعي تم تدريبها على مواد موجودة مسبقاً على الإنترنت دون أخذ إذن صريح من أصحابها.

هذا يطرح مشكلة حقيقية: لمن تعود حقوق الصورة التي قمت بتوليدها؟ في الوقت الحالي، لا تزال القوانين العالمية غير واضحة المعالم. ولكن، كقاعدة عملية أتبعها في موقع uptoz لتجنب المشاكل:

  • لا أعتمد على الصور المولدة كشعارات رسمية للموقع أو لعلامة تجارية، لأن حقوق تسجيلها كعلامة تجارية أمر معقد قانونياً.
  • أبتعد تماماً عن كتابة أسماء شخصيات حقيقية أو فنانين في أوامر توليد الصور لتجنب انتهاك حقوقهم الشخصية.
  • أعتبر الصور المولدة مجرد عناصر توضيحية للمقالات، ولا أتعامل معها كأعمال فنية حصرية تمتلك حصانة قانونية كاملة.

6. كيف تبدأ بشكل صحيح؟ (نصائح للمبتدئين)

إذا كنت ترغب في دمج هذه الأدوات في عملك اليومي دون أن تضيع وقتك أو أموالك، إليك خطوات عملية مبسطة:

  1. ابدأ بالأدوات المجانية: لا تقم بشراء اشتراكات باهظة في منصات توليد الفيديو أو الصور الاحترافية قبل أن تفهم الأساسيات. ابدأ بالمنصات المدمجة والمجانية المتوفرة في محركات البحث.
  2. تعلم كيفية كتابة البرومبت : جودة النتيجة تعتمد بنسبة 90% على دقة ما تكتبه. كن محدداً في طلبك. بدلاً من كتابة “اكتب لي مقالاً عن الهواتف”، اكتب: “قدم لي 5 نقاط رئيسية لمقارنة بين شاشات الهواتف بأسلوب مبسط”.
  3. التعامل معها كمسودة: القاعدة الذهبية لأي صانع محتوى هي أن ما ينتجه الذكاء الاصطناعي هو نقطة انطلاق وليس منتجاً نهائياً. استخدمه لتسريع المهام الروتينية، ثم ضع لمستك البشرية، وخبرتك الشخصية، وأسلوبك الخاص في التعديل.

رأي الكاتب

تقنيات الذكاء الاصطناعي التوليدي هي إضافة مفيدة لصندوق أدواتنا الرقمي، لكنها بالتأكيد ليست الحل السحري لكل شيء. هي توفر الوقت في المهام المتكررة، وتساعد في العصف الذهني، وتنتج صوراً توضيحية مقبولة، لكنها لا تزال تفتقر للمنطق البشري، والاستمرارية الدقيقة، والقدرة على إنتاج أعمال إبداعية كاملة دون توجيه وتصحيح مستمر.

كمستثمرين في صناعة المحتوى، يجب أن نتعامل مع هذه التقنيات كـ “مساعدين تحت التدريب” يحتاجون للمراقبة، وليس كبدائل لنا. استغلال هذه الأدوات بذكاء وواقعية هو ما يميز صانع المحتوى الذي يواكب التطور، عن الذي ينخدع بوعود التسويق المبالغ فيها.

شاركونا في التعليقات: ما هي أكثر مهمة حاولتم إنجازها باستخدام الذكاء الاصطناعي وكانت نتيجتها مخيبة للآمال؟ وكيف تعاملتم معها؟ ننتظر تجاربكم الواقعية في uptoz.