كيف تنشئ صورا واقعية بالذكاء الاصطناعي دون مهارات تصميم؟ | تكنولوجيا

Published On 24/5/202624/5/2026|آخر تحديث: 15:38 (توقيت مكة)آخر تحديث: 15:38 (توقيت مكة)شهدت تكنولوجيا توليد الصور من النصوص قفزة نوعية مدفوعة بنماذج الانتشار والتحليل الذاتي التلقائي، حيث لم يعد توليد صور تحاكي الواقع الفوتوغرافي يتطلب مهارات في برامج التصميم المعقدة مثل فوتوشوب، بل تحول الأمر إلى علم يعرف بهندسة الوصف يعتمد على صياغة شيفرات لغوية دقيقة وممنهجة لتوجيه نماذج الذكاء الاصطناعي لاستخراج تفاصيل بصرية معقدة بدقة مذهلة.وتشير الدراسات التجريبية المنشورة في منصات البحث التقني إلى أن نماذج توليد الصور تمنح الكلمات الأولى في الوصف وزنا تقنيا أكبر مقارنة بالكلمات الأخيرة، مما يتطلب ترتيبا تسلسليا دقيقا لعناصر الوصف. فالبنية الرياضية والتقنية المثالية لبناء وصف فائق الواقعية تتكون من العناصر التالية:
الموضوع الأساسي: تحديد الكائن المحوري إن كان إنسانا أو منتجا أو مبنى أو أي شيء آخر، مع تفاصيل مجهرية مثل ملمس البشرة، والمسام، والخطوط الدقيقة.
البيئة والمحيط: تحديد الخلفية، والطقس، وتشتت الضوء في المكان، والتفاعل الفيزيائي بين الكائن والمحيط.
هندسة الإضاءة: العنصر الأكثر حساسية للواقعية، مثل نماذج  ميدجورني (Midjourney) حيث أصبحت تفهم المصطلحات الفيزيائية للضوء بدقة عالية مثل “الإضاءة الجانبية في الساعة الذهبية” (Golden hour side lighting)، وهي الفترة الزمنية التي تلي شروق الشمس مباشرة أو تسبق غروبها.
محاكاة الكاميرا والعدسات: من خلال خداع النموذج عبر تقديم مواصفات تقنية لعدسات حقيقية مثل عدسات 85 ملم أو 35 ملم الفاخرة لتوليد عمق ميداني وعزل طبيعي لخلفية الصورة بوكيه.
نجاح الصورة الواقعية يعتمد بالدرجة الأولى على جودة وهيكلية “الوصف النصي” الموجه للنموذج (شترستوك)

تقنية الأوزان والأوصاف السلبية

وفقا لأبحاث تطوير الألعاب والتصميم الرقمي، تتيح بعض النماذج مثل ستايبل ديفيوجن (Stable Diffusion) وفلوكس (Flux) التحكم في قوة الكلمات باستخدام الأقواس والمعاملات الرقمية، مثل زيادة تركيز تفصيل معين عبر كتابته بصيغة (keyword:1.2). بالمقابل، تستخدم الأوصاف السلبية لاستبعاد التشوهات ومنع النموذج من توليد أخطاء بصرية مثل الأيدي المشوهة أو المظهر البلاستيكي غير الطبيعي.

المحركات القائدة لثورة الواقعية

لتوليد صورة واقعية، يجب أولا اختيار “المحرك” المناسب، فالنماذج الرائدة حاليا تعتمد على تقنيات انتشار متطورة (Diffusion Models) وأخرى تعتمد على المحولات (Transformers):

ميدجورني في 6: يصنف عالميا بأنه الأقوى في محاكاة التفاصيل البشرية العميقة، مثل مسام الجلد، وانعكاس الضوء على قزحية العين، وتأثيرات الإضاءة السينمائية.
دال-إي 3 (DALL-E 3) من أوبن إيه آي: يتميز بفهم استثنائي للغة الطبيعية بفضل دمجه مع هندسة تشات جي بي تي (ChatGPT)، مما يجعله الأفضل في تطبيق التوجيهات المعقدة بدقة متناهية، وفقا لمراجعات منصة إم آي تي تكنولوجي ريفيو (MIT Technology Review).
إيماجن 3 (Imagen 3) من غوغل: يركز بشكل كبير على الواقعية الفوتوغرافية العالية وتجنب العيوب الشائعة في النصوص المكتوبة داخل الصور، مع الالتزام بمعايير الأمان المتقدمة وتضمين العلامات المائية الرقمية مثل “سينث آي دي” (SynthID).

اقرأ أيضاً
مطور Dawn of War IV لا يرى أن لعبة Total War: Warhammer 40,000 تمثل منافسًا مباشرًا

مطور Dawn of War IV لا يرى أن لعبة Total War: Warhammer 40,000 تمثل منافسًا مباشرًا

كيف تكتب وصفا احترافيا؟

السر لا يكمن في كتابة وصف طويل، بل في كتابة وصف هيكلي، فوفقا لدليلي التصميم الصادرين عن مجتمع ميدجورني ومركز أبحاث أوبن إيه آي، تنقسم صياغة الأمر الواقعي إلى خمسة عناصر أساسية:1- الموضوع الأساسي

ابدأ بتحديد دقيق جدا للموضوع دون تعميم، فبدلا من كتابة “رجل عجوز”، اكتب “رجل عجوز يبلغ من العمر 70 عاما، تظهر على وجهه تجاعيد عميقة ونظرة حكيمة”.2- بيئة العمل والإضاءة 

الإضاءة هي الفارق الجوهري بين الصورة التي تبدو كرسوم حاسوبية (CGI) والصورة الحقيقية، ولذلك استخدم مصطلحات التصوير الاحترافي:
Golden Hour Light: إضاءة الساعة الذهبية قبل الغروب التي تمنح دفئا وظلالا ناعمة.
Cinematic Lighting / Rim Lighting: إضاءة سينمائية تبرز حواف الجسد وفصله عن الخلفية.
Volumetric Light: الإضاءة الحجمية مثل أشعة الشمس المخترقة للضباب.
3- إعدادات الكاميرا والعدسة

محاكاة الكاميرات الحقيقية تخدع خوارزميات الذكاء الاصطناعي لإنتاج عمق ميدان واقعي:
العدسة: تحديد عدسة مثل 85mm lens أو 50mm f/1.2 يمنحك عزل خلفية بوكيه (Bokeh) احترافيا ومثاليا للبورتريه.
نوع اللقطة: لقطة قريبة جدا (Close-up shot) أو لقطة ماكرو (Macro shot) للتفاصيل الدقيقة.
نوع الكاميرا: الإشارة إلى كاميرات مثل Shot on DSLR camera أو Sony A7R V يوجه النموذج لمحاكاة جودة المستشعرات الاحترافية.
4- التفاصيل الدقيقة والخلفية

لتحقيق الواقعية الفائقة، اطلب تفاصيل مجهرية تمنع السطح الأملس الزائف (Plastic Look):
أضف مصطلحات مثل: photorealistic, skin texture, hyper-detailed pores, subtle imperfections.
تحديد الخلفية بدقة: “في خلفية تظهر شوارع مدينة ممطرة ومصادر إضاءة نيون غير واضحة التركيز (blurred Neon lights)”.
نوع الإضاءة مثل “إضاءة الساعة الذهبية” أو “الإضاءة السينمائية”، يمنح الصورة عمقا واقعيا ويخفي المظهر الزائف (شترستوك)

شاهد أيضاً
تصميم فايرفوكس الجديد يمنحك السيطرة الكاملة على الذكاء الاصطناعي بضغطة زر

تصميم فايرفوكس الجديد يمنحك السيطرة الكاملة على الذكاء الاصطناعي بضغطة زر

الهيكل النموذجي للأمر

إليك الصيغة الهيكلية التي يمكنك محاكاتها باللغة الإنجليزية، لأن النماذج تتفوق في فهمها:

[Subject] + [Environment/Background] + [Lighting] + [Camera/Lens] + [Style/Quality Details]

مثال تطبيقي لـ بورتريه سينمائي واقعي:

“A close-up photographic portrait of a 30-year-old female astronaut, sweat drops on her skin, looking through a spacecraft window at planet Earth. Soft cinematic volumetric lighting, shot on 85mm lens, f/1.8, photorealistic, hyper-detailed skin texture, 8k resolution.”

قد يهمك
ميزات Assassin’s Creed Black Flag Re المتزامنة شاشة التحميل في حالة سكر

ميزات Assassin’s Creed Black Flag Re المتزامنة شاشة التحميل في حالة سكر

وترجمة النص أعلاه هي:
صورة فوتوغرافية مقرّبة لرائدة فضاء تبلغ من العمر 30 عاما، تظهر قطرات العرق على بشرتها، وهي تنظر من خلال نافذة مركبة فضائية إلى كوكب الأرض. إضاءة سينمائية ناعمة، تم التقاطها بعدسة 85 ملم، f/1.8، واقعية للغاية، نسيج بشرة فائق التفاصيل، دقة 8K.

تقنيات متقدمة بدون كود

إذا كنت تستخدم أدوات مثل ميدجورني أو ستايبل ديفيوجن عبر واجهات مبسطة، فهناك حيلتان ترفعان الجودة فورا:
الأوامر السلبية: وهي إخبار الذكاء الاصطناعي بما لا تريده في الصورة. لمنع العيوب الشائعة، أضف في خانة الأوامر السلبية: ugly, deformed hands, extra fingers, blurry, CGI, 3D render, plastic skin, mutation. (أياد قبيحة مشوهة، أصابع زائدة، ضبابية، مؤثرات بصرية حاسوبية، عرض ثلاثي الأبعاد، جلد بلاستيكي، طفرة جينية).
معامل الواقعية: استخدام أمر –s 50 أو تقليله يمنحك صورة أقرب للواقع الفوتوغرافي الخام، بينما ترفع القيم العالية (–s 750) النزعة الفنية والجمالية على حساب الواقعية الحقيقية وفقا للوثائق الرسمية لميدجورني.
الأوامر السلبية تساعد في توجيه الخوارزميات لاستبعاد التشويه، والأطراف الزائدة، والرسومات ثلاثية الأبعاد (شترستوك)

معالجة الإشكالية الأكبر.. الأيدي والعيون والنصوص

تاريخيا، عانت نماذج الذكاء الاصطناعي من توليد أيدي بـ 6 أصابع أو عيون مشوهة، فقد وضح تقرير لموقع تيك كرنتش أن الأجيال الجديدة مثل ميدجورني الجيل السادس ودال-إي 3 حلت هذه المشكلة بنسبة تتجاوز 90% عبر زيادة تدريب النماذج على تشريح الجسد البشري.

لكن في حال واجهت مشكلة في الأيدي، عليك أن تستخدم أدوات “إعادة التوليد الموضعي” المتاحة في معظم المنصات الآن، وذلك من خلال تظليل اليد المعيبة فقط، واطلب من الذكاء الاصطناعي إعادة توليدها منفردة مع كتابة perfectly anatomically correct hand.

كاتب المقال

صحفي متخصص في الشأن السعودي أكتب من 15 سنة وأعمل بالعديد من المواقع في جميع المجالات وانقل الأخبار بحيادية تامة وأفضل الكتابة في الموضوعات الإخبارية سواء علي المستوي المحلي أو العالمي واعشق السفر والتنقل والسيارات وأحب الإطلاع على كل جديد