تحميل لدينا الذكاء الاصطناعي في الأعمال | تقرير الاتجاهات العالمية 2023 والبقاء في الطليعة!

الذكاء الاصطناعي وبيانات الصور: من الخيال إلى الجدية

جلسة استشارية مجانية في مجال الذكاء الاصطناعي

في الآونة الأخيرة، دخلت نماذج التعلم الآلي بثقة إلى مرحلة جديدة من تطورها. في الأصل، ظهرت كمصنفات ومتنبئات، لكنها الآن يمكنها توليد بيانات جديدة تمامًا من تلقاء نفسها.

وقد أصبح ذلك ممكنًا من خلال توسيع التعلم غير الخاضع للرقابة إلى النمذجة التوليدية التي يمكن تطبيقها على البيانات المرئية.

في هذه المقالة، سنشرح أي نوع من العقل الاصطناعي يدفع إلى توليد الصور وما هي الآثار المترتبة عليه، بدءًا من الثقافة الشعبية وحتى الصناعات المنقذة للحياة.
ما هي شبكات الخصومة التوليدية؟
أثبتت شبكات الخصومة التوليدية (GANs) أنها واحدة من أكثر معالجات الصور كفاءة.

شبكات GAN هي شبكات عصبية تعمل في أزواج.

كل زوج لديه مولد ومميز. يستهلك المولد بيانات التدريب ثم يقوم بإنشاء بيانات جديدة يجب أن تمتلك نفس صفات مجموعة البيانات الأصلية وستمر على أنها طبيعية للبشر. على سبيل المثال، إذا تم تغذية المولد بصور قطط، فيجب أن يولد صورة قطة جديدة تمامًا ذات مظهر طبيعي.

ومع ذلك، ليس الإنسان هو الذي يقيم طبيعة البيانات التي تم إنشاؤها. وهذه هي مهمة الشبكة الثانية: المُميِّز. يستهلك المُميِّز كلا من بيانات التدريب بالإضافة إلى مخرجات المولد. فهو إما يوافق أو يرفض مخرجات المولد باعتبارها مزيفة. تنخرط الشبكتان في سباق تطوري معروف من الطبيعة حيث يطور المفترس قدرات على الصيد بشكل أفضل بينما تطور ضحيته قدرات أفضل على الهروب.

بمجرد أن يقوم جهاز التمييز بوضع علامة على الإدخال على أنه مزيف ومزيف، يقوم المولد بتحديث خوارزمية التوليد الخاصة به لتزييف البيانات بشكل أكثر كفاءة. الهدف من التدريب هو جعل المولد مثاليًا في التزييف.

لكن التزييف لا يعني الضرر في هذه الحالة. فهو يساعد على سد الفجوات في البيانات المرئية للأبد.
تطبيقات GAN (البوب) الثقافية
في الوقت الحاضر، ليس من الضروري أن تكون جزءًا من صناعة الذكاء الاصطناعي لتتمكن من التواصل مع تقنيات معالجة الصور.

تذكر القطة؟ تسمى هذه الصور التزييف العميق. تُستخدم تقنية Deepfakes، على سبيل المثال، في صناعة الأفلام. في Star Wars، استبدل صانعو الأفلام الممثلة الميتة كاري فيشر بتزييفها العميق لإدراج مشهد مع الأميرة ليا في أحد العناصر العرضية للملحمة.

تزدهر صناعة الهاتف المحمول والإنترنت بالتطبيقات التي تتيح لك جعل صورك الشخصية تبدو على طراز Van-Gogh باستخدام تقنية نقل النمط. يقوم العلماء أو الأشخاص الفضوليون ببساطة بتلوين الصور بالأبيض والأسود لإعادة بناء تاريخ وذكريات عائلاتهم أو الأحداث المهمة من الماضي.

حتى أن شبكات GAN اتخذت خطوة أخرى نحو عقل مستقل تمامًا من خلال تمكين الذكاء الاصطناعي من إنشاء صور بناءً على تعليمات مكتوبة. والعكس صحيح أيضًا: قم بإعطاء GAN صورة وسوف يخبرك بلغة طبيعية من أو ما الذي تم تصويره عليها.

دعونا نلقي نظرة عميقة على كيفية عمل كل شيء.

كيف تعمل شبكات GAN في الصناعات الحيوية

التكيف المجال: الطب والصيدلة

لقد ذكرنا ترجمة الصورة إلى نص أو ترجمة النص إلى تخيل في الجزء السابق. علاوة على ذلك، فإن الترجمة من صورة إلى صورة ممكنة أيضًا. يعد نقل الأسلوب لأغراض الترفيه جزءًا واحدًا فقط منه.

في الصناعات الحيوية، مثل الرعاية الطبية، ترجمة من صورة إلى صورة يمكن استخدامها لتسهيل البحث والعلاج الفعلي للمرضى. على سبيل المثال، يسمح تحليل الأنسجة بتتبع تقدم المرض وتحديد العلاج الأكثر فعالية. أثناء التحليل، يتم تلوين الأنسجة بكاشف. ومع ذلك، توجد الكواشف المختلفة لهذا الغرض. سوف يستغرق الأمر الكثير من الوقت والجهد لجمع صور حقيقية لجميع الاختلافات المحتملة لتقدم المرض والأنسجة الملطخة بجميع الكواشف المتاحة.

وبدلاً من ذلك، تسمح الترجمة من صورة إلى صورة بإنشاء مثل هذه الصور بمستوى عالٍ من الدقة. في AI Superior، كنا فخورين بالحصول على مثل هذه التجربة من خلال إجراء عملية نقل البقع: معالجة صور الأنسجة السرطانية، يؤدي لشركة الأدوية. كان التحدي الأكبر لهذا المشروع هو عدم وجود أي صور مقترنة توضح كيف يبدو النسيج نفسه بعد معالجته بواسطة كواشف مختلفة. ومع ذلك، استفاد فريق الذكاء الاصطناعي المتفوق من أحدث التقنيات للتغلب على هذه المشكلة وأنشأ شبكة GAN تمكنت من إنشاء صور واقعية لمجال آخر مع الحفاظ على الخصائص المهمة لمزيد من التحليل.

التكيف المجال: التحليلات الجغرافية المكانية

المجال الكامل الآخر لخدماتنا الذي يتضمن شبكات GAN هو التحليلات الجغرافية المكانية. بالنسبة للكيانات المهتمة بعمليات التفتيش الخارجية، بما في ذلك شركات التطوير، ومشغلي المتنزهات الوطنية، وبلديات المدن، وشركات النفط والغاز، وما إلى ذلك، فإننا نساعد على ترجمة بيانات رادار الفتحة الاصطناعية المقدمة من الأقمار الصناعية إلى بيانات مرئية صديقة للإنسان، سواء بالتدرج الرمادي أو لون. يرى عملاؤنا المشهد الطبيعي أو الصناعي كما هو موجود على أرض الواقع تمامًا. تسمح هذه التقنية باتخاذ قرارات أسرع باستخدام طرق عرض الخريطة التي لا تتطلب أي تفسير. علاوة على ذلك، يمكن تراكب البيانات الجغرافية المكانية مع بيانات غير مكانية أو وضع علامات عليها. تقوم العلامات بتصنيف الأشياء المادية مما يتيح لك اكتشاف التناقضات بسرعة، مثل كائن لا ينتمي إلى المنطقة مما يقلل الجهد اليدوي ويقلل وقت الاستجابة.

يعمل هذا بشكل مثالي لكل من المرافق المستخدمة تجاريًا وغير التجارية، مما يمنع الضرر المادي من الانتشار أو من إحداث تأثير سلبي.

معالجة الصور وتحسينها

وبصرف النظر عن هذين المجالين المحددين تمامًا، فإن العديد من التطبيقات عبر النطاقات لشبكات GAN ممكنة لمختلف الصناعات.

في الأساس، تسمح شبكات GAN بمعالجة الصور استنادًا إلى "الفهم" المُدرب لـ GAN لما يجب أن تكون عليه الصورة المثالية أو المناسبة.

على سبيل المثال، يمكن للصور غير المكتملة استعادة أجزائها المفقودة، أو يمكن إعادة الأجزاء التالفة من الصورة - في كثير من الأحيان، من صورة فوتوغرافية أو عمل فني قديم - إلى وضعها السابق. هذه التقنية تسمى الصورة في الرسم ويتناول احتياجات العديد من العلماء والمرممين والأشخاص العاديين وأي شخص مهتم بتعزيز الصور الرقمية، سواء كانت رقمية خالصة أو بقطع أثرية مادية وراءها.

بعد ذلك، تنقل شبكات GAN التقنيات المعروفة من برنامج Photoshop والبرامج المشابهة إلى مستوى جديد. إنها تسمح بجعل الصور الباهتة أكثر وضوحًا. يمكن لشبكات GAN زيادة دقة الصورة بشكل مصطنع عن طريق إضافة أجزاء صغيرة من الصورة، لا يمكن تتبعها للعين البشرية، عن طريق استعارتها من صورة مماثلة تعلمتها سابقًا.

لا تستطيع شبكات GAN الإضافة إلى الصورة فحسب، بل يمكنها أيضًا إزالة أجزاء الصورة واستبدالها بما هو أكثر ملاءمة. يمكنهم مسح بقع الأوساخ من النسخ الرقمية للصور القديمة، أو الأهم من ذلك، السلوك تقليل الضوضاء من الصور. محققو الجرائم هم بالتأكيد من يمكنهم الاستفادة من هذه التقنية.

توليد البيانات الاصطناعية

من خلال القدرة على توليد بيانات مرئية، تساعد شبكات الخصومة التوليدية الشبكات العصبية الأخرى على التعلم وتساعد منشئيها في الحصول على مجموعات بيانات غير مكلفة وواقعية لهم. ومن الأمثلة الساطعة على ذلك خوارزميات التعرف على الصور المضمنة في السيارات ذاتية القيادة والتي تحتاج إلى الكثير من العناصر المرئية لتعلم التنقل بأمان بين الكم الهائل من الأشياء الواقعية، الحية منها والاصطناعية.

قد تكون البيانات المرئية الاصطناعية مفيدة في إخفاء هوية البيانات الحقيقية. نعلم جميعًا مشكلة Google Street View. إنه لأمر عظيم أن ترغب في معرفة مكان بعيد بشكل أفضل، ولكنه شر إذا علق وجهك به. في الوقت الحالي، تقوم جوجل بطمس الوجوه ولوحات الترخيص، ولكن بالنظر إلى المستقبل سيكون من الرائع استبدال الوجوه الحقيقية بالوجوه المزيفة العميقة: أشخاص غير موجودين لا يهتمون بخصوصياتهم.

ومن المثير للاهتمام أن أحد مجالات تطبيق البيانات الاصطناعية كان أقوى قاعدة للإبداع البشري: الموضة. ومع ذلك، لأي سبب من الأسباب، يبدو أن الموضة تتبنى خوارزميات الذكاء الاصطناعي عن طيب خاطر. ولكن أقل لتوليد أفكار جديدة تمامًا. وعلى غرار صانعي ألعاب الفيديو، يلجأ مصممو الأزياء إلى الذكاء الاصطناعي لتقليد السلوك الطبيعي للملابس على جسم الإنسان. يسمح ذلك بالتنبؤ بشعبية الملابس الجديدة، حيث لا يهم مظهرها العملاء فحسب، بل أيضًا كيفية تماسك القماش على أجسادهم

تشفير وفك تشفير البيانات

توصلت Nvidia إلى تحسين لطيف لـ مستخدمي مؤتمرات الفيديو. ربما تعرف مدى غرابة عدم مقابلة أعين نظيرك أثناء مؤتمر فيديو لسبب بسيط وهو أن كاميرات الويب الخاصة بنا لا يتم وضعها أبدًا في منتصف الشاشة، في النقطة التي نحاول النظر إليها بشكل طبيعي. طورت Nvidia تقنية تسمح بتحويل لقطات الكاميرا الخاصة بك على الجانب الآخر من المكالمة وتجعلك تنظر في عيون شريكك في المحادثة.

وهذا لا يعني فقط تواصلًا بشريًا أفضل وأكثر طبيعية، بل يعني أيضًا عبئًا أقل على أجهزة الاتصال. بدلاً من إرسال اللقطات بأكملها طوال المكالمة، يتم إرسال صورتك مرة واحدة فقط. بعد ذلك، يتم تعقب عدد قليل فقط من النقاط المرجعية على وجهك لالتقاط الصورة المحاكية. يتم بعد ذلك إعادة بناء تعبيرات وجهك على الطرف الآخر من المكالمة. تعمل هذه الطريقة على تقليل كمية الحمولة المنقولة ذهابًا وإيابًا والتي كانت تستهلك سابقًا نطاقًا تردديًا ضخمًا وقدرات حوسبة كبيرة.

خاتمة

في AI Superior، نراقب باستمرار أحدث الاتجاهات في التعلم الآلي. يقدم لنا عملاؤنا أعظم الأمثلة على كيفية قيام الذكاء الاصطناعي ومعالجة الصور بإعادة تشكيل حياتنا، مما يجعل هذا العالم مكانًا أكثر أمانًا للعيش فيه. نحن على استعداد لمشاركة خبراتنا في تطبيق شبكات GAN للرعاية الطبية والأبحاث بالإضافة إلى التحليلات الجغرافية المكانية وغيرها من الصناعات.

دعونا نعمل معا!
الاشتراك في النشرة الإخبارية

ابق على اطلاع بآخر التحديثات والعروض الحصرية لدينا من خلال الاشتراك في النشرة الإخبارية لدينا.

arArabic
انتقل إلى أعلى