مثير للإعجاب

شبكات الخصومة التوليدية: التقنية وراء DeepFake و FaceApp

شبكات الخصومة التوليدية: التقنية وراء DeepFake و FaceApp

تمت مناقشة شبكات الخصومة التوليدية أو شبكات GAN بشكل متزايد في السنوات القليلة الماضية. إذا عدت 10 سنوات إلى الوراء ، فلن تجد أي أثر لمثل هذا الموضوع. إذن ، ما الذي جعل شبكات الخصومة التوليدية تأتي في المقدمة ولماذا يجب أن تهتم؟ دعونا نناقش.

عندما يكون هناك نقاش حول شبكات الخصومة التوليدية أو شبكات GAN ، يكون دائمًا في سياق الذكاء الاصطناعي أو التعلم الآلي أو التعلم العميق. في حين أن هذا الموضوع واسع جدًا ، إلا أن هذه المقالة تهدف إلى مساعدتك في فهمه بعبارات مبسطة.

لنبدأ بالمصطلح نفسه - شبكات الخصومة التوليدية.

ذات صلة: يمكن لنظام الذكاء الاصطناعي الجديد هذا رؤية ما تفكر فيه

تعد شبكات GAN في الأساس نهجًا للنمذجة التوليدية باستخدام أساليب التعلم العميق. تشير كلمة "Generative" في المصطلح إلى خاصية GANs لإنشاء شيء خاص بها.

كيف يمكن للبرنامج أن يمتلك الإبداع ليصنع شيئًا خاصًا به؟ نمنحه قوة التعلم الآلي حيث يمكنه التعلم من البيانات السابقة.

لذلك ، إذا كنت ستقوم بتغذية شبكات GAN بعدد كبير من الصور ، فيمكنها إنشاء صورة فريدة خاصة بها. وينطبق الشيء نفسه على أي مجموعة من البيانات.

بالنظر إلى هذا التعريف ، نواجه مشكلة حيث لا يوجد مرشح للتحقق من إخراج المولد للتأكد من صحته. يمكن للمولد إنشاء أي شيء يتعلق بمجموعة البيانات المرجعية الخاصة به دون معرفة المكان الذي سيكون مقبولاً لنا فيه أم لا.

لحل هذه المشكلة ، تأتي شبكات GAN مع شبكة تمييزية تتحقق من البيانات التي تم إنشاؤها باستخدام البيانات الحقيقية. هذا هو الجزء الخصامي من شبكة الخصومة التوليدية. نحن أساسًا نحرض الشبكة التوليدية والشبكة التمييزية ضد بعضنا البعض ، ونخلق خصومًا مع بعضهم البعض.

يتم استخدام شبكة تمييزية أو أداة تمييز للحفاظ على القيم المولدة للمولد قيد الفحص. وتتمثل مهمة المولد في خداع أداة التمييز في التفكير في أن القيم المولدة حقيقية في الواقع وليست ناتجة عن الكمبيوتر.

هذا هو المفهوم الأساسي لشبكات GAN.

تم شرح شبكات GAN بمزيد من التفصيل في الورقة من قبل Ian Goodfellow وغيره من الباحثين في جامعة مونتريال بعنوان شبكات الخصومة التوليدية.

في الورقة ، ذكروا بوضوح أن الغرض الكامل من الشبكة التوليدية هو دفع الشبكة التمييزية إلى ارتكاب خطأ. والشبكة التمييزية سترتكب خطأ فقط عندما لا تستطيع التمييز بين البيانات التي تم إنشاؤها آليًا وبيانات التدريب.

أفضل طريقة لتدريب GAN هي استخدام قاعدة بيانات MNIST (قاعدة بيانات المعهد الوطني المعدل للمعايير والتكنولوجيا).

تتكون قاعدة البيانات من مجموعة تدريب من 60.000 مثال ومجموعة اختبار من 10000 مثال. يستخدم تدريب MNIST القيم الرقمية المكتوبة بخط اليد.

إنها بداية رائعة لأي شخص يبحث عن موارد لتدريب الشبكات. إنها مجموعة من البيانات التي تم استخدامها لتدريب النموذج من قبل إيان وفريقه.

من هذه البيانات ، فإن أفضل تشبيه يمكننا استخدامه لـ GAN هو أنها لعبة ثنائية اللاعبين حيث يحاول كل لاعب بذل قصارى جهده للتغلب على الآخر.

ربما لا تزال تتذكر موجة الأخبار التي جاءت في أواخر ديسمبر 2018 حول الصور الواقعية التي تم إنشاؤها بواسطة الذكاء الاصطناعي. حسنًا ، كان ذلك GAN!

إذا راجعت هذه الصور ، فمن السهل أن تعرف لماذا كانت هذه قصة كبيرة. كانت الصور لا يمكن تمييزها عن الصور الواقعية لوجه بشري.

كان الأشخاص الذين يقفون وراء المشروع هم شركة NVidia ، مطور برامج وأجهزة رسومات الكمبيوتر الشهير. أعد الباحثون وراء المشروع ورقة حول تطوره ونتائجهم بعنوان A Style-Based Generator Architecture لشبكات الخصومة التوليدية.

أمضى الباحثون في NVidia 8 أسابيع في تدريب الشبكات ، وكان هذا يستخدم ثمانية من مجموعة بطاقات الرسوم Tesla الخاصة بهم.

يثير هذا بالتأكيد بعض الأسئلة حول كيف يمكننا الوثوق بالبيانات المصورة بعد الآن. أيضًا ، إذا تمكنا من إنشاء وجوه بشرية من صور مرجعية ، فلن يمر وقت طويل قبل أن نتمكن من إنشاء وجوه مثالية ، مما يتسبب في توقف النماذج عن العمل!

يثير العديد مخاوف بشأن استخدام البيانات التصويرية في النظام القضائي إذا كان البرنامج يمكن أن يغير الصور بشكل فعال. هذا بالتأكيد شيء للتفكير فيه!

بالعودة إلى موضوع مدى تطور GAN ، لا شيء يصور صورة أوضح للتقنية من التجربة من NVidia. نحن قادرون على إنشاء وجوه ذات مظهر واقعي لا يمكن تصديقها فحسب ، بل يمكن تخصيصها بدرجة كبيرة بواسطة الكمبيوتر.

لا تزال الأبحاث جارية لجعل شبكات GAN أكثر قوة لإنشاء بيانات واقعية ومتطلبات أقل استهلاكا للطاقة.

يمكن استخدام شبكات GAN في مجموعة متنوعة من التطبيقات ، معظمها متعلقة بالصور ، ولكن هذا بالتأكيد سيتغير. حاليًا ، تُستخدم شبكات GAN في:

إنشاء محتوى جديد (صور): يمكن استخدام شبكات GAN لإنشاء صور واقعية من مجموعة من الصور المصدر. استخدام مثل هذا النظام هو فقط لفهم قدرات شبكات GAN.

يجادل البعض بأن هذه التقنية يمكن استخدامها لتحديد مظهر الطفل من صور والديه.

الشيخوخة أو التقادم: من خلال مجموعة قوية من الصور النموذجية ، يمكن لشبكات GAN أن تنجح في تقادم أو إزالة عمر الوجوه البشرية. تُظهر الشعبية الأخيرة لتطبيق يسمى FaceApp مدى شعبية هذه التكنولوجيا بين الجماهير.

إذا كنت تتساءل عن التكنولوجيا وراء FaceApp ، وشبكات GAN الخاصة به.

تلوين الصور بالأبيض والأسود: عندما يتم تدريب GAN جيدًا بما فيه الكفاية ، يمكنها تلوين الصور والقيام بذلك بشكل جيد بشكل ملحوظ. يمكن لهذه التقنية بالفعل إعادة الحياة إلى الصور القديمة وتعطينا لمحة عن ذلك الوقت بالألوان.

تحسين القرار: إذا حاولت تحسين دقة نتيجة منخفضة في صورة ما ، فستكون النتيجة دائمًا فوضى ضبابية مع وحدات البكسل المنفجرة. ومع ذلك ، فإن GAN تستبدل كل صورة إضافية وتقوم بإنشاء صور تحسين عالية الجودة حتى عندما تكون الدقة منخفضة.

لقد شهد العالم العديد من الأمثلة على شبكات GAN في العمل ، ويشير البحث الجاري في هذا الاتجاه إلى العديد من التطبيقات غير المتوقعة لشبكات GAN في المستقبل.

ذات صلة: تستمر منظمة العفو الدولية في التصرف بطرق لا يمكن التنبؤ بها ، فهل يجب أن نشعر بالذعر؟

التكنولوجيا ثورية ويمكننا أن نتوقع ظهور شبكات GAN على أجهزتنا بأكثر من طريقة. ومع ذلك ، قبل أن تنضج هذه التكنولوجيا ، هناك حاجة إلى مناقشات جادة حول الاستخدام الأخلاقي لأساليب التعلم العميق القوية هذه.


شاهد الفيديو: Princess Leia Fixed using Deepfakes (ديسمبر 2021).