ملخص سريع: تستخدم تقنية التعرف على الصور لتحديد هوية الأشخاص خوارزميات التعرف على الوجوه لاكتشاف وتحليل ومطابقة الوجوه البشرية في الصور الفوتوغرافية ومقاطع الفيديو. تحقق الأنظمة الحديثة دقة تزيد عن 99% في ظروف مضبوطة، مع تطبيقات تتراوح من فتح قفل الهواتف الذكية إلى أمن المطارات، على الرغم من أن التحيز الديموغرافي الكبير لا يزال يمثل تحديًا بالغ الأهمية يؤثر بشكل غير متناسب على ذوي البشرة الداكنة.
أصبحت تقنية التعرف على الوجوه منتشرة في كل مكان. نفتح هواتفنا بنظرة، ويتم التعرف علينا تلقائيًا في الصور، ونمر عبر المطارات دون إبراز أي وثائق. ولكن كيف تتعرف تقنية التعرف على الصور على الأشخاص فعليًا، وماذا تخبرنا البيانات عن مدى موثوقيتها؟
تعتمد هذه التقنية على خوارزميات التعلم الآلي التي ترسم ملامح الوجه في تمثيلات رياضية تُسمى التضمينات. تحلل هذه الخوارزميات خصائص فريدة - مثل المسافة بين العينين، وشكل الأنف، ومحيط خط الفك - وتحولها إلى بيانات رقمية يمكن مقارنتها بقواعد البيانات.
كيف تعمل تقنية التعرف على الوجه
تعتمد تقنية التعرف على الوجوه الحديثة على عدة مراحل متميزة. أولاً، يكتشف النظام وجود وجه في الصورة. ثم يحلل هندسة الوجه وينشئ نموذجاً. وأخيراً، يطابق هذا النموذج مع السجلات المخزنة.
وفقًا لبيانات NIST FRTE 1:N، شهدت الخوارزميات المقدمة نموًا ملحوظًا. ففي عام 2018، تم تقديم 209 خوارزميات؛ وبحلول عام 2026، ازداد عدد الخوارزميات المقدمة بشكل كبير، حيث تم تقييم أكثر من 1200 خوارزمية من أكثر من 350 مطورًا مختلفًا منذ بدء التقييم.
أضاف تحديث واجهة برمجة تطبيقات FRTE بتاريخ 14 فبراير 2022 ميزة الكشف عن الوجوه المتعددة، مما يسمح للخوارزميات بمعالجة عدة وجوه في صورة واحدة. وهذا أمر بالغ الأهمية لأن ما يقارب 3% من صور عبور الحدود و7% من صور الأكشاك تحتوي على وجوه متعددة.
معدلات الدقة في التطبيقات العملية
تحقق الخوارزميات المتقدمة الآن دقة مذهلة. ففي سيناريوهات تحديد هوية ركاب المطارات، تصل دقة أفضل الأنظمة إلى 99.5% عند المطابقة مع قواعد البيانات التي تحتوي على صورة واحدة لكل شخص مسجل.
قيّم المعهد الوطني للمعايير والتكنولوجيا (NIST) خوارزميات لمهام المطابقة من واحد إلى متعدد في سيناريوهات الصعود إلى الطائرة. وأظهرت الاختبارات دقة عالية في تحديد المسافرين مع الحد الأدنى من النتائج السلبية الخاطئة في عمليات معالجة الركاب المحاكاة.
لكن الدقة تنخفض بشكل ملحوظ في الظروف غير المثالية. فالإضاءة الضعيفة، وزوايا الكاميرا، والتقدم في السن، واختلاف مظهر الشخص نفسه، كلها عوامل تُضعف الأداء. وتشير الأبحاث إلى أن دقة التعرف على الأشخاص تتحسن من 50% باستخدام صورة واحدة للشخص المستهدف إلى حوالي 90% عند توفر ست صور مختلفة لنفس الشخص.
| سياق التطبيق | معدل الدقة | المتغيرات الرئيسية |
|---|---|---|
| فحص الركاب في المطار | 99.5% | إضاءة مضبوطة، صورة واحدة لكل سجل |
| التصنيف العام | 90%+ | ظروف مثالية، صور عالية الجودة |
| تحديد هوية الإنسان (صورة واحدة) | 50% | صورة مرجعية واحدة |
| تحديد الهوية البشرية (6 صور) | 90% | صور مرجعية متعددة |
قم ببناء أدوات التعرف على الصور باستخدام الذكاء الاصطناعي المتفوق
متفوقة الذكاء الاصطناعي تُطوّر الشركة برمجيات ذكاء اصطناعي مُخصصة، بما في ذلك حلول رؤية الحاسوب ومعالجة الصور. ويستطيع فريقها بناء أنظمة لتحليل الصور، واكتشاف الأجسام، وتقسيم الصور، والتعرف الضوئي على الأحرف، والتعرف على الوجوه، وتصنيف الصور السياقي.
ولتحديد هوية الأشخاص، يمكن لهذا أن يدعم التعرف على الوجوه، واكتشاف الأشخاص، وسير العمل المتعلق بالوصول، أو أدوات البحث المرئي المبنية حول متطلبات البيانات والخصوصية للمشروع.
هل تحتاج إلى نظام للتعرف على الصور مبني على بياناتك؟
يمكن أن تساعدك تقنية الذكاء الاصطناعي المتفوقة في:
- بناء حلول رؤية حاسوبية مخصصة
- اكتشاف وتصنيف الأشياء في الصور
- اختبار الأفكار من خلال تطوير نموذج إثبات المفهوم أو المنتج الأولي القابل للتطبيق
- دمج أدوات الذكاء الاصطناعي في الأنظمة الحالية
👉 تواصل مع شركة AI Superior لمناقشة مشروعك.
مشكلة التحيز الديموغرافي
على الرغم من دقتها الإجمالية العالية، تُظهر أنظمة التعرف على الوجوه تفاوتات ديموغرافية مقلقة. قيّم المعهد الوطني للمعايير والتكنولوجيا 189 خوارزمية من 99 مطورًا - بما في ذلك شركات كبرى مثل مايكروسوفت وإنتل - ووجد تحيزًا منهجيًا.
أظهرت العديد من الخوارزميات معدلات خطأ أعلى بمقدار 10 إلى 100 ضعف عند تحديد الوجوه السوداء أو الآسيوية الشرقية مقارنةً بالوجوه البيضاء. وبالنسبة للإناث ذوات البشرة الداكنة تحديدًا، كانت معدلات الخطأ أعلى بكثير من الذكور ذوي البشرة الفاتحة. ووجد بحثٌ أجراه بولامويني وجيبرو أن النساء ذوات البشرة الداكنة سجلن أعلى معدل خطأ مقارنةً بالرجال ذوي البشرة الفاتحة، على الرغم من اختلاف النسب المئوية المحددة بين الأنظمة التي تم اختبارها.

لماذا يحدث هذا؟ يؤدي تكوين بيانات التدريب إلى تحيز الخوارزميات. فمجموعة بيانات Labeled Faces in the Wild الشهيرة تحتوي على 83.5% من البيض. أما مجموعة بيانات IJB-A التي أنشأها المعهد الوطني للمعايير والتكنولوجيا (NIST) فقد صُممت خصيصًا مع مراعاة التمثيل العرقي. عندما تُدرَّب الخوارزميات بشكل أساسي على فئة ديموغرافية واحدة، فإنها تُؤدي أداءً ضعيفًا على المجموعات المُمثلة تمثيلًا ناقصًا.
أليس هذا مألوفاً؟ إنها مشكلة "المدخلات السيئة تؤدي إلى مخرجات سيئة" الكلاسيكية، إلا أن العواقب هنا تؤثر على أشخاص حقيقيين يبحثون عن عمل أو سكن أو يواجهون تدقيق سلطات إنفاذ القانون.
مخاوف الخصوصية ومحركات البحث عن الوجوه
لقد سهّلت محركات البحث عن الوجوه الوصول إلى تقنية التعرف على الوجوه بشكل كبير. واليوم، تتيح بعض الأدوات للمستخدم تحميل صورة والبحث عن نفس الوجه في مختلف المواقع العامة على الإنترنت.
كيف تعمل محركات البحث عن الوجوه
تقوم هذه المنصات بمسح مصادر متاحة للعموم مثل وسائل التواصل الاجتماعي، والمواقع الإلكترونية، ومعارض الصور، ومجموعات الصور الأخرى على الإنترنت. وتقارن ملامح الوجه وتحاول مطابقة الصورة المرفوعة مع صور لنفس الشخص في مواقع أخرى على الإنترنت.
لماذا يُشكّل هذا مخاطر على الخصوصية؟
إن المخاوف المتعلقة بالخصوصية خطيرة. فقد يظهر أشخاص في صور لم يوافقوا على نشرها علنًا. كما يمكن إعادة استخدام الصور دون إذن، ويمكن أن يُسهّل البحث الواسع عن الوجوه انتحال الشخصية أو التجسس أو سرقة الهوية.
لماذا يختلف التعرف على الجهاز؟
يختلف نهج آبل عن أنظمة البحث عن الوجوه القائمة على الحوسبة السحابية. ففي تطبيق الصور، يتم تشغيل تقنية التعرف على الوجوه على الجهاز باستخدام التعلم الآلي الخاص.
وهذا يعني أن بيانات الوجه لا تحتاج إلى مغادرة الجهاز، بينما لا يزال بإمكان المستخدمين تنظيم مكتبة الصور الخاصة بهم والبحث فيها.
البنية التقنية والكفاءة
تحقق أنظمة التعرف على الوجوه الحديثة كفاءةً ملحوظة. تُظهر الأبحاث التي أُجريت على الشبكات العصبية المُدرَّبة على الهوية أن الأداء يظل مستقرًا حتى مع انخفاض الأبعاد بشكل كبير. تحافظ الشبكات على دقة التعرف باستخدام 16 وحدة فقط - أي ما يعادل 3% من أصل 512 وحدة.
تُعدّ هذه الكفاءة مهمة للنشر. فمتطلبات الحوسبة المنخفضة تعني معالجة أسرع، وتكاليف أقل، وإمكانية التشغيل على الأجهزة المحمولة بدلاً من الحاجة إلى بنية تحتية سحابية.
بصراحة، هذه التقنية قادرة على التعامل مع قواعد بيانات ضخمة بشكلٍ مدهش. تُظهر الاختبارات عدم وجود انخفاض ملحوظ في الدقة حتى يتجاوز حجم العينة مليون وجه في بيئات واقعية، مما يجعل هذه التقنية مناسبة للتطبيقات المؤسسية مثل أنظمة الدخول إلى حرم الجامعات أو الأمن المؤسسي.
التطبيقات الحالية وحالات الاستخدام
تُستخدم تقنية التعرف على الوجوه لتحديد هوية الأشخاص في العديد من المجالات. تستخدمها وكالات مراقبة الحدود في إجراءات الهجرة والتحقق من هوية الركاب. كما تستخدمها شركات الطيران لتأكيد الصعود إلى الطائرة وإعداد جداول الرحلات.
تستخدم جهات إنفاذ القانون هذه التقنية لتحديد هوية المشتبه بهم، على الرغم من أن حالات الاستخدام هذه تثير مخاوف تتعلق بالحريات المدنية نظراً للتحيز الموثق ضد الأشخاص الملونين والاستخدام التاريخي لهذه التقنية في مراقبة النشطاء.
تشمل تطبيقات المستهلكين فتح قفل الهواتف الذكية، وتنظيم الصور، ووضع علامات تلقائية على وسائل التواصل الاجتماعي، والتحقق من صحة المدفوعات. ويستخدم المستجيبون الأوائل المصادقة البيومترية للوصول الآمن إلى الأنظمة الحيوية أثناء حالات الطوارئ.
| قطاع | الاستخدام الأساسي | الاعتبارات الرئيسية |
|---|---|---|
| أمن الحدود | التحقق من هوية الركاب، تسجيل الخروج من قسم الهجرة | دقة عالية في ظل ظروف مضبوطة |
| تكنولوجيا المستهلك | فتح قفل الجهاز، ووضع علامات على الصور | تحمي المعالجة على الجهاز الخصوصية |
| إنفاذ القانون | تحديد هوية المشتبه به | يؤدي التحيز إلى تفاقم أوجه عدم المساواة القائمة. |
| تجاري | البحث العكسي عن الصور، والتحقق من الهوية | مخاوف تتعلق بالموافقة والخصوصية |
الأسئلة الشائعة
ما مدى دقة تقنية التعرف على الوجوه في تحديد هوية الأشخاص؟
تحقق أفضل الخوارزميات دقة تصل إلى 99.5% في ظروف مضبوطة، مثل عمليات التفتيش في المطارات، باستخدام صور عالية الجودة وإضاءة مناسبة. مع ذلك، تنخفض الدقة بشكل ملحوظ مع رداءة جودة الصورة، أو التقدم في السن، أو تغيرات المظهر. كما تؤثر العوامل الديموغرافية على الدقة، حيث ترتفع معدلات الخطأ من 10 إلى 100 ضعف لدى ذوي البشرة الداكنة في العديد من الأنظمة.
هل يمكن لتقنية التعرف على الوجوه تحديد هوية شخص ما من صورة قديمة؟
نعم، لكن دقة التعرف على الأشخاص تقل مع مرور الوقت بسبب التقدم الطبيعي في السن، وتغيرات المظهر، وانخفاض جودة الصور. وتتحسن كفاءة الأنظمة عندما تتضمن قاعدة البيانات صورًا متعددة للشخص نفسه من فترات زمنية مختلفة. ويُعدّ التباين في مظهر الشخص الواحد تحديًا كبيرًا لدقة التعرف عليه.
هل تقنية التعرف على الوجوه متحيزة ضد فئات معينة؟
نعم. كشف اختبار المعهد الوطني للمعايير والتكنولوجيا (NIST) لـ 189 خوارزمية عن تحيز ديموغرافي منهجي، حيث أظهرت العديد من الأنظمة معدلات خطأ أعلى بمقدار 10 إلى 100 ضعف عند التعامل مع الوجوه السوداء وشرق الآسيوية مقارنةً بالوجوه البيضاء. ووجد بحثٌ أجراه بولامويني وجيبرو أن النساء ذوات البشرة الداكنة سجلن أعلى معدلات خطأ مقارنةً بالرجال ذوي البشرة الفاتحة، مع اختلاف النسب المئوية المحددة بين الأنظمة المختبرة. وينبع هذا التحيز من عدم تمثيل مجموعات بيانات التدريب للواقع.
كيف تجد محركات البحث عن الوجوه الصور عبر الإنترنت؟
تقوم محركات البحث عن الوجوه بتحليل الصور المرفوعة لإنشاء تمثيلات رياضية للوجه، وهي تمثيلات رياضية لملامح الوجه الفريدة. ثم تُقارن هذه التمثيلات بقواعد بيانات الصور المستخرجة من مواقع الويب العامة ووسائل التواصل الاجتماعي والمعارض الإلكترونية للعثور على تطابقات بناءً على تشابه ملامح الوجه.
هل يمكنك حماية خصوصيتك من تقنية التعرف على الوجه؟
يُمكن توفير حماية جزئية. تسمح بعض الخدمات بطلبات إلغاء الاشتراك لاستبعاد صورتك من نتائج البحث. يوفر استخدام منصات تركز على الخصوصية وتعالج الصور على الجهاز بدلاً من السحابة حماية أفضل. مع ذلك، بمجرد نشر الصور علنًا على الإنترنت، يُمكن جمعها وتحليلها بواسطة خدمات خارجية.
ما الفرق بين التعرف على الوجوه بنسبة 1:1 والتعرف على الوجوه بنسبة 1:N؟
تعتمد عملية التحقق 1:1 على مقارنة وجه واحد بنموذج مُخزّن لتأكيد الهوية (مثل فتح قفل الهاتف). أما عملية التحقق 1:N فتقارن وجهًا واحدًا بقاعدة بيانات كاملة للعثور على تطابقات (مثل البحث عن مشتبه به بين آلاف السجلات). وتُعدّ عملية التحقق 1:N أكثر تعقيدًا من الناحية الحسابية وأكثر عرضة للنتائج الإيجابية الخاطئة.
كم عدد الصور اللازمة للتعرف الدقيق؟
زيادة عدد الصور تُحسّن الدقة بشكل ملحوظ. ترتفع دقة تحديد هوية الأشخاص من 50% باستخدام صورة مرجعية واحدة إلى حوالي 90% باستخدام ست صور مختلفة للشخص نفسه. تُساعد الصور المتعددة الأنظمة على مراعاة الاختلافات في مظهر الشخص الواحد الناتجة عن الإضاءة والزوايا وتعبيرات الوجه والتقدم في السن.
نظرة مستقبلية
لقد تطورت تقنية التعرف على الصور لتحديد هوية الأشخاص لتصبح تقنية قوية واسعة الانتشار. وتؤكد الأرقام هذا التطور، بدءًا من النمو الكبير منذ عام 2017، حيث تم تقييم 653 خوارزمية من قبل 201 مطورًا مختلفًا، وصولًا إلى دقة بلغت 99.5% في التطبيقات العملية.
لكن القدرة التقنية لا تعني بالضرورة الاستخدام الأخلاقي. فالتحيز الديموغرافي لا يزال مشكلةً جوهريةً لم تُحل بعد، تُكرّس أوجه عدم المساواة القائمة. وتتزايد المخاوف بشأن الخصوصية مع ازدياد سهولة الوصول إلى تقنيات البحث عن الوجوه. والسؤال ليس ما إذا كانت التقنية فعّالة - فهي فعّالة بلا شك - بل ما إذا كان بإمكاننا استخدامها بنزاهة ومسؤولية.
يتعين على المنظمات التي تستخدم تقنية التعرف على الوجوه مراجعة خوارزمياتها للتأكد من خلوها من التحيزات الديموغرافية، وضمان تنوع بيانات التدريب، والحفاظ على الشفافية بشأن حدود الدقة، وتوفير آليات موافقة وإلغاء اشتراك فعّالة. يجب أن يواكب التقدم التقني أطر أخلاقية تحمي الفئات السكانية الضعيفة من التمييز الخوارزمي.
