Menu

كيف تحولنا إلى أسطر برمجية في خوارزميات آلة البحث

الاختطاف الرقمي والتعرف على الوجوه

أحمد مصطفى جابر

.jpg

نُشر هذا المقال في العدد 18 من مجلة الهدف الرقمية

بعد اجتماع مطول استمر عدة ساعات، يوم 2 تموز /يوليو 2017، قرر الكابينت الصهيوني النزول عن شجرة الغلو والتجبر والخضوع لإرادة الشعب الفلسطيني وتفكيك البوابات الإلكترونية التي كان قد بدأ بنصبها على أبواب ومداخل المسجد الأقصى، والتي تعتمد على تقنيات التدقيق البيوميتري (الحيوي) وتتبع الوجوه، وفكك الاحتلال صاغرًا تلك البوابات بعد انتفاضة بدأت في الرابع عشر من الشهر ذاته.

هذا النص، ينشغل بفحص طبيعة التقنية التي تعتمد عليها آلية الكشف البيومتري والتعرف على الوجوه، ودورها القمعي الأمني، ومن يستخدمها ويسيطر عليها ولمصلحة من؟

 

هل تساءلت يومًا من أين تذهب صورك على الفيس بوك، أو تويتر أو غيرها من وسائل التواصل الاجتماعي، أو حيثما تحملها على شبكة الإنترنت؟ الإجابة البسيطة هي أنها موجودة دائمًا في قسم الصور، وإذا كنت أنت المحرر المسؤول فسيكون بإمكانك دائمًا حذفها والتخلص منها، وبهذه الطريقة تعتقد أنك قمت بإزالتها وأن أحدًا آخر لن يستطيع الوصل إليها.

الخبر السيئ والذي لم يعد سرًا، أن هذا غير صحيح، لأن أثرك لا يمحى على الإنترنت، ليس لأنها عملية صعبة، بل مستحيلة، يعلم الجميع بأن التقنيات المبسطة والمتاحة، عبر تنزيل الصور وحفظها من قبل أي كان، يكفي أن يدخل شخص على صفحة حسابك، ويضغط بزر الفأرة الأيمن على الصورة ويقوم بحفظها على حاسوبه، وهو ربما شخص لا يعرفك، أو شخص يريد استخدام صورتك، أو إنه يحبك ببساطة، وحتى لو كانت صورك محمية، فإن بالإمكان دائمًا أن ينفذ أي شخص تقنية السكرين شوت، بالضغط على زر كونترول وبرنت سكرين، سيكون قد التقط الصورة كما تظهر على شاشته وسيقوم بإلصاقها في أي محرر صور بسيط، ومجاني، ويحررها كما يريد.

لكن هذه الأشياء هي التي يقوم بها ربما شخص عادي، أو مبتز أو مجرم مبتدئ، ولكن هذا ليس كل شيء، لأن عليك أن تقلق من أنك بمجرد أن فتحت حسابًا افتراضيًا على منبر تواصل اجتماعي، فإنك تكون قد خلقت كيانًا موازيًا، قد يكون مطابقًا، كما هو حال 70% من المستخدمين تقريبًا، لحياتك الواقعية، وهكذا فإن الرقابة على حسابك في الواقع هي رقابة أيضًا على حياتك الواقعية، فـ"أنت" الافتراضي، أصبحت في تصرف خوارزمية جبارة أحكمت قبضتها عليك، ولن تتركك أبدًا، حتى لو قمت بإغلاق حسابك، فإنك لن تتمكن من دفن تلك الجثة الافتراضية، فقد تم اختطافها وكما يفعل طبيب المختبر الجنائي، سييتم تشريحها وتمزيقها إربًا لتتحول ذاتك الافتراضية التي تكون قد نسيتها في عالمك الواقعي إلى أرقام ورموز غامضة في معادلات ضخمة، تقوم بتصنيفك، وفرزك وتحديد ما تشير إليه بصمة وجهك، وتصبح جزءًا من آلية ملاحقتك أو ملاحقة من يتشابهون معك في التعبيرات الوجهية والانعكاسات العاطفية على الوجه.

هذا ليس كل شيء، فصورك ليست متاحة فقط عن طريق اتصالك المباشر بالإنترنت، فأنت مباح أيضًا لمئات الكاميرات التي تُستخدم للمراقبة، في شوارع المدن والأسواق ومراكز التسوق والمستشفيات وهذه كلها موصولة بالإنترنت وتتدفق دائمًا باتجاه تلك الخوارزمية، ولكن من الذي يريد استخدام "بصمة" وجهك، وتعبيراتك الخاصة؟ ولماذا؟ وكيف تحول أكثر الأشياء خصوصية إلى شيء مستباح بشكل خطير دون ضبط ولا رقابة وطبعًا بدون إذن منك شخصيًا؟

البداية:

في عام 1995، كتب نيكولاس نيغروبونتي، خبير التكنولوجيا وناقدها، كتابًا تنبؤيًا فريدًا "أن تكون رقميًا: Being Digital" وهو كتاب ليس مرتبطًا بالخيال العلمي كما قد يظن القارئ، بل حول التقنيات الرقمية ومستقبلها وقد أوجز فيه تاريخ التقنيات الرقمية، وكانت مقالته الأساسية حول الحياة المدفوعة بالتكنولوجيا، في ذلك الوقت كانت تقنية التعرف على الوجه لا تزال مجرد حلم، ولكنه  شعر أنه مقدر لها أن تصبح حقيقة فكتب: "وجهك هو في الواقع جهاز العرض الخاص بك، ويجب أن يكون جهاز الكمبيوتر الخاص بك قادرًا على قراءته، الأمر الذي يتطلب التعرف على وجهك وتعبيراته الفريدة "و "التحدي التقني المتمثل في التعرف على الوجوه وتعبيرات الوجه هائل، ومع ذلك، فإن تحقيقه يمكن بشكل بارز في بعض السياقات، في التطبيقات التي تشترك فيها أنت وجهاز الكمبيوتر الخاص بك، يحتاج فقط إلى معرفة ما إذا كنت أنت، وليس أي شخص آخر على هذا الكوكب".

هذا لم يكن خيالًا كما اعتقد البعض في ذلك الوقت، ففي عام 2018 الذي يعتبره البعض عام تحقق نبوءة نغروبنتي أصدرت شركة Apple  جهاز iPhone X، والذي يمكن للمستخدمين اختيار فتحه من خلال النظر إلى الكاميرا التي ستتعرف على المستخدم، أصبح الوجه هو كلمة المرور.

قبل أن تكون متاحة للمستخدمين المدنيين، استخدمت هذه التقنية في سياقات أخرى، ففي السنوات الأخيرة  تم إدخال تقنية التعرف على الوجه في المطارات في الولايات المتحدة كوسيلة لتأكيد هوية المسافرين، على سبيل المثال تم الاستفادة منها العام الماضي في التعرف على رجل قتل خمسة أشخاص في مكتب إحدى الصحف في ولاية ماريلاند، وأيضًا لتحديد شخصين يشتبه في قيامهما بتسميم العميل المزدوج الروسي سيرجي سكريبال وابنته يوليا في المملكة المتحدة، ومن الاستخدامات الحميدة أيضًا على سبيل المثال أن بعض الشركات تعمل على إنشاء برنامج للتعرف على الوجه يمكنه، من بين أمور أخرى، مساعدة المكفوفين على معرفة من في الصورة، أو حتى من في الغرفة معهم.

بمقدار ما تثير تقنية التعرف على الوجه الإعجاب، فإنها تثير الخوف أيضًا، وكما كتب براد سميث الرئيس والمسؤول القانوني الأول بشركة  Microsoft "": "تخيل حكومة تتعقبك في كل مكان تمشي فيه خلال الشهر الماضي دون إذنك أو علمك" و "تخيل قاعدة بيانات لكل من حضر تجمعًا سياسيًا يشكل جوهر حرية التعبير"،  ما الذي تقدر عليه هذه التقنية؟ والأهم كما ذكرنا أعلاه أن مثل هذه التقنية تحتاج لقاعدة بيانات صورية هائلة، يتم تخزينها وملؤها بشكل غير قانوني على الأغلب، ويتم استباحة وجوهنا التي هي ملكية خاصة لنا طبعا إن صح التعبير بدون إذن.

ولكن هل هذا ممكن فعلًا؟

السؤال بسيط، والانجازات المحققة أعلاه تقول أن الجواب بالإيجاب، ولكن هذا يحتاج إلى تدقيق، ففي صيف 2019، زعم فنان فرنسي يدعى رفائيل فاير، أنه نجح في التقدم بطلب للحصول على بطاقة هوية وطنية في فرنسا باستخدام صورة تم إنشاؤها بواسطة الكمبيوتر بالكامل لوجهه. وقالت وسائل إعلام فرنسية أن فابر ابتكر الصورة باستخدام البرامج والتقنيات المستخدمة للتأثيرات الخاصة في الأفلام والألعاب، مثل Blender و TurboSquid، وهو سوق للعناصر ثلاثية الأبعاد. لقد نحت رأسًا بشريًا رقميًا مما كان في الأساس مكعبًا قبل تنقيح الصورة ثنائية الأبعاد عند الفحص الدقيق، من الواضح أن الصورة التي أنشأها فابر ليست صورة - لكنها قريبة بشكل مذهل من الصورة.

قال فابر لمجلة Vice أن هدفه كان استكشاف علاقتنا بالصورة، "حدود العين البشرية، أو تفسيرها الشعري، وقوة الخيال والتكنولوجيا. نحن محاطون جدًا بالصورة الرقمية المعدلة [كذا] للأجساد، وصور كل شيء بشكل أساسي، بحيث يصبح عالمنا صورة رقمية بطريقة ما". في الواقع إن فابر محق تمامًا، وما لم يذكره أنه ليس فقط عالمنا الذي تحول إلى صورة رقمية، بل أجسادنا أيضًا وذواتنا. وبالتالي ما الذي "تراه" كاميرا التعرف على الوجه عندما تكتشف وجهنا بين الآخرين؟ كيف تعرف من ينظر إليها - أو من تنظر إليه؟

الجواب هو أنها تفعل  لكل واحد منا ما فعله فابر بنفسه؛ إنها تعتبر وجهنا، كبيانات خالصة، فنحن تحت أنظار كاميرا التعرف على الوجه، لسنا أنفسنا؛ نحن عروض رقمية لأنفسنا.

نحن نتحول إلى مجرد أسطر في خوارزمية عملاقة:

دائما استخدمت الوجوه كأداة لتحديد الهوية، وتمييز الآخرين، ولكن النظر إلى وجه أي شخص لا يعني معرفته، ولكن الترقيم أخطر من ذلك، حيث يتم بناء الخوارزميات التي تجعل هذا ممكنًا، عبر مئات الصور لشخص واحد في جميع حالاته الانفعالية والعاطفية، وبينما كانت الوجوه تخفي أسرارنا أصبحت الآن هي كلمة المرور للدخول إلى هذه الأسرار.

قاعدة البيانات:

ربما يكون جهاز التعرف على الوجه لدى مكتب التحقيقات الفيدرالية الأمريكي هو الأكبر على الإطلاق، دون ذكر الصين طبعًا، وهو يحتوي حاليًا على أكثر من 640 مليون صورة وهو رقم أكبر من إجمالي عدد سكان الولايات المتحدة، وهو يتضمن صورًا من كل شيء؛ رخص القيادة؛ الهويات الشخصية؛ جوازات السفر وأينما استطاعت أذرع برامج البحث الوصول، ربما أيضًا سجلات المدارس والمستشفيات، ومخازن غوغل الهائلة، وغيرها كثير.

ووفقًا لمكتب التحقيقات المذكور، فإنه يقوم بإجراء عدد هائل من عمليات البحث سنويًا، حيث من تشرين أول/أكتوبر 2017 إلى نيسان/أبريل 2019، أجرى مكتب التحقيقات الفيدرالي أكثر من 152000 عملية بحث لنظام التعرف على الوجوه الذي يتطابق مع صور mugshots ، هذا الرقم لا يشمل حتى عمليات البحث في قواعد البيانات الخارجية، مثل صور جواز السفر. كما أنه مرتفع بشكل غير عادي عند مقارنته بحقيقة أنه لم يكن هناك سوى 10232 إدانة جنائية ناجمة عن التحقيقات التي قادها مكتب التحقيقات الفيدرالي في السنة المالية 2017. عن ماذا إذًا كان يبحث ال FBI؟

نهر من الصور على الإنترنت.. بل هو محيط

ساعد الكم الهائل من الصور على الإنترنت على تعزيز نماذج وخوارزميات أكثر تطورًا وقوة لفهرسة الصور وبيانات الوسائط المتعددة واستعادتها وتنظيمها؛ عبر الفرز والتصنيف والتفاعل معها وصولًا إلى تنميطها وهو الجزء الأخطر من العملية والأكثر إثارة للذعر. فكيف يتم هذا الأمر؟

للإجابة على هذا السؤال نلقي نظرة على أكبر قاعدة بيانات مفتوحة ربما وجديدة نوعًا ما تسمى "ImageNet"، وهي عبارة عن أنطولوجيا واسعة النطاق للصور مبنية على العمود الفقري لهيكل  WordNet [الووردنت هي قاعدة بيانات معجمية للغة الإنجليزية. تجمع الكلمات الإنجليزية ذات المعنى الواحد إلى مجموعات من المرادفات تدعى كل مجموعة سينست، ولكل مجموعة تعريف قصير عام، كما توضح العلاقات الدلالية المتنوعة بين المجموعات الترادفية مثل علاقة النقيض، علاقة الكل والجزء من، علاقة الشامل والمشمول] وتهدف ImageNet  إلى إنتاج عشرات الملايين من الصور المشروحة التي تنظمها التسلسل الهرمي الدلالي لـ WordNet . تقدم هذه الورقة تحليلاً مفصلاً لـ ImageNet ، وبتوضيح أكبر فإن ImageNet هو عبارة عن قاعدة بيانات بصرية كبيرة جدًا مصممة للتعرف على الوجوه وكان قد تم بالفعل تصنيف 14 مليون صورة قبل إطلاقها، وتم فرز هذه الصور يدويًا في البداية عن طريق توظيف طلاب جامعيين قبل الانتقال إلى الخوارزميات الآلية.

اكتشاف صادم:

عندما كانت جيليان يورك وهي ناشطة أمريكية في 36 من العمر في إجازة في شباط/ فبراير 2019، تلقت رسالة غير متوقعة، حيث اكتشف صديقها آدم هارفي وهو ناشط وباحث آخر، صورًا لها في قاعدة بيانات حكومية أمريكية تستخدم لتدريب خوارزميات التعرف على الوجه، وتساءل عما إذا كانت تعرف ذلك. يورك التي تعمل في برلين لمؤسسة الحدود الإلكترونية، وهي مجموعة غير ربحية تعمل في مجال الحقوق الرقمية، لم تكن تعلم، وصدمت عندما اكتشفت أن قاعدة البيانات تحتوي على ما يقرب من اثنتي عشرة صورة لها، وهي مزيج من الصور ولقطات الفيديو على YouTube، تم التقاطها على مدار عقد تقريبًا. وعندما بحثت في سبب استخدام قاعدة البيانات، اتضح لها أن وجهها ساعد في بناء أنظمة تستخدمها الحكومة الفيدرالية للتعرف على الوجوه محل الاهتمام، بما في ذلك المجرمين المشتبه بهم والإرهابيين والأجانب غير الشرعيين. تقول يورك: "ما أدهشني على الفور هو نطاق المرات التي يغطونها"، حيث "كانت الصور الأولى من عام 2008، حتى عام 2015"  وكان هناك صور خاصة ومحدودة التداول أصلًا وليست عامة.

يورك هي عنصر واحد من 3500 موضوع آخر في قاعدة البيانات الحكومية المذكورة، والتي تُعرف باسم IARPA Janus Benchmark–C (IJB-C)وهي هيئة حكومية أمريكية تمول الأبحاث المبتكرة التي تهدف إلى منح مجتمع الاستخبارات الأمريكية ميزة تنافسية، و Janus التي سميت على اسم الإله الروماني ذو الوجهين - هي مبادرة التعرف على الوجوه، وتتضمن مجموعة البيانات التي جمعها مقاول  حكومي من الباطن يُدعى Noblis، ما مجموعه 21294 صورة لوجوه (هناك أجزاء أخرى من الجسم أيضًا)، بمتوسط ​​ست صور وثلاثة مقاطع فيديو لكل شخص، وهي متاحة عند الطلب للباحثين في هذا المجال. وباعترافهم الخاص، اختار مبتكروها "مواضيع ذات وظائف متنوعة، وتجنب الوقوع في مأزق واحد لوسائل الإعلام "المشاهير فقط" [والتي] قد تكون أقل تمثيلًا لسكان العالم، وتشمل الموضوعات الأخرى في مجموعة البيانات ثلاثة أعضاء من مجلس إدارة EFF ، وصحفي في قناة الجزيرة، وكاتب مستقبلي في مجال التكنولوجيا، وثلاثة نشطاء سياسيين من الشرق الأوسط على الأقل، بمن فيهم عالم مصري شارك في احتجاجات ميدان التحرير في عام 2011، كما تؤكد فايننشال تايمز، ولم يكن أي من الأشخاص المذكورين أعلاه على علم بإدراجهم في قاعدة البيانات. تم الحصول على صورهم دون موافقتهم الصريحة، حيث تم تحميلها بموجب شروط تراخيص المشاع الإبداعي، وهي اتفاقية حقوق نشر عبر الإنترنت تسمح لأي شخص بنسخ الصور وإعادة استخدامها للأغراض الأكاديمية والتجارية، ويتمثل الاستخدام الأساسي لتقنية التعرف على الوجه في الأمن والمراقبة، سواء من قبل الشركات الخاصة مثل تجار التجزئة وأماكن الأحداث، أو من قبل الهيئات العامة مثل قوات الشرطة لتعقب المجرمين، وتستخدمه الحكومات بشكل متزايد لتحديد الأشخاص من أجل الأمن الوطني والحدودي، وكانت أكبر عقبة فنية أمام تحقيق التعرف الدقيق على الوجه حتى الآن هي عدم قدرة الآلات على التعرف على الوجوه البشرية عندما تكون مرئية جزئيًا فقط، أو مغطاة بالظل أو مغطاة بالملابس، على عكس الصور عالية الدقة التي تواجه الوجه  والتي تم تدريب أجهزة الكمبيوتر عليها.

تدريب الآلة:

لتعليم الآلة كيفية قراءة الوجه البشري والتعرف عليه بشكل أفضل في كل الظروف، يجب تدريبها باستخدام مئات الآلاف من الوجوه من جميع الأشكال والأحجام والألوان والأعمار والأجناس، وكلما كانت الوجوه طبيعية ومتنوعة وغير مظللة، كان من الأفضل محاكاة سيناريوهات الحياة الواقعية التي قد تتم فيها المراقبة، وكلما كانت النماذج الناتجة للتعرف على الوجه أكثر دقة، ومن أجل إشباع مصاص الدماء الرقمي هذا، كان يجب إيجاد عدد متزايد من المستودعات التي تحوي الوجوه مثل IJB-C -، والتي تحتوي على صور تم انتقاؤها يدويًا وربطها معًا من مصادر متنوعة مثل حرم الجامعات وساحات المدينة والأسواق والمقاهي ومواقع التواصل مثل الفيس بوك، وأنستغرام، وتويتر واليوتيوب، وغيرها، ووجد الباحثون أن الصور تُستخدم لتدريب الخوارزميات التي تخدم مجموعة متنوعة من الأغراض ذات الصلة بالقياسات الحيوية وقياس معاييرها - التعرف على الوجوه في مراقبة الجوازات ومراقبة الحشود والقيادة الآلية والروبوتات وحتى تحليل المشاعر للإعلان. وقد تم الاستشهاد بها في أوراق بحثية من قبل شركات تجارية بما في ذلك Facebook و Microsoft و Baidu و SenseTime و IBM، وكذلك من قبل أكاديميين في جميع أنحاء العالم، من اليابان إلى الإمارات العربية المتحدة والكيان الصهيوني، ويقول ديف ماس، كبير الباحثين الاستقصائيين في مؤسسة الحدود الإلكترونية  EFFالذي صُدم عندما اكتشف أن وجوه زملائه موجودة في قاعدة بيانات " Iarpaلقد رأينا تحول التعرف على الوجه من حيث الهدف.. حيث كان يستخدم في الأصل لأغراض تحديد الهوية... الآن يتم استخدام وجه شخص ما كرقم تتبع لمشاهدته أثناء تحركه عبر المواقع على الفيديو، وهو تحول كبير. [الباحثون] لا يتعين عليهم دفع المال للناس مقابل الموافقة، ولا يتعين عليهم العثور على نماذج، ولا يتعين على أي شركة أن تدفع مقابل الحصول عليها، فالجميع يحصل عليها مجانًا".

مجموعة البيانات التي تحتوي على وجه جيليان يورك هي واحدة من سلسلة تم تجميعها نيابة عنIarpa  والتي استشهد بها أكاديميون في 21 دولة مختلفة، بما في ذلك الصين وروسيا والكيان الصهيوني و تركيا وأستراليا، تم استخدامها من قبل شركات مثل شركة الذكاء الاصطناعي الصينية  SenseTime التي تبيع منتجات التعرف على الوجه للشرطة الصينية، وشركة تكنولوجيا المعلومات اليابانية NEC التي تزود وكالات إنفاذ القانون بالبرمجيات في الولايات المتحدة والمملكة المتحدة والهند، حتى أن الصور الموجودة بها تم حذفها من قبل الجامعة الوطنية لتكنولوجيا الدفاع في الصين التي تسيطر عليها أعلى هيئة عسكرية في الصين؛ اللجنة العسكرية المركزية، والذي تعاون أحد الأكاديميين التابعين لها العام الماضي في مشروع يستخدم IJB-A، من بين مجموعات أخرى، لبناء نظام من شأنه، كما كتب المهندسون "[تمكين] فهمًا أكثر تفصيلاً للبشر في المشاهد المزدحمة"، مع تطبيقات تتضمن "مجموعة تحليل السلوك" و "إعادة تعريف الشخص". ففي الصين، لعبت برامج مسح الوجه دورًا مهمًا في المراقبة الجماعية الحكومية واحتجاز مسلمي الأويغور في منطقة شينجيانغ أقصى الغرب. وتم استخدام الكاميرات التي صنعهاHikvision ، إحدى أكبر شركات الدوائر التلفزيونية المغلقة في العالم، وLeon ، الشريك السابق لـSenseTime، لتتبع المسلمين في جميع أنحاء شينجيانغ، ولعبت دورًا فيما وصفه نشطاء حقوق الإنسان بالقمع المنهجي لملايين الأشخاص. وفي وقت سابق من هذا الأسبوع، ظهر أن SenseTime  باعت حصتها البالغة 51 في المائة في مشروع أمني مشترك مع شركة ليون في شينجيانغ بعد الاحتجاج الدولي المتزايد على معاملة الأويغور.

يرى الباحثون أن الجزء الصادم في هذه الاكتشافات أن الأمر "لا يتعلق باستحدام الصورة"، بل "بكيفية استخدامها"، وتبعًا لمقال يورك، قام آدم هارفي ومن خلال رسم خرائط طرق التجارة البيومترية هذه، بتجميع حجم توزيع الوجوه ببطء، والذي ربما يكون قد ساهم في المنتجات التجارية وتقنيات المراقبة دون أي إذن صريح من الأفراد المعنيين، والحقيقة المفزعة أنه بمجرد أن يكون وجهك في مجموعة بيانات، من المستحيل الخروج منه لأنه تم تنزيله بالفعل وإعادة استخدامه في جميع أنحاء العالم.

كان أول مشروع نفذه آدم هارفي لتحليل تكنولوجيا المراقبة هو CV Dazzle، وهو أول مشروع خاص للقياسات الحيوية في عام 2011، حيث تم ابتكار سلسلة من تصاميم الماكياج وتصفيف الشعر لتمكين الأشخاص العاديين من الاختباء من أنظمة التعرف على الوجه الآلية، و يهدف مشروع آخر MegaPixels، الممول من قبل مؤسسة Mozilla، وهي مؤسسة غير ربحية، إلى تمكين المواطنين من فهم العالم الجديد الذي يعيشون فيه: تم إطلاقه كقاعدة بيانات قابلة للبحث لجميع الأوراق التي استشهدت بها، كل مجموعة بيانات اكتشفها. على مدى الأشهر التالية، يخطط لتطوير أداة البحث بحيث يمكن للمستخدم العادي أن يكتب اسمه ويعرف إذا كان قد تم استخدام وجهه لتدريب نظام ذكاء اصطناعي في أي جزء من العالم، وظهر في البحث أنه تم إنشاء واحدة من أولى قواعد بيانات الوجوه على نطاق واسع من قبل وزارة الدفاع الأمريكية في التسعينيات، من خلال دفع أفراد عسكريين لالتقاط الصور في الاستوديوهات. بحلول عام 2007، بدأ الباحثون يدركون أن صور الاستوديو كانت غير واقعية للغاية لاستخدامها كمجموعات تدريب، وأن أنظمة التعرف على الوجه المبنية عليها ستفشل في العالم الحقيقي، ما كان مطلوبًا هو المزيد من الصور في "البرية" - طبيعية وغير واضحة وغير مثبتة.

الانترنت: منجم ذهب التلصص الرقمي

في ذلك العام  2007، تم إصدار مجموعة جديدة من قبل جامعة ماساتشوستس، أمهيرست، تسمى الوجوه الموصوفة في البرية  (LFW)، وهي مجموعة من الصور مأخوذة من القصص الإخبارية على الإنترنت، مع تسمية كل وجه، وأظهرت هذه الصور "البرية" موضوعات ذات أوضاع وتعبيرات مختلفة، في ظل ظروف إضاءة مختلفة، وأدرك الباحثون أنهم قاموا بالتنصت على منجم ذهب: الإنترنت.

كان هنا كمية كبيرة من بيانات الوجه التي كانت متنوعة وغير مقيدة ويسهل الحصول عليها؛ أصبح LFW الآن أكثر معايير التعرف على الوجه استخدامًا على مستوى العالم، بعد 11 سبتمبر، عندما تم تحفيز وكالات الدفاع والاستخبارات على الاستثمار بشكل أكبر في التعرف على الوجه، تم ضخ ملايين الدولارات في المختبرات بهدف صريح هو جمع المزيد من الصور في البرية، للحصول على ملفات تعريف حيوية أكثر قوة. اليوم، الطريقة الافتراضية إذا كنت بحاجة إلى مجموعة تدريب هي الذهاب إلى محركات البحث مثل Google أو Bing، أو الشبكات الاجتماعية مثل Flickr و YouTube، حيث غالبًا ما يتم تحميل الوسائط المتعددة بترخيص Creative Commons، وأخذ ما تحتاجه.

اقتصاد: سرقة الوجوه

نما سوق التعرف على الوجه بنسبة 20 في المائة سنويًا على مدى السنوات الثلاث الماضية، وستبلغ قيمته 9 مليارات دولار بحلول عام 2022، وفقًا لتقديرات Market Research Future تقدمت سرعة ودقة البرنامج بفضل الخطوات الأخيرة في التعلم الآلي، وهي التكنولوجيا التي يمكن لأجهزة الكمبيوتر من خلالها تعلم التعرف على كائنات معينة - مثل الوجوه - من خلال التدريب على مجموعات البيانات الكبيرة مثلIJB-C" "  في عام 2019، كانت هناك العشرات من مجموعات البيانات التي تم إنشاؤها بهذه الطريقة، والتي تم تمريرها في جميع أنحاء العالم، بعضها ممول من قبل إدارات الدفاع، والبعض الآخر ممول بشكل مباشر من قبل شركات التعرف على الوجه التجارية، أو أجهزة الأمن القامعة، كما في الشاباك في الكيان الصهيوني أو الإمارات والصين، إضافة طبعًا للولايات المتحدة الأمريكية والمملكة المتحدة، ويقول هارفي، "لكن لم يتوقف أحد أبدًا عن التفكير فيما إذا كان من الأخلاقي جمع صور حفلات الزفاف [و] ألبومات الصور العائلية مع الأطفال، أو ما إذا كان الأشخاص الذين حمّلوا الصور يعرفون حتى ما كانوا يفعلونه عندما حصلوا على الترخيص". واليوم، نظرًا لأن هيئات إنفاذ القانون والحكومات حريصة على دفع حدود التعرف على الوجه لتقليل التكاليف والوقت اللازمين لتحديد المشتبه بهم، فإن الإجماع هو أنه حتى الوجوه على الإنترنت ليست "جامحة" حقًا؛ لأن الناس يميلون إلى وضع صور معدلة وأدت الرغبة في الحصول على بيانات وجه أكثر تنوعًا إلى حدوث فجوة في التقاط صور الأشخاص بشكل طبيعي قدر الإمكان، وغالبًا دون علمهم، خذ مثلا مجموعة بيانات طلاب الجامعات غير المقيدة، حيث تم تصوير حوالي 1700 طالب في جامعة كولورادو، كولورادو سبرينغز، في 20 يومًا مختلفًا، بين شباط/فبراير 2012 وأيلول/سبتمبر 2013، باستخدام "كاميرا مراقبة عالية الدقة بعيدة المدى دون علمهم"، وفقًا لمصمم المجموعة، الأستاذ تيري بولت، عالم كمبيوتر في الجامعة، حتى صور [LFW] ليست بهذا القدر من الدقة؛ لأن الناس يعرفون أنه يتم تصويرها وتحميلها على الإنترنت، لكن هؤلاء طلاب يسيرون على رصيف في الحرم الجامعي، ولا يدركون أنهم جزء من مجموعة البيانات .

هل لديك فرصة للنجاة؟

قطعًا لقد فات الأوان، كما ذكرنا أعلاه، لقد تم اختطافك رقميًا وبشكل حرفي منذ زمن، وتم فرزك وتصنيفك وتنميطك ووضعك في سجل وتحويلك إلى سطر برمجي في خوارزمية عملاقة، لقد فات الأوان الآن أن تستطيع أي جهة وقف هذا الجموح، وليس الأمر إنك لا تثق بالكيان الذي يجمع صورك، بل إنك لا تعرفه أصلًا وقد أصبحت تعلم الآن إنك صرت ضمن اتفاقية المشاع الرقمي، بدون أن يكون لك رأي، فلا أحد يشعر أو يظن إنه ملزم باستشارتك أو أخذ إذنك.

بعد الآن ستظن إنك ستنجو إذا أشحت بوجهك أمام الكاميرات العامة، أو توقفت عن نشر صورك على الانترنت، ولكن للأسف، هيهات، لقد فات الأوان.