تم تدريب الذكاء الاصطناعي الجديد للتعرف على الصور على Facebook على مليار صورة على Instagram

19

إذا كان Facebook يحمل شعارًا غير رسمي ، يعادل شعار Google “Don’t Be Evil” أو “فكر بشكل مختلف” من Apple ، فهو “Move Fast and Break Things.” هذا يعني ، من الناحية النظرية على الأقل ، أنه يجب على المرء أن يكرر تجربة أخبار الأشياء وألا يخاف من احتمال الفشل. ومع ذلك ، في عام 2021 ، مع إلقاء اللوم حاليًا على وسائل التواصل الاجتماعي في عدد كبير من العلل المجتمعية ، ربما ينبغي تعديل العبارة إلى: “تحرك بسرعة وإصلاح الأشياء”.

تعرضت وسائل التواصل الاجتماعي ، وليس الفيسبوك فقط ، للسخرية بسبب انتشارها لصور معينة على الإنترنت. إنها مشكلة صعبة بأي شكل من الأشكال: يتم تحميل حوالي 4000 صورة على Facebook كل ثانية. وهذا يعادل 14.58 مليون صورة في الساعة ، أو 350 مليون صورة كل يوم. يتطلب التعامل مع هذه الوظيفة يدويًا أن يعمل كل موظف على Facebook في مناوبات مدتها 12 ساعة ، والموافقة على صورة يتم تحميلها أو رفضها كل تسع ثوانٍ.

facebook hacked
رسم الاتجاهات الرقمية

من غير المحتمل أن يحدث هذا في أي وقت قريب. هذا هو سبب تسليم مهمة تصنيف الصور لأنظمة الذكاء الاصطناعي. يصف جزء جديد من بحث على Facebook ، نُشر اليوم ، نموذجًا جديدًا لرؤية الكمبيوتر واسع النطاق يسمى SEER (هذا “SElf-supERvised” في تقليد الخلفية المشوهة بشكل ميؤوس منه والذي يحب خبراء التكنولوجيا احتضانه). تم تدريبه على أكثر من مليار صورة عامة على Instagram ، ويمكنه أن يتفوق في الأداء على نظام التعرف على الصور الأكثر حداثة للمراقبة الذاتية ، حتى عندما تكون الصور منخفضة الجودة وبالتالي يصعب قراءتها.

إنه تطور يمكن ، كما يدعي منشئوه ، ” الطريق لنماذج رؤية حاسوبية أكثر مرونة ودقة وقابلية للتكيف “. يمكن استخدامه لإبقاء “الصور أو الميمات الضارة بعيدًا عن منصتنا بشكل أفضل”. يمكن أن يكون مفيدًا بنفس القدر لإنشاء صور لوصف النص البديل تلقائيًا للأشخاص ضعاف البصر ، والتصنيف التلقائي المتفوق للعناصر التي سيتم بيعها في Marketplace أو متاجر Facebook ، والعديد من التطبيقات الأخرى التي تتطلب رؤية كمبيوتر محسنة.

مرحبًا بكم في ثورة الإشراف الذاتي

“باستخدام الإشراف الذاتي ، قالت بريا جويال ، مهندسة برمجيات في Facebook AI Research (FAIR) ، حيث تجري الشركة الكثير من أبحاث التعرف على الصور المبتكرة ، لـ Digital Trends ، “يمكننا التدرب على أي صورة عشوائية”. “[That] تعني أنه مع تطور المحتوى الضار ، يمكننا تدريب نموذج جديد سريعًا على البيانات المتطورة ، ونتيجة لذلك ، الاستجابة بشكل أسرع للمواقف.”

الإشراف الذاتي يشير غويال إلى علامة تجارية للتعلم الآلي تتطلب قدرًا أقل من المدخلات البشرية. التعلم شبه الخاضع للإشراف هو نهج للتعلم الآلي يقع في مكان ما بين التعلم الخاضع للإشراف والتعلم غير الخاضع للإشراف. في التعلم الخاضع للإشراف ، يتم تصنيف بيانات التدريب بالكامل. في التعلم غير الخاضع للإشراف ، لا توجد بيانات تدريب مصنفة. في التعلم شبه الخاضع للإشراف … حسنًا ، فهمت الفكرة. بالنسبة للتعلم الآلي ، فإن ما تبقيه نصف عين على طفلك أثناء شحنه بشكل مستقل حول الحديقة هو الأبوة والأمومة. تم استخدام التعلم تحت الإشراف الذاتي لإحداث تأثيرات تحويلية في عالم معالجة اللغة الطبيعية لكل شيء من الترجمة الآلية إلى الإجابة على الأسئلة. الآن ، يتم تطبيقه على التعرف على الصور أيضًا.

brain network on veins illustration كريس ديجرو / ديجيتال تريندز ، جيتي إيماجيس

“التعلم بدون إشراف واسع جدًا مصطلح يشير إلى أن التعلم لا يستخدم أي إشراف على الإطلاق ، “قال جويال. “التعلم تحت الإشراف الذاتي هو مجموعة فرعية – أو حالة أكثر تحديدًا – من التعلم غير الخاضع للإشراف ، حيث يستمد الإشراف الذاتي الإشارات الإشرافية تلقائيًا من بيانات التدريب.”

ماذا يعني التعلم تحت الإشراف الذاتي بالنسبة لـ Facebook هو أنه يمكن لمهندسيها تدريب النماذج على صور عشوائية ، والقيام بذلك بسرعة مع تحقيق أداء جيد في العديد من المهام.

“القدرة على التدريب على أي صورة عشوائية عبر الإنترنت تتيح لنا التقاط قال جويال: “التنوع البصري للعالم”. “من ناحية أخرى ، يتطلب التعلم الخاضع للإشراف تعليقات توضيحية للبيانات ، مما يحد من الفهم البصري للعالم حيث يتم تدريب النموذج على تعلم مفاهيم مشروحة بصرية محدودة للغاية. كما أن إنشاء مجموعات بيانات مشروحة يحد من كمية البيانات التي يمكن تدريب أنظمتنا عليها ، وبالتالي من المرجح أن تكون الأنظمة الخاضعة للإشراف أكثر تحيزًا. ”

ما يعنيه هذا هو أن أنظمة الذكاء الاصطناعي يمكنها التعلم بشكل أفضل مهما كانت المعلومات التي يتم تقديمها لهم ، دون الحاجة إلى الاعتماد على مجموعات البيانات المنسقة والمصنفة التي تعلمهم كيفية التعرف على كائنات معينة في الصورة. في عالم يتحرك بسرعة مثل العالم عبر الإنترنت ، هذا ضروري. يجب أن يعني التعرف على الصور بشكل أكثر ذكاءً ويعمل بشكل أسرع.

تطبيقات أخرى محتملة

)

قال جويال: “يمكننا استخدام نماذج الإشراف الذاتي لحل المشكلات في المجالات التي تحتوي على بيانات محدودة للغاية أو لا تحتوي على بيانات وصفية ، مثل التصوير الطبي”. “القدرة على تدريب نماذج عالية الجودة تخضع للإشراف الذاتي من صور عشوائية وغير مصنفة وغير مشبعة ، يمكننا تدريب النماذج على أي صورة على الإنترنت ، وهذا يسمح لنا بالتقاط تنوع المحتوى المرئي ، والتخفيف من التحيزات التي يقدمها تنظيم البيانات. نظرًا لأننا لا نحتاج إلى تسميات أو تنظيم بيانات لتدريب نموذج يخضع للإشراف الذاتي ، يمكننا إنشاء نماذج جديدة ونشرها بسرعة لحل المشكلات. ”

كما هو الحال مع جميع أعمال FAIR ، هذا الآن في مراحل البحث ، بدلاً من أن تكون تقنية سيتم نشرها في موجز Facebook الخاص بك في الأسبوعين المقبلين. هذا يعني أنه لن يتم نشر هذا على الفور لحل مشكلة انتشار الصور الضارة عبر الإنترنت. في الوقت نفسه ، هذا يعني أن المحادثات حول استخدام الذكاء الاصطناعي لتحديد التفاصيل الدقيقة في الصور التي تم تحميلها سابقة لأوانها.

سواء أعجبك ذلك أم لا ، على الرغم من أن أدوات تصنيف الصور بالذكاء الاصطناعي أصبحت تحصل على أذكى. السؤال الكبير هو ما إذا كانوا معتادون على كسر الأشياء أكثر أو البدء في إصلاحها مرة أخرى.

توصيات المحررين

لماذا يمكن أن يكون تعليم الروبوتات للعب الغميضة هو المفتاح للجيل القادم من الذكاء الاصطناعي

  • شطرنج. خطر. يذهب. لماذا نستخدم الألعاب كمعيار للذكاء الاصطناعي؟
  • يستخدم العلماء الذكاء الاصطناعي لإنشاء شفرة وراثية بشرية اصطناعية
  • يعد نظام الذكاء الاصطناعي الجديد الذكي بتدريب كلبك أثناء تواجدك بعيدًا عن المنزل يشبه BigSleep AI البحث عن صور Google للصور التي لم توجد بعد

brain network on veins illustration