تأثير سامانثا: نظرة فاحصة على مستقبل الروبوتات

في عام 2013 ، أصدرت Spike Jonze الفيلم الدرامي rom-indie-Sci-Fi-الدرامي.

يتبع الفيلم المسار التطوري لأول نظام تشغيل ذكي في العالم ، "سامانثا".

تشير سكارليت جوهانسون إلى جانب أن سامانثا هي حلم كل مطور: مثال مثالي على الذكاء الاصطناعي "الحقيقي" (AI). إنها محادثة مثيرة للإعجاب ، فهي تستوعب السياق واللغة الطبيعية والعواطف والحس السليم.

من الواضح أن البوتات الحديثة ليست على مستوى سامانثا. في أحسن الأحوال ، يمكنهم تقديم نتائج محددة عبر واجهة محادثة. في أسوأ الأحوال ، إنهم يصيبونك بخيبة أمل محبطة.

بما أن التكنولوجيا تتطور بسرعة البرق ، فهل يمكننا أن نتحرك نحو عصر يمكن أن يوجد فيه روبوت يشبه سامانثا؟

بيانات ذكية عاطفيا

يجمع الذكاء الاصطناعى اليوم بين المعالجة الرمزية (الذكاء الاصطناعى باستخدام القواعد والمنطق الصريح) مع التعلم الآلي بطريقة تستغل نقاط قوتها وتقلل من نقاط ضعفها.

على سبيل المثال ، تتيح لنا المعالجة الرمزية تحديد المعرفة والسلوكيات التي قد يصعب التعلم من البيانات فقط. التعلم الآلي يكمل هذا من خلال مساعدة النظام على التكيف مع المواقف غير المتوقعة والمفاهيم الجديدة.

يحتوي هذا المزيج أيضًا على خصائص مفيدة تتجاوز تسريع عملية التعلم. في المستقبل ، يمكن أن يمنحنا القدرة على التفاعل بطريقة تشبه الإنسان أكثر مع الروبوتات.

لأنه ، على الرغم من كل الصفات المغرية ، لا يزال التعلم الآلي عملية إحصائية بشكل أساسي. وهذا يعني أنها تعكس جودة البيانات التي تعتمد عليها.

هذه نعمة ونقمة. تعني حساسية التعلم الآلي لخصائص بيانات الإدخال الخاصة به أنه يمكن بسهولة تعلم الشيء الخطأ ، كما هو موضح في حالة Tay ، روبوت Microsoft العنصري الخاص.

وقد قيل أيضًا أن البيانات التي يتم اختيارها للتعلم الآلي غالباً ما تعكس التحيزات اللاواعية للباحث / المطور (عادة ما تكون من الذكور البيض الشباب).

لكي نقترب من قدرة سامانثا على التأمل والتفكير ، سنحتاج إلى برمجة نوع من الذكاء العاطفي الاصطناعي في برامجنا: لتمكينهم من الإجابة

"لماذا اخترت أن تفعل هذا؟"

وحتى أنظمة اليوم البسيطة نسبياً تتخذ خطوات نحو تجميع الإجابات الفردية للأسئلة.

ولكن في الوقت نفسه ، فإن التأكد من أننا نطبق خوارزميات التعلم الآلي لدينا على بيانات جيدة النوعية في بيئة مراقبة عن كثب هو الأقرب إلى أننا سنصل إلى الأجهزة الذكية عاطفياً.

الويب الدلالي

كان مبدع شبكة الويب العالمية تيم بيرنرز لي متقدماً على الوقت الذي اقترح فيه الويب الدلالي في عام 2001:

"نظام يسمح لأجهزة الكمبيوتر باستنتاج معنى من العلاقات بين الموارد في الويب".

في الأساس ، ستكون الآلات قادرة على ربط الأفكار والمفاهيم والحقائق معًا بدلاً من المستندات والصفحات.

هذا سيسمح لـ "مساعدي الكمبيوتر" الذين يشبهون سامانثا بـ "قراءة" المعلومات عنا والعمل نيابة عنا: تحديد مواعيدنا بشكل مستقل وتنظيم سفرنا وإبداء تحفظات العشاء. مرحبا ، PA أحلامنا.

لقد تم بالفعل تحقيق رؤية بيرنرز لي إلى حد ما من خلال الرسم البياني للمعرفة من Google ، والذي تطلب من جوجل توظيف الآلاف من الأشخاص لإدخال قواعد واضحة في تمثيل رمزي للمعرفة المنطقية.

يسمح هذا لـ Google بالإجابة على الأسئلة باستخدام مربع صغير من البيانات المهيكلة (أدناه) ، بدلاً من مجرد قائمة صفحات الويب.

قد تكون تقنيات التعرف على الصور أيضًا مقدمة للويب الدلالي ؛ يمكن أن يتعرف AI هذا بالفعل على الكلمات الرئيسية والتركيبة السكانية والألوان والوجوه في الصور.

التعرف على الكلام الطبيعي

القدرة على فهم اللغة الطبيعية أمر أساسي لنجاح الروبوت ؛ مع النص ، ولكن أيضا مع التعرف على الصوت.

من الناحية المثالية ، يجب أن يكون الروبوت قادرًا على الوصول إلى هدفه عن طريق ملء فراغات المحادثة تلقائيًا.

سيري وكورتانا وأليكسا لا يتماشيان تمامًا مع معايير سامانثا حتى الآن. لكن أداءها في هذا المجال لا يبدو بعيد المنال.

تتراجع معدلات أخطاء التعرف على الكلام عند 20٪ تقريبًا كل عام ، مع وصول Google مؤخرًا إلى 4.1٪ فقط - وهو ما يقرب من دقة مثيله للبشر.

يمكن أن تعزى هذه التحسينات إلى سلسلة من الابتكارات: صفائف الميكروفون المتعددة ، الحزم الاتجاهية ، ومعالجة الضوضاء المعقدة وتطبيق القياسات الحيوية الصوتية.

تحليل المشهد السمعي هو أسلوب واعد آخر يحاول فصل مصادر الصوت المختلفة.

يستفيد التعرف على الصوت أيضًا من المجموعة الضخمة المتزايدة من البيانات المستخدمة لتدريب النماذج الإحصائية باستخدام تقنيات التعلم الآلي: أحدها يسمى الشبكات العصبية العميقة (DNNs).

تتكون DNNs من طبقات متعددة متصلة بوحدات المعالجة المستوحاة من الشبكات العصبية للدماغ البشري.

يمكنهم تصنيف مجموعة متنوعة من المدخلات - الصور وتسلسل الكلمات والمواقع ونطق الكلام - في الفئات المطلوبة ، مثل الكلمات والكائنات وتمثيل المعنى.

السياق والتجريد

يعتمد نوع التفكير الذي نفعله كبشر على فهم السياق وصنع الاستدلالات. في بعض الأحيان تكون هذه منطقية ، ولكنها في أغلب الأحيان تستند إلى معرفتنا المشتركة بالعالم: إدراك أن X قد يؤدي إلى Y.

عند تطبيقه على الذكاء الاصطناعي ، يجب أن يكون المساعد الافتراضي المثالي قادرًا على اقتراح البدائل عند مواجهة قيود ، والنظر في إمكانيات مختلفة وفهم أهميتها:

أنا: "أود شراء بعض الأحذية في ميليسا اليوم"
بوت: "آسف ، ميليسا مغلقة. لماذا لا تجرب Office ، وهو مشابه وقريب؟ "

يمكن لبوت الروبوت ، من حيث المبدأ ، أن يتعلم هذه الارتباطات من خلال التجربة والخطأ ، لكن هذا سيستغرق الأعمار: لكل تفاعل يوجد مليون اختلاف.

بعض الباحثين في منظمة العفو الدولية يعتقدون أن المفتاح لأجهزة الكمبيوتر للتعلم عن طريق القياس. إنها هذه القدرة التي تسمح للبشر بالتعميم من حالة إلى أخرى ، للتخلص من السياق إلى مستوى أعلى من الفهم

روبوتات السبر البشري

لا يزال النطاق العاطفي والانحراف في صوت سامانثا بعيدًا عن متناولنا ، لكن نماذج توليد الكلام الجديدة مثل Google WaveNet قادرة على إنتاج أصوات مصطنعة "مقنعة بشكل رائع".

لا مزيد من الروبوتية سيري.

إن الصوت الطبيعي الساطع يزيد بشكل كبير من انطباعنا عن ذكاء الآلة. الجانب السلبي لهذا هو أنه يثير التوقعات نيابة عن المستخدم ، مما قد يؤدي إلى فشل المحادثة والإحباط.

ونحن نعلم جميعًا ما هو مقدار الصبر الذي لدينا مع الماكينة عن الصبر ...

سواءً كان بإمكان الروبوت أن يرقى إلى مستوى توقعاتنا ، فنحن على استعداد لوضع إيماننا في الآلات التي تظهر سلوكًا يشبه الإنسان (التلاعب بالكلمات والتورية والنكات والاقتباسات والاستدلالات العاطفية).

هذا يضع في الاعتبار اختبار تورينج ، حيث يشترك القاضي البشري في محادثة مع إنسان وآلة أخرى. إذا كان القاضي غير قادر على إخبار الآلة من الإنسان ، فقد اجتاز الجهاز الاختبار.

أفكارا

هل يمكن أن تساعدنا الذكاء الاصطناعي على تطوير "البصيرة"؟

توفر لك البصيرة ، في جوهرها ، شيئًا جديدًا وقيمًا في آن واحد. والأهم من ذلك ، أنه يساعد في توجيه القرارات والإجراءات المستقبلية - شيء صعب على البرمجيات لفهمه.

نحن نعرف نظرة ثاقبة عندما نراها ، لكن من الصعب تحديد أو رسم حدود حادة حولها. والقدرة على تطوير نظرة ثاقبة ينطوي على تحديد الأنماط والعلاقات والعلاقات.

لقد دخلت بعض مشاريع التعلم الآلي بالفعل في هذا المجال.

على سبيل المثال ، يعد Google Deep Mind (الذي يستخدم أيضًا DNNs) جيدًا في تحديد الأنماط الجديدة ، على مستوى من التعقيد يتجاوز في حالة واحدة (اللعبة Go) مستوى البشر. لكن تقنيات مثل هذه تعمل فقط إذا أخبرنا الجهاز عن الهدف (في هذه الحالة: الفوز باللعبة).

يمكن للبشر فقط تحديد أنماط جديدة مثيرة للاهتمام دون هدف محدد مسبقًا. يمكن للآلة تحديد الأنماط إذا كانت تفهم الهدف ؛ يمكن للبشر فقط التعرف على الأنماط بشكل خلاق.

من ناحية أخرى ، فإن إحدى المشكلات التي يواجهها البشر هي أنه عندما نركز على مهمة محددة ، فإننا نعتمد على الكثير من المعلومات. تم الحصول على بعض هذه المعلومات دون وعي ، من خلال التجربة ؛ بعض من خلال التعلم المتعمد.

ولكن مع زيادة حجم المعلومات ، يصبح المبلغ الذي يمكننا التدقيق فيه أقل نسبيًا.

لذلك ، هنا تتمتع الأجهزة بميزة ؛ إنهم أفضل في التعامل مع مجموعات كبيرة من البيانات.

عندما نقوم بتجميع ودمج هذه البيانات ، يمكن للآلات أن تتعاون معنا في المناطق التي نكافح فيها.

وفي الوقت الحالي ، فإن معظم المعلومات الرقمية في شكل نص - أي أن البيانات غير منظمة ، بدلاً من البيانات المنظمة الموجودة في قواعد البيانات التقليدية.

البيانات النصية

يأخذنا هذا إلى مجال قراءة الماكينات التي انتقلت على مدار العشرين عامًا الماضية من مختبرات الأبحاث إلى التطبيقات التجارية.

على الرغم من أنها لا تزال بعيدة عن الكمال ، فإن التقنيات الآلية لفهم النصوص المكتوبة قد نضجت مؤخرًا بسرعة ، مدعومة بتطورات جديدة في الذكاء الاصطناعى.

إليكم مثال.

يدخل المريض إلى مكتب الطبيب مصابًا بمرض نادر لا يعرفه الطبيب. يستشير الطبيب مساعده الرقمي ، الذي يقوم بمسح جميع المجلات الطبية والحقائق والمعلومات المكتوبة من أي وقت مضى حول هذا المرض في ثوان.

ثم يلخص هذه المعلومات ويعرضها على الطبيب في قطع صغيرة.

تحاول Maluuba ، وهي شركة ناشئة للتعلم العميق حصلت عليها Microsoft مؤخرًا ، تطوير "آلة لمحو الأمية" يمكنها قراءة النص وتعلم التواصل على هذا الأساس.

في الأساس ، يمكن لأجهزة الكمبيوتر مسح ، ورعاية وتلخيص كميات هائلة من النص بطرق لا يمكننا أبدا أن نحلم بها.

ولا يتعين علينا استخدام لغات برمجة الكمبيوتر عالية التقنية أو استعلامات قاعدة البيانات لنقول ما نبحث عنه: يمكن للأنظمة المطورة حديثًا أيضًا استخدام اللغة الطبيعية لطرح أسئلة حول النص.

هذا شيء نعرفه بالفعل إلى حد ما ، وذلك بفضل كتابة طلبات البحث في أمثال Google (الإكمال التلقائي يجعل هذا الأمر أسهل).

كل هذا يجعل البوتات مورثًا طبيعيًا لهذا التقليد.

الانقلاب النهائي هو أن لدينا الآن التخصيص من خلال التطبيقات التي تتعلم عن طريق التفاعل.

على سبيل المثال ، تقوم Replika بتطوير أنماط خاصة للغة تعتمد على المسح الضوئي من خلال جلسات الدردشة السابقة ، مما يخلق معرفة بتفضيلات المستخدم وأولوياته.

وهذا يأخذنا قريبة جدا من أراضي سامانثا.

الذكاء البشري المدعوم من منظمة العفو الدولية

خلال الثورة الصناعية الأولى ، بدأت الآلات في تولي العمل اليدوي.

اليوم ، مع Industry 4.0 ، يتولون العمل الذهني اليدوي أيضًا.

تقريبا أي مهمة روتينية يمكن أن يكون آليا.

وباعتبارنا مندوبي مبيعات ومسوقين ، فهناك الكثير من المهام اليومية التي لا نمانع من إعفائنا عنها ، مثل:

... إدخال إدخالات البيانات يدويًا ، والبحث عن الموضوعات ومقالات الأفكار ، والخوض عبر رسائل البريد الإلكتروني التي لا نهاية لها ...

من خلال نقلها إلى "ذهن" ذكي بشكل مصطنع ، يمكننا تركيز جهودنا على المجالات التي نتفوق فيها (كبشر) ، والتي تميزنا (كبشر) عن الآلات.

كانت هذه نقطة انطلاقنا في تطوير GrowthBot ، روبوتات التسويق والمبيعات لدينا المصممة لمساعدتك على تنمية أعمالك.

لا يمكن لمنظمة العفو الدولية إنتاج رؤى جديدة ؛ ولكن يمكن أن يساعدنا في جعل إبداعنا في اللعب بشكل أكثر فعالية.

قد ننظر إلى مجموعة من البيانات والعلاقات والارتباطات ، ونعتقد أننا نرى شيئًا جديدًا ، شيء يساعدنا في فهم العالم بشكل أفضل.

بعد كل شيء ، هذا ما يجيده البشر.

لكن هل هذه البصيرة مجرد حدس أم أكثر من ذلك؟ هذا هو المكان الذي يمكننا فيه إصدار تعليمات التشغيل التلقائي للتخلص من الافتراضات وخلق الشفافية.

الطريقة التي نراها ، الجانب الأكثر وعدًا في الذكاء الاصطناعي ليس القدرة على تكرار رفيق نابض بالحياة مثل سامانثا - ولكن تضخيم ذكائنا الخاص كبشر.

شكرا للقراءة.

إذا استمتعت بهذا المقال ، فلا تتردد في الضغط على زر التصفيق هذا others لمساعدة الآخرين في العثور عليه.

.

نشرت أصلا في blog.growthbot.org.