Placeholder كيف تتعرف الآلات على المشاعر البشرية ، ولماذا يجب أن أهتم | SINSMART

ROIPRESS / EXPERTS / TECHNOLOGY / AI / NEUROMARKETING - للإجابة على هذه الأسئلة ، يجب أن نبدأ بالسؤال الآخر: كيف تمنح آلة المشاعر؟ يعلم الجميع أن أحد الاختلافات الكبيرة بين البشر والآلات أو الروبوتات هو أن الأشخاص فقط هم من يمكنهم الشعور بالعواطف.

الآلة هي مجرد مزيج من الأصفار والآحاد ، تمت برمجتها من قبل البشر لأداء مهام مختلفة ، مثل التحكم في إشارات المرور ، والحسابات الرياضية ، وألعاب الفيديو ، وما إلى ذلك. حتى أنها مجهزة بما يسمى بالذكاء الاصطناعي ، فهي قادرة على التغلب على أفضل لاعبي الشطرنج (1951) أو مؤخرًا في لعبة Go (2016).

أدى هذا النمو الهائل في قدرات الذكاء الاصطناعي (AI) إلى ظهور كلمات رئيسية جديدة شائعة جدًا مثل #deepLearning أو #machineLearning أو #AI أو #NeuralNetworks. لقد كان التقدم التكنولوجي للشبكات العصبية في السنوات الخمس الماضية مذهلاً ، من وجهة النظر الرياضية وفيما يتعلق باستخدامها في أجهزة الكمبيوتر ، مما جعل من الممكن حل المشكلات التي كانت حتى الآن بعيدة المنال أو التي تتطلب وقتًا طويلاً. من أسابيع إلى شهور.

هذا ما سمح للآلات من خلال الذكاء الاصطناعي بتحديد المشاعر البشرية. لا تستطيع هذه الآلات (في الوقت الحالي) الشعور بالعواطف مثلنا كبشر ، لكنها قادرة على فهم حالتنا العاطفية من خلال الصور ومقاطع الفيديو. لكن السؤال كيف يكون ذلك ممكنا؟

تمامًا كما يفعل بعض البشر ، فإنه يستخدم المعلومات التي توفرها التعبيرات الدقيقة على وجوه الأشخاص.

إمكانات التعبيرات الدقيقة العالمية في الفصائل البشرية.

التعبيرات الدقيقة هي حركة سريعة جدًا (بترتيب ثانية) لا يستطيع البشر التحكم فيها. وتشمل عضلة وجه واحدة أو أكثر متصلة مباشرة بالدماغ. تمت دراسة هذه التعبيرات الدقيقة من قبل المجتمع العلمي ، بما في ذلك بول إيكمان في عام 1978 ، الذي كان قادرًا على تصنيف عضلات الوجه المختلفة وتحديد أن جميع البشر يعبرون عالميًا عن سبع مشاعر أساسية بطريقة متطابقة ، بغض النظر عن أصلنا أو أصلنا. ثقافة. هذه التعبيرات هي: السعادة ، المفاجأة ، الحزن ، الخوف ، الغضب ، الاشمئزاز والازدراء.

تم تدريب البشر منذ صغرهم على رؤية وفهم تلك التعبيرات على وجوه من حولنا والتصرف وفقًا لذلك. على سبيل المثال ، إذا كنت تسافر إلى الخارج ، حتى إذا كنت لا تتحدث لغة السكان الأصليين ، فأنت تفهم غريزيًا أنه من الأفضل عدم الاقتراب من شخص مثل الشخص الموجود في الصورة على اليسار لطلب شيء ما أو حتى الحفاظ على مسافة. ومع ذلك ، كنا نتواصل مع الشخص الموجود على اليمين ، ويمكننا طرح سؤال عليه دون الشعور بأي خطر.

حسنًا ، الآلات التي تستخدم التعبيرات الدقيقة مستوحاة من نظريات إيكمان بمساعدة الذكاء الاصطناعي. لكن هذا لا يفسر كيفية عملها.

دعنا نجيب على هذا السؤال. تستخدم الآلات الشبكات العصبية التلافيفية التي تستخدم وظائف رياضية مثل Leaky Relu لاستنتاج المشاعر البشرية باستخدام صورة أو مقطع فيديو.

إذا لم أكن حاصلًا على درجة الدكتوراه في الرياضيات أو هندسة الكمبيوتر ، ولست خبيرًا في علم الأعصاب أيضًا ، فهل يمكنني فهم كيفية عمل هذه الأجهزة؟

لا تقلق. في أقل من خمس دقائق ، بعد قراءة الفقرات التالية ، ستتمكن من الإجابة على هذا السؤال بنفسك. لمساعدتنا في هذه العملية ، دعنا نستخدم مثالاً.

ما المشاعر الرئيسية التي يمكن أن يعبر عنها الشخص؟

لنأخذ الصور الأربع التالية من مقطع فيديو كمثال ، حيث يعبر الشخص عن مشاعر عميقة. إنهم أول 30 عشرات من الثواني منذ ولادة تلك المشاعر. كشخص ، يجب أن تكون قادرًا على تخمين المشاعر الرئيسية ، أليس كذلك؟

إذا نظرت إلى الصورتين على اليسار ، هل تعتقد أنه رجل سعيد ، على وشك أن يضحك؟

لكن إذا نظرت الآن إلى الصورتين على اليمين ، فهل تعتقد أنه رجل حزين ، وأنه على وشك البكاء؟ أم أنه غاضب من أن يبدأ بالصراخ؟ أنت إنسان لديه خلايا عصبية بيولوجية ، وهذا ليس واضحًا ، أليس كذلك؟

لنرى كيف يواجه الجهاز هذا التحدي باستخدام الشبكات العصبية ، أو ما هو نفسه ، الذكاء الاصطناعي ، ودعنا ننتهز هذه الفرصة لشرح هذه العملية بطريقة بسيطة. يمكنك اختبار ما إذا كان التفسير بسيطًا حقًا ، لأنه حتى الطفل الذي يزيد عمره عن 10 سنوات يجب أن يفهمه.

ما هي الشبكة العصبية؟

في هذه السطور لدينا خلية عصبية. احصل على المعلومات من السهم الموجود على اليسار. تقوم الحسابات الرياضية بتحليل المعلومات ويتم نقل النتيجة عبر السهم الموجود على اليمين.

تحت هذه الأسطر لدينا شبكة من 6 خلايا عصبية. إنهم جميعًا يتلقون المعلومات ويعالجونها وينقلونها. جميعها مترابطة ، مثل الخلايا العصبية البيولوجية البشرية ، مع اختلاف أنها في هذه الحالة هي الأصفار والآحاد في الكمبيوتر.

أسفل هذه الفقرة يمكنك مشاهدة مثال لشبكة عصبية تتكون من عدة "مجموعات" من الخلايا العصبية منظمة في أعمدة تسمى "الطبقات المخفية". يتعامل كل عمود مع معالجة المعلومات وإرسالها إلى العمود الموجود على يمينها ، حتى يتم الوصول إلى نقطة معينة. النتيجة النهائية على سبيل المثال ، التقط الصورة رقم 2 لتظهر ، خطوة بخطوة ، تشغيل الجهاز من خلال شبكته العصبية.

تتمثل الخطوة الأولى في تزويد الجهاز بالصورة (السهم الأول على اليسار). تتعامل الخلية العصبية الأولى مع تحويل هذه الصورة إلى جدول رقمي يمثل مقدار الأحمر والأخضر والأزرق في كل بكسل من الصورة. يجب أن يؤخذ في الاعتبار أن شاشات أجهزتنا تتكون من عدة نقاط (بكسل) ، تتكون بدورها من كمية معينة من الأحمر والأخضر والأزرق ، والتي ينتج عن مزيجها اللون النهائي لكل نقطة. يتم إرسال هذه الجداول الرقمية إلى العمود الثاني من الخلايا العصبية التي تتمثل مهمتها في تحديد الوجوه في الصورة.

والخطوة الثالثة هي نقل الوجه إلى العمود الثالث من الخلايا العصبية ، وهو المسؤول عن اكتشاف النقاط الإستراتيجية على الوجه. تتعرف معظم الشبكات العصبية على ما بين 68 و 105 نقطة على الوجه.

الخطوة الرابعة هي تحديد أجزاء من الوجه مثل الفك أو الفم أو العينين أو الحاجبين.

الخطوة الخامسة هي تحديد عدد المشاعر المقابلة لكل جزء من الوجه. سوف يعطينا الفم على شكل ابتسامة معلومات تتعلق بالسعادة. رفع الحواجب يمكن أن يترافق مع مفاجأة ، وما إلى ذلك.

ستستنتج الآلة في النهاية أن الصورة رقم 2 تحتوي على وجه بشري تربطه 65٪ بالسعادة و 31٪ بالغضب. حسب الآلة ، في هذه الصورة ، الرجل على وشك أن يضحك ، وبالتالي يعبر عن سعادته. من أجل إعطاء نتيجة ذات صلة ، ستحلل الآلة سلسلة متوالية من الصور من مقطع فيديو ، كما يفعل الشخص أثناء حوار مع إنسان آخر ، وهذا ليس إجراءً ثابتًا أيضًا.

لنعد إلى مثالنا ، ونرى ما ستستنتجه الآلة بناءً على هذه الصور الأربع.

ما هي المشاعر الرئيسية لهذا الرجل حسب الآلة؟

كما رأينا سابقًا ، ستتبع الآلة أربع خطوات ، وفقًا لكل عمود من الخلايا العصبية الاصطناعية. في البداية سوف تقوم بعزل وجوه كل صورة من الصور الأربع.

بعد ذلك ستحدد 68 نقطة على كل وجه وتستنتج مكان كل جزء من الوجه (هنا نجمع الخطوتين 2 و 3)

أخيرًا ، تحدد الآلة مقدار المشاعر في كل صورة:

ستحسب الآلة نتائج كل صورة وتستنتج المشاعر الرئيسية التي شعر بها الشخص. وبحسب الآلة فإن هذا الرجل حزين بنسبة 66٪. كإنسان ، من المؤكد أنك توصلت أيضًا إلى نفس النتيجة (ولكن ربما بدون تحديد نسبة مئوية).

إذا وصلت إلى هذا الحد ، فستتمكن من شرح باختصار كيف يمكن للآلة أن تستنتج المشاعر. ألقِ بعض الكلمات الرائعة مثل الشبكات العصبية التلافيفية أو Leaky Relu وستُعتبَر عالِمًا لبضع دقائق.

لكنك تتساءل بالتأكيد: ما الغرض منه؟ ما الذي يمكن للآلة تحقيقه بهذه المعلومات؟

لماذا يجب أن تهتم الآلات بالمشاعر البشرية؟

بينما ننتظر حتى تتمكن الآلات في النهاية من الشعور بالعواطف ، نراهم يعبرون عن أنفسهم كبشر ، أليس من الرائع أن يتمكنوا على الأقل من فهم مشاعرنا؟

على سبيل المثال ، لتجنب إرسال رسالة تذكير لنا "لا تنس قراءة قصة لطفلك الليلة" عندما نكون بعيدًا عن العمل أو نعزلنا في الخارج بسبب فيروس كورونا ، بعيدًا عن أحبائك.

إذا تمكنت الآلات من فهم الحزن الذي يشعر به المرء في ليلة في هذا الموقف ، فربما يمكنها أن تعرض علينا إمكانية إجراء مكالمة فيديو بدلاً من ذلك ، أو عرض ألبوم صور العائلة.

في عالم الأعمال ، يمكن أن يكون لهذا العديد من الآثار المفيدة للبشر. في قطاع الصحة ، على سبيل المثال ، يمكن للآلة مساعدة مرضى التوحد من خلال مساعدتهم على فهم البشر الآخرين.

في عالم الإعلان ، يمكن للآلة تحليل مشاعر المستخدمين وإخبار العلامات التجارية ما إذا كان المستهلك محايدًا أو مؤيدًا لمنتج أو خدمة جديدة ، أو ما هو تأثير رسائل أو شعارات معينة.

بالنسبة لصناعة السينما ، يمكن أن يحسن جودة الأفلام من خلال التأكد من أن الملاحظات الفكاهية مضحكة بالفعل أو أن اللحظة الدرامية توصل هذا الشعور إلى المشاهدين ، وبأي شدة.

نعم ، التطبيقات لا حصر لها.

ومع ذلك ، بصفتي خبيرًا في الرياضيات وعلوم الكمبيوتر وعلم الأعصاب والتواصل غير اللفظي ، أعتقد أن استخدام الذكاء الاصطناعي في تعابير الوجه الدقيقة وحده يمكن أن يؤدي إلى أخطاء كبيرة وتحيزات.

حدود التعبيرات الدقيقة

كبشر ، يعد الوجه أحد الأجزاء الرئيسية في علم وظائف الأعضاء لدينا لفهم ما يشعر به الآخرون ، ولكنه ليس الجزء الوحيد بأي حال من الأحوال. في كل ثانية ودون أن ندرك ذلك ، نقوم بتحليل ما إذا كان محاورنا ينظر إلينا مباشرة أو لديه نظرة متجنبة ، ونحلل إيماءاته وسرعة خطابه ، وكذلك نبرة صوته.

تشير المسافة التي يقع عليها المحاور أيضًا إلى درجة علاقتنا به (إذا كان صديقًا مقربًا ، فسيكون قريبًا ، أو أبعد إذا كان غريبًا أو علاقة عمل ما). لذلك لا يمكن أن يقتصر الجهاز على البيانات التي تم جمعها من تعابير الوجه فقط ويجب أن يبني ذكاءً قادرًا على تحليل العديد من المعايير الأخرى.

المزيج الفائز بين البشر والآلات.

ما فائدة هذا الذكاء الاصطناعي والعواطف في السياق المهني؟

هل يمكن أن يكون تحليل التواصل غير اللفظي وحده كافياً لاستنباط المشاعر وتحديد شدتها؟ بصفتي خبيرًا ، فإن إجابتي المباشرة هي لا.

يعتمد ذلك بشكل خاص على السياق الذي يتفاعل فيه الشخص. على سبيل المثال ، الضحك الحقيقي مع الأصدقاء سيكون تافهاً ومقبولاً. من ناحية أخرى ، إذا حدثت نفس الضحكة أثناء اجتماع احترافي حيث يعبر عميلك عن خلاف معك ، فسيكون ذلك غير مرحب به للغاية وقد تكون العواقب وخيمة ، على الرغم من أن كلا الموقفين بالنسبة للآلة يعتبران تعبيراً عن السعادة.

للاستخدام الاحترافي ، ستحتاج الآلات إلى المعرفة البشرية للحصول على تحليلها الصحيح ، لا سيما فيما يتعلق بسياق المواقف التي يتم فيها تلقي المعلومات ، والعديد من المعايير الأخرى المعقدة جدًا لأتمتة الآلة.

إذا استخدمنا هذا التحالف بين البشر والآلات بذكاء ، فسوف تتحسن القدرات البشرية ، وتكون قادرة على تسهيل التبادل بين الرجال والنساء والشركات والعملاء أو الحكومات والمواطنين.

أنا مقتنع بأن التحالف بين الإنسان والآلة الذي يركز على تحليل المشاعر الإنسانية سيؤدي إلى تحسين التفاعلات بين الأشخاص وتحسين صلة العلاقات بين الشركات والعملاء.

Reprinted in:La Voz de La Empresa

Leave a comment

Your cart

×