معلومات

الباحثون يتطلعون إلى الدماغ بحثًا عن خوارزميات لمشكلة حفلة الكوكتيل

الباحثون يتطلعون إلى الدماغ بحثًا عن خوارزميات لمشكلة حفلة الكوكتيل

تعد قدرة الكمبيوتر على التعرف على بعض الإشارات المخبأة في كتلة من البيانات الصاخبة دون غيرها مشكلة معروفة ومستعصية حاليًا لعلماء الكمبيوتر العاملين في مجال اللغة ومعالجة الصوت. تُعرف باسم مشكلة حفلة الكوكتيل ، الخوارزميات التي يمكنها تحديد صوت معين وتضخيمه بينما تخفف من نشاز الأصوات والضوضاء والتشويه الناتج عن البيئة ظلت بعيدة المنال حتى الآن.

ذات صلة: جهاز الكمبيوتر الذكي هذا يعطي صوتًا لمن لا يستطيع التحدث

لحسن الحظ ، لدى العلماء نظام للنمذجة لمساعدتهم على حل هذه المشكلة: الدماغ البشري. البشر حيوانات اجتماعية ، وعلى هذا النحو ، فقد تطورت أدمغتنا بشكل كبير لعزل والتركيز على صوت الشخص الذي نتحدث إليه ، مما يؤدي إلى إخماد الأصوات والضوضاء البيئية الأخرى وكتمها في كثير من الأحيان لسماع ما يقوله الشخص. الآن ، بدأ الباحثون في إحراز تقدم كبير في فهم كيفية قيام الدماغ بعزل ومعالجة صوت معين من بين العديد من الأشخاص بالإضافة إلى تطوير مناهج جديدة لحل المشكلة.

تأثير حفل الكوكتيل

تأثير حفلة الكوكتيل ، كما هو معروف ، هو قدرة الدماغ البشري على التركيز على صوت واحد في حشد من الناس وعزله عن الضوضاء البيئية المحيطة. على الرغم من أن هذا قد يبدو واضحًا إلى حد ما بالنسبة للبعض ، إلا أنه من السهل اعتبار تأثير حفلة الكوكتيل أمرًا مفروغًا منه وعدم تقدير مدى استثنائية العملية العصبية.

في حشد من الناس ، الأصوات عبارة عن تشويش في الهواء المحيط الذي يضرب ويتناثر في بعضها البعض ، مما يجعل من الصعب سماع صوت أي شخص ما لم يتغلب ببساطة على كل ما تبقى من الصراخ أو شيء مشابه. نظرًا لأن هذا ليس حلاً مثاليًا لمشكلة حفل الكوكتيل ، فإن أدمغتنا تفعل شيئًا آخر بدلاً من ذلك يكون غير عادي إلى حد ما.

في أجزاء من الثانية ، تحدد أدمغتنا وتعزل الإشارة الصوتية للشخص الذي نريد الاستماع إليه وتضخيمها. بعد ذلك ، يقوم بتصفية أو إخفاء جميع الإشارات الصوتية أو الضوضاء الأخرى بحيث يتم قمع هذه الأصوات ، مما يسمح لنا بسماع ما يقوله الشخص في معظم الظروف الاجتماعية.

كل يوم ، تعالج أدمغتنا عددًا لا نهائيًا من الأصوات التي تعطيها الأولوية في أجزاء من الثانية. ومثلما يقومون باستمرار بإزالة صورة ذلك الجزء من أنفنا الذي يمتد جسديًا إلى مجال رؤيتنا غير المعوق ، فإن دماغنا يضخم الأصوات التي نركز عليها ويقمع الضوضاء الأخرى ذات الأولوية المنخفضة في البيئة بحيث وظيفيا تختفي.

لكن كيف تحقق أدمغتنا بالضبط هذا التأثير المذهل لحفل الكوكتيل كان لغزًا لعقود من الزمن بعد أن ناقش الباحثون `` مشكلة حفل الكوكتيل '' لأول مرة في الخمسينيات من القرن الماضي. لحسن الحظ ، سلطت الأبحاث في السنوات القليلة الماضية الضوء على كيفية تحديد أدمغتنا وعزلها للإشارات الصوتية المهمة جدًا في البيئات الاجتماعية ، مما يقربنا أكثر من أي وقت مضى من تكرار نفس العملية باستخدام آلة.

فصل الإشارات الصوتية المختلفة في القشرة السمعية

ال العقد الماضي شهدت تحسينات كبيرة في فهمنا لكيفية تحديد البشر للكلام واللغة ومعالجتها. قام زوجان من الباحثين بدعم من المعهد الوطني الأمريكي للصمم واضطرابات التواصل الأخرى بنشر بحث رائع في المجلة طبيعة في 2012 أظهر ذلك كيف لم نتمكن فقط من رؤية كيف يقوم الدماغ بالترشيح والتمييز بين الإشارات الصوتية المتنافسة ، بل تمكن الباحثون حتى من التنبؤ بالكلمة التي كان المستفتى يستمع إليها.

إدوارد تشانغ ، دكتوراه ، جراح أعصاب وأستاذ مشارك في جامعة كاليفورنيا في سان فرانسيسكو (UCSF) لم يكن يبحث في البداية عن تحديد كيفية تحقيق الإنسان لتأثير حفل الكوكتيل. كان يعالج مرضى الصرع. قام بزرع ورقة 256 قطب كهربائي مباشرة تحت جمجمة مرضاه لمراقبة النشاط الكهربائي في الطبقة الخارجية من الخلايا العصبية في الفص الصدغي.

أدرك Chang و Nima Mesgarani ، دكتوراه ، زميل ما بعد الدكتوراه في UCSF ، أن هؤلاء المرضى قدموا لهم فرصة نادرة. باستخدام أجهزتهم المتطورة - التي كانت حساسة بدرجة كافية لاكتشاف إطلاق خلية عصبية واحدة - وحقيقة أن الأقطاب الكهربائية داخل الجمجمة ستكون أيضًا قادرة على مراقبة القشرة السمعية - الموجودة في الفص الصدغي - يمكنهم الدراسة كيف يعالج الدماغ الأصوات بتفاصيل غير مسبوقة.

استمع ثلاثة متطوعين إلى تسجيلات صوتية متزامنة ، قرأ أحدها امرأة والآخر قرأه رجل ، مع تعليمات للاستماع إلى إحدى الكلمتين المستهدفتين المحددتين التي ستبدأ العينة الصوتية ، ثم قاموا بالإبلاغ عن الصوت الموجود على الصوت قال عينة بعد تلك الكلمات. من خلال تحليل القراءات من الأقطاب الكهربائية باستخدام خوارزمية فك التشفير التي يمكنها تحديد الأنماط وإعادة بناء ما سمعه الموضوع ، وجد الباحثون أن القراءات من الأقطاب الكهربائية تلتقط فقط نمط السماعة المستهدفة ، مما يعني أن القشرة السمعية تتجاهل غير- المتحدث المستهدف بالكامل.

قال تشانغ: "اعتقد الكثير من الناس أن القشرة السمعية تقوم فقط بتمرير هذه المعلومات إلى الجزء المعرفي من الدماغ والقشرة الأمامية ومناطق التحكم التنفيذية ، حيث ستتم معالجتها حقًا". ما وجدناه هو ذلك القشرة السمعية في حد ذاتها معقدة للغاية. يبدو الأمر كما لو أنها تعرف الأصوات التي يجب تجميعها معًا وتستخرج فقط تلك المتعلقة بالمتحدث الواحد. "

والأمر الأكثر أهمية هو حقيقة أن خوارزمية فك التشفير كانت قادرة على التنبؤ بالمتحدث الذي كان الشخص يستمع إليه بناءً على النشاط العصبي وحده وأنه كان قادرًا على اكتشاف اللحظة التي تحول فيها انتباه الأشخاص إلى المتحدث الآخر أو انحرف عنه. ما يخبرنا به هذا هو أن القشرة السمعية تحمل المفتاح لفهم كيف يمكن للدماغ البشري أن يتعامل مع مشكلة حفل الكوكتيل بطريقة لا تستطيع أجهزة الكمبيوتر حاليًا التعامل معها.

التفريق بين الصوت والصوت

في حين أن الكمبيوتر يمكنه فك شفرة النشاط العصبي للدماغ ومعرفة بالضبط ما سمعته القشرة السمعية بالفعل ، فإن هذا لا يكفي للتغلب على مشكلة حفل الكوكتيل بمفرده ؛ ما زلنا بحاجة إلى معرفة كيف يقوم الدماغ بالفعل بعمل هذه الفروق ويميز الإشارات الصوتية والضوضاء البيئية الأخرى للتركيز على الصوت المستهدف.

نشر باحثون في جامعة جنيف بسويسرا (UNIGE) وجامعة ماستريخت في هولندا ورقة بحثية هذا الصيف في المجلة. طبيعة سلوك الإنسان التي حاولت الوصول إلى الآلية الجذرية لهذه العملية ، وهي كيفية معالجة الدماغ للأصوات التي نسمعها والكلمات التي يتم التحدث بها.

للقيام بذلك ، ابتكر الباحثون مجموعة من الكلمات الكاذبة - كلمات ليس لها معنى - يتحدث بها أخصائي صوتي مدرب في ثلاث طبقات مختلفة. ثم طُلب من الأشخاص الذين يسمعون عينات الصوت أداء المهام السمعية المحددة للتمييز بين النغمات المختلفة لنفس الصوت أو من خلال الاستماع إلى أصوات الكلام بأنفسهم ، والمعروفة باسم الصوتيات.

قال Narly Golestani ، الأستاذ في قسم علم النفس في UNIGE: "أنشأنا 120 كلمة مستعارة تتوافق مع علم الأصوات للغة الفرنسية ولكن هذا لا معنى له ، للتأكد من أن المعالجة الدلالية لن تتداخل مع الإدراك الصافي للفونيمات". كلية علم النفس والعلوم التربوية (FPES) ومؤلف مشارك في البحث.

قالت ساني روتن ، الباحثة في FPES التابعة لـ UNIGE والمؤلفة المشاركة للورقة البحثية ، إن مهمة التمييز بين أصوات المتحدث يجب أن تكون صعبة بقدر الإمكان بالنسبة للموضوع من أجل الدراسة الدقيقة للطريقة التي يؤدي بها الدماغ هذه السمعية. معالجة. "لجعل التمييز بين الأصوات صعبًا مثل التمييز بين أصوات الكلام ، أنشأنا تصورًا لثلاثة أصوات مختلفة من المنبهات المسجلة ، بدلاً من تسجيل ثلاثة أشخاص مختلفين فعليًا."

قبل الاختبار ، قام الباحثون بتحليل الاختلافات في المعلمات الصوتية بين الأصوات الصوتية وأصوات الصوت ، مثل التردد - إما مرتفع أو منخفض - التعديل الزمني - السرعة المدركة للصوت المنطوق - والتعديل الطيفي - طريقة توزيع الطاقة الصوتية على الترددات المختلفة. تم تحديد التعديلات الطيفية العالية لتكون مفيدة للغاية في التمييز بين عينات الصوت المختلفة ، وأن التعديلات الطيفية المنخفضة جنبًا إلى جنب مع التعديل الزمني السريع كانت مفيدة للغاية في تحديد الاختلافات في الصوتيات.

أثناء الاختبار نفسه ، طُلب من الأشخاص تحديد ثلاثة أصوات محددة للكلام - / p / أو / t / أو / k / ، كما هو الحال في pseudowords preperibion ​​و gabratade و ecalimacre - أو تحديد ما إذا كانت العينة قد تم نطقها عن طريق الصوت واحد أو اثنين أو ثلاثة. أثناء الاختبار ، تم فحص أدمغتهم بواسطة جهاز التصوير بالرنين المغناطيسي الوظيفي (fMRI) لرصد أكسجة الدم في الدماغ ، وهي طريقة فعالة للغاية لتحديد أجزاء الدماغ الأكثر نشاطًا نظرًا لأن المزيد من النشاط يتطلب أكسجين أكثر من أقل نشاطًا مناطق الدماغ.

باستخدام نموذج حاسوبي لتحليل نتائج الرنين المغناطيسي الوظيفي ، وجد الباحثون أن القشرة السمعية تضخيم التحولات الطيفية الأعلى عندما تم تكليفها بتمييز الأصوات وعندما طُلب منها تحديد الصوتيات المحددة في العينات ، ركزت على السرعة الزمنية الأسرع. التحويرات والتعديلات الطيفية المنخفضة على المحفزات الأخرى.

قال جولستاني: "تظهر النتائج أوجه تشابه كبيرة بين معلومات المهمة في الأصوات نفسها والبيانات العصبية ، الرنين المغناطيسي الوظيفي".

يوضح هذا أن القشرة السمعية تعالج نفس الصوت بشكل مختلف اعتمادًا على المهمة المحددة التي تحاول القيام بها ، مما يكشف عن الآليات الأساسية التي ينطوي عليها كيفية الاستماع إلى الأشخاص الذين يتحدثون إلينا وكيف تميز أدمغتنا بين الأصوات المختلفة. قال روتن: "هذه هي المرة الأولى التي يظهر فيها ، عند البشر وباستخدام طرق غير جراحية ، أن الدماغ يتكيف مع المهمة المطروحة بطريقة تتفق مع المعلومات الصوتية التي يتم التعامل معها في أصوات الكلام".

حل مشكلة حفل الكوكتيل بخوارزميات على غرار القشرة السمعية

مع نمو فهمنا لما يجري داخل القشرة السمعية واكتشاف المزيد من آليات تأثير حفلة الكوكتيل ، يمكننا استخدام هذه الأفكار الجديدة لتحسين طريقة معالجة أنظمة الكمبيوتر للصوت البشري. في حين أن أنظمة معالجة اللغة الطبيعية مثل واجهة برمجة تطبيقات تحويل الكلام إلى نص من Google قوية بالتأكيد ، فإن أفضل الخوارزميات الخاصة بها لحل مشكلة حفل الكوكتيل لا تزال غير كافية. سوف تمر عدة سنوات على الأقل قبل أن تسفر الأبحاث العصبية في القشرة السمعية عن نوع الاختراقات التي تسمح لنا بتطوير الخوارزميات الصحيحة لإعادة إنتاج تأثير حفلات الكوكتيل في أجهزة الكمبيوتر.

حتى ذلك الحين ، ستظل واجهات الكمبيوتر التي يتم التحكم فيها بالصوت مثل تلك التي تظهر في Star Trek بعيدة المنال. لكن البحث في القشرة السمعية يظهر الكثير من الأمل ، والبيانات التي حصلنا عليها حتى الآن من الدراسات العصبية تُظهر أن المزيد من البحث في هذه المنطقة من الدماغ سيكشف على الأرجح آليات عصبية جديدة ضرورية لتطوير خوارزميات فعالة للكوكتيل مشكلة الحزب.


شاهد الفيديو: نظرية الآت شرح belt rop (شهر نوفمبر 2021).