أنظمة الرؤية مستوحاة من البصر البشري



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

وفقًا لمقال نُشر في 21 فبراير 2007 في Technology Review ، طورت مجموعة من علماء الأعصاب في معهد ماساتشوستس للتكنولوجيا نموذجًا للكمبيوتر يحاكي نظام الرؤية البشرية لاكتشاف الأشياء بدقة والتعرف عليها مثل السيارات والدراجات النارية في شارع مزدحم. وفقًا لتوماس سيري ، عالم الأعصاب في معهد ماساتشوستس للتكنولوجيا ، يمكن استخدام هذه الأنواع من أنظمة الرؤية قريبًا في أنظمة المراقبة أو في أجهزة الاستشعار الذكية التي تنبه السائقين إلى وجود مشاة أو أشياء أخرى.

لسنوات ، حاول الباحثون تقليد أنظمة الرؤية البيولوجية ، بسبب كمالها. يقول سيري ، الذي قام بالعمل مع توماسو بوجيو ، إن تعليم الكمبيوتر لتصنيف الأشياء أصبح أكثر تعقيدًا مما بدا في البداية. أولاً ، للتعرف على نوع معين من الأشياء ، يحتاج الكمبيوتر إلى قالب أو تمثيل حسابي محدد لهذا الكائن المحدد ، وهو ما يسمح للكمبيوتر بتمييز ، على سبيل المثال ، بين السيارة والكائنات التي ليست سيارات. ومع ذلك ، يجب أن يكون النموذج مرنًا بما يكفي لاستيعاب جميع أنواع السيارات المختلفة بزوايا ومواضع مختلفة وتحت ظروف إضاءة مختلفة.

أفضل طريقة لتحقيق ذلك هي تدريب خوارزمية التعلم بسلسلة من الصور لاستخراج الخصائص التي تشترك فيها. يعتقد سيري وبوجيو أن نظام الرؤية البشرية يتبع نهجًا مشابهًا ، لكنه يعتمد على تسلسل هرمي للطبقات المتعاقبة في القشرة البصرية. وبالتالي ، ستكتشف الطبقات الأولى من القشرة أبسط خصائص كائن ما ، وستجمع الطبقات الأخيرة هذه المعلومات لتشكيل تصورنا للكائن ككل.

لاختبار نظريتهم ، عمل سيري وبوجيو مع ستانلي بيلشي من معهد ماساتشوستس للتكنولوجيا وليور وولف من جامعة تل أبيب بإسرائيل ، لإنشاء نموذج كمبيوتر يحتوي على 10 ملايين وحدة حسابية ، مصممة للعمل مثل مجموعات الخلايا العصبية. من القشرة البصرية. كما في القشرة البصرية ، تنقسم الوحدات إلى طبقات.

أولاً ، تستخرج أبسط الوحدات ميزات بدائية من المشهد (على سبيل المثال ، ملفات التعريف الموجهة) عن طريق تحليل مجموعات صغيرة جدًا من وحدات البكسل. ثم تقوم الوحدات الأكثر تعقيدًا بتحليل الأجزاء الأكبر من الصورة والتعرف على الخصائص المتعلقة بحجم أو موضع الكائنات. مع كل طبقة متتالية ، يتم استخراج الخصائص المعقدة بشكل متزايد ، مثل المسافة بين جزأين من كائن أو زوايا الاتجاه المختلفة لهذه الأجزاء. يتيح لك هذا التعرف على نفس الكائن من زوايا مختلفة.

عندما اختبروا النظام ، كانت نتائجهم جيدة جدًا ، حيث تمكنوا من منافسة أفضل الأنظمة في السوق. أيضًا ، نظرًا لقدرته على التعلم ، فكلما زاد عدد الصور التي تحللها ، زادت دقة نتائجك.
في الوقت الحالي ، تم تصميم النظام فقط لتحليل الصور الثابتة. ومع ذلك ، وفقًا لسيري ، فإن العملية تشبه تلك الخاصة بنظام الرؤية البشرية ، حيث يتعامل جزء من النظام مع الأشكال والآخر مع الحركة. يعمل الفريق الآن على دمج نظام موازٍ يعمل مع مقاطع الفيديو.

المصدر: Technology Review


فيديو: تقنية جديدة تعيد البصر لفاقديه في أقل من ساعة


تعليقات:

  1. Uriel

    أنت ترتكب خطأ. يمكنني إثبات ذلك. أرسل لي بريدًا إلكترونيًا إلى PM ، سنتحدث.

  2. Colbert

    أسفل مع البريد العشوائي. إعطاء الإبداع على صفحات المدونة!

  3. Siraj

    فكرة مثيرة جدا للاهتمام

  4. Rey

    ما هو موضوع مسلية



اكتب رسالة


المقال السابق

نصائح للسفر إلى السويد

المقالة القادمة

ونقلت الشهيرة من الحرية