Deva Ramanan обучает компьютеры распознавать людей
Deva Ramanan нажимает на кнопку на своем MacBook Air и начинает играть видео, где Мишель Кван, катается на коньках в 1998 на Олимпийских Играх в Нагано. Рядом с ним на сервере от Intel компьютерная программа выдает результаты своего «восприятия» этой видеозаписи: Голова Кван, ноги, туловище, плечи и предплечья, все, что отличается цветовой гаммой. Ramanan, программист из Калифорнийского университета в Ирвине, обучает компьютеры проводить опознание трехмерных моделей людей на плоских фотографиях. Кстати, Калифорнийский университет решил купить сервер intel для этих целей.
Как сообщает mirnt.ru, программное обеспечение распознавания лиц, которое точно определяет классическую конфигурацию глаза-нос-рот, использовалось в течение многих лет. Но обнаружение человеческого тела, особенно в любом положении, намного более сложная задача для компьютеров из-за бесконечного разнообразия возможных поз, углов, размеров и оборудования. Большинство исследователей наполняет программу миллионами изображений для того, чтобы запомнить обширную базу данных людей. Ramanan, вместо этого, обучал свою компьютерную программу идентифицировать части тела и сопоставлять их с гибкими человеческими шаблонами. “Вы можете думать о нем как о подходе «разделяй и властвуй»,” рассказывает разработчик. Программное обеспечение использует контрольный список: Руки, туловище, ноги? Проверить. Таким образом, и проходит идентификация человека. Метод Раманэна намного быстрее и использует меньше вычислительной мощности, чем традиционные методы, которые требовали для несложных определений довольно сложной серверной техники.
Раманэн предвещает довольно обширную область возможного применения для своих алгоритмов по нахождению людей, включая быстрые и точные системы пешеходного обнаружения в автомобилях и системы видеоигр. Тем временем он сосредоточился на обучении компьютеров чтению и пониманию контекста — другими словами, как научить компьютеры думать. “Что, если Вы действительно хотите понять то, что делает человек,” спрашивает Раманэн. “Не только, ‘Вот рука,’ но и ‘Этот человек ждет автобус.’? ” Если его будущие проекты будут успешны, способность компьютеров думать будет медленно приближать их к возможностям человеческого мозга.