Две группы исследователей, независимо друг от друга, одновременно разработали технологии распознавания образов, которые способны описывать изображения на человеческом языке. Первая группа работала в Стэнфордском университете, а вторая — в компании Google.

Обе программы выполняют одинаковую задачу: распознавание объектов в кадре. После этого они составляют словесное описание кадра. Как показал эксперимент, в некоторых случаях это описание довольно точное и практически не отличается от описания человеком.

Ниже приведены примеры, как программное обеспечение распознаёт образы.

003
Человек: группа людей играет в Frisbee в парке.
Программа: группа молодых людей играет в игру Frisbee.

004
Человек: юный хоккеист играет на ледовом катке.
Программа: два хоккеиста сражаются за шайбу.

Работа исследователей из Стэнфордского университета опубликована на сайте университета, а доклад сотрудников Google — на arXiv.org.



14 комментария

  1. 21.11.2014 at 14:52

  2. 21.11.2014 at 15:18

    А в матчасть заглянуть? Никаких новшеств в распознавании образов авторы не придумали — использовали известные методы. Относительно новым является способ сопоставления визуальных объектов с их описанием. И до совершенства ему пока далеко — демотиваторы сочинять не станет. 🙂

    • 22.11.2014 at 14:21

      Ну так придумай новшество в распознавании,че ж ты сидиш,комментатор юный

      • 22.11.2014 at 23:46

        А ты не умничай «старик» епт,парень дело говорит.Документацию на офф сайте почитай,иль образование 90-х не позволяет?

      • 26.11.2014 at 12:50

        1. Ну, сначала сходи на урок русского языка и выучи правила.
        2. Моё замечание относилось к описанию в статье, а не к самому алгоритму, который, кстати говоря, со многими языками будет работать плоховато.

    • 23.11.2014 at 22:44

      Да вроде как генеративные дескрипторы — это сейчас state of the art в области распознавания изображений. В продакшене еще никто такого не использует, насколько мне известно.

  3. http://romanakamagician.tumblr.com/

    24.11.2014 at 13:09

    надо им картину Пикассо дать для распознавания 🙂

  4. 25.11.2014 at 19:27

    А вот интересно, язык кода можно таким образом определить

    • 26.11.2014 at 12:45

      Что значит «язык кода»? Если нужно определить язык, на котором написана конкретная программа, то вряд ли целесообразно использовать нейронную сеть — синтаксис языков программирования жёстко формализован, для его определения прекрасно подходят обычные средства.

  5. http://money4honey.ru/

    26.11.2014 at 23:59

    вроде даже я могу это сделать — идём в гугл и делаем поиск по картинке, а потом просто сравниваем описания — парсим из них слова и определяем какие чаще поторяются — с высокой долей вероятности слова будут по теме самого фото. и не нужно заново изобретать велосипед

  6. 05.03.2015 at 02:49

    Хотелось бы более детально узнать о программе. Какие математические принципы заложены в ней?

    • http://shopstars.com.ua/

      19.06.2015 at 13:19

      Вычисляй создателя. Лично я так делаю. Он тебе расскажет все о программе, если ее код не закрыт от общего доступа.

Оставить мнение