000

Компания Nuance Communications вчера анонсировала новый ежегодный конкурс Winograd Schema Challenge для выявления наиболее продвинутых программ Искусственного Интеллекта. Конкурс станет альтернативой популярному тесту Тьюринга, в котором чат-боты разговаривают с судьями и пытаются выдать себя за человека. Как показал опыт последних лет, исследования в этом направлении практически зашли в тупик, а сами чат-боты не имеют ничего общего с настоящим ИИ.

Вместо беседы отрывочными фразами в чате участникам Winograd Schema Challenge предложат набор вопросов с несколькими вариантами ответа. При этом ответ на каждый вопрос должен быть очевиден для любого человека, но не для машины, которая не обладает здравым смыслом.

ПРИМЕР

Приз не подходит к коричневому чемодану из-за размера.

Вопрос: что больше?

  • Ответ 0: Приз
  • Ответ 1: Чемодан

Для человека ответ очевиден, а машине придётся искать настоящий смысл этого предложения. Здесь не отделаешься шуточкой, как в тесте Тьюринга.

Инициатором проведения нового конкурса стал профессор компьютерных наук Гектор Левеск (Hector Levesque) из университета Торонто, лауреат премии IJCAI Award for Research Excellence за 2013 год. Компания Nuance Communications будет спонсором, а организатором выступает исследовательская группа CommonsenseReasoning.org, которая содействует научным исследованиям в области «формального здравого смысла».

Авторы программы, которая пройдёт тест, получат главный приз в размере $25 000. Сумма небольшая. Возможно, если к инициативе подключатся другие спонсоры, она вырастет. Но, по текущим условиям, если ни одна программа не пройдёт тест, то двум наилучшим кандидатам вручат призы $3000 и $2000.

Конкурс будут проводить ежегодно с 2015 года. Дедлайн для приёма заявок на первый конкурс назначен на 1 октября 2015 года. Подробности проведения соревнования обсудят на симпозиуме Commonsense Reasoning в марте.

  • Подпишись на наc в Telegram!

    Только важные новости и лучшие статьи

    Подписаться

  • Подписаться
    Уведомить о
    45 комментариев
    Старые
    Новые Популярные
    Межтекстовые Отзывы
    Посмотреть все комментарии