Задача №6

MOSCOW TRAVEL HACK
Смотреть остальные задачи
Виртуальный помощник Пушкинского музея
#ML # BigData #ВиртуальныйПомощник #DataScience
О партнере

ГМИИ им. А.С.ПушкинаГосударственный музей изобразительных искусств им. А.С. Пушкина — признанный культурный центр Москвы и России. Это музейный комплекс, обладающий одним из крупнейших в России художественных собраний зарубежного искусства. 

Описание бизнес-процесса, который хочется улучшить

В музее гораздо больше информации, чем может показаться на первый взгляд. И намного больше, чем возможно уложить в понятную человеку навигацию сайта или мобильного приложения.

 

В ГМИИ им. А.С. Пушкина проходит до полусотни выставок в год, сотни мероприятий и программ, проводятся тысячи экскурсий. Мы храним несколько сотен тысяч экспонатов, у нас отличная библиотека по искусству, есть виртуальные туры, аудиогиды, оцифрованные ресурсы, сайты по коллекциям и, конечно, базы данных, описывающие хранимое.

 

Чтобы сделать эти информационные ресурсы доступными для наших посетителей во всем объеме, мы хотим научить нашу информацию разговаривать:

 

  • на естественном языке; 

  • предлагая посетителю быстрые, лаконичные и точные ответы на конкретные вопросы;

  • с предложением информационных альтернатив и связанных результатов.

В чем проблема

В настоящий момент посетителя сложно или даже невозможно сориентировать во всем массиве информации музея.

 

Необходимо предложить программное решение для создания голосового виртуального помощника по Пушкинскому музею с единым поиском по существующей информационной инфраструктуре музея. Ведь говорить всегда быстрее, проще и органичнее для человека, чем писать и пользоваться десятком не связанных поисковых систем.

Задача: как нужно решить проблему

Основной акцент задачи — интегрированный поиск по музейной информационной инфраструктуре, поэтому в ходе выполнения задачи должна быть проанализирована и учтена в схеме обращения к данным структура (по полям) всех предложенных источников данных. В алгоритме поиска должна быть заложена механика ранжирования выдачи по релевантности запросу.

 

Мы понимаем, что полное обучение помощника требует больше, чем 30 часов, однако в ходе работы должна быть заложена полноценная основа для дальнейшей работы музея с ним. 

 

Виртуальный помощник должен уметь (ветви диалога):

 

  • привлечь посетителя в музей, просто рассказав о текущих событиях, а также по возможности предложив в результатах любого поиска релевантные текущему запросу актуальные события;

  • сориентировать посетителя в музее (навигация): от режима работы, месторасположения кафе и гардероба, до ориентирования в экспозиции и цифровых сервисах музея;

  • осуществить тематический поиск по музейным базам данных и цифровым ресурсам относительно научных (профильных) запросов пользователей.

 

Особенный акцент нужно сделать на разработке дизайна диалога помощника со сценариями обращения к источникам данных и ранжированием результатов поиска. 

 

Участниками может быть также предложено (с обоснованием):

 

  • создание новых источников данных (автоматизированно из существующих, но с некоторой новой структурой или техническим форматом);

  • подключение внешних источников (справочников, служебных БД, мировых ресурсов);

  • формирование промежуточных баз знаний по отвеченным вопросам;

  • рекомендации по доработке форматов представления музейной информации, ссылки на которые может давать помощник.

Описание итогового продукта

Виртуальный помощник должен заговорить и ответить на составленный музеем список из 60 вопросов (по 20 на каждую ветвь). Результаты поиска как минимум по 50% вопросов должны содержать информацию из более чем одного источника данных.

 

Любой запрос не должен «провисать», то есть заканчиваться точкой. Всегда должно быть предложено развитие диалога. Все программные коды и сценарий диалога должны быть продемонстрированы и пояснены, то есть должна состояться защита кода (алгоритма). Код должен быть откомментирован. 

 

Важно, чтобы предложенный механизм поиска был расширяемым, то есть архитектура решения должна позволять добавлять дополнительные источники данных и правила их обработки (критерии ранжирования выдачи). 

Возможно подключать внешние доступные (распространяемые на бесплатной основе) программные библиотеки (например, библиотеки алгоритмов искусственного интеллекта).

Инфраструктура исполнения кода не должна предусматривать использования специфических программных компонентов, права на которые невозможно получить (бесплатно или путем приобретения).

Разумеется, неприемлемо нарушение авторского права.

В бэке мы ждем, возможно, не очень обученный, но развиваемый код, универсальный, а не «подточенный» под список контрольных запросов.

Экспертиза, которая должна быть у команды для решения задачи

data science, machine learning, sql

Ресурсы, которые дает заказчик, чтобы задачу решить

Источники данных:

 

  • ISO-выгрузка фрагмента библиотечной БД в стандарте rusmarc
  • JSON событий музея 
  • JSON зданий музея 
  • JSON коллекций музея 
  • JSON предметов музея 
  • API izi.TRAVEL 
  • API ARTEFACT

 

Критерии оценки итогового продукта

MVP c возможностью ответа хотя бы на часть проверочных вопросов, представленных Музеем. 

 

В качестве результата выполнения задачи должны быть предложены и продемонстрированы отработанные на типовых запросах (предоставляются музеем) алгоритмы действия помощника, а также план и инструменты его обучения (развития каждой из ветвей диалога).

Приз

100 000 рублей

 

Процесс внедрения решения в жизнь будет обсуждаться с выигравшей командой индивидуально.

Дополнительная информация

Целевая аудитория — посетители музея (состоявшиеся и потенциальные), а также и все, кто интересуются его информационными ресурсами (учащиеся, исследователи и т.п.)

 

  • pushkinmuseum.art — основной сайт музея, описание JSON в word будет предоставлено на хакатоне.
  • pushkinmuseum.art/media/satellites/ — сайты-сателлиты, электронные коллекции, тематические проекты
  • virtual.arts-museum.ru/ — виртуальный музей и панорамы выставок 
  • izi.travel — аудиогиды по экспозициям и выставкам 
  • ar.culture.ru — медиагиды ARTEFACT
  • rusmarc.ru — стандарт описания библиотечных изданий rusmarc
Менторы задачи
Владимир Определенов
Заместитель директора по цифровому развитию в ГМИИ им. А.С. Пушкина
Юлия Строева
Инженер по научно-технической информации ГМИИ им. А.С. Пушкина