ГМИИ им. А.С.Пушкина — Государственный музей изобразительных искусств им. А.С. Пушкина — признанный культурный центр Москвы и России. Это музейный комплекс, обладающий одним из крупнейших в России художественных собраний зарубежного искусства.
В музее гораздо больше информации, чем может показаться на первый взгляд. И намного больше, чем возможно уложить в понятную человеку навигацию сайта или мобильного приложения.
В ГМИИ им. А.С. Пушкина проходит до полусотни выставок в год, сотни мероприятий и программ, проводятся тысячи экскурсий. Мы храним несколько сотен тысяч экспонатов, у нас отличная библиотека по искусству, есть виртуальные туры, аудиогиды, оцифрованные ресурсы, сайты по коллекциям и, конечно, базы данных, описывающие хранимое.
Чтобы сделать эти информационные ресурсы доступными для наших посетителей во всем объеме, мы хотим научить нашу информацию разговаривать:
на естественном языке;
предлагая посетителю быстрые, лаконичные и точные ответы на конкретные вопросы;
с предложением информационных альтернатив и связанных результатов.
В настоящий момент посетителя сложно или даже невозможно сориентировать во всем массиве информации музея.
Необходимо предложить программное решение для создания голосового виртуального помощника по Пушкинскому музею с единым поиском по существующей информационной инфраструктуре музея. Ведь говорить всегда быстрее, проще и органичнее для человека, чем писать и пользоваться десятком не связанных поисковых систем.
Основной акцент задачи — интегрированный поиск по музейной информационной инфраструктуре, поэтому в ходе выполнения задачи должна быть проанализирована и учтена в схеме обращения к данным структура (по полям) всех предложенных источников данных. В алгоритме поиска должна быть заложена механика ранжирования выдачи по релевантности запросу.
Мы понимаем, что полное обучение помощника требует больше, чем 30 часов, однако в ходе работы должна быть заложена полноценная основа для дальнейшей работы музея с ним.
Виртуальный помощник должен уметь (ветви диалога):
привлечь посетителя в музей, просто рассказав о текущих событиях, а также по возможности предложив в результатах любого поиска релевантные текущему запросу актуальные события;
сориентировать посетителя в музее (навигация): от режима работы, месторасположения кафе и гардероба, до ориентирования в экспозиции и цифровых сервисах музея;
осуществить тематический поиск по музейным базам данных и цифровым ресурсам относительно научных (профильных) запросов пользователей.
Особенный акцент нужно сделать на разработке дизайна диалога помощника со сценариями обращения к источникам данных и ранжированием результатов поиска.
Участниками может быть также предложено (с обоснованием):
создание новых источников данных (автоматизированно из существующих, но с некоторой новой структурой или техническим форматом);
подключение внешних источников (справочников, служебных БД, мировых ресурсов);
формирование промежуточных баз знаний по отвеченным вопросам;
рекомендации по доработке форматов представления музейной информации, ссылки на которые может давать помощник.
Виртуальный помощник должен заговорить и ответить на составленный музеем список из 60 вопросов (по 20 на каждую ветвь). Результаты поиска как минимум по 50% вопросов должны содержать информацию из более чем одного источника данных.
Любой запрос не должен «провисать», то есть заканчиваться точкой. Всегда должно быть предложено развитие диалога. Все программные коды и сценарий диалога должны быть продемонстрированы и пояснены, то есть должна состояться защита кода (алгоритма). Код должен быть откомментирован.
Важно, чтобы предложенный механизм поиска был расширяемым, то есть архитектура решения должна позволять добавлять дополнительные источники данных и правила их обработки (критерии ранжирования выдачи).
Возможно подключать внешние доступные (распространяемые на бесплатной основе) программные библиотеки (например, библиотеки алгоритмов искусственного интеллекта).
Инфраструктура исполнения кода не должна предусматривать использования специфических программных компонентов, права на которые невозможно получить (бесплатно или путем приобретения).
Разумеется, неприемлемо нарушение авторского права.
В бэке мы ждем, возможно, не очень обученный, но развиваемый код, универсальный, а не «подточенный» под список контрольных запросов.
data science, machine learning, sql
Источники данных:
MVP c возможностью ответа хотя бы на часть проверочных вопросов, представленных Музеем.
В качестве результата выполнения задачи должны быть предложены и продемонстрированы отработанные на типовых запросах (предоставляются музеем) алгоритмы действия помощника, а также план и инструменты его обучения (развития каждой из ветвей диалога).
100 000 рублей
Процесс внедрения решения в жизнь будет обсуждаться с выигравшей командой индивидуально.
Целевая аудитория — посетители музея (состоявшиеся и потенциальные), а также и все, кто интересуются его информационными ресурсами (учащиеся, исследователи и т.п.)