Крупнейший игрок e-grocery, лидер рынка аналитики и факультет компьютерных наук НИУ ВШЭ провели открытый конкурс на лучшую прогнозную модель.
Хакатон проходил в два этапа – онлайн и оффлайн. В ходе онлайн-этапа (с 18 октября по 18 ноября 2019) участникам предлагалось спрогнозировать вероятность отказа клиента от заказа без учета времени и стадии формирования заказа. Для построения модели участникам предоставлялась подвыборка (sample) истории заказов клиентов за определенный период времени с бинарной целевой переменной – признаком того, что заказ был отменен клиентом. В конкурсе мог поучаствовать любой желающий. На онлайн-этапе модели на конкурс прислали 69 человек.
В финал конкурса, который проходил 23-24 ноября 2019 в Культурном центре ВШЭ, были отобраны 22 участника, авторы лучших моделей первого онлайн-этапа: 3 конкурсанта выступали в индивидуальном зачете, еще 19 – в составе пяти команд (от факультета компьютерных наук ВШЭ, от факультета вычислительной математики и кибернетики МГУ, а также сборные команды). В ходе двухдневного марафона участники должны были построить модель, способную уже не только просчитать отмену, но и спрогнозировать, за сколько часов до периода запланированной доставки это произойдет.
Конкурсанты учитывали такие факторы, как дата заказа и дата доставки. Были подтверждены гипотезы, что чем дальше срок доставки от момента заказа, тем вероятнее произойдет отмена, а в выходные дни это происходит чаще, чем в будние. Жюри высоко оценило использование участниками дополнительных внешних данных, которые могут повлиять на отмену покупки — например, погодные условия.
Финальный лидерборд был сформирован на основании точности построенных моделей, а также на возможной бизнес-применимости и оригинальности идеи, которые оценивались жюри в ходе презентаций решений участников.
Факты и цифры:
175 человек
заинтересовались задачей
69 человек
присылали решения в ходе онлайн-конкурса
8 команд
в финале
2 задачи
для онлайн-этапа и для финала
Победу в соревновании по анализу данных одержал разработчик из Норильска Дмитрий Федотов (FEDOTOVDN): именно ему удалось предложить наиболее точную и оптимальную модель прогнозирования отказов и рассчитать максимально приближенный к реальности временной промежуток отмены покупки. Он обнаружил, что самый яркий признак отмены — наличие в личном кабинете пользователя похожих заказов на одну и ту же дату доставки.
«Общие впечатления от конкурса самые положительные. Все было организовано строго по таймингу. Условия задачи четко поставлены, всегда была возможность уточнить некоторые неясные и/или спорные моменты у организаторов, которые всегда были доступны и открыты к общению. Питание – выше всяческих похвал. Уровень сложности задачи был средним. Не назову сложным, так как не было огромного количества таблиц и признаков, которыми нужно было оперировать. Все признаки не были анонимизированными, что большой плюс. Намного приятнее работать с данными, которые понимаешь. Но и простой задачу не могу назвать, так как требовалась некоторая предобработка предоставленных данных, как минимум группировки по номеру заказа. Также нужно было глубоко проанализировать распределение целевой переменной, найти в ней выбросы, понять, что с ними можно сделать и почему», - говорит победитель.
Илья Горшков, магистрант программы ФКН НИУ ВШЭ «Анализ данных в биологии и медицине», принимал участие в хакатоне впервые. Он тоже был единственным участником команды и занял второе место. Третье место поделили две команды взрослых разработчиков, а четвертое и пятое место заняли команды студентов МГУ.
Поздравляем лучших решателей и благодарим всех финалистов за участие!
1 место – команда FEDOTOVDN: Дмитрий Федотов
2 место – команда bsfireworks: Илья Горшков
3 место – команда 1x0r: Давид Казарян, Антон Савинков и команда polo: Павел Половников
4 место – команда qwertyasdf: Мария Яворская, Алексей Письменный, Валентин Александров, Андрей Соловьев, Алексей Щекалев
5 место – команда Dreamteam: Алексей Медведев, Николай Скачков, Иван Сомов, Дмитрий Медведев, Павел Коробов
Пятёрка лидеров хакатона получила ценные призы от спонсоров и организаторов (Яндекс.Станции, умные часы Garmin, планшеты Apple (iPad)).
После церемонии награждения компании-организаторы пригласили участников финала на вакансии сотрудников и стажеров.
Такие соревнования помогают участникам развивать профессиональные навыки и на практике учиться применять теоретические знания. В будущем это поможет им стать востребованными специалистами — в первую очередь дата-сайентистами, которых сегодня остро не хватает во всех отраслях. А для бизнеса это хороший способ проверить их рабочие гипотезы и посмотреть, как сторонние специалисты подойдут к решению задачи.
-
Цель SAS Data Hack Platypus — не просто собрать вместе единомышленников и способных студентов, чтобы предложить им выполнить какую-то абстрактную задачу. Мы стремились сделать наш хакатон максимально приближенным к реальным условиям бизнеса, поэтому и задачу ставили очень актуальную для рынка. Теоретические знания должны согласовываться с реальными бизнес-процессами. Это поможет будущему специалисту развиваться с профессиональной точки зрения. И конечно, нам важно в таких условиях знакомиться со студентами, которые, возможно, захотят пройти стажировку в SAS. Михаил Петровский руководитель Академической программы SAS Россия/СНГ
-
Совместный хакатон с SAS стал для “Утконоса” отличной возможностью посмотреть на способы решения сложных нестандартных задач с помощью аналитики больших данных. Построение точных моделей аналитики потребительского поведения и прогнозирования отмены заказа на основе работы с большими данными открывает новые возможности для оптимизации всего бизнес-процесса и позволяет нам минимизировать убытки. Мария Артамонова Директор по IT Утконос ОНЛАЙН
-
Когда хакатон организовывает компания-лидер в области аналитики вместе со своим заказчиком на реальных данных – это приносит участникам двойную пользу. Во-первых, хакатоны способствуют развитию бизнес-мышления студентов, что пригодится им в будущем за стенами учебного заведения. Во-вторых, такие соревнования – это приятное времяпрепровождение с единомышленниками и возможность получить награду за свой труд. Рады были принимать гостей в новом здании на Покровке. Будем ждать еще. Тамара Вознесенская первый заместитель декана факультета компьютерных наук НИУ ВШЭ
-
Хакатоны позволяют структурировать опыт решения задач, выработать свой стиль, оценить, как та или иная модель проявляет себя на практике. На самом деле, любой из участников хакатона мог в два клика проверить гипотезы в нашей программе, которая к тому же доступна для студентов, но ребята предпочли Python. Компания SAS поставляет софт для бизнеса, с помощью которого люди без навыков программирования могут строить сложные модели. Таким образом, даже бизнес-аналитики без специальных знаний имеют возможность получить приличный результат с помощью модели дата-майнинга. Елена Щенявская консультант, ментор на хакатоне SAS Россия/СНГ
Рекомендуем прочитать
- Ключевые вопросы для запуска ваших проектов по аналитике данныхНет единого плана по работе над проектом по аналитике данных. Эксперт по технологиям Фил Саймон предлагает рассмотреть эти десять вопросов в качестве руководства.
- Model risk management: Vital to regulatory and business sustainabilitySloppy model risk management can lead to failure to gain regulatory approval for capital plans, financial loss, damage to a bank's reputation and loss of shareholder value. Learn how to improve model risk management by establishing controls and guidelines to measure and address model risk at every stage of the life cycle.
- Operationalizing analytics: 4 ways banks are conquering the infamous ‘last mile’Here are four examples across the banking industry that show how these leading organizations followed a clearly defined path to conquer the infamous 'last mile' of analytics.
Готовы подписаться на инсайты сейчас?