Что такое Kaggle?

Читать в полной версии →

Как начинающему специалисту в области Data Science набраться опыта, где прокачать скилы и к кому обратиться за помощью, если собственных знаний не хватает? Можно стать участником соревнований на платформе Kaggle! Сервис — это и социальная сеть, и площадка для организации соревнований в области исследования данных.

Как работает платформа Kaggle?

Kaggle — это платформа для публикации наборов данных, создания и исследования моделей, взаимодействия с другими экспертами, а также организации конкурсов по Data Science и участия в них.

Структура Kaggle

Платформа включает следующие разделы:

Участники Kaggle

Kaggle присваивает пользователям несколько вариантов статусов: Novice, Contributor, Expert, Master и Grandmaster. Для получения начального статуса Novice участнику необходимо просто зарегистрироваться на платформе с помощью учетной записи Google или имейл.

Все последующие статусы присваиваются за качество и количество сделанных на платформе проектов. Так, статус Contributor пользователь получит за выполнение следующих пунктов:

Соревнования Kaggle: участие, призы, примеры

Kaggle имеет обширную базу соревнований для участников с разным уровнем компетенций. Алгоритм проведения соревнований следующий:

  1. Организатор конкурса публикует данные и описание проблемы, устанавливает срок подачи решений, описывает критерии правильности и приз для победителя.
  2. Пользователи платформы выбирают соревнование по уровню сложности и тематике, присоединяются к нему и разрабатывают решение поставленной задачи с использованием разных методов, моделей и алгоритмов.
  3. Платформа автоматически проверяет решения по критериям организатора.
  4. Приз получает автор лучшего решения. Остальным участникам начисляются баллы в зависимости от их места в таблице результатов конкурса. Эти баллы определяют место участника в общем рейтинге Kaggle.

Learning Agency Lab — Automated Essay Scoring 2.0

Конкурс для профессионалов с денежным вознаграждением. Цель — улучшить алгоритмы оценки студенческих эссе для повышения их результатов обучения.

Размер призов:

Regression with a Flood Prediction Dataset

Конкурс для начинающих специалистов. Цель — спрогнозировать вероятность затопления региона с учетом различных факторов. Авторы трех лучших решений получат фирменную продукцию Kaggle.

Как извлечь максимальную пользу от участия на платформе Kaggle?

Сегодня Kaggle — это более 15 миллионов пользователей. Сообщество позволяет дата-сайентистам, разработчикам и исследователям с разным уровнем подготовки улучшать свои навыки, учиться новому и практиковаться.

Начинающие специалисты могут перенимать опыт у продвинутых пользователей. Kaggle позволяет оперативно погрузиться в практику работы с большими данными и осваивать основные принципы машинного обучения и дата сайенс на реальных данных.

А еще ресурс помогает устраиваться на работу. Рекрутеры часто учитывают рейтинг кандидатов на позицию аналитика данных в Kaggle, поэтому в резюме стоит указывать ссылку на свой профиль.