За последние десятилетия стало использоваться все больше айти-систем. Как следствие, и объемы используемых данных увеличились в тысячи раз. Еще 30 лет назад система с объемом данных в 1 терабайт считалась огромной. Тогда ее могли себе позволить только крупнейшие мировые компании, а сейчас — это объем памяти в обычном домашнем компьютере. Сейчас в крупных компаниях уже используются системы с объемами в десятки петабайт — это десятки тысяч терабайт.
Такие огромные объемы данных невозможно анализировать без применения математики и статистики. Поэтому в этом курсе вы познакомитесь со статистической значимостью — еще одним важным аспектом в работе с данными. Статистическая значимость помогает:
- Оценивать надежность данных для анализа
- Очищать данные от значений, которые отклоняются от средних значений
- Оценивать вероятность того или иного значения
- Определять, какая степень надежности выводов нам нужна
- Проводить чистые эксперименты и получать меньше ложноположительных ответов
Все эти знания помогут правильно оценивать данные, делать из них верные и точные выводы. На их основе компания будет принимать решения и развиваться эффективнее.
После завершения данного курса вы научитесь:
- Искать гипотезы и обосновывать их
- Правильно проводить AB-тестирование и не допускать ошибок подглядывания
Также на курсе мы повторим основные математические понятия, которые необходимы для работы с данными. Так вы сможете создавать более оптимальные алгоритмы и сделаете свою работу более эффективной.
Для полного доступа к курсу нужен базовый план
Базовый план откроет полный доступ ко всем курсам, упражнениям и урокам Хекслета, проектам и пожизненный доступ к теории пройденных уроков. Подписку можно отменить в любой момент.