Зарегистрируйтесь для доступа к 15+ бесплатным курсам по программированию с тренажером

Введение Python: Составные данные

Абстракция

Абстракция — один из главных способов борьбы со сложностью реального мира.

До сих пор мы работали только с примитивными типами данных, такими как строки и числа. В этом курсе произойдет переход на новый уровень, и большая часть работы сосредоточится вокруг составных данных.

Вы могли подумать, что на этот раз мы будем осваивать словари. И если бы мы не были Хекслетом, то все было бы именно так. Но у нас немного другие планы на ближайшие курсы. Есть вещи важнее массивов, и с них мы и начнем. К массивам обратимся позже.

Начиная с этого курса, мы погружаемся в парадигму декларативного программирования. Вас ждут функции как объекты первого рода, функции высшего порядка, неизменяемые данные (константы), рекурсия и другие интересные вещи. К сожалению, словари при стандартном использовании плохо сочетаются с этими концепциями, а так же позволяют срезать углы там, где не надо. Это сводит на нет весь эффект от обучения. Поэтому основой для составных данных станет так называемая пара — структура данных, некогда популярная во многих языках программирования. В отличие от массивов, ее нельзя изменять. В любой ситуации потребуется создать новую пару на основе предыдущей, и обойти этот механизм невозможно. Подобное ограничение оставляет только один способ работы — функциональный.

Как вы увидите позже, точно так же можно (и зачастую нужно) работать и со словарями. К тому моменту, когда мы начнем их использовать, вы уже будете готовы к такому способу работы.

Одна из самых важных тем в программировании — абстракция. Чем больше кодовая база, тем больше абстракций используется, либо создается в ней. Значительная часть времени разработчика тратится на моделирование предметной области и реализацию ее в коде, а также в ее дальнейшей поддержке и развитии. Как правило, этому вопросу совсем не уделяют времени, но именно от умения моделировать зависит качество вашего кода, насколько просто будет работать с ним, понимать и модифицировать его.

Представьте, что вам необходимо автоматизировать работу отдела продаж (создать CRM). С чего вы начнете? А начать стоит с онтологии.

В следующих курсах вы увидите, как, благодаря некоторым особым свойствам, пара может стать основой для создания более сложных структур данных, таких как списки, множества и даже деревья. Другими словами, мы заочно познакомимся с разными структурами данных и поработаем с ними.

По названию этого курса можно подумать, что мы будем говорить о таких типах данных в python, как список или словарь. Это совсем не так. В этом курсе мы используем python, как язык, на котором пишем код, но сам курс относится в целом к программированию. Мы изучим такое понятие, как абстракция данных. Эта общая концепция никак не связана конкретно с python и является важным механизмом абсолютно во всех языках программирования. В отличие от предыдущих курсов мы вообще не введем ни одной новой синтаксической конструкции. В этом и есть наше отличие: мы учим вас мыслить, писать код и программировать, что сильно отличается от того, что существует сейчас на рынке.

Итак, давайте начнем.

Что такое составные данные?

Составные данные используются в следующих случаях. Когда мы пишем программы, то чаще всего пытаемся моделировать достаточно сложные процессы и явления, протекающие часто в реальной жизни. Для этого мы можем использовать составные вычислительные объекты, которые включают в себя несколько различных частей. Это позволяет лучше моделировать все явления реальной среды, того, с чем мы взаимодействуем. И язык программирования должен предоставлять возможность создавать механизмы для создания так называемых составных данных, то есть из разных кусков собирать отдельный вычислительный объект.

Зачем это нужно?

При работе со сложными вычислительными объектами благодаря составным данным, как мы уже говорили, мы можем поднимать так называемый понятийный уровень. Мы будем работать на более высоком уровне абстракции и строить нашу программу и производить вычисления в терминах наших вычислительных объектов. Давайте рассмотрим это на конкретном примере, который известен всем со школы — это точки на плоскости.

У нас есть координатная плоскость, и мы можем строить на ней точки. При этом любая точка обладает двумя характеристиками — это ее координаты x и y, то есть абсцисса и ордината. В данном примере мы используем то, что уже известно — простые числовые значения, и описываем две точки. Одна из них — x1 / y1, вторая — x2 / y2. После этого вычисляем точку посередине:

x1 = 3
y1 = 5

x2 = -2
y2 = 10

# Точка посередине
x3 = middle_x(x1, x2)
y3 = middle_y(y1, y2)

Мы считаем, что мы строим отрезок между двумя этими точками и находим точку, которая лежит посередине. То, как это работает, не имеет значения. Главное, что вы можете себе это представить. Мы оперируем понятием точка. При этом понимаем, что она состоит из двух простых типов, то есть двух чисел. По сути появляется такая вещь как пара. И в общем-то нам удобно оперировать такими терминами.

Но при написании кода, если у нас не существует понятия составные данные, то, как видите, нам приходится производить вычисления независимо. Т.е. сначала вычислить х3, после этого нам надо вычислить y3. Это происходит потому, что мы не оперируем понятием точка. У нас нет такого составного вычислительного объекта. И все, что мы можем в наших функциях, это принимать простые параметры и возвращать точно такие же простые параметры. Получается, что одно действие технически разбивается на два. Согласитесь, это крайне неудобно. Особенно, когда ваша программа становится достаточно большой и начинает оперировать большим количеством сложных объектов.

Точки, кстати говоря — это еще достаточно простые объекты, которые включают в себя буквально 2 параметра. Представьте, что будет, когда мы начнем использовать более сложные объекты и фигуры. Возьмем для примера квадрат. Он включает в себя 4 точки — это уже 8 параметров, потому что в каждой точке 2 параметра. Работать на таком уровне абстракции, используя только примитивные типы и примитивные данные, мы просто бы не смогли. Наше мышление очень сильно бы этому сопротивлялось. Код получался бы очень громоздкий и не очень интуитивный.

В идеале нам бы хотелось работать так, как показано в этой строчке:

# Compound Data
middle_point = middle(point1, point2)

Мы отдаем в функцию две точки (point1 и point2), и нам возвращается точка посередине. Как она устроена и что там внутри — это отдельный вопрос. Главное, что мы оперируем этим понятием, как единым целым. Возможность строить составные объекты данных позволяет нам использовать технику, которая называется абстракция данных.

Абстракция данных — это метод отделения частей программы, которые реализуют представление объектов данных.

При использовании точки в предыдущем примере это обозначает, что нас не очень волнует, как внутри устроена точка. Мы можем просто оперировать только этим понятием. Соответственно, определять то, как непосредственно внутри она выглядит, мы можем совершенно в другом месте. Это делает код модульным и дает огромные возможности по модификации и поддержке кода. Например, мы можем изменить представление данных на более эффективное, более удобное в данный момент и не переписывать всю программу. Нужно будет переписать только ту часть, где именно происходит определение того, как данные структурированы внутри.

Абстракция данных приводит нас к такому понятию, как барьеры абстракции, когда мы можем строить многоуровневые слои, позволяющие изолировать разные части и разные уровни системы друг от друга. Об этом будет отдельный урок, где мы подробно поговорим, как работает абстракция данных, и как строятся барьеры абстракции.

Кроме этого в любом языке программирования нужен некий клей, который позволит из простых данных строить более сложные. И как мы увидим в дальнейшем, для этого даже не нужны специальные операции. Строить составные объекты можно используя только возможности функций, что еще больше стирает разницу между функциями и данными. Это можно было уже заметить, потому что функции определяются точно так же как данные. Функции являются полноправными данными, так называемыми объектами первого рода. Этому будет посвящен целый отдельный урок.

Графические примитивы

На протяжении всего курса мы будем строить графические примитивы и небольшую библиотеку для работы с примитивами на плоскости. Начнем с точек, поработаем с кругами, научимся делать различные отрезки и фигуры.

Рациональные числа

Кроме этого попробуем построить простую библиотеку для работы с рациональными числами. Это числа, у которых есть числитель и знаменатель. Определение, конечно, не строго математическое, но вы на интуитивном уровне все с ними знакомы. Рациональное число — достаточно простой, но составной объект, который включает в себя пару чисел.

Преимущества Hexlet

  • Осмысление
  • СИКП
  • Не используем существующие структуры данных
  • Функции высшего порядка
  • Неизменяемость (Функциональный стиль)

По опыту предыдущих курсов очень часто у людей возникают вопросы: "А почему именно так?", "Как мне это поможет в практике?" и "Я хочу быстрее начать писать продакшн код во фреймворках". Да, мы не просто учим синтаксису. Мы хотим изменить ваше мышление и развить критическое мышление, чтобы вы понимали причинно-следственные связи. Это поможет вам мыслить абстракциями, а не полагаться только на синтаксис языка. Это позволит писать вам модульные программы, которые легко читать, поддерживать, развивать, и они будут выполнять то, что нам нужно. Это наша основная идея, то, что хочет дать и несет Хекслет. Возможно, вы уже заметили это по каким-то вещам, которые мы рассказываем или делаем.

Наш курс во многом построен на так называемом СИКПе — курсе, который велся и ведется до сих пор в большом количестве университетов мира. Расшифровывается, как структура и интерпретация компьютерных программ. Курс был придуман в Массачусетском технологическом институте (MIT). Это университет номер один в мире IT-технологий, который выпускал и выпускает лучших специалистов в этой области. СИКП — достаточно большой, сложный, но крайне важный курс. По нему выпущена книга, которая уже десятки лет считается книгой номер один среди обучающей литературы по программированию. В любом случае всем ее рекомендуем. Здесь мы ее активно используем, потому что она дала нам много материала и пищи для размышлений. Книга была выпущена в 1985 году, а сам курс велся еще раньше (с начала 80-х). Но, как вы увидите в дальнейшем, несмотря на то, что меняются технологии, меняются фреймворки, меняется все вокруг, но базовые вещи, так же как во многом и математика, в общем-то не меняется и не поменяется. Не гонитесь за новым модным, изучайте то, на чем все это базируется.

Курс не использует существующие структуры данных. Мы сказали об этом в самом начале. Здесь не будет ничего про массивы, объекты или какие-то другие возможные способы комбинирования данных. Это отвлечет нас от основной идеи. От понимания сути вопроса. Наши функции в этом курсе приобретут совершенно новый оттенок и заиграют новыми красками. Мы познакомимся с функциями высшего порядка и увидим, что функции — это точно такие же данные, которые можно передавать в другие функции, возвращать из функций и делать с ними совершенные чудеса.

В курсе мы будем работать с неизменяемыми данными, использовать функциональный стиль программирования. Этот достаточно важный аспект позволяет нам сосредоточиться только на самом вопросе, который разбирается в курсе, и оставить вопрос изменения состояния и связанных с этим проблем в стороне. В Основах программирования мы уже немного говорили о том, какие проблемы привносят переменные и изменения их состояний. В дальнейшем будет отдельный большой курс, посвященный работе с состояниями и всеми особенностями, которые привносят возможность использовать переменные.


Аватары экспертов Хекслета

Остались вопросы? Задайте их в разделе «Обсуждение»

Вам ответят команда поддержки Хекслета или другие студенты

Для полного доступа к курсу нужен базовый план

Базовый план откроет полный доступ ко всем курсам, упражнениям и урокам Хекслета, проектам и пожизненный доступ к теории пройденных уроков. Подписку можно отменить в любой момент.

Получить доступ
1000
упражнений
2000+
часов теории
3200
тестов

Открыть доступ

Курсы программирования для новичков и опытных разработчиков. Начните обучение бесплатно

  • 130 курсов, 2000+ часов теории
  • 1000 практических заданий в браузере
  • 360 000 студентов
Отправляя форму, вы принимаете «Соглашение об обработке персональных данных» и условия «Оферты», а также соглашаетесь с «Условиями использования»

Наши выпускники работают в компаниях:

Логотип компании Альфа Банк
Логотип компании Aviasales
Логотип компании Yandex
Логотип компании Tinkoff

Используйте Хекслет по-максимуму!

  • Задавайте вопросы по уроку
  • Проверяйте знания в квизах
  • Проходите практику прямо в браузере
  • Отслеживайте свой прогресс

Зарегистрируйтесь или войдите в свой аккаунт

Отправляя форму, вы принимаете «Соглашение об обработке персональных данных» и условия «Оферты», а также соглашаетесь с «Условиями использования»