Ключи словаря хранятся в нем в единственном экземпляре. Добавление нового значения по существующему ключу заменяет старое значение. Хранение в единственном экземпляре полезно и в тех случаях, когда нам нужно хранить не столько значения по ключам, сколько именно сами ключи.
Например, нужно хранить список городов, которые посетил каждый пользователь. При повторном посещении города дублировать запись не требуется. Это позволяет сэкономить память и упростить поиск информации. Также нам может понадобиться узнать, какие города посетили и Вася и Маша, а какие — только Маша или только Вася.
По сути, это хранения перечня элементов в неких наборах и сопоставления этих наборов между собой. В математике для решения такого рода задач служат множества. В свою очередь, Python предоставляет одноименную структуру данных — set
.
Итак, множества в Python — это неупорядоченные последовательности элементов, каждый из которых в множестве представлен ровно один раз. С ними мы подробнее познакомимся в этом уроке.
Создание множеств и манипуляции над ними
Множество можно создать с помощью соответствующего литерала:
s = {1, 2, 3, 2, 1}
s # {1, 2, 3}
type(s) # <class 'set'>
Литералы множеств записываются в фигурных скобках, как и литералы словарей. Однако внутри скобок через запятую перечисляются только элементы множества. Литерал {}
уже занят словарями, поэтому пустое множество создается вызовом функции set
без аргументов:
set() # {}
type(set()) # <class 'set'>
Эту же функцию можно использовать, чтобы создать множество из элементов произвольного количества итераторов или итерируемых элементов:
set('abracadabra') # {'c', 'd', 'a', 'r', 'b'}
set([1, 2, 3, 2, 1]) # {1, 2, 3}
set({'a': 42, 'b': 'foo'}) # {'a', 'b'}
Заметьте, что в множестве каждый уникальный элемент представлен ровно один раз, даже если в коллекции-источнике были повторы.
Проверка на вхождение
Для некоторых задач нужно проверять, является ли некое значение элементом множества — другими словами, «входит ли оно в множество» или «принадлежит ли оно множеству». В таких случаях нужно использовать оператор in
:
42 in set() # False
42 in set([42]) # True
'a' in set('abracadabra') # True
Проверка на вхождение в множество выполняется очень быстро — гораздо быстрее, чем проверка на вхождение в строку, кортеж или список. Так же быстро работает поиск ключа в словаре, потому что словари и множества используют один механизм хранения и поиска ключей.
На небольших коллекциях это незаметно. Но разница становится очевидна, если в коллекции есть больше пары десятков элементов и в условиях, когда проверка на вхождение проводится часто.
Дополнительные материалы
Остались вопросы? Задайте их в разделе «Обсуждение»
Вам ответят команда поддержки Хекслета или другие студенты
Для полного доступа к курсу нужен базовый план
Базовый план откроет полный доступ ко всем курсам, упражнениям и урокам Хекслета, проектам и пожизненный доступ к теории пройденных уроков. Подписку можно отменить в любой момент.