Бывают разные способы представлять данные в программах. Есть строки — наборы символов в кавычках вроде "Hello, World!"
. Есть целые числа — например, 7
, -198
, 0
. Это две разные категории информации — два разных типа данных. Операция умножения имеет смысл для категории «целые числа», но не для категории «строки»: нет смысла умножать слово «мама» на слово «блокнот».
Тип данных определяет, что можно делать с элементами конкретного множества информации. В этом уроке мы изучим типы данных и узнаем, как работает типизация в Python.
Язык программирования распознает типы данных, поэтому Python не позволит нам умножать строку на строку — нельзя умножать текст на текст. При этом можно умножать целое число на другое целое число. Наличие типов и таких ограничений в языке защищает программы от случайных ошибок.
В отличие от строк, числа оборачивать в кавычки не нужно. Чтобы напечатать число 5, достаточно написать:
print(5) # => 5
Число 5
и строка '5'
— совершенно разные вещи, хотя вывод у print()
для этих данных идентичный. Целые числа (1
, 34
, -19
и т.д.) и рациональные числа (1.3
, 1.0
, -14.324
и т.д.) — это два отдельных типа данных. Такое разделение связано с особенностями устройства компьютеров. Есть и другие типы, с ними мы познакомимся позже.
Вот еще один пример, но уже с рациональным числом:
print(10.234) # => 10.234
Типы данных «строка», «целое число» и «рациональное число» — это примитивные типы, то есть они встроены в сам язык Python. В язык встроены также и некоторые составные типы, но пока мы будем работать только с примитивными. Программисты также могут создавать собственные типы данных.
По-английски строки в программировании называются strings, а строчки текстовых файлов — lines. Например, в коде выше есть строчка (line), но нет никаких строк (string). В русском иногда может быть путаница, поэтому во всех уроках мы будем говорить строка для обозначения типа данных «строка», и строчка для обозначения строчек кода (lines) в файлах.
Python — один из языков, который строго относится к типам данных. Поэтому на любую несовместимость типов он ответит ошибкой. Все дело в сильной типизации.
Нам известно про два разных типа данных: числа и строки. Например, мы могли складывать числа, потому что операция сложения — это операция для типа «числа». А что, если применить эту операцию не к двум числам, а к числу и строке?
print(1 + '7') # TypeError: unsupported operand type(s)...
Python не разрешит сложить число 1
и строку '7'
, потому что это значения разных типов. Нужно сначала либо сделать строку числом, либо число строкой. Как это сделать, мы поговорим позже.
Такое педантичное отношение к совместимости типов называется строгой типизацией или сильной типизацией. Python — язык со строгой типизацией.
Не все языки так делают. Например, PHP — это язык со слабой типизацией. Он знает о существовании разных типов, но относится к их использованию не очень строго. PHP пытается преобразовывать информацию, когда это кажется разумным. То же самое относится к JavaScript:
// Как тебе такое, Илон Маск?
// Число 1 + Строка 7 = Строка 17
1 + '7'; // '17'
С одной стороны, автоматическое неявное преобразование типов и правда кажется удобным. Но на практике это свойство языка создает множество ошибок и проблем, которые трудно найти. Код может иногда работать, а иногда не работать — в зависимости от того, «повезло» ли с автоматическим преобразованием. Программист это заметит не сразу и потратит много времени на отладку.
Представим, что нам нужно изменить символ в строке. Вот, что из этого выйдет:
first_name = 'Alexander'
first_name[0] = 'B'
# Ошибка: TypeError: 'str' object does not support item assignment
Такое происходит из-за неизменяемости примитивных типов в Python — язык не дает никакой физической возможности поменять строку. Неизменяемость примитивных типов важна по многим причинам. Ключевая причина — производительность.
Но иногда нам нужно изменить строку. Для этого и существуют переменные:
first_name = 'Alexander'
first_name = 'Blexander'
print(first_name) # => Blexander
Есть большая разница между изменением значения переменной и изменением самого значения. Примитивные типы в Python поменять нельзя, а составные — можно. Также можно без проблем заменить значение переменной.
В программировании регулярно встречаются задачи, когда один тип данных нужно преобразовать в другой — например, при работе с формами на сайтах. Данные формы всегда приходят в текстовом виде, даже если значение — число. Вот как его можно преобразовать:
# str станет int
number = int('345')
print(number) # => 345
int()
— это функция, в которую передается значение, чтобы его преобразовать. Функция ведет себя подобно арифметическим операциям, но делает особые действия. Вот еще несколько примеров:
value = '0'
# Внутри скобок можно указывать переменную
converted_value = int(value)
print(converted_value) # => 0
# Или конкретное значение
converted_value2 = int('10')
print(converted_value2) # => 10
converted_value3 = int(False)
print(converted_value3) # => 0
converted_value4 = int(True)
print(converted_value4) # => 1
# Если преобразуется число с плавающей точкой
# то отбрасывается вся дробная часть
converted_value5 = int(3.5)
print(converted_value5) # => 3
Точно так же можно преобразовать данные в строки str()
и число с плавающей точкой float()
:
value = str(10)
print(value) # '10'
value2 = str(True)
print(value2) # 'True'
value3 = float(5)
print(value3) # 5.0
Некоторые преобразования Python выполняет автоматически. Например, в операциях, где встречается одновременно целое число и число с плавающей точкой. Python автоматически все приводит к float — числу с плавающей точкой:
# Неявно выполняется код float(3) + 1.2
value = 3 + 1.2
print(value) # => 4.2
В математике существуют разные виды чисел. Например, натуральные — целые числа от одного и больше, или рациональные — числа с точкой, например 0.5. С точки зрения устройства компьютеров, между этими видами чисел — пропасть. Например, нам легко определить, сколько будет 0.2 + 0.1. А теперь посмотрим, что на это скажет Python:
0.2 + 0.1 # 0.30000000000000004
Сложение двух рациональных чисел внезапно привело к неточному вычислению результата. Тот же самый результат выдадут и другие языки программирования. Это объясняется ограничениями вычислительных мощностей. Объем памяти конечен, в отличие от чисел. Бесконечное количество чисел потребовало бы бесконечного количества памяти.
Рациональные числа не выстроены в непрерывную цепочку — между 0.1 и 0.2 бесконечное множество чисел. Как тогда хранить рациональные числа? В интернете много статей об организации памяти в таких случаях. Более того, существует стандарт, в котором описано, как это делать правильно. На этот стандарт опирается подавляющее число языков.
Разработчикам важно понимать, что операции с плавающими числами неточны, но эту точность можно регулировать при работе с конкретными задачами.
Вам ответят команда поддержки Хекслета или другие студенты.
Курсы программирования для новичков и опытных разработчиков. Начните обучение бесплатно
Наши выпускники работают в компаниях:
С нуля до разработчика. Возвращаем деньги, если не удалось найти работу.
Зарегистрируйтесь или войдите в свой аккаунт