Основы реляционных баз данных

Теория: Условия (WHERE)

Полный доступ к материалам

Зарегистрируйтесь и получите доступ к этому и десяткам других курсов

Обычно данных в базе много, и мы хотим работать только с их частью, а не всеми данными сразу. Например, нам нужно посмотреть данные только тех пользователей, которые зарегистрировались вчера. Для выборки части данных из базы используются условия. В этом уроке мы научимся строить подобные условия при выполнении запросов в базу данных с помощью WHERE.

WHERE

Самое простое условие — указать прямое соответствие. Например, выборка по идентификатору:

-- В случае базы данных знак `=` должен восприниматься
-- как математическое равенство, а не присваивание.
SELECT * FROM users WHERE id = 3;

UPDATE users SET first_name = 'Valya' WHERE id = 3;

DELETE FROM users WHERE id = 3;

Первый запрос выше звучит так: выбрать всех пользователей, у которых идентификатор равен трем. Такая формулировка звучит странно, так как если мы выбираем по идентификатору, то и запись должна быть одна. С точки зрения семантики идентификатора она будет одна, но в реляционной базе данных результатом любой операции над множеством является множество.

В том случае, если ничего не найдено, возвращается не пустота, а пустое множество. Если же в базе есть пользователь с указанным идентификатором, то вернется множество, которое содержит один элемент — найденного пользователя.

Если нужно получить все записи, кроме тех, у которых есть определенное значение, то нужно =, заменить на !=:

-- выбрать всех пользователей с идентификатором, НЕ равным трем
SELECT * FROM users WHERE id != 3;

Сравнение с конкретным значением работает для всех типов данных, кроме NULL. Разберем эту ситуацию подробнее.

Проверка на равенство с NULL

У данных типа NULL свой синтаксис:

Равно NULL:

SELECT * FROM users WHERE first_name IS NULL;

Не равно NULL:

SELECT * FROM users WHERE created_at IS NOT NULL;

NOT, как и отрицание в языках программирования, может добавляться практически к любому оператору.

Равенство строк

У строк тоже свои особенности. В соответствии со стандартом ANSI SQL, строки в PostgreSQL регистрозависимые — результат зависит от регистра, в котором записан текст. Например, следующие два запроса выбирают разные данные:

SELECT * FROM users WHERE first_name = 'sunny';
SELECT * FROM users WHERE first_name = 'Sunny';

По этой причине данные в базе стараются хранить в нормализованном виде — перед добавлением в БД их приводят, например, к нижнему регистру, и то же самое делают при выборках. Классический пример — email. Его нужно хранить только в нижнем регистре.

Другие операции сравнения

Кроме точного соответствия SQL поддерживает и все остальные операции сравнения:

> — больше
< — меньше
!= — не равно
>= — больше либо равно, не меньше
<= — меньше либо равно, не больше

Работа WHERE

Например, так может выглядеть запрос на сравнение:

SELECT *
  FROM users
  WHERE created_at < '2018-10-05';

Здесь мы выбираем всех пользователей, созданных до 2018-10-05.

Логические операторы

Все операции можно объединять в цепочки, если использовать логические операторы OR и AND:

SELECT *
  FROM users
  WHERE created_at > '2018-01-01' AND created_at < '2018-10-05';

Здесь мы выбираем пользователей, которые зарегистрировались между 2018-01-01 и 2018-10-05.

Как и в случае с языками программирования, здесь действуют те же приоритеты. Чтобы не создавать неоднозначностей, в сложных ситуациях используются круглые скобки:

SELECT *
  FROM users
  WHERE first_name = 'Sunny' OR (created_at > '2018-01-01' AND created_at < '2018-10-05');

BETWEEN

Для условий с проверкой диапазона SQL поддерживает особый формат BETWEEN. По сути, это сокращенная версия для двух условий соединенных через AND:

SELECT *
  FROM users
  WHERE created_at BETWEEN '2018-01-01' AND '2018-10-05';
  -- WHERE created_at >= '2018-01-01' AND created_at <= '2018-10-05';

Здесь мы выбираем пользователей, которые зарегистрировались между 2018-01-01 и 2018-10-05, включая эти даты. BETWEEN всегда учитывает границы диапазона.

IN

В некоторых ситуациях требуется найти не диапазон строк, а строки, в которых поле соответствует одному значению из набора. Предположим, что мы хотим выполнить один запрос и найти пользователей с идентификаторами 1, 2 или 5. Для этого используют OR:

SELECT * FROM users WHERE id = 1 OR id = 2 OR id = 5;

Если понадобится найти десяток совпадений, можно использовать другое решение — IN:

SELECT * FROM users WHERE id IN (1, 2, 5);

Если нужно исключить определенные записи, достаточно добавить NOT:

SELECT * FROM users WHERE id NOT IN (1, 2, 5);

LIKE

Иногда нужно искать по частичному совпадению: например, проверить, что строка начинается или заканчивается с определенной последовательности символов. Допустим, мы хотим посмотреть пользователей, имя которых начинается с буквы A:

SELECT * FROM users WHERE first_name LIKE 'A%';

% — специальный заполнитель, который означает «все что угодно». Если его поставить в конце, то поиск выполняется по совпадению в начале фразы, если в начале — то по совпадению с концом, а если по краям — то проверяется совпадение внутри текста. Совпадение в конце может понадобиться, чтобы анализировать пользователей, которые регистрировались с определенного почтового домена:

SELECT * FROM users WHERE email LIKE '%hotmail.com';

Здесь мы выбираем всех пользователей, электронная почта которых заканчивается на hotmail.com.

Обратите внимание на то, что этот поиск регистрозависимый. Если вы хотите искать без учета регистра, то используйте ILIKE.

Выводы

В этом уроке мы разобрали, как работать с выборками части данных по условию. Теперь вы умеете строить условия при выполнении запросов в базу данных с помощью WHERE и таким образом сможете работать только с частью данных, а не со всей базой сразу.

Дальше→

Навигация по темеТеория

Завершено

0 / 24

→