Основы реляционных баз данных

Теория: Вторая нормальная форма

В этом уроке мы разберем вторую нормальную форму реляционной модели, а также два ее требования.

Будем работать с таблицей, которая уже соответствует первой нормальной форме:

order_items

idfirst_namelast_nameaddressitemprice
8СергейИвановМосква, ул. Промышленнаяутюг1000.00
2ИванПетровСамара, ул. Энгельсакофеварка5000.00
7ВикторСидоровОмск, ул. Дворцоваяутюг1000.00
4ВикторСидоровОмск, ул. Дворцоваятелевизор6500.00
9СергейИвановМосква, ул. Матросованоутбук20000.00
6СергейИвановМосква, ул. Матросованоутбук20000.00

Вторая нормальная форма

Вторая нормальная форма включает в себя два требования:

  • Таблица должна быть в первой нормальной форме
  • Все неключевые атрибуты таблицы должны зависеть от первичного ключа

Первое требование уже выполнено, так как в таблице:

  • Каждая ячейка хранит только одно значение
  • Все данные в одной колонке одного типа
  • Каждая запись отличается от других записей

Поэтому разберем подробнее второе требование.

Зависимость от первичного ключа

Зависимость атрибута от первичного ключа — это ситуация, при которой ключ имеет значение, зависимое от конкретного контекста. Предположим, что в таблице, Сергей — это всегда один и тот же человек, который делает заказ на разные адреса. В таком случае видно, что заказ привязан к конкретному пользователю. Это и есть зависимость от первичного ключа. А вот имя пользователя и его фамилия с заказом никак не связано. Оно имеет отношение к самому пользователю.

Согласно второй форме, атрибуты first_name и last_name необходимо вынести в свою таблицу, которая будет отвечать за пользователей:

users

idfirst_namelast_name
2СергейИванов
3ИванПетров
5ВикторСидоров

В этой таблице всего три записи, потому что у нас три уникальных пользователя. Каждому из этих пользователей присваивается первичный ключ.

Теперь нужно связать таблицу order_items с таблицей users. Делается это через указание первичных ключей в зависимых таблицах:

order_items

iduser_idaddressitemprice
82Москва, ул. Промышленнаяутюг1000.00
23Самара, ул. Энгельсакофеварка5000.00
75Омск, ул. Дворцоваяутюг1000.00
45Омск, ул. Дворцоваятелевизор6500.00
92Москва, ул. Матросованоутбук20000.00
62Москва, ул. Матросованоутбук20000.00

Мы удалили first_name, last_name и добавили user_id. В этом поле хранятся идентификаторы пользователей, а само поле называется внешним или вторичным ключом.

Такую же операцию нужно произвести и с товаром. Вынесем item в свою таблицу:

goods

idname
50утюг
30кофеварка
20телевизор
33ноутбук

Теперь свяжем эти данные с таблицей order_items:

order_items

iduser_idaddressgood_idprice
82Москва, ул. Промышленная501000.00
23Самара, ул. Энгельса305000.00
75Омск, ул. Дворцовая501000.00
45Омск, ул. Дворцовая206500.00
92Москва, ул. Матросова3320000.00
62Москва, ул. Матросова3320000.00

Другой пример внешнего ключа в таблице покупателя и города можно схематично показать так:

Внешний ключ

Внешний ключ — это не ссылка. Таблицы существуют сами по себе, и во внешнем ключе указывается конкретное значение, которое должно совпадать с первичным ключом другой таблицы.

Так выглядит синтаксис определения вторичного ключа:

REFERENCES <название таблицы, на которую смотрим> (<список полей в той таблице, которым соответствуем>)

-- Внешних ключей может быть любое количество: сколько ссылок — столько и ключей
CREATE TABLE orders (
    id bigint PRIMARY KEY,
    -- Тип внешнего ключа должен быть такой же,
    -- как у первичного в той таблице, куда ссылается внешний
    user_id bigint REFERENCES users (id),
    -- остальные поля
);

Благодаря вторичному ключу поддерживаются гарантии корректности данных. Например, невозможно удалить запись из основной таблицы, если на нее есть ссылки из внешних ключей в другой таблице. Так не получится случайно завести базу в неконсистентное состояние — когда данные ссылаются на несуществующие данные.

Выводы

В этом уроке мы разобрали вторую нормальную форму, ее свойства, а также ее зависимость от внешнего ключа. Осталось изучить третью форму — и у вас будет полное понимание самых распространенных форм в базах данных.