Нормализация – это процесс декомпозиции сложной структуры данных на эквивалентное множество плоских файлов.
Декомпозиция – это разбиение объекта обработки (системы, данных, программы, задачи) на структурные единицы.
Рассмотрим преобразование ИМД в РМД. Преобразование выполняется путем размножения узлов (рис. 6.1).
Получено представление файла в виде таблицы. Достаточно присвоить таблице имя и именовать домены.
Рассмотрим преобразование СМД в РМД. Преобразование выполняется в следующей последовательности: СМД → ИМД → РМД. Для его выполнения применяется процесс размножения узлов (рис. 6.2).
Функциональные зависимости. Реляционная БД содержит как структурную, так и смысловую (семантическую) информацию.
Рис. 6.1. Преобразование ИМД в РМД
Рис. 6.2. Преобразование СМД в РМД
Структура БД характеризуется видом и числом включенных в нее отношений, а также связями «один ко многим», которые существуют между кортежами этих отношений.
Семантическая часть БД определяет функциональные зависимости, которые существуют между атрибутами отношений.
Дадим определение функциональных зависимостей.
Если заданы два атрибута X и Y некоторого отношения, то атрибут Y функционально зависит от атрибута X, если в любой момент времени каждому значению X соответствует только одно значение Y.
Связь функциональной зависимости обозначается как X → Y. X и Y могут представлять не только отдельные атрибуты, но и совокупности, составленные из нескольких атрибутов одного отношения. Некоторые функциональные зависимости могут быть нежелательны.
Определение. Избыточная функциональная зависимость – это зависимость, которая заключает в себе информацию, могущую быть полученной на основе других зависимостей, имеющихся в БД.
Корректной считается схема БД, в которой не имеются избыточные функциональные зависимости. Иначе необходимо приступать к процедуре разложения (декомпозиции) имеющегося множества отношений. При этом вновь образуемое множество будет содержать большее число отношений, являющихся проекциями отношений исходного множества.
Обратимый пошаговый процесс замены данного множества отношений другим с удалением избыточных функциональных зависимостей называется нормализацией.
Критерий обратимости обязывает, чтобы декомпозиция сохраняла эквивалентность отношений при замене одного отнощения на другое, т.е. в полученных отношениях:
● не должны появляться новые ранее отсутствовавшие кортежи;
● на новых отношениях должно выполняться исходное множество функциональных зависимостей.
Вывод: Существует строгая теория, которая использует понятия нормальных форм отношений (НФ). Всего разработано шесть нормальных форм отношений: 1НФ, 2НФ, 3НФ, НФБК (нормальная форма Бойса – Кодда), 4НФ, 5НФ или 1NF, 2NF, 3NF, 4NF, 5NF
[2, 9, 12, 13]. Две последние формы на практике используются очень редко, и разработчик стремится к тому, чтобы обеспечить нормализацию таблиц по крайней мере до уровня 3НФ или НФБК. Предполагается, что каждая нормальная форма анализируемого отношения уже находится в нормальной форме на уровень ниже рассматриваемой. Чем выше уровень нормальной формы, тем более жесткие ограничения накладываются на отношения. В ходе модификаций схема базы данных становится более строгой, а ее отношения всё менее подвержены аномалиям различного рода. Процесс перехода от нормальной формы более низкого уровня к форме высокого уровня называется нормализацией отношений.