СТАТЬЯ
09.01.02

<< Часть 1

Проектирование реляционных баз данных (Часть 2)

© Зеленков Ю.А.
Главы из книги "Введение в базы данных"
Книга была опубликована на сайте http://alpha.netis.ru


Содержание

5.4. Концептуальное моделирование. Пример построения диаграммы "сущность-связь"
5.5. Правила порождения реляционных отношений из модели "сущность-связь".M
       5.5.1. Бинарные связи.
       5.5.2. N-арные связи.
       5.5.3. Иерархические связи.
5.6. Проектирование реляционной базы данных на основе декомпозиции универсального отношения.

5.4. Концептуальное моделирование. Пример построения модели "сущность-связь"

В предыдущей главе мы кратко рассмотрели методы функционального моделирования, которые позволяют выделить первичные информационные объекты, из которых затем строятся концептуальная и реляционная модели данных. Однако, в случае достаточно простой предметной области выделение информационных объектов можно произвести и без функционального анализа. Один из способов такого проектирования структуры реляционной базы данных описан в этом и следующем разделах. В параграфе 5.6 будет рассмотрен другой способ проектирования реляционной структуры, основанный на декомпозиции универсального отношения.

Один пример построения модели "сущность-связь" был приведен в параграфе, где были введены основные понятия этой модели. Здесь мы рассмотрим другой пример, связанный с проектированием базы данных publucations, которая использовалась для практических занятий при изучении языка SQL.

БД publications должна хранить сведения о печатных изданиях, а также ссылки на интересные ресурсы в Internet. И те, и другие источники информации будут касаться одной темы, а именно "баз данных". Попробуем выделить интересующие нас сущности и определить связи между ними.

Прежде всего, займемся понятием "печатное издание". Что это такое? Мы знаем, что объект "печатное издание" воплощается в виде книги, которую можно полностью описать с помощью следующих характеристик: название, автор, год издания и издатель (издательство). Можно ли на основании этого ввести сущность "книга", а названные характеристики определить в качестве ее атрибутов? Прежде чем сделать это рассмотрим более внимательно отношения между книгой и ее характеристиками:

Таким образом, мы определили, что у сущности "книга" имеется два атрибута "название" и "год издания". Как уже говорилось, название, скорее всего, будет однозначно определять данную книгу, чего не скажешь о годе издания. Поэтому объявим ключом сущности атрибут "название" (или "имя_книги").

Что касается всех возможных авторов, то нас интересует только одна их характеристика - имя. Поэтому, сущность "автор" имеет только один атрибут "имя_автора", который и является ключом.

С сущностью "издатель" дел обстоит несколько сложнее. Практически все крупные издательства имеют сейчас собственные web-страницы, которые могут содержать информацию полезную для пользователей проектируемой базы данных. Поэтому, нужно рассмотреть две характеристики этого объекта: "имя_издателя" и "URL" (uniform resource locator - универсальный указатель ресурсов, с помощью которого в Internet определяется путь к web - странице). Ясно, что каждый издатель имеет уникальное имя и уникальный url, но прежде чем внести их в список атрибутов, вспомним, что наша база данных должна также содержать ссылки и на другие Internet-ресурсы. Возможно, при дальнейшем анализе возникнет необходимость во введении отдельной сущности "URL". Поэтому "имя_издателя" внесем в список атрибутов сущности "издатель", а "URL" будем считать атрибутом отдельной сущности "web - страница", ассоциируемой с "издателем" связью (1,1):(1,1).

Теперь настала пора заняться объектом "ресурс Internet". Его мы можем описать с помощью понятий "имя ресурса", "url", "автор". Внимательно рассмотрев связи этих понятий с описываемым объектом, можно прийти к заключению, что "имя_ресурса" и "url" однозначно с ним связаны, т.е. являются атрибутами. В то же время, "автор" является отдельной сущностью (один ресурс может иметь много авторов, и один автор может быть создателем многих web - страниц). Т.к. мы уже ранее ввели сущность "автор" просто определим характеристики ее связи с сущностью "Internet-ресурс". Из сказанного выше следует, что эти сущности объединяются связью n : m, в то же время, автор какой-либо книги может не иметь собственной web - страницы, а авторы некоторых Internet ресурсов не указывают своих имен (т.е. можно формально сказать, что эти ресурсы не имеют авторов). Следовательно, класс принадлежности обеих сущностей будет необязательным.

Прежде чем объявить нашу модель готовой, проверим еще раз определение каждой сущности. Внимательный анализ покажет, что построенная модель имеет несколько ошибок:

  1. Сущность "автор" имеет обязательный класс принадлежности в связи с сущностью "книга". Это означает, что мы не сможем добавить в базу данных сведения о человеке, который создал собственный web - сайт, но не написал ни одной книги. Для того, что бы устранить это ограничение изменим класс принадлежности сущности "книга" в рассматриваемой связи "автор" - "книга" на необязательный.
  2. При анализе объекта "издатель" мы предположили, что сущность "web-страница" может быть объединена с сущностью "Internet-ресурс". Однако, мы видим, что эти сущности имеют разный набор атрибутов, следовательно, выполнить такое объединение нельзя. Вспомним, что в противном случае, предполагалось единственный атрибут сущности "web - страница" присоединить к атрибутам сущности "издатель". Тем не менее, не будем этого делать, в следующем разделе мы увидим, что с помощью правил порождения реляционных отношений из модели "сущность-связь" в том и в другом случае мы получим одинаковый результат.

Готовая модель "сущность-связь" представлена на следующем рисунке:

5.5. Правила порождения реляционных отношений из модели "сущность-связь"
       5.5.1. Бинарные связи

Тип связи
Пример связи
Правило построения отношений
Отношения
(1,1):(1,1)
Требуется только одно отношение. Первичным ключом данного отношения может быть ключ любой из сущностей.
(1,1):(0,1)(1,1):(0,n)
Для каждой сущности создается свое отношение, при этом ключи сущностей служат ключами соответствующих отношений. Кроме того, ключ сущности с обязательным классом принадлежности добавляется в качестве внешнего ключа в отношение, созданное для сущности с необязательным классом принадлежности.
(0,1):(0,1)
Необходимо использовать три отношения: по одному для каждой сущности (ключи сущностей служат первичными ключами отношений) и одно отношение для связи. Отношение, выделенное для связи, имеет два атрибута - внешних ключа - по одному от каждой сущности.
(0,1):(0,n)(0,1):(1,n)

Формируются три отношения: по одному для каждой сущности, причем ключ каждой сущности служит первичным ключом соответствующего отношения, и одно отношение для связи. Отношение, выделенное для связи, имеет два атрибута - внешних ключа - по одному от каждой сущности.

n : m
В этом случае всегда используются три отношения: по одному для каждой сущности, причем ключ каждой сущности служит первичным ключом соответствующего отношения, и одно отношение для связи. Последнее отношение должно иметь среди своих атрибутов внешние ключи, по одному от каждой сущности.

       5.5.2. N - арные связи

Общее правило: для представления n-сторонней связи всегда требуется n+1 отношение. Например, в случае трехсторонней связи необходимо использовать четыре отношения, по одному для каждой сущности (причем ключ сущности служит первичным ключом соответствующего отношения), и одно для связи. Отношение, порождаемой для связи, будет иметь среди своих атрибутов ключи от каждой сущности.

       5.5.3. Иерархические связи

К сожалению, надо признать, что реляционная модель мало подходит для отображения отношений наследования между сущностями (иерархических связей). Напомним, что в таких связях дочерние сущности наследуют все атрибуты родительской, и каждая из них обладает своим уникальным набором дополнительных атрибутов. В параграфе http://alpha.netis.ru/koi/db/ch_2_2.html приведен пример такой связи между родительской сущностью ЗАКАЗЧИК и дочерними - ЗАРУБЕЖНОЕ_ПРЕДПРИЯТИЕ и ОТЕЧЕСТВЕННОЕ_ПРЕДПРИЯТИЕ.

В этом случае возможны два варианта построения реляционных отношений. Согласно первому для иерархической структуры создается одно отношение, которое содержит атрибуты связи и всех сущностей. Для примера, из параграфа http://alpha.netis.ru/koi/db/ch_2_2.html мы должны создать отношение ЗАКАЗЧИК (НАЦ_ПРИНАДЛЕЖНОСТЬ, ВАЛЮТА, ЯЗЫК, ФОРМА_СОБСТВЕННОСТИ). Недостаток такого способа - для каждого кортежа часть атрибутов всегда будет неопределена. Т.е. для отечественного предприятия всегда будут иметь значения NULL атрибуты ВАЛЮТА и ЯЗЫК, а для зарубежного атрибут ФОРМА_СОБСТВЕННОСТИ. Более того, этот факт является требованием целостности сущности, следовательно, для СУБД должны быть явно указаны несколько списков атрибутов (по числу дочерних сущностей), причем определенные значения могут быть присвоены только членам одного из них. Реляционная модель не поддерживает такого ограничения, на практике его реализуют с помощью триггеров.

По второму способу генерируется по одному отношению для каждой дочерней сущности. Каждое из этих отношений включает атрибуты родительской сущности и связи кроме атрибутов - дискриминантов, т.е. ЗАРУБЕЖНОЕ_ПРЕДПРИЯТИЕ (ВАЛЮТА, ЯЗЫК) и ОТЕЧЕСТВЕННОЕ_ПРЕДПРИЯТИЕ (ФОРМА_СОБСТВЕННОСТИ). Недостатком данного способа является невозможность получить в одном запросе список всех заказчиков.

Оба описанных способа представлены на рисунке:

Следует отметить, что построенные таким образом реляционные отношения, не являются окончательной схемой базы данных. Их необходимо проверить на избыточные функциональные зависимости и привести к NFBK или нормальной форме более высокого порядка.

Применив все эти правила к модели "сущность-связь" базы данных publications, построенной в предыдущем параграфе, получим следующую реляционную структуру:

Синим цветом на диаграмме выделены первичные ключи, красным - внешние. Отношения, созданные для представления связей, обозначены серыми прямоугольниками, для сущностей - желтыми прямоугольниками.

5.6. Проектирование реляционной базы данных на основе декомпозиции универсального отношения

Как мы видели из предыдущего материала, проектирование реляционной базы данных фактически сводится к устранению избыточных функциональных зависимостей (а при необходимости избыточных многозначных зависимостей и зависимостей по соединению) из предварительного набора отношений, полученного каким-либо способом (например, из диаграммы сущность связь). В том случае, когда проектируемая база данных сравнительно невелика (общее число атрибутов не превышает 20-30), предварительный набор отношений можно представить в виде одного отношения, называемого универсальным. В него включаются все представляющие интерес атрибуты.

В качестве примера построим универсальное отношение для базы данных publications:

PUBLICATIONS(AUTHOR, TITLE, YEARPUB, PUBLISHER, PUBL_URL, SITE, SITE_URL)

здесь

Функциональные зависимости, имеющиеся в полученном отношении, представлены на следующей схеме:

(1) TITLE --> YEARPUB
|
(2) -----> PUBLISHER --> PUB_URL

(3) SITE ---> SITE_URL
(4)

Для устранения избыточной функциональной зависимости (3) декомпозируем исходное отношение на два:

PUBLICATIONS(AUTHOR, TITLE, YEARPUB, PUBLISHER, PUBL_URL, SITE)
WWWSITES(SITE,SITE_URL)

Приняв во внимание, что атрибут SITE требует типа данных "строка" и, следовательно, его использование в качестве первичного ключа не очень удобно, введем в отношении WWWSITES первичный ключ SITE_ID, основанный на целом типе данных. (Такая подстановка, хотя и ведет к избыточности с точки зрения теории, на практике позволяет ускорить обработку данных. Поэтому, в дальнейшем примем за правило заменять подобным образом строковые первичные ключи, не оговаривая это в каждом отдельном случае). Теперь наши отношения примут вид:

PUBLICATIONS(AUTHOR, TITLE, YEARPUB, PUBLISHER, PUBL_URL, SITE_ID)
WWWSITES(SITE_ID,SITE,SITE_URL)

Устраним функциональную зависимость (2):

PUBLICATIONS(AUTHOR, TITLE, YEARPUB, PUB_ID, SITE_ID)
PUBLISHERS(PUB_ID,PUBLISHER,PUBL_URL)
WWWSITES(SITE_ID,SITE,SITE_URL)

Теперь мы имеем следующие избыточные функциональные зависимости в отношении PUBLICATIONS:

TITLE --> YEARPUB
|
-----> PUB_ID

Для их устранения необходимо вынести атрибуты TITLE, YEARPUB и PUB_ID в отдельное отношение:

PUBLICATIONS(AUTHOR, TITLE_ID, SITE_ID)
TITLES(TITLE_ID,TITLE,YEARPUB,PUB_ID)
PUBLISHERS(PUB_ID,PUBLISHER,PUBL_URL)
WWWSITES(SITE_ID,SITE,SITE_URL)

Теперь наша база данных находится в третьей нормальной форме, однако мы видим, что полученный набор отношений не совпадает с набором, полученным из модели "сущность-связь". Для того, чтобы разобраться в причинах этого противоречия, рассмотрим отношение PUBLICATIONS вместе с его данными. Добавим автора, который имеет две книги и две web-страницы:

AUTHOR
TITLE_ID
SITE_ID
J.Doe
1
1
J.Doe
2
1
J.Doe
1
2
J.Doe
2
2

Из этой таблицы становится ясно, что в рассматриваемом отношении существует многозначная зависимость AUTHOR ->> TITLE_ID | SITE_ID. Для ее устранения приведем отношение к четвертой нормальной форме, для чего разобъем его на три.

                                                                                                                                                  AUTHORS(AU_ID,AUTHOR)
                    PUBLICATIONS(AUTHOR,TITLE_ID,SITE_ID) -> TITLEAUTHORS(TITLE_ID,AU_ID)

WWWSITEAUTHORS(AU_ID,SITE_ID)

Окончательно получим:

AUTHORS(AU_ID,AUTHOR)
TITLEAUTHORS(TITLE_ID,AU_ID)
WWWSITEAUTHORS(AU_ID,SITE_ID)
TITLES(TITLE_ID,TITLE,YEARPUB,PUB_ID)
PUBLISHERS(PUB_ID,PUBLISHER,PUBL_URL)
WWWSITES(SITE_ID,SITE,SITE_URL)

Теперь схема базы данных соответствует структуре, полученной другими способами.

Анализ показывает, что избыточные функциональные зависимости в ней отсутствуют.

 

Литература:

Дополнительную информацию Вы можете получить в компании Interface Ltd.

Обсудить на форуме
Отправить ссылку на страницу по e-mail


Interface Ltd.
Тel/Fax: +7(095) 105-0049 (многоканальный)
Отправить E-Mail
http://www.interface.ru
Ваши замечания и предложения отправляйте автору
По техническим вопросам обращайтесь к вебмастеру
Документ опубликован: 09.01.02