Научная электронная библиотека
Монографии, изданные в издательстве Российской Академии Естествознания

1.2. Банк данных

Банк данных является современной формой организации хранения и доступа к информации. Существует значительное разнообразие определений понятия «банк данных». В «общеотраслевых руководящих материалах по созданию банков данных» дается следующее определение.

Банк данных – это специальным образом организованная система данных (баз данных), технических, языковых, программных и организационно-методических средств, которые предназначены обеспечить централизованное накопление и коллективное многоцелевое использование данных.

В таком определении подчеркивается, что БнД является сложной системой, включающей в себя несколько подсистем, необходимых для функционирования любой системы автоматизированной обработки данных.

Использование БнД при правильной его организации должно существенно изменить деятельность той организации, где он внедряется, сократить документооборот, формы документов, перераспределить функциональные обязанности сотрудников.

БнД является сложной человеко-машинной системой, включающей в себя совокупность различных взаимосвязанных и взаимозависимых компонент (рис. 1.1).

missing image file

Рис. 1.1. Состав банка данных

Информационная компонента является ядром БнД поскольку включает в себя БД.

Здесь БД – совокупность данных, которая организована по определенным правилам и предусматривает общие принципы описания, хранения и манипулирования этими данными, не зависящая от прикладных программ, и находящаяся под управлением СУБД.

В состав БД включаются не только хранимые данные о предметной области, но и собственно описание БД, которое относится к метаинформации, то есть информации характеризующую какую-либо другую информацию.

Метаинформация включает в себя информацию о схеме БД, описание взглядов различных категорий пользователей на предметную область и информацию о проектных решениях. Центральное хранилище метаинформации называется словарем данных. Роль метаинформации возрастает при использовании автоматизированных средств автоматизированного проектирования.

Другой отличительной особенностью БнД является то, что в ней имеются специальные языковые и программные средства, облегчающие выполнение операций, связанных с организацией хранения данных и обеспечения доступа к ним. Комплекс программных средств, которые обслуживают базу данных и позволяют использовать содержащуюся в ней информацию многим пользователям, называют СУБД.

Функции СУБД:

1. Управление данными во внешней памяти (позволяет пользователям выполнять основные операции с данными: сохранять, извлекать и обновлять информации).

2. Управление транзакциями. К транзакциям относится совокупность операций над БД, рассматриваемых СУБД как единое целое. В тоже время, транзакция – это набор действий, которые могут быть выполнены с целью доступа или изменению содержимого БД. В случае, когда необходимо внести в БД сразу несколько изменений, создается сложная транзакция. При использовании транзакций не нарушается целостное состояние БД.

3. Восстановление БД. СУБД должна быть в состоянии восстановить после любого аппаратного или программного сбоя последнее согласованное состояние БД. Это требует избыточности хранения данных. Наиболее распространенным методом поддержания такой избыточности является ведения журнала изменения БД.

4. Поддержка языков БД.

5. Ведение словаря данных. Словарь данных – системный каталог с данными о схемах, пользователях, приложениях и т.д.

6. Управление параллельным доступом. При одновременном доступе к обрабатываемым данным СУБД должна гарантировать, что пользователи не будут мешать друг другу, то есть не произойдут конфликты с нежелательными последствиями для хранимых данных.

7. Управление буферами оперативной памяти. СУБД зачастую функционирует с БД значительного объема. Поэтому при обращении к каждому элементу данных необходимо осуществлять обмен с внешней памятью, что вызывает значительное замедление работы системы, Реальное увеличение скорости возможно за счет буферизации данных в оперативной памяти, но возможности общесистемной буферизации при этом оказывается недостаточно. Поэтому СУБД поддерживает свой собственный набор буферов оперативной памяти с собственной дисциплиной замены буферов.

8. Контроль доступа к данным. СУБД должна поддерживать различный уровень доступа к данным разных категорий пользователей.

9. Поддержка обмена данными. Поддерживает работу в локальных сетях и обладает возможностью объединения с коммуникационным программным обеспечением (ПО) и с различными существующими менеджерами по обмену данными.

10. Поддержка целостности данных, которая предполагает, что СУБД содержит сведения обо всех правилах, которые ни в коем случае нельзя нарушать при работе с данными и обладает инструментами контроля над данными и их изменениями по их соответствиям этим правилам.

11. Поддержка независимости от данных, то есть независимость программ от структур данных.

Основными средствами СУБД являются:

– инструменты структурирования данных (ЯОД – языки описания данных);

– инструменты обработки данных, позволяющие заносить данные в БД, удалять, модифицировать или выбирать существенные данные (языки манипулирования данными – ЯМД);

– инструменты конструирования экранных форм, которые предназначены для ввода данных, просмотра и обработки в диалоговом режиме (генераторы экранных форм);

– инструменты создания запросов для поиска данных при заданных условиях (язык запросов);

– инструменты создания отчетов, вывода на печать результатов обработки в удобном для пользователя виде (генераторы отчетных форм);

– графические языки выборки данных по различным критериям;

– инструменты создания пользовательских приложений, которые позволяют объединять разные операции работы с базой данных в единый технологический процесс (генераторы приложений);

– инструменты, позволяющие специфицировать приложения различных типов (языки спецификаций – документаторы приложений).

Большинство современных СУБД включают в себя несколько языковых средств.

Технические средства БнД включают в себя универсальные, персональные ЭВМ, периферийные средства для ввода/вывода информации. Персональные компьютеры (ПК) делятся на два класса:

1) персональные компьютеры класса SOHO (small office, home office);

2) рабочие станции.

Под компьютерами SOHO подразумевают универсальные машины для использования дома и в офисе. Рабочие же станции предназначены для работы с приложениями большой вычислительной мощности. К рабочим станциям предъявляются более высокие требования, чем к системам SOHO.

Организационно-методические инструменты включают в себя методические материалы для пользователей различных категорий.

Администратор базы данных (АБД) – это специалист(ы), который отвечает за управление техническими аспектами системы управления базы данных, разработку программ, определение данных, ввод данных в БД, удаление данных, поддержание целостности и защиты данных. Кроме того, АБД участвует в обучении пользователей
различных категорий, планировании и разработке БД. АБД необходимо знать конкретную СУБД и системное окружение.

Классификация БнД. Центральной компонентой БнД является база данных, и большинство квалификационных [8] признаков относится именно к ней. Классификация выполняется по следующим признакам (рис. 1.2):

1. По форме представления информации различают:

– видеосистемы;

– аудиосистемы;

– мультимедийные системы.

missing image file

Рис. 1.2. Классификация банков данных

Такая классификация показывает, какая разновидность информации выдается пользователям из БД: изобразительная, звуковая или с использованием комбинации различных форм отображения. Наибольшее практическое использование в настоящее время находят БД, содержащие обычные символьные данные.

Информацию, представленную в символьном виде по характеру организации можно разделить на:

– неструктурированные (семантические сети);

– частично структурированные (обычный текст или гипертекст);

– структурированные.

Для структурированных БД требуется предварительное проектирование и описание структуры БД, после чего базы данных этого типа заполняются данными. В свою очередь структурированные БД по типу используемой модели подразделяются на:

– иерархические (ИМД);

– сетевые (СМД);

– реляционные (РМД);

– объектно-ориентированные;

– мультимодальные.

ИМД представляются в виде дерева, которое состоит из объектов различных уровней. На верхнем уровне располагается один объект (родитель). На следующем уровне находятся объекты-потомки и т.д. Например, ИМД является файловая система, которая состоит из корневой директории, имеющей иерархию поддиректорий и файлов. В такой модели запрос, который направлен вниз по иерархии, прост в реализации; а вверх направленный запрос, трудно исполним.

СМД подобны иерархическим, исключая того, что в них содержатся указатели, работающие в обоих направлениях, соединяющих родственную информацию. Несмотря на то, что эта модель данных решает часть проблем, связанных с иерархической моделью, но осуществление простых запросов является достаточно непростым процессом.

В основе реляционной базы данных лежит понятие «отношения». Отношение представляется двумерной таблицей, имеющей свое собственное название. В РМД минимальным объектом действий, который сохраняет ее структуру, является строка, состоящая из ячеек таблицы – полей. С точки зрения логики РМД представляется совокупностью двумерных таблиц различного наполнения.

Объектно-ориентированная база данных (ООБД) – это БД, в которой данные моделируются в виде объектов, их атрибутов, методов и классов. ООБД обычно рекомендованы для применения в случаях, когда необходима высокопроизводительная обработка данных, которые имеют сложную структуру.

Модальность – это присущая человеку форма воздействия на другого человека или компьютер с помощью речи, жестов, прикосновений и т.п. Модальные модели – это формальные модели, используемые для анализа модальностей.

2. По типу хранимой информации:

– документальные (объект хранения – документ);

– фактографические (хранятся сведения об объектах предметной области);

– лексикографические (содержатся многоязычные словари, классификаторы, словари основ слов и т.п.).

Среди документальных баз данных различают полнотекстовые, реферативные и библиографические. БД такого типа могут быть по-разному организованы: с хранением и без хранения исходного документа на машинных носителях. К системам второго типа относятся реферативные и библиографические БД, и БД-указатели, отсылающие к источнику информации. Системы, предусматривающие хранение полного текста документа, называются полнотекстовыми. Целью поиска в системах документального типа является не только определенная информация, хранимая в документах, но и сами документы. В качестве признаков поиска могут быть любые «выходные данные» документов, к примеру: «дата принятия документа».

В фактографических БД хранится информация об объектах предметной области в виде «фактов» (например, данные об объеме выпуска продукции производителями и т.п.).

3. По виду организации хранения информации и обращению к ней выделяют:

– локальные или персональные;

– интегрированные (централизованные);

– распределенные.

Персональная база данных предназначена для использования одним пользователем.

Интегрированные и распределенные БД позволяют одновременно обращаться нескольким пользователям к одной и той же информации (режимы доступа – многопользовательский, параллельный). Это вносит специфические проблемы при проектировании и эксплуатации БнД. Кроме того, распределенные БД (РБД), имеют особенности, которые связаны с тем, что разные части БД физически расположены на разных ЭВМ, а логически, они представляют собой единое целое. Создание РБД было вызвано необходимостью с одной стороны – интеграцией, а с другой – децентрализацией обработки данных.

Интеграция обеспечивает централизованное управление и ведение баз данных. Децентрализация подразумевает хранение данных в местах их возникновения или обработки, при этом увеличивается скорость обработки данных и степень надежности системы, а стоимость – снижается,.

4. По охвату предметной области различают БД:

– территориальные (всемирная, страна, город, регион и т.п.);

– временные (год, месяц и т.п.);

– ведомственные;

– проблемные.

В литературе наблюдаются и другие способы классификации банков данных, но обозначенные являются наиболее значимыми.


Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»
(Высокий импакт-фактор РИНЦ, тематика журналов охватывает все научные направления)

«Фундаментальные исследования» список ВАК ИФ РИНЦ = 1,674