Ростелеком

Разница между информацией и данными. Чем отличается информация от данных

Компания "Ксерокс" в последние годы позиционирует себя не как производитель копировальных аппаратов, а как компания по обработке документов. Компания "ЗМ" называет себя компаний по инновационному решению задач. "ИБМ" идентифицирует себя как компания, создающая долгосрочные экономические преимущества для клиентов, объединяя свои знания в области бизнеса с широкими технологическими возможностями. Компания Steelcase, которая производит конторское оборудование, утверждает, что она продает собственные знания и услуги, которые позволяют создать лучшие условия пребывания людей на своих рабочих местах. Что добавляет стоимость в деятельность всех этих компаний? Это в основном решения, базирующиеся на знаниях: технические и технологические ноу-хау, дизайн продукта, маркетинговые исследования, выявление истинных нужд клиентов. Именно знания дают устойчивое конкурентное преимущество этим компаниям.

Рассмотрим, в чем отличие знаний от данных и информации. То, что это разные вещи, руководители начинают осознавать особенно ярко после того, как в организации потрачены значительные средства для создания той или иной базы данных, или информационной системы, или же просто эти средства потрачены на компьютеризацию, причем без соответствующего эффекта.

Данные - это совокупность различных объективных фактов. В корпорациях это, например, структурированные записи о трансакциях (в частности, данные обо всех продажах: сколько, когда и кто купил, сколько и когда заплатил и пр.). Эти данные не говорят о том, почему покупатель пришел именно сюда и придет ли он еще раз.

Информация - это иерархическая совокупность данных о тех или иных аспектах реального мира. Информация - это поток сообщений, а знание создается из этого потока, оно находится в зависимости от мнений и убеждений носителя знания.

Информация - это своего рода послание, обычно в форме документа или в видео- либо в аудиоформе. Она имеет получателя и отправителя. Она информирует, т.е. "придает форму", получателю путем изменения его оценок или поведения. Насколько послание является информацией, определяет получатель. Именно он оценивает, насколько полученное сообщение информирует его, а насколько оно представляет собой просто информационный шум.

Данные превращаются в информацию несколькими путями:

o контекстуализация : мы знаем, для чего эти данные нужны;

o подсчет : мы обрабатываем данные математически;

o коррекция : мы исправляем ошибки и ликвидируем пропуски;

o сжатие : мы сжимаем, концентрируем, агрегируем данные.

Знания - понятие более глубокое и широкое, чем просто данные или информация. Каждое предприятие в ходе своей деятельности осуществляет сбор данных, их структуризацию и генерирование нового знания. Чаще всего это знание касается технологии, если речь идет о материальном производстве, а также технологии работы с клиентами и технологии взаимодействия друг с другом, если речь идет о предприятии, осуществляющем обслуживание клиентов. Также это может быть знание относительно окружающей среды предприятия - о демографических, макроэкономических, социальных, макроэкономических, технологических и конъюнктурных трендах.


Отличие знаний от информации и данных: пример

У компании Chrysler имеется собрание компьютерных файлов, которые носят название "Книга инженерных знаний" и представляют собой исчерпывающие данные и информацию о создании автомобилей этой компании, которыми может пользоваться каждый разработчик новых автомобилей. Когда управляющий получил данные о проведенных крэш-тестах, то он отказался их поместить в файлы без соответствующей обработки. Он предложил ответить на следующие вопросы:

o почему эти тесты проводились;

o каковы результаты по сравнению другими аналогичными тестами данной компании других лет и конкурентов;

o какие выводы дачи тесты для конструкции автомобиля и его основных узлов?

Аналогичные вопросы трансформируют информацию в знания; более того, ответы на эти вопросы добавляют информации ценность, или, говоря другими словами, добавляют стоимость. На практике встречаются противоположные примеры, когда путем добавления ненужной, пустой информации исходная информация теряет в своей цене. Происходит потеря стоимости за счет размывания нужной информации в потоке информационного шума.

Знание - это комбинация опыта, ценностей, контекстной информации, экспертных оценок, которая дает общие рамки для оценки и инкорпорирования нового опыта и информации. Знание существует в сознании тех, кто знает. В организациях оно фиксируется не только в документах, но и в процессах, процедурах, нормах, в целом в практике деятельности.

Точно так же как информация возникает из данных, так и знания возникают из информации путем:

o сравнения, определения области применения (как и когда мы можем применить информацию об этом явлении к другому, аналогичному);

o установления связей (как эта информация соотносится с другой информацией);

o оценки (как можно оценить данную информацию и как ее оценивают другие);

o определения области применения (какое применение имеет эта информация к тем или иным решениям или действиям).

Процесс трансформации данных в информацию, а информации в знания показан на рис. 14.1.

Рис. 14.1. Данные, информация и знания

Различают индивидуальные и групповые знания. Традиционные представления исходят из того, что знания - это прерогатива отдельных людей, при этом группа - это лишь простая сумма членов этой группы, а групповое знание - сумма их знаний.

Существует другая, современная точка зрения, в соответствии с которой группа людей формирует новую сущность со своей уникальной спецификой. В рамках этого представления можно говорить о групповом поведении и о групповом знании соответственно. Это новое представление широко используется в рамках науки об управлении знаниями. Таким образом, знание может быть не только у отдельного человека, но и у группы людей. Тогда говорят о том, что что-то знает организация в целом, что-то знает группа, бригада и т.д.

Билл Гейтс в своей книге "Бизнес со скоростью мысли" пишет о необходимости повышения корпоративного IQ. При этом он имеет в виду не только количество умных сотрудников, но и накопление знаний в компании в целом и свободное распространение информации, которое позволяет сотрудникам пользоваться идеями друг друга.

Знание может быть явным и неявным. Явное знание может быть выражено в виде слов и цифр и может передаваться в формализованном виде на носителях. Это относится к тем видам знаний, которые передаются в форме предписаний, инструкций, книг, на различных носителях, в виде памятных записок и пр.

Неявное знание в принципе не формализуется и может существовать лишь вместе с его обладателем - человеком или группой лиц.

Существует два вида неявного знания. Первое - это технические навыки, которые проявляются у мастеров своего дела и выступают, как правило, результатом многолетней практики. Второе - это верования, идеалы, ценности и ментальные модели, которые мы используем, не задумываясь о них.

Неявные знания формируются и развиваются в процессе создания и укрепления позитивной корпоративной культуры и с помощью средств группового взаимодействия (ретриты, творческие группы и пр.).

Отношение к явному и неявному знанию со стороны коммерческих фирм весьма противоречиво. С одной стороны, многие фирмы стремятся перевести неявное знание в явное. Это делается для того, чтобы, с одной стороны, не зависеть от отдельных личностей, а с другой - продублировать значимые достижения. В то же время эти фирмы не заинтересованы в том, чтобы основные конкурентные преимущества перешли в форму, готовую для дублирования. Именно поэтому многие компании стараются сохранять некоторые из своих конкурентных преимуществ в тех формах, которые не поддаются дублированию (специфические тренинги, корпоративная культура, специальные системы обслуживания и пр.).

Носителем как явного, так и неявного знания может быть не только конкретная личность, но и организация . Следовательно, можно говорить и о неявном групповом знании, которое лежит в основе устойчивых моделей коллективных реакций и внутренних взаимодействий.

В западной литературе для обозначения неявного группового знания иногда используется термин "рутины" (routines), которые есть повторяющиеся по шаблону действия, регулярные поведенческие шаблоны организации или фирмы. Рутины - это то, что происходит автоматически, без инструкций и в отсутствие процедуры выбора; при этом рутины не могут быть кодифицированы.

В русском языке под рутиной понимаются заведенный порядок, установившаяся практика, определенный режим, шаблон, сложившиеся правила, касающиеся занятий людей. В то же время понятие "рутина" имеет еще один опенок: это косный порядок, т.е. такой порядок, который тяготеет к старому, привычному, в силу своей отсталости невосприимчивый к новому, прогрессивному. В тех случаях, когда термин "рутина" применяется для обозначения группового неявного знания, то оттенки, относящиеся к косности, отсутствуют.

Таким образом, персональное неявное знание - это, прежде всего, умения. В то же время групповое неявное знание - это, прежде всего, рутины. Рутины существуют не изолированно, а образуя взаимозависимость. Некоторые рутины могут быть неявными для одних членов группы (организации) и явными для других. Таким образом, границы между явными и неявными знаниями относительны, также можно говорить о степени неявности этих знаний. Соотношение явных и неявных, индивидуальных и групповых знаний представлено в табл. 14.1.

Таблица 14.1

Соотношение знаний

Наличие неявных знаний в организации заставляет подходить к управлению знаниями нетрадиционным способом. Традиционно под управлением знаниями понимают создание, развитие и использование различных баз данных и знаний. Наличие неявных знаний смещает внимание к средствам прямого общения между людьми. Важно не только и не столько создать корпоративную энциклопедию, в которой записано все, что кто-либо из работников знал и с чем сталкивался. В случае с неявными знаниями важнее иметь под рукой координаты людей, которые знают рецепт и имеют соответствующий опыт, создать культуру общения, используя "мозговые штурмы", совещания, "разборы полетов" и соответствующие средства общения, такие как электронная почта, персональные сайты, телеконференции и пр.

Данные - это совокупность сведений, которые зафиксированы на каком-либо носителе - бумаге, диске, пленке. Эти сведения должны быть в форме, пригодной для хранения, передачи и обработки. Дальнейшее преобразование данных позволяет получить информацию. Таким образом, информацией можно назвать результат анализа и преобразования данных. В базе хранятся различные данные, а система управления может выдавать по определенному запросу требуемую информацию. К примеру, можно узнать из школьной базы данных, кто из учеников живет на определенной улице или кто в течение года не получил плохой отметки и др. Данные превращаются в информацию тогда, когда ими заинтересуются. Можно утверждать, что информация - это используемые данные.

Слово «информация» произошло от латинского informatio, «сведения, изложение, разъяснение». Также информацией называют сведения об объектах, явлениях окружающей среды, их свойствах, которые уменьшают степень неопределенности, неполноты знаний. В результате обмена сведениями формируется более полное представление о предмете, повышается уровень осведомленности.

Информация не существует изолированно, сама по себе. Всегда есть источник, который ее производит и , ее воспринимающий. В роли источника или приемника выступает любой объект - человек, компьютер, животное, растение. Информация всегда предназначается конкретному объекту.

Человек получает информацию из самых разных источников - при чтении, прослушивании радио, просмотре телепередач, когда он дотрагивается до предмета, пробует на вкус еду. Одну и ту же информацию разные люди могут воспринимать по-разному.

В зависимости от сферы использования существует научная, техническая, экономическая и другие виды информации. Это сильнейшее средство воздействия на и на общество в целом. Согласно известному выражению, кто владеет наибольшей информацией по какому-либо вопросу, тот владеет миром, то есть, находится в выигрышном положении в сравнении с другими. В повседневной жизни от информации зависит развитие общества, здоровье и жизнь людей.

На протяжении тысячелетий человечество накопило огромные знаний, которые все продолжают увеличиваться. Объем информации в наши дни удваивается каждые два года. В любой ситуации, даже самой обыденной, эффективна лишь актуальная, полная, достоверная и понятная информация. Только актуальные, то есть, вовремя полученные сведения могут принести пользу людям. Прогноз погоды или предупреждение об урагане важно узнать накануне, а не в этот же день.

Существует множество определений и взглядов на понятие "информация". Так, например, наиболее общее философское определение звучит следующим образом: "Информация есть отражение реального мира. Информация - отраженное разнообразие, то есть нарушение однообразия. Информация является одним из основных универсальных свойств материи". В узком, практическом толковании определение понятия "информация" представляется так: "Информация есть все сведения, являющееся объектом хранения, передачи и преобразования".

Автор теории информации К. Шеннон (1916) определил понятие информации как коммуникацию, связь, в процессе которой устраняется неопределенность. Шеннон предложил в к. 40-х годов единицу измерения информации - бит. Каждому сигналу в теории приписывалась априорная вероятность его появления. Чем меньше вероятность появления того или иного сигнала, тем больше информации он несет для потребителя (т.е. чем неожиданнее новость, тем больше ее информативность).

Информация равна нулю, когда возможно только одно событие. С ростом числа событий она увеличивается и достигает максимального значения, когда события равновероятны. При таком понимании информация - это результат выбора из набора возможных альтернатив. Однако математическая теория информации не охватывает все богатство содержания информации, поскольку она не учитывает содержательную сторону сообщения.

Дальнейшее развитие математического подхода к понятию "информация" отмечается в работах логиков (Р. Карнап, И. Бар-Хиллел) и математиков (А.Н. Колмогоров). В этих теориях понятие информации не связано ни с формой, ни с содержанием сообщений, передаваемых по каналу связи. Понятие "информация" в данном случае определяется как абстрактная величина, не существующая в физической реальности, подобно тому, как не существует мнимое число или не имеющая линейных размеров точка.

С кибернетической точки зрения информация (информационные процессы) есть во всех самоуправляемых системах (технических, биологических, социальных). При этом одна часть кибернетиков определяет информацию как содержание сигнала, сообщения, полученного кибернетической системой из внешнего мира. Здесь сигнал отождествляется с информацией, они рассматриваются как синонимы. Другая часть кибернетиков трактуют информацию как меру сложности структур, меру организации. Вот как определяет понятие "информация" американский ученый Б.Винер, сформулировавший основные направления кибернетики, автор трудов по математическому анализу, теории вероятностей, электрическим сетям и вычислительной техники: информация - это обозначение содержания, полученного из внешнего мира.

В физике информация выступает в качестве меры разнообразия. Чем выше упорядоченность (организованность) системы объекта, тем больше в ней содержится "связанной" информации. Отсюда делается вывод, что информация - фундаментальная естественнонаучная категория, находящаяся рядом с такими категориями как "вещество" и "энергия", что она является неотъемлемым свойством материи и потому существовала и будет существовать вечно. Так, например, французский физик Л. Бриллюэн (1889-1969), основоположник зонной теории твердых тел, автор трудов по квантовой механике, магнетизму, радиофизики, философии естествознания, теории информации определяет информацию как отрицание энтропии (энтропия - мера неопределенности, учитывающая вероятность появления и информативность тех или иных сообщений).

С 50-60-х годов терминология теории информации стала применяться и в физиологии (Д. Адам). Была обнаружена близкая аналогия между управлением и связью в живом организме и в информационно-технических устройствах. В результате введения понятия "сенсорная информация" (т.е. оптические, акустические, вкусовые, тепловые и прочие сигналы, поступающие к организму извне или вырабатываемые внутри его, которые преобразуются в импульсы электрической или химической природы, передающиеся по нейронным цепям в центральную нервную систему и от нее - к соответствующим эффекторам) появились новые возможности для описания и объяснения физиологических процессов раздражимости, чувствительности, восприятия окружающей среды органами чувств и функционирования нервной системы.

В рамках генетики было сформулировано понятие генетической информации - как программа (код) биосинтеза белков, материально представленных полимерными цепочками ДНК. Генетическая информация заключена преимущественно в хромосомах, где она зашифрована в определенной последовательности нуклеидов в молекулах ДНК. Реализуется эта информация в ходе развития особи (онтогенеза).

Таким образом, систематизируя вышеизложенное, можно сделать вывод, что для инженеров, биологов, генетиков, психологов понятие "информации" отождествляется с теми сигналами, импульсами, кодами, которые наблюдаются в технических и биологических системах. Радиотехники, телемеханики, программисты понимают под информацией рабочее тело, которое можно обрабатывать, транспортировать, так же как электричество в электротехнике или жидкость в гидравлике. Это рабочее тело состоит из упорядоченных дискретных или непрерывных сигналов, с которыми и имеет дело информационная техника.

С правовой точки зрения информация определяется как "некоторая совокупность различных сообщений о событиях, происходящих в правовой системе общества, ее подсистемах и элементах и во внешней по отношению к данным правовым информационным образования среде, об изменениях характеристик информационных образований и внешней среды, или как меру организации социально-экономических, политических, правовых, пространственных и временных факторов объекта. Она устраняет в правовых информационных образованиях, явлениях и процессах неопределенность и обычно связана с новыми, ранее неизвестными нам явлениями и фактами".

Информация с экономической точки зрения - это стратегический ресурс, один из основных ресурсов роста производительности предприятия. Информация - основа маневра предпринимателя с веществом и энергией, поскольку именно информация позволяет устанавливать стратегические цели и задачи предприятия и использовать открывающиеся возможности; принимать обоснованные и своевременные управленческие решения; координировать действия различных подразделений, направляя их усилия на достижение общих поставленных целей. Например, маркетологи Р.Д. Базел, Д.Ф. Кокс, Р.В. Браун определяют понятие "информация" следующим образом: "информация состоит из всех объективных фактов и всех предположений, которые влияют на восприятие человеком, принимающим решение, сущности и степени неопределенностей, связанных с данной проблемой или возможностью (в процессе управления). Все, что потенциально позволит снизить степень неопределенности, будь то факты, оценки, прогнозы, обобщенные связи или слухи, должно считаться информацией".

В менеджменте под информацией понимаются сведения об объекте управления, явлениях внешней среды, их параметрах, свойствах и состоянии на конкретный момент времени. Информация является предметом управленческого труда, средством обоснования управленческих решений, без которых процесс воздействия управляющей подсистемы на управляемую и их взаимодействие невозможен. В этом смысле информация выступает основополагающей базой процесса управления.

Значение информации для бизнеса определили Д.И. Блюменау и А.В. Соколов: "информация - это продукт научного познания, средство изучения реальной действительности в рамках, допустимых методологией одного из информационных подходов к исследованию объектов различной природы (биологических, технических, социальных). Подход предполагает описание и рассмотрение этих объектов в виде системы, включающей в себя источник, канал и приемник управляющих воздействий, допускающих их содержательную интерпретацию". Если попытаться объединить предложенные подходы, то получится следующее:

Данные несут в себе информацию о событиях, произошедших в материальном мире, поскольку они являются регистрацией сигналов, возникших в результате этих событий. Однако данные не тождественны информации. Станут ли данные информацией, зависит от того, известен ли метод преобразования данных в известные понятия. То есть, чтобы извлечь из данных информацию необходимо подобрать соответствующий форме данных адекватный метод получения информации. Данные, составляющие информацию, имеют свойства, однозначно определяющие адекватный метод получения этой информации. Причем необходимо учитывать тот факт, что информация не является статичным объектом - она динамически меняется и существует только в момент взаимодействия данных и методов. Все прочее время она пребывает в состоянии данных. Информация существует только в момент протекания информационного процесса. Все остальное время она содержится в виде данных.

Одни и те же данные могут в момент потребления представлять разную информацию в зависимости от степени адекватности взаимодействующих с ними методов.

По своей природе данные являются объективными, так как это результат регистрации объективно существующих сигналах, вызванных изменениями в материальных телах или полях. Методы являются субъективными. В основе искусственных методов лежат алгоритмы (упорядоченные последовательности команд), составленные и подготовленные людьми (субъектами). В основе естественных методов лежат биологические свойства субъектов информационного процесса. Таким образом, информация возникает и существует в момент диалектического взаимодействия объективных данных и субъективных методов.

Переходя к рассмотрению подходов к определению понятия "знания" можно выделить следующие трактовки. Знания - это:

  • * вид информации, отражающей знания, опыт и восприятие человека - специалиста (эксперта) в определенной предметной области;
  • * множество всех текущих ситуаций в объектах данного типа и способы перехода от одного описания объекта к другому;
  • * осознание и толкование определенной информации, с учетом путей наилучшего ее использования для достижения конкретных целей, характеристиками знаний являются: внутренняя интерпретируемость, структурируемость, связанность и активность.

Основываясь на приведенных выше трактовках рассматриваемых понятий, можно констатировать тот факт, что знание - это информация, но не всякая информация - знание. Информация выступает как знания, отчужденные от его носителей и обобществленные для всеобщего пользования. Другими словами, информация - это превращенная форма знаний, обеспечивающая их распространение и социальное функционирование. Получая информацию, пользователь превращает ее путем интеллектуального усвоения в свои личностные знания. Здесь мы имеем дело с так называемыми информационно-когнитивными процессами, связанными с представлением личностных знаний в виде информации и воссозданием этих знаний на основе информации.

В превращении информации в знание участвует целый ряд закономерностей, регулирующих деятельность мозга, и различных психических процессов, а также разнообразных правил, включающих знание системы общественных связей, - культурный контекст определенной эпохи. Благодаря этому знание становится достоянием общества, а не только отдельных индивидов. Между информацией и знаниями имеется разрыв. Человек должен творчески перерабатывать информацию, чтобы получить новые знания.

Таким образом, учитывая вышеизложенное, можно сделать вывод , что фиксируемые воспринимаемые факты окружающего мира представляют собой данные . При использовании данных в процессе решения конкретных задач - появляется информация . Результаты решения задач, истинная, проверенная информация (сведения ), обобщенная в виде законов, теорий, совокупностей взглядов и представлений представляет собой знания .

Данные - это тоже знания, однако знания совершенно особого рода. В первом приближении данные -это результат языковой фиксации единичного наблюдения, эксперимента, факта или ситуации . Примерами данных могут быть:

а) «такого-то числа, такого-то года, в момент t в определенной местности шел дождь» (метеорологическое данное)";

б) «цена деловой древесины в такой-то день такого-то года, по сведениям такой-то биржи, составляла столько-то долларов за тонну» (торговое данное);

в) «дефицит государственного бюджета в такой-то стране составлял в таком-то году столько-то миллиардов долларов» (финансовое данное);

г) «в такой-то момент времени автоматическая лаборатория, направляющаяся к Юпитеру, отклонилась от расчетной траектории на столько-то градусов, столько-то тысяч километров в таком-то направлении» (данные из сферы космической технологии).

С технологической точки зрения некоторые специалисты понятие «данные», как правило, определяют как информацию, которая хранится в базах данных и обрабатывается прикладными программами, или информация, представленная в виде последовательности символов и предназначенная для обработки в ЭВМ , т.е. данные включают только ту часть знаний, которые формализованы в такой степени, что над ними могут осуществляться процедуры формализованной обработки с помощью различных технических средств.

Данные - это информация, представленная в формализованном виде, пригодном для автоматической обработки при возможном участии человека . Данные - это информация, записанная (закодированная) на языке машины . Данные - это отдельные факты, характеризующие объекты, процессы и явления в предметной области, а также их свойства .

Между информацией и данными существует различие; Данные могут рассматриваться как признаки или записанные наблюдения, которые по каким-то причинам не используются, а только хранятся. Следовательно, в данный момент времени они не оказывают воздействия на поведение, на принятие решений. Однако данные превращаются в информацию, если такое воздействие существует.

Например, основной массив данных для ЭВМ состоит из таких признаков, которые не воздействуют на поведение. Пока эти данные не организованы соответствующим образом и не отражаются в виде выходного результата, чтобы руководитель действовал в соответствии с ними, они не являются информацией. Они остаются данными до тех пор, пока сотрудник не обратился к ним в связи с осуществлением тех или иных действий или в связи с некоторым решением, которое он обязан принять.

Данные превращаются в информацию, когда осознается их значение. Можно также сказать, что в том случае, когда появляется возможность использовать данные для уменьшения неопределенности о чем-либо, данные превращаются в информацию.

Циклы жизни данных

Подобно веществу и энергии, данные можно собирать, обрабатывать, хранить, изменять их формы. Однако у них есть некоторые особенности. Прежде всего, данные могут создаваться и исчезать. Так, например, данные о некотором вымершем животном могут исчезнуть, когда сжигается кусок угля с его отпечатками. Данные могут стираться, терять точность и т.д. Данные могут быть охарактеризованы циклом жизни (рис. 1.9), в котором основное значение имеют три аспекта - зарождение, обработка, хранение и поиск .

Воспроизведение и использование данных может осуществляться в различные моменты их цикла жизни и поэтому на схеме не показаны.

Рис. 1.9. Цикл «жизни» данных

При обработке на ЭВМ данные трансформируются, условно проходя следующие этапы:

1) данные как результат измерений и наблюдений:

2) данные на материальных носителях информации (таблицы, протоколы, справочники);

3) модели (структуры) данных в виде диаграмм, графиков, функций;

4) данные в компьютере на языке описания данных;

5) базы данных на машинных носителях.

Модели данных

Модель данных является ядром любой базы данных. Появление этого термина в начале 70-х годов двадцатого столетия связывается с работами американского кибернетика Э.Ф. Кодда, в которых отражался математический аспект модели данных, употребляемой в смысле структуры данных. В связи с потребностями развития технологии обработки данных в теории автоматизированных банков информации (АБИ) во второй половине 70-х годов появился инструментальный аспект модели данных, в содержание этого термина были включены ограничения, налагаемые на структуры данных и операции с ними.

В современной трактовке модель данных определяется как совокупность правил порождения структур данных в базах данных, операций над ними, а также ограничений целостности, определяющей допустимые связи и значения данных, последовательности их изменения .

Таким образом, модель данных представляет собой множество структур данных, ограничений целостности и операций манипулирования данными. Исходя из этого, можно сформулировать следующее рабочее определение: модель данных – это совокупность структур данных и операций их обработки.

В настоящее время различают" три основных типа моделей данных: иерархическая, сетевая и реляционная. Иерархическая модель данных организует данные в виде древовидной структуры и является реализацией логических связей: родовидовых отношений или отношений «целое - часть». Например, структура высшего учебного заведения - это многоуровневая иерархия (см. рис. 1.10).

Рис. 1.10. Пример иерархической структуры

Иерархическая (древовидная) БД состоит из упорядоченного набора деревьев; более точно, из упорядоченного набора нескольких экземпляров одного типа дерева. В этой модели исходные элементы порождают другие элементы, причем эти элементы в свою очередь порождают следующие элементы. Каждый порожденный элемент имеет только один порождающий элемент. Организационные структуры, списки материалов, оглавление в книгах, планы проектов, расписание встреч и многие другие совокупности данных могут быть представлены в иерархическом виде.

Основными недостатком данной модели является: а) сложность отображения связи между объектами типа «многие ко многим»; б) необходимость использования той иерархии, которая была заложена в основу БД при проектировании. Потребность в постоянной реорганизации данных (а часто невозможность этой реорганизации) привели к созданию более общей модели – сетевой.

Сетевой подход к организации данных является расширением иерархического подхода. Данная модель отличается от иерархической тем, что каждый порожденный элемент может иметь более одного порождающего элемента. Пример сетевой модели данных приведен на рис 1.11.

Поскольку сетевая БД может представлять непосредственно все виды связей, присущих данным соответствующей организации, по этим данным можно перемещаться, исследовать и запрашивать их всевозможными способами, т.е. сетевая модель не связана всего лишь одной иерархией. Однако для того, чтобы составить запрос к сетевой БД, необходимо достаточно глубоко вникнуть в её структуру (иметь под рукой схему этой БД) и выработать свой механизм навигации по базе данных, что является существенным недостатком этой модели БД.

Рис. 1.11. Пример сетевой структуры

Одним из недостатков рассмотренных выше моделей данных является то, что в некоторых случаях при иерархическом и сетевом представлении рост базы данных может привести к нарушению логического представления данных. Такие ситуации возникают при появлении новых пользователей, новых приложений и видов запросов, при учете других логических связей между элементами данных. Эти недостатки позволяет избежать реляционная модель данных.

Реляционной считается такая база данных, в которой все данные представлены для пользователя в виде прямоугольных таблиц значений данных, и все операции над базой данных сводятся к манипуляциям с таблицами.

Таблица состоит из столбцов (полей) и строк (записей); имеет имя, уникальное внутри базы данных. Таблица отражает тип объекта реального мира (сущность), а каждая ее строка - конкретный объект. Так, таблица Спортивная секция содержит сведения обо всех детях, занимающихся в данной -спортивной секции, а ее строки представляют собой набор значений атрибутов каждого конкретного ребёнка. Каждый столбец таблицы - это совокупность значений конкретного атрибута объекта. Столбец Вес, например, представляет собой совокупность всех весовых категорий детей, занимающихся в секции. В столбце Пол могут содержаться только два различных значения: «муж.» и «жен.». Эти значения выбираются из множества всех возможных значений атрибута объекта, которое называется доменом. Так, значения в столбце Вес выбираются из множества всех возможных весов детей.

Каждый столбец имеет имя, которое обычно записывается в верхней части таблицы. Эти столбцы называются полями таблицы. При проектировании таблиц в рамках конкретной СУБД имеется возможность выбрать для каждого поля его тип, т.е. определить для него набор правил по его отображению, а также определить те операции, которые можно, выполнять над данными, хранящимися в этом поле. Наборы типов могут различаться у разных СУБД.

Имя поля должно быть уникальным в таблице, однако различные таблицы могут иметь поля с одинаковыми именами. Любая таблица должна иметь, по крайней мере, одно поле; поля расположены в таблице в соответствии с порядком следования их имен при ее создании. В отличие от полей, строки не имеют имен; порядок их следования в таблице не определен, а количество логически не ограничено. Строки называются записями таблицы.

Так как строки в таблице не упорядочены, невозможно выбрать строку по ее позиции - среди них не существует "первой", "второй", "последней". Любая таблица имеет один или несколько столбцов, значения в которых однозначно идентифицируют каждую ее строку. Такой столбец (или комбинация столбцов) называется первичным ключом. В таблице Спортивная секция первичный ключ - это столбец Ф.И.О. (рис. 1.12).

Такой выбор первичного ключа имеет существенный недостаток: невозможно записать в секцию двух детей с одним и тем же значением поля Ф.И.О., что на практике встречается не так уж редко. Именно поэтому, часто вводят искусственное поле для нумерации записей в таблице. Таким полем, например, может быть номер в журнале для каждого ребёнка, который сможет обеспечить уникальность каждой записи в таблице. Если таб.лица удовлетворяет этому требованию, она называется отношением (relation).

Рис. 1.12. Реляционная модель данных

Реляционные модели данных обычно могут поддерживать четыре типа связей между таблицами:

1) Один к Одному (пример: в одной таблице хранятся сведения о школьниках, в другой сведения о прохождении школьниками прививок).

2) Один ко Многим (пример: в одной таблице хранятся сведения об учителях, в другой сведения о школьниках, у которых эти учителя являются классными руководителями).

3) Много к Одному (в качестве примера можно предложить предыдущий случай, рассматривая его с другой стороны, а именно со стороны таблицы, в которой хранятся сведения о школьниках).

4) Много ко Многим (пример: в одной таблице хранятся заказы на поставку товаров, а в другой - фирмы, исполняющие эти заказы, причем для выполнения одного заказа могут объединяться несколько фирм/

Реляционное представление данных имеет целый ряд преимуществ. Оно понятно пользователю, не являющемуся специалистом в области программирования, позволяет легко добавлять новые описания объектов и их характеристики, обладает большой гибкостью при обработке запросов.

Вопросы и задания

1. Дайте определение понятию «данные».

2. Что называется циклом жизни данных?

3. Какие модели данных вы знаете?

4. Укажите преимущества и недостатки каждой модели данных.


ИНФОРМАЦИОННЫЕ ПРОЦЕССЫ