Автор Анна Евкова
Преподаватель который помогает студентам и школьникам в учёбе.

СПОСОБЫ ПРЕДСТАВЛЕНИЯ ДАННЫХ В ИНФОРМАЦИОННЫХ СИСТЕМАХ (Данные и модели данных)

Содержание:

Введение

В современном мире человеку постоянно приходится сталкиваться с огромным объемом данных и знаний, исследовать их. Ежедневно их количество увеличивается, и становится труднее и труднее обрабатывать информацию. Современные методики исследований рассматривают любые объекты как систему, т.е. множество элементов, находящихся в отношениях и связях друг с другом, которое образует определенную целостность.

Цель данной работы проанализировать способы предоставления данных в информационных системах.

Для достижения поставленной цели в курсовой работе необходимо решить следующие задачи:

1. Выявить роль данных и модели данных;

2. Изучить структуру данных;

3. Рассмотреть типы данных.

При написании курсовой работы применялись современные методы исследования, теоретический и практический анализ литературы по тематике данной работы.

При написании данной работы использовались труды таких авторов, как: Гайдамакин Н.А., Избачков Ю.С., Титоренко Г.А., Тиори Т., Майоров С.А., Новиков Г.И., Кузнецов О.П. и др.

Справиться с таким количеством информации сложно, поэтому используют информационные системы. Однако, как правильно предоставить данные в информационных системах вопрос проблематичный, поэтому эта проблема актуальна.

В данной работе будут рассмотрены способы представления данных в информационных системах.

Объектом курсовой работы является данные в информационных системах.

Предметом исследования является изучение представления данных в системе обработки данных.

Структура работы: работа состоит из введения, двух глав, заключения, списка литературы, приложения.

Глава 1 Способы представления данных в информационных системах

1.1 Понятие информационной системы

Информационная система представляет собой взаимосвязанный набор инструментов, методов и персонала, используемых для хранения, обработки и доставки информации в целях достижения цели. Современное понимание информационной системы предполагает использование компьютера как основного технического средства обработки информации. Необходимо понимать разницу между компьютерами и информационными системами. Компьютеры, оснащенные специализированным программным обеспечением, являются технической базой и инструментом для информационных систем. Информационная система немыслима без взаимодействия персонала с компьютерами и телекоммуникациями.

В юридическом смысле информационная система определяется как "организационно упорядоченный комплекс документов (массив документов) и информационных технологий, в том числе с использованием вычислительной техники и средств связи, реализующих информационные процессы" [Закон Российской Федерации "Об информации, информатизации и защите информации" от 20.02.1995 г. № 24-ФЗ].

Процессы, обеспечивающие функционирование информационной системы любого назначения, могут быть представлены из следующих блоков:

ввод информации из внешних или внутренних источников;

обработка входной информации и представление ее в удобном виде;

вывод информации для представления потребителям или передачи в другую систему;

обратная связь - это информация, обрабатываемая сотрудниками данной организации для корректировки вводимой информации.

В общем случае информационные системы определяются следующими свойствами:

1) любая информационная система может быть проанализирована, построена и управляться на основе общих принципов построения системы;

2) информационная система динамична и развивается;

3) при построении информационной системы необходимо использовать системный подход;

4) выводом информационной системы является информация, на основании которой принимаются решения;

5) информационная система должна восприниматься как человеко-машинная система обработки информации.

Внедрению информационных систем может способствовать получение более рациональных вариантов решения управленческих задач за счет внедрения математических методов; освобождение сотрудников от рутинной работы за счет ее автоматизации; обеспечение достоверности информации; совершенствование структуры информационных потоков (в том числе системы документооборота); обеспечение потребителей уникальными услугами; снижение себестоимости производства продукции и услуг (в том числе информационных).

Тип информационной системы зависит от того, чьи интересы она обслуживает и на каком уровне управления. По характеру представления и логической организации хранимой информации Информационные системы подразделяются на фактографические, документальные и геоинформационные.

Классификация информационных систем по уровням управления:
• информационные системы оперативного (операционного) уровня – бухгалтерская, банковских депозитов, обработки заказов, регистрации билетов, выплаты зарплаты;

• информационная система специалистов – офисная автоматизация, обработка знаний (включая экспертные системы);
• информационные системы тактического уровня (среднее звено) – мониторинг, администрирование, контроль, принятие решений;
• стратегические информационные системы – формулирование целей, стратегическое планирование.

1.2 Данные и модели данных

Восприятие окружающего мира связано с множество часто взаимосвязанных явлений, в результате которых мы получаем информацию о реальном мире. С древних времен человечество пыталось как-то описать эти явления, независимо от того, было ли достигнуто их полное понимание или нет. Элементы такого описания реального мира будут называться данными.

Слово "данные" происходит от латинского "datum", буквально означающего изучение "факта". Однако данные не всегда соответствуют конкретным или правдивые факты. Иногда они неточны или описывают то, чего нет происходящее в реальности, например, идея или мечта. Поэтому данные будут включать описания любых явлений (в широком смысле этого слова), которые ценны для того, чтобы их зафиксировать. Информация относится к любой информации о событии, сущности, процессе, явлении и т.д., которая является предметом некоторых операций: восприятия, передачи, преобразования, хранения или использования. Другими словами, информация-это знание чего-то.

На современном этапе, считается, что информация присуща всем видам

а формы движения материи связаны и с присущими ей свойствами или атрибутами (отражением, разнообразием, структурой, распределением материи и энергии в пространстве и времени и др.).

Для того чтобы соотнести данные и информацию, Мы ставим следующую абстрактную ситуацию. Существует определенная система, информация о состоянии которой представляет интерес, и наблюдатель способен воспринимать состояние системы и в определенной форме фиксировать их в своей памяти (никаких других действий он не выполняет). В этом случае говорят, что в памяти наблюдателя находятся данные, описывающие состояние системы. В общем случае СОД выступает в роли такого "наблюдателя".

Таким образом, данные также могут быть определены как информация,

в определенной форме, пригодной для дальнейшей обработки, хранения и передачи. Данные соответствуют зарегистрированным фактам об объектах и ​​явлениях реального мира. Чтобы использовать данные в будущем, требуется их семантическое содержание - семантика данных. Следовательно, СОД должны предоставлять правила и средства для интерпретации данных. Фиксация данных осуществляется с использованием определенных средств связи (например, с использованием языка или изображений) на каком-либо носителе (например, бумаге, камне и т. Д.). Основным и наиболее мощным средством представления семантики данных является естественный язык. Чаще всего данные описываются на естественном языке и записываются на бумаге.

Обычно данные (факты) и их интерпретация (семантика) фиксируются вместе, поскольку естественный язык достаточно гибок, чтобы представлять оба Пример может быть утверждение "Рост Иванова - 173 см." Здесь «173» и его семантика «рост Иванова в сантиметрах».
Тем не менее, использование естественного языка в ОРВ вызывает известные
Сложности, поэтому в них широко используются формализованные языки, которые позволяют эффективно организовать обработку данных и, при определенных ограничениях, - представлять семантику данных, соответствующую практическим потребностям.

Данные и их интерпретация могут быть разделены. Например,
Все полеты представляют собой таблицу данных, и их интерпретация дается в начале (заголовок) таблицы. Разделение данных и их интерпретация могут затруднить работу с данными, что проявляется, в частности, при использовании расписания рейсов.

Широкое использование ОРВ привело к разделению данных и
с помощью. Компьютеры имеют дело прежде всего с данными как таковыми.
Большая часть интерпретирующей информации явно не записана вообще. Например, программа численного анализа, предназначенная для решения уравнений в частных производных, получает некоторые числа в качестве входных данных и производит другие числа. Он не содержит информации о том, какие реальные явления описывают эти дифференциальные уравнения. Ответственность за интерпретацию результатов в контексте их применения лежит на пользователе программы.

Существуют, по крайней мере, две причины, по которым применение

компьютеров привело к отделению данных от интерпретации. Во-первых, компьютеры не обладают достаточными возможностями для обработки текстов настественном языке, который остается основным средством кодирования и интерпретации семантики данных. Во-вторых, стоимость компьютерной памяти была первоначально весьма велика, и память использовалась в основном для хранения самих данных, а интерпретация традиционно возлагалась на пользователя.

По мере развития вычислительной техники возможность обеспечения

автоматической интерпретации возрастает. Программы, в которых заложена

интерпретация используемых данных, имеют существенно большую значимость, так как без интерпретации данные не несут для потребителя никакой полезной информации и представляют собой не более чем совокупности битов.

Однако в современных СОД, в условиях совместного использования

данных, при множестве различных приложений такой подход можно применять только до определенного предела. За этим пределом написание программ, в каждую из которых встроены близкие, хотя и не идентичные механизмы интерпретации, становится весьма неэффективным. В такой ситуации целесообразнее ассоциировать данные и механизмы интерпретации и обеспечить однократность представления интерпретирующей информации.

В результате изменяется роль данных. Их уже нельзя рассматривать как совокупность битов, они приобретают определенную семантическую окраску. В таком качестве их можно расценивать уже как семантически значимое представление реального мира, как некоторое абстрактное знание.

Интерпретация данных должна позволять наряду со стабильным базисом отображать множественность и эволюцию взглядов на данные. Такая гибкость достигается двумя способами. Во-первых, обеспечиваются разносторонние взгляды на одни и те же данные. Например, различные приложения могут накладывать на данные свои ограничения и конкретную интерпретацию. Так, человек может рассматриваться в приложениях, связанных с кадровыми вопросами – как служащий, в производственных приложениях – как исполнитель работ, при обработке данных выборных кампаний – как избиратель, в медицинских приложениях – как пациент и т.д. Вместе с тем, та часть интерпретации данных, которая осуществляется системой ведения данных, должна оставаться достаточно абстрактной для того, чтобы обеспечить множественность взглядов.

С другой стороны, должна существовать возможность единообразного представления различных данных. Например, администраторы, клерки, торговые агенты, секретари могут рассматриваться как служащие независимо от рода их деятельности. Это также требует значительной абстрактности интерпретации. Двум понятиям – «информация» и «данные» в СОД соответствуют два аспекта рассмотрения вопросов: инфологический и датологический.

Инфологический аспект употребляется при рассмотрении вопросов, связанных со смысловым содержанием данных (семантика данных) независимо от способов их представления.

Датологический аспект употребляется при рассмотрении вопросов представления данных в памяти СОД. Моделирование данных. Очевидно, что наряду с абстрактностью интерпретации должны обеспечиваться развитые возможности представления соотношения данных.

Интеллектуальное средство, позволяющее реализовать интерпретацию данных, находящихся между собой в определенных взаимоотношениях, называется моделью данных. Модель данных – это средство абстракции, которое дает возможность составить целостную картину отображения данных определенной предметной области, т.е. увидеть «лес» (информационное содержание данных), а не «отдельные деревья» (конкретные значения данных). Модели данных широко используются в различных дисциплинах, они помогают понять проблемы и абстрагироваться от деталей. Уровень абстрактности модели может меняться в зависимости от того, как она будет использоваться.

Существует множество моделей, отражающих различные аспекты реального мира: физические, позволяющие понять его физические свойства, математические, представляющие собой абстрактное описание мира с помощью математических знаков, экономические, отображающие тенденции экономики и позволяющие получить прогноз ее развития. Модели данных дают возможность представить частичную семантику данных, что в свою очередь обеспечивает пользователей частичными знаниями о реальном мире.

Привлекательной, на первый взгляд, может показаться мысль – найти

универсальную модель данных, которая бы полностью отражала реальный мир.

Однако возможность создания такой модели весьма проблематична. Система наших знаний о мире – это открытая система. Даже, располагая самыми обширными знаниями в некоторой области, мы фактически никогда не достигнем исчерпывающего ее познания. Важно, чтобы объем знаний и семантика данных, представленные в модели, были адекватны желаемому использованию данных. Приступая к задаче моделирования данных, необходимо, прежде всего, определить элементарные объекты моделирования. Примем в качестве рабочего определения элементарной единицы данных кортеж

<имя объекта, свойство объекта, значение свойства, время>.

Первый элемент кортежа – имя объекта – является, по существу, идентификатором объекта, явления (или идеи). Второй элемент – свойство объекта – дает определенную характеристику объекту, явлению и может принимать не которое конкретное значение (значение свойства) в определенное время (время). Среди названных четырех характеристик данных наибольшие проблемы вызывает характеристика времени. Для множества данных требуется решить сложную задачу синхронизации времени их представления и изменения. Кроме того, часто представляет интерес не абсолютное, а относительное время наблюдения явления (т. е. последовательность, в которой возникают явления). В этом случае необходимый результат достигается временным упорядочением данных, а не фиксацией абсолютного времени. В разных аспектах использования данных может меняться информационная ценность новых и старых данных. Например, в расчетах заработной платы предприятия используется текущий размер заработной платы служащего и не требуется знания всех предыдущих изменений его заработка. В то же время, для других приложений, связанных, например, с динамикой роста заработной платы на предприятии, сведения об изменениях заработка служащего станут необходимыми. Поэтому характеристика времени во многих моделях данных подменяется, либо некоторыми другими характеристиками, либо упорядочением объектов.

Опуская временную характеристику, приходим к следующему представлению элементарной единицы данных:

<имя объекта, свойства объекта, значение свойства>.

Она может быть реализована множеством способов, что и привело к

созданию множества моделей данных. Простым и естественным способом

представления элементарных данных и связей между ними является сетевая

структура, в которой вершины соответствуют элементам, а дуги – связям между ними. Другой мощный способ установления связей между данными состоит в распределении их по категориям. Данные одной категории предполагаются подобными. В соответствии с уровнем требований к категоризации данных, модели данных разделяются на два класса: сильно типизированные и слабо типизированные.

Сильно типизированные – это модели, в которых предполагается, что все данные должны быть отнесены к какой-либо категории. Если данные нельзя отнести ни к одной из них, то их следует с помощью искусственных приемов привести к той или иной категории.

Слаботипизированные модели не связаны никакими предположениями относительно категорий. Категории используются в той степени, в какой это целесообразно в каждом конкретном случае. Отдельные данные могут существовать как сами по себе, так и в связи с другими данными.

Сильно типизированные модели накладывают весьма жесткие ограничения на представление данных и на их применение, что затрудняет передачу тонких семантических различий. Например, категория СЛУЖАЩИЙ в сильно типизированной модели данных должна быть гомогенной, т. е. все объекты, принадлежащие этой категории, должны иметь однотипные свойства, структуру и т. д. Между тем, женатые и неженатые, временные и постоянные, находящиеся на сдельной и повременной оплате служащие могут характеризоваться по - разному.

Вместе с тем, сильно типизированные модели данных обладают и

большими достоинствами. Они позволяют построить строгие абстракции

свойств данных и исследовать их в терминах категорий. Иными словами, можно построить теорию, основывающуюся на категориях, которые фактически инкапсулируют (не требуют специального описания) свойства конкретных данных.

Отдельные свойства категорий наследуются принадлежащими к ним

данными. Кроме того, устраняется дублирование имен: имена подобных объектов и их свойств могут быть абстрагированы соответственно в имя категории и имя свойства категории. Например, путем присвоения самой категории имени

СЛУЖАЩИЙ, а свойству этой категории – имени ВОЗРАСТ, устраняется повторение имен в каждой тройке < СЛУЖАЩИЙ, ВОЗРАСТ, ЗНАЧЕНИЕ >. Еще одно преимущество сильно типизированных моделей состоит в возможности устранять очевидную противоречивость данных, поскольку семантически близкие данные будут рассматриваться в рамках одной категории.

Это не всегда имеет место в слабо типизированных моделях данных. Гибкость последних позволяет отводить факту различные места в общей структуре фактов. В слабо типизированных моделях обнаружить противоречивость далеких по представлению фактов очень трудно.

В отличие от сильно типизированных моделей слабо типизированные

модели данных обеспечивают интеграцию данных и категорий. Предельные

возможности в этом плане обеспечиваются исчислением предикатов, в котором акцент делается на обеспечении универсальности средств описания, вне связи с искусственными ограничениями на типизацию и категоризацию данных. Во многих моделях данных исчисление предикатов используется для представления знаний, не реализуемого базовыми средствами модели.

Вместе с тем, исчисление предикатов не обеспечивает хорошего наглядного представления данных, поскольку предполагает работу с линейными текстами (или с конструкциями формального языка типа ПРОЛОГ), и поэтому не может служить универсальным средством моделирования. Основные причины, по которым в сильно типизированных моделях поддерживаются столь серьезные ограничения, связаны с тем, что число представляемых объектов обычно весьма велико, а возможности интеллекта человека ограничены. Для облегчения понимания данных и работы с ними необходимо разбить множество объектов на подмножества. Элементы каждого подмножества должны подчиняться общим закономерностям. При небольшом числе объектов или высоком уровне интеллекта пользователей ограничения могут быть ослаблены, а значения представлены в естественной для них форме.

Определение модели данных. Большинство моделей данных, используемых в СОД, относится к сильно типизированным. Поэтому в данном курсе основное внимание будет уделено именно этим моделях. В модели данных конкретной предметной области совокупность именованных категорий (например, ЛИЧНОСТЬ, АВТОМОБИЛЬ), их свойств (ФИО, МАРКА АВТОМОБИЛЯ) и связей между ними (ВЛАДЕЕТ, ВОДИТ) называется схемой.

Рассмотрим простую модель данных – т.н. «плоский файл», в которой

категории называются типами сущностей, а свойства категорий – атрибутами Пусть эта модель применяется для представления данных о служащих. Тогда в схеме будет специфицирован тип сущности

СЛУЖАЩИЙ (ФИО, Возраст, Адрес), где СЛУЖАЩИЙ – имя типа сущности, ФИО, Возраст, Адрес – имена атрибутов. Конкретные данные будут иметь форму, например, 􀀟 Иванов И.И._29_ Таганрог, ул. Греческая, 82

Модель данных определяет правила, в соответствии с которыми структурируются данные. Однако структурные спецификации не обеспечивают возможности полной интерпретации семантики данных и способа их использования. Должны быть также специфицированы операции над данными. Так, например, список объектов в зависимости от допустимых операций может приобрести свойства стека или очереди. Обычно операции соотносятся со структурами данных.

Совокупность данных, структура которых соответствует конкретной

схеме, называется базой данных (БД). Этот термин применяется, как к определенной реализации указанной совокупности данных, так и к ряду связанных между собой реализаций. Дело в том, что операции, предусмотренные моделью данных, преобразуют одну БД в другую. Эти БД имеют одну и ту же структуру

и соответствуют одной и той же схеме. Последовательность БД, получаемую в результате преобразований, обычно и называют БД.

Разнообразие моделей данных соответствует разнообразию областей

применения и контингента пользователей. Тем не менее, существует ряд общих понятий и определений, относящихся ко всем моделям. Свойства, которые отображает модель реального мира, в основном делятся на два класса: статические и динамические. К статическим относятся свойства, инвариантные во времени. Они всегда справедливы и неизменны. Динамические свойства соответствуют эволюционной природе мира. Любая модель данных должна некоторым образом представлять эти два класса свойств.

Исходя из этого, модель данных М можно определить как множество правил порождения G и множество операций О.

Множество правил порождения выражает статические свойства модели

данных и соотносится с языком описания данных (ЯОД). Множество операций выражает динамические свойства модели данных и соотносится с языком манипулирования данными (ЯМД).

Средствами ЯОД определяются допустимые структуры данных объектов и связей, а также допустимые реализации данных. Определение структур

данных реализуется посредством спецификаций, которые должны удовлетворять правилам порождения. Например, спецификация типа сущности СЛУЖАЩИЙ производится в терминах атрибутов и типов значений каждого атрибута. Селекция допустимых реализаций объектов или связей задается путем указания для каждой категории ограничений целостности. Так, можно указать, что каждый номер по реестру социального страхования может быть присвоен не более чем одному служащему или что никакой служащий не может зарабатывать больше, чем его руководитель.

В некоторых моделях данных правила порождения G разделяют на две

части: правила порождения структур GS и правила порождения ограничений . Соответственно этому схема S будет также состоять из двух частей: спецификации структуры SS и спецификации явных ограничений . Примером явного ограничения целостности служит указание на то, что атрибут Номер служащего типа сущности СЛУЖАЩИЙ есть идентификатор (ключ). Это означает, что в каждый момент времени множество реализаций типа сущности СЛУЖАЩИЙ не может содержать две или более реализаций с одинаковым значением атрибута Номер служащего.

Наряду с явными ограничениями в модели данных могут поддерживаться также внутренние ограничения, отражаемые в структурной части SS. Эти ограничения налагаются на объекты и связи по определению. Например, связи между объектами могут быть ограничены только древовидной структурой (т. е. более общие – сетевые структуры недопустимы).

Правила G обеспечивают порождение множества схем S, каждая из которых определяет конкретную структуру данных и специфицирует ограничения целостности. Если под БД понимать реализацию совокупности данных, удовлетворяющую схеме, то можно сказать, что схеме соответствует множество D различных БД.

Множество операций О, которые соотносятся с ЯМД, определяют допустимые действия над реализацией Di БД для преобразования ее в другую реализацию Dj.

Не все операции приводят к изменению реализации БД. Поэтому для

отслеживания динамики БД вводят некоторые дополнительные объекты – индикаторы текущих и другие управляющие элементы. Эти объекты в строгом смысле не относятся к объектам БД, но они связаны с реализацией БД и могут изменяться в результате выполнения операций. Совместно с конкретной реализацией D БД они определяют состояние БД – DBS. Рассмотрим, например, последовательную выборку из плоского файла с использованием команды «дать следующую (запись)». Текущее состояние БД определяется реализацией D, а также значением индикатора текущей. Выполнение операции «дать следующую» не приведет к изменению реализации D БД, но состояние БД изменится, так как изменится значение индикатора текущей.

Управление БД осуществляется системой управления БД (СУБД), которая поддерживает средства определения схем БД и обеспечивает выполнение

операций над данными БД. Естественно, СУБД должна поддерживать модель

данных. Иногда СУБД вообще создаются под определенную модель данных. В других СУБД эволюционное изменение модели данных привело к независимым реализациям ее отдельных версий.

1.3 Структуры данных

Структура данных - программный блок, позволяющий хранить и обрабатывать множество однотипных и / или логически связанных данных при вычислениях. Для добавления, поиска, изменения и удаления данных структура данных предоставляет набор функций, составляющих ее интерфейс.

Термин "структура данных" может иметь несколько похожих, но разных значений:

* Абстрактный тип данных;

* Реализация абстрактного типа данных;

* Экземпляр типа данных, например определенный список;

• В контексте функционального программирования-уникальный блок (англ. уникальная идентичность), которая сохраняется во время изменений. Он неофициально называется единой структурой данных, несмотря на возможное существование различных версий.

Структуры данных формируются с использованием типов данных, ссылок и операций над ними на выбранном языке программирования.

Различные виды структур данных соответствующие для различных применений; некоторые сильно специализированы для записей и ссылок, где каждая запись (узел) будет хранить данные и ссылки на «левый» и «правый» узлы.

Работа с большими наборами данных автоматизируется проще, когда данные упорядочены, то есть образуют заданную структуру. Существует три основных типа структур данных: линейная, иерархическая и табличная. Их можно рассмотреть на примере обычной книги.

Если разобрать книгу на отдельные листы и перемешать их, книга потеряет свое назначение. Она по-прежнему будет представлять набор данных, но подобрать адекватный метод для получения из нее информации весьма непросто. (Еще хуже дело будет обстоять, если из книги вырезать каждую букву отдельно — в этом случае вряд ли вообще найдется адекватный метод для ее прочтения.)

Если же собрать все листы книги в правильной последовательности, мы получим простейшую структуру данных — линейную. Такую книгу уже можно читать, хотя для поиска нужных данных ее придется прочитать подряд, начиная с самого начала, что не всегда удобно.

Для быстрого поиска данных существует иерархическая структура. Так, например, книги разбивают на части, разделы, главы, параграфы и т. п. Элементы структуры более низкого уровня входят в элементы структуры более высокого уровня: разделы состоят из глав, главы из параграфов и т. д.

Линейные структуры представляют собой списки. Список — это простейшая структура данных, отличающаяся тем, что каждый элемент данных однозначно определяется своим номером в массиве. Проставляя номера на отдельных страницах рассыпанной книги, мы создаем структуру списка. Обычный журнал посещаемости занятий, например, имеет структуру списка, поскольку все студенты группы зарегистрированы в нем под своими уникальными номерами. Мы называем номера уникальными потому, что в одной группе не могут быть зарегистрированы два студента с одним и тем же номером.

При создании любой структуры данных надо решить два вопроса: как разделять элементы данных между собой и как разыскивать нужные элементы. В журнале посещаемости, например, это решается так: каждый новый элемент списка заносится с новой строки, то есть разделителем является конец строки. Тогда нужный элемент можно разыскать по номеру строки.

N п/п Фамилия, Имя, Отчество

1 Аистов Александр Алексеевич

2 Бобров Борис Борисович

3 Воробьева Валентина Владиславовна

…………………………………………………..

27 Сорокин Сергей Семенович

Разделителем может быть любой специальный символ. Мы хорошо знаем, что разделителями между словами являются пробелы. В русском и многих европейских языках общим разделителем предложений является точка.

В журнале классов, который мы обсуждали, можно использовать любой символ, который не отображается в самих данных в качестве разделителя, например символ"*". Тогда наш список будет выглядеть так:

Аисты Александр * Бобров, Борис Борисович * Воробьева Валентина *... * Сорокин Сергей Семенович

В этом случае, чтобы найти элемент с номером N, нужно просмотреть список с самого начала и пересчитать встреченные разделители. При подсчете N-1 сепараторов будет запущен необходимый элемент. Он закончится, когда будет найден следующий разделитель.

Таким образом, линейные структуры данных (списки) - это упорядоченные структуры, в которых адрес элемента однозначно определяется его номером.

Мы также достаточно знакомы с таблицами данных, чтобы вспомнить хорошо известную таблицу умножения. Структуры таблиц отличаются от структур списков тем, что элементы данных определяются адресом ячейки, состоящим из нескольких параметров, а не из одного параметра, как в списках. Например, для таблицы умножения адрес ячейки определяется номерами строк и столбцов. Нужная ячейка находится на их пересечении, и элемент выбирается из ячейки.

При хранении табличных данных, количество разделителей должно быть больше, чем для данных, имеющих структуру списка. Например, при печати таблиц в книгах строки и столбцы разделяются графическими элементами, такими как вертикальные и горизонтальные линии разметки:

Планета

Расстояние до Солнца, а.е.

Относительная масса

Количество спутников

Меркурий

0,39

0,056

0

Венера

0,67

0,88

0

Земля

1.0

1,0

1

Марс

1,51

0,1

2

Юпитер

5,2

318

16

Рис. 1.4. В двумерных таблицах, которые печатают в книгах, применяется два типа разделителей — вертикальные и горизонтальные

Если нужно сохранить таблицу в виде длинной символьной строки, используют один символ-разделитель между элементами, принадлежащими одной строке, и другой разделитель для отделения строк, например так:

Меркурий*0,39*0,056*0#Венера*0,67*0,88*0#Звмля*1,0*1,0*1#Марс*1,51*0,1 *2#...

Для розыска элемента, имеющего адрес ячейки (m,n), надо просмотреть набор данных с самого начала и пересчитать внешние разделители. Когда будет отсчитан m-1 разделитель, надо пересчитывать внутренние разделители. После того как будет найден n-1 разделитель, начнется нужный элемент. Он закончится, когда будет встречен любой очередной разделитель.

Таким образом, табличные структуры данных (матрицы) — это упорядоченные структуры, в которых адрес элемента определяется номером строки и номером столбца, на пересечении которых находится ячейка, содержащая искомый элемент.

Нерегулярные данные, которые трудно представить в виде списка или таблицы, часто представляют в виде иерархических структур. С подобными структурами мы очень хорошо знакомы по обыденной жизни. Иерархическую структуру имеет система почтовых адресов. Подобные структуры также широко применяют в научных систематизациях и всевозможных классификациях

Списочные и табличные структуры являются простыми. Ими легко пользоваться, поскольку адрес каждого элемента задается числом (для списка) или двумя числами (для двумерной таблицы). Они также легко упорядочиваются. Основным методом упорядочения является сортировка. Данные можно сортировать по любому избранному критерию, например: по алфавиту, по возрастанию порядкового номера или по возрастанию какого-либо параметра.

Несмотря на многочисленные удобства, у простых структур данных есть и недо­статок — их трудно обновлять. Если, например, перевести студента из одной группы в другую, изменения надо вносить сразу в два журнала посещаемости; при этом в обоих журналах будет нарушена списочная структура. Если переведенного студента вписать в конец списка группы, нарушится упорядочение по алфавиту, а если его вписать в соответствии с алфавитом, то изменятся порядковые номера всех студен­тов, которые следуют за ним.

Таким образом, при добавлении произвольного элемента в упорядоченную структуру списка может происходить изменение адресных данных у других элементов. В журналах успеваемости это пережить нетрудно, но в системах, выполняющих автоматическую обработку данных, нужны специальные методы для решения этой проблемы.

Иерархические структуры данных по форме сложнее, чем линейные и табличные, но они не создают проблем с обновлением данных. Их легко развивать путем созда­ния новых уровней. Даже если в учебном заведении будет создан новый факультет, это никак не отразится на пути доступа к сведениям об учащихся прочих факультетов.

Недостатком иерархических структур является относительная трудоемкость записи адреса элемента данных и сложность упорядочения. Часто методы упорядочения в таких структурах основывают на предварительной индексации, которая заключается в том, что каждому элементу данных присваивается свой уникальный индекс, кото­рый можно использовать при поиске, сортировке и т. п.

Требование уникальности имени файла очевидно — без этого невозможно гаран­тировать однозначность доступа к данным. В средствах вычислительной техники требование уникальности имени обеспечивается автоматически — создать файл с именем, тождественным уже имеющемуся, не может ни пользователь, ни авто­матика.

Хранение файлов организуется в иерархической структуре, которая в данном случае называется файловой структурой. В качестве вершины структуры служит имя носителя, на котором сохраняются файлы. Далее файлы группируются в каталоги (папки), внутри которых могут быть созданы вложенные каталоги (папки). Путь доступа к файлу начинается с имени устройства и включает все имена каталогов (папок), через которые проходит. В качестве разделителя используется символ «\» (обратная косая черта).

Глава 2 Представление данных в системах обработки данных

Уровни представления данных. СОД хранения и обработки информации - информация об объектах реального мира. Некоторый набор информации, ОПИ- конкретный объект называется логической записью или просто записью . Коллекция записей, охватывающих множество объектов определенного типа класс, называемый информационным массивом.

В реальном мире существуют определенные отношения между объектами - отношения и отношения разной степени сложности. Во время процесса - работы в ОРВ эти связи идентифицируются и отображаются путем структурирования - документации и информационных массивов. Организация информационного обмена, которая обеспечивает определенные связи и отношения между данными, он формируется структурой данных. Любые манипуляции с данными в процессе их обработки компьютерная обработка не должна разрушать структуру данных, поэтому в этом нет необходимости- надо все время поддерживать. Существует 3 уровня представления данных:

На логическом уровне работают с логическими структурами данных,

отражающими реальные отношения между объектами и их характеристиками. При разработке логических структур данных учитывается также информационная потребность пользователей системы и характер задач, для решения которых предназначена СОД. Единицей информации на этом уровне является логическая запись. Каждый объект, описываемый соответствующей логической записью, характеризуется определенными признаками, являющимися атрибутами записи. На логическом уровне устанавливается перечень признаков, полностью характеризующий описываемый класс объектов. Совокупность признаков и их взаимосвязь определяют внутреннюю структуру логической записи.

Логическая структура данных должна исчерпывающе характеризовать

объекты, сведения о которых обрабатываются СОД, адекватно отражать реальные отношения между объектами и их характеристиками, обеспечивать удовлетворение информационных потребностей пользователей системы и решение задач приложений.

На логическом уровне представления данных не учитывается техническое и математическое обеспечение системы (тип ЭВМ, типы памяти, язык программирования, операционная система).

На уровне хранения оперируют со структурами хранения − представлениями логической структуры данных в памяти ЭВМ. Структура хранения должна полностью отображать логическую структуру данных и поддерживать это в работе СОД. Единица информации на этом уровне
также является логической записью.

При проектировании или выборе структуры хранения следует учитывать особенности организации компьютерной памяти. Это устанавливает тип и формат способ сохранения логической структуры определяется данными. Существуют различные способы представления данных в оперативной и на внешних носителях, и такая же логическая структура дается это может быть реализовано в памяти компьютера различными структурами хранения.

Каждая структура хранения обеспечивает определенный способ доступа к данным. Есть определенные возможности манипулирования данными. Структура храма он характеризуется количеством памяти, необходимой для размещения данных. Выбор структуры хранения напрямую влияет на эффективность обработка данных. Правильная структура хранения обеспечивает мининизкое потребление машинной памяти, быстрый поиск необходимых данных и возможность добавлять новые и удалять устаревшие записи, не разрушая журналы структура, а также возможность настройки записей. Поддержание структуры хранилища осуществляется программным обеспечением. Для реализации структур хранения требуются определенные языковые Возможности программирования CI, которые следует учитывать при разработке или выбор структуры хранения. На физическом уровне представления данных работают с физическим структуры данных. На этом уровне задача внедрения структуры решена хранением непосредственно в определенной памяти конкретного компьютера. Единица измерения информация на этом уровне является физической записью, которая представляет собой часть медиа, на которой размещены один или несколько логических записи. При разработке структур памяти анализируются параметры бетонов: технические средства: тип и объем памяти, метод адресации, методы и время доступа. На этом же уровне решаются задачи по организации обмена данные между оперативной и внешней памятью компьютера.

Развитие структур данных на всех уровнях должно обеспечить
принцип независимости данных. Если у меня есть данные, то я не имею данных, указывает, что изменения в физическом местоположении данных и в техническом на эти системы не должны влиять логические структуры и
программы, т. е. не должны вызывать их изменения. Данные не означают, что изменения в структурах хранения не должны вызывать изменения в логических структурах данных и в структурах данных приложения программы. Кроме того, внесены изменения в логические структуры данных из-за появления новых пользователей и новых запросов, не следует на приложениях других пользователей системы.

Соблюдение принципа независимости данных позволяет использовать специальные типы данных: виртуальные и прозрачные. Виртуальные данные существуют только на логическом уровне. Для программист подобен реальным данным, которыми он оперирует- ожидается в программах. Каждый раз, когда вы получаете доступ к этим данным, операционная система система генерирует их определенным образом на основе других данных, физически существующий в системе. Анонс некоторых данных, виртуальный- это экономит память машины.

Прозрачные данные представляются как несуществующие на логическом уровне. Это позволяет скрыть от программиста или от пользователя многие сложные механизмы, используемые при преобразовании логических структур данные в физические, и упрощают прикладные программы.

Структура данных. ОРВ имеют многоуровневую структуру данных, которая формируется из отдельных элементов, связанных определенными отношениями. Элементы каждого уровня имеют определенное название. Формирование - элементы более высокого уровня сделаны из элементов более низкого уровня по определенным правилам. Многоуровневая структура- самый низкий уровень-элементарные данные:

числа, символы, логические данные, знаки. Элементарные данные считываются программист целиком, доступ к их частям невозможен. Эти данные не являются непосредственным объектом информационного поиска, но в некоторых случаях они должны быть доступны. Например, в процессе поиска можно возможно, потребуется сравнить отдельные символы в строках. Элементарные данные каждого типа имеют определенную форму.-

при выводе в оперативную память компьютера, память выделяется строго ОП- ограниченная память. Знание элементарных форматов хранения данных

позволяет рассчитать объем памяти, необходимый для размещения массивов

данные и программы.

Элементом второго уровня является поле записи. Это последовательность элементарных данных, имеющая определенный смысл, но не имеющая смысловой завершенности. Данные, образующие отдельное поле записи, описывают соответствующий признак объекта.

Каждый признак объекта имеет наименование и значение. Так, для студентов, записи о которых хранятся в СОД, в качестве признаков могут использоваться: номер студенческого билета, ФИО, средний балл успеваемости. Каждый конкретный студент характеризуется определенными значениями этих признаков, например, наименование признака средний балл, значение признака 4,7. Отдельные студенты отличаются значениями одноименных признаков.

Число признаков, характеризующих объект, определяет количество полей в записи. В каждом поле помещается значение соответствующего признака. Поля записи именуются, причем имя поля может совпадать с наименованием признака.

Признак, используемый для идентификации записи в процессе обработки или поиска, называется ключевым или ключом записи. Поле записи, содержащее ключ, называется ключевым полем. Если каждое из возможных значений ключа идентифицирует единственную запись, то такой ключ называется уникальным. Так, номер студенческого билета является уникальным ключом каждой записи массива сведений о студентах данного вуза.

В записи могут предусматриваться дополнительные поля для хранения

служебной информации: меток, ссылок, указателей.

Поле записи может быть объектом информационного поиска в различных приложениях, а также в тех случаях, когда это поле ключевое. Однако поле записи само по себе не имеет смысловой завершенности. Например, поле средний балл может явиться объектом поиска, но информационную ценность значение этого поля будет иметь лишь в том случае, когда станут известными фамилия, имя и отчество студента.

Понятие поля записи не следует отождествлять с понятием поля машинной памяти. Эти понятия относятся к разным уровням представления данных. Для хранения поля записи могут использоваться единицы машинной памяти как фиксированной, так и переменной длины.

Поля записи объединяются в группу данных (агрегат данных, групповое данное). Группа данных − элемент третьего уровня внутренней структуры записи − представляет собой поименованную совокупность элементов данных, рассматриваемую как единое целое. Например, группа данных, имеющая наименование адрес, состоит из элементов данных город, улица, № дома, № квартиры. В качестве элемента группа может иметь другую группу данных.

Группа данных имеет определенный смысл и может быть объектом поиска, но не имеет смысловой завершенности. Например, адрес полезно знать лишь в том случае, если известно, кому он принадлежит.

Логическая запись представляет ч е т в е р т ы й уровень структуры данных − это поименованная совокупность полей или групп данных. Запись является отдельной логической единицей и имеет смысловую завершенность. Каждая запись описывает индивидуальный объект или класс объектов. Логическая запись является непосредственным объектом информационного поиска и основной единицей обработки информации в СОД.

Перечень полей, последовательность их расположения и взаимосвязь

между ними составляет внутреннюю структуру записи, которая в конечном

итоге определяет тип записи. Поля записи могут располагаться последовательно друг за другом, в этом случае запись называется неструктурированной. Запись может быть структурирована, со сложными нелинейными отношениями между полями. Структурирование записей является одним из основных понятий баз данных данная величина.

Отдельные логические записи, описывающие определенный класс объектов- проекты группируются в наборе данных, образуя последний p I -

t-й уровень структуры данных. Массивы, хранящиеся во внешней памяти,

называется файлы. Файл имеет имя и обрабатывается как единое целое. На-

например, можно рассмотреть коллекцию записей всех студентов в учебной группе рассматривается как отдельный файл.

Типы структур данных. В процессе функционирования ОРВ записи и

массивы претерпевают изменения. Новые записи добавляются в массивы, UDA- старые становятся ненужными. Процесс ведения информации обновленный массив, состоящий из добавления и удаления для написания называется ведущим.

Индивидуальные характеристики объектов могут изменяться с течением времени, согласно необходимо внести соответствующие изменения в эту запись. Процесс- изменение в записи называется корректировкой или модификацией.

Для любой манипуляции с их записями, прежде всего, необходимо

найти в массиве. Поиск записей-одна из основных операций в ОРВ, поэтому

время поиска является наиболее важным параметром, который в значительной степени определяет общую скорость обработки информации в ОРВ.

Для обеспечения общей "жизнеспособности" информационной массы-

Структуры данных VA должны быть организованы таким образом, чтобы один временно предоставляется: обслуживание массива; исправление отдельных записей; быстрый поиск записей; минимальное потребление памяти для массива. Все эти требования исследования в значительной степени противоречивы, т. е. улучшение некоторых характеристик СОД может сопровождается ухудшением состояния окружающих. Поэтому перед проектировщиком ОРВ задача состоит в том, чтобы выбрать компромиссное решение, которое позволяет DOS- Тип эффективное сочетание этих характеристик.

Структуры данных делятся на линейные и нелинейные. Линейный

структуры данных включают массив, стек, очередь, таблицу. В нелинейном

связь между элементами структуры (записями) определяется- подчинение или любые логические условия. К нелинейным структуры данных включают деревья, графики, многосвязные списки и структуры.

Ряд структур данных, однажды созданных, не допускают включения или ключевые записи, и позволяет только коррекцию записей. Это структуры

фиксированный размер. Напротив, структуры переменного размера позволяют включать и исключать записи, позволяя информацию массив динамически изменяется.

В зависимости от способа представления структур в памяти компьютера (программное обеспечение следственные или родственные) структуры переменного размера снабжены есть возможность расти и уменьшаться: либо в рамках заранее зарезервированного блока памяти, либо в пределах всего адресного пространства памяти. В первом случае необходимо заранее знать максимальное число элементов структуры, чтобы выделить блок памяти достаточного размера. Если число элементов структуры окажется большим чем то, которое можно разместить в отведенном для нее блоке памяти, то все элементы не удастся разместить в памяти. Если число элементов структуры окажется меньшим, чем выделенный блок памяти, то участок памяти окажется неиспользованным. Т.е. последовательное представление данных в памяти ЭВМ ставит проблему оптимального выбора размера памяти под их размещение. Связанное представление данных снимает эту проблему. Структуры данных переменного размера при таком представлении могут свободно расти и уменьшаться в пределах всего адресного пространства памяти, а число элементов структуры может быть заранее неизвестным. Различные структуры данных предоставляют и различные возможности доступа к своим элементам (к любому или – строго определенному элементу).

Ограничение в доступе к произвольным элементам структур данных сопровождается увеличением времени поиска нужных записей.

Структуры данных могут быть однородными и неоднородными. В однородных структурах все элементы представлены записями одного типа. Примером являются записи о студентах группы. В неоднородных структурах элементами одной структуры могут являться записи разных типов. Примером является структура, отражающая сведения о заказе, выполненном какой-либо организацией-подрядчиком. Записи могут содержать сведения о характере заказа, объемах и стоимости работ, исполнителях, сроках работы и т.д.

Последовательное и связанное представление данных. По способу

представления данных в памяти СОД различают структуры хранения с последовательным и связанным представлением данных.

При последовательном представлении данные в памяти размещаются в соседних последовательно расположенных ячейках. При этом физический порядок следования записей полностью соответствует логическому порядку. Совокупность записей, размещенных в последовательно расположенных ячейках памяти, называется последовательным списком.

Для хранения информационного массива в виде последовательного

списка в памяти выделяется блок свободных ячеек под максимальный размер

массива. Так, массив записей, имеющий логический порядок

Запись В

Запись А

Запись F

Запись C

. . . . . . . .

Запись N

Многие приложения СОД требуют непрерывного обновления и корректировки записей, что приводит к большим потерям времени на частую перезапись и – к неэффективному использованию памяти. В таких приложениях последовательное представление неприемлемо и заменяется связанным представлением.

При связанном представлении в каждой записи предусматривается

дополнительное поле, в котором размещается указатель (ссылка). Физический порядок следования записей в этом случае может не соответствовать логическому порядку. В памяти записи располагаются в любых свободных ячейках и связываются между собой указателями, показывающими место расположения записи, логически следующей за данной записью. Указатель можно интерпретировать как адрес ячейки памяти, в которой хранится следующая запись.

Структуры хранения, основанные на связанном представлении данных,

называют связанными списками. Если каждая запись содержит лишь один указатель, то список односвязный, при большем числе указателей – список многосвязный.

Пусть структура данных имеет следующую логическую последовательность записей:

Запись А

Запись В

Запись С

Запись F

Записи размещены в ячейках с адресами 01, 05, 03, 10. В поле указателя

каждой записи размещается адрес связи (АС), определяющий адрес ячейки с

логически следующей записью. Порядок чтения записей указан стрелками.

Связанное представление обеспечивает гибкость структуры хранения.

Ведение списка не требует перезаписи элементов массива, а производится с

помощью такой замены указателей, чтобы логический порядок следования записей не нарушался. Однако для размещения указателей требуется дополнительный объем памяти.

Для включения в односвязный список новой записи из списка свободных ячеек берется первая ячейка, в ее информационное поле заносится новая запись, а в поле указателя заносится адрес хранения логически следующей записи. Адрес ячейки с новой записью становится указателем логически предшествующей записи. Для размещения новых записей используются любые свободные ячейки, поэтому список может расти неограниченно в пределах всего пространства памяти.

После замены указателей устанавливается порядок следования ячеек памяти 01, 05, 03, 15, 10, обеспечивающий требуемую логическую последовательность записей: А, В, С, D, F Односвязный список может быть организован в виде замкнутого кольца. При этом указателем последней записи будет адрес первой записи. Такой список еще называют циклическим. Просмотр циклического списка можно начинать с любой ячейки. Условием окончания просмотра может быть либо совпадение числа просмотренных записей с общим числом записей в списке, либо совпадение указателя с адресом первой прочитанной ячейки.

2.1 Элементарные и линейные данные и их хранение

Элементарные данные (числа, символы, логические данные, указатели) имеют определенное машинное представление и занимают вполне определенные единицы памяти ЭВМ. Это позволяет рассчитывать объем памяти, необходимый для размещения информационных массивов. Числовые данные присутствуют во всех языках программирования. К ним относятся целые, вещественные и комплексные числа. Для представления чисел наиболее часто используется позиционная система счисления с каким-либо основанием. В ЭВМ наиболее употребительными являются системы счисления с двоичным, восьмеричным и шестнадцатеричным основанием. При любом основании числа в ЭВМ представляются в виде двоичных кодов (двоичных слов) фиксированной длины. Разряды двоичного числа (0, 1) называются битами. Двоичные слова в современных ЭВМ обычно разбиваются на фиксированные части по 8 бит, называемые байтами. В ЭВМ приняты две формы представления чисел: с фиксированной точкой (запятой) и с плавающей точкой (запятой).

Эти формы называют также соответственно естественной и полулогарифмической. Положение точки фиксируется: для целых чисел – после младшего разряда, для дробных чисел – перед старшим цифровым разрядом. Для представления знака числа выделяется знаковый разряд (обычно крайний слева). Плюс в этом разряде кодируется нулем, а минус – единицей. Для выполнения арифметических операций над числами обеих полярностей в ЭВМ используются прямой, обратный и дополнительный коды. В современных ЭВМ преимущественно используется дополнительный код. Знак 44 числа в дополнительном коде кодируется двумя крайними слева битами. Плюс кодируется как 00, минус – как 11. Примеры представления целых и дробных двоичных чисел с фиксированной точкой при использовании дополнительного кода приведены на рис. 4.1, а, б соответственно. При обработке чисел с фиксированной точкой диапазон их представления жестко определяется разрядной сеткой машины. Для целых чисел: 1} x } 2n. Для дробных чисел: 2-(n+1) } x } 2-1. При выходе чисел за пределы указанных диапазонов возникает необходимость дополнительного их масштабирования (см. приложение 1).

В СОД широкого назначения обычно используется обработка чисел с плавающей точкой, не требующая масштабирования. Представление числа с плавающей точкой в общем случае имеет вид x = sp q, где sp – характеристика числа х; p – порядок; s – основание характеристики; q – мантисса числа х. Мантисса (дробь со знаком) и порядок (целое число со знаком) представляются в системе счисления с основанием, равным s в соответствующей двоично-кодированной форме. Знак числа совпадает со знаком мантиссы. Порядок p, который может быть положительным или отрицательным целым числом, – определяет положение точки в числе х. Пример представления двоичных чисел с плавающей точкой при использовании дополнительного кода приведен в таблице 2 (см. приложение 2)

При фиксированном числе разрядов мантиссы любая величина представляется с наибольшей возможной точностью нормализованным числом. Число x = sp называется нормализованным, если мантисса q удовлетворяет условию 1 ! V q V 1 ~s, Т.е. старший разряд нормализованной мантиссы в s-ричной системе всегда отличен от нуля. В процессе вычислений могут получаться ненормализованные числа. В этом случае ЭВМ, если это предписано программой, автоматически их нормализует. При обработке чисел с плавающей точкой диапазон их представления зависит от основания системы счисления и числа разрядов, выделенных для представления порядка. Точность вычислений определяется числом разрядов мантиссы. Для хранения целых чисел в десятичной форме каждая десятичная цифра кодируется четырехразрядным двоичным числом. На один байт приходится по две десятичные цифры. Такая форма представления называется упакованной десятичной формой. Под знак числа отводится крайний левый полубайт. Форма представления чисел может быть различной для разных типов ЭВМ.

К символьным данным относятся буквы латинского и кириллического алфавита, знаки препинания, десятичные цифры, знаки операций, специальные, управляющие и другие символы. Различные типы ЭВМ работают с различными наборами символов и используют различные символьные коды. Наибольшее распространение получило представление символьной информации с помощью байтов. Один байт позволяет кодировать 256 различных символов. В программах символьной обработки как тип данных чаще используется не отдельный символ, а строка символов, образуемая из отдельных байт-символов с помощью операции конкатенации (сцепления). Над строками возможны определенные операции: конкатенации, отыскания и замены подстроки, проверки тождественности строк и определения длины строки. Символы, образующие строку, запоминаются в последовательно расположенных байтах памяти. Размер строки может быть фиксированным и переменным. Память для представления строки переменной длины выделяется исходя из максимального размера строки, объявленного в программе. Логические данные принимают только два значения: «истинно» и «ложно». Представление логических данных различно для разных языков программирования. Над логическими данными выполняются операции булевой алгебры. В машинной памяти логические данные также представляются поразному, в зависимости от типа транслятора и типа ЭВМ. Для хранения одного логического данного достаточно отвести один бит, значение которого равно 1, если «истинно», и равно 0, если «ложно». Однако в большинстве ЭВМ структуризация памяти обычно не предусматривает доступа к одному биту. В этом случае для одного логического данного используется один байт или машинное слово – как элементарная машинная единица информации. Указатель (связка, ссылка) – это элемент данных фиксированного размера. Он используется для реализации связанного представления данных в машинной памяти.

Указатель может быть абсолютным или относительным адресом данного. Относительный указатель содержит значение смещения в области памяти относительно некоторого базового адреса в этой области памяти. Поскольку указатель выступает в качестве адреса данного, то он и хранится в памяти ЭВМ как адрес в виде машинного слова или полуслова. Линейные структуры данных и их хранение Массив. Массив – это линейная структура данных фиксированного размера, реализуемая с использованием последовательного представления данных. Не следует путать два различных понятия: массива как типа структуры данных и информационного массива как совокупности данных, обрабатываемых в СОД. Каждый элемент массива идентифицируется одним или несколькими индексами. Индекс − это целое число, значение которого определяет позицию соответствующего элемента в массиве и используется для осуществления доступа к этому элементу. Отдельные элементы массива могут изменяться, но общее число элементов массива всегда остается неизменным, т.е. для массивов нет операций удаления и добавления. Различают одномерные и многомерные массивы. Одномерный массив называется вектором. Вектор А = {a1, a2, . . . , an} − это последовательность элементов (записей), размещенных в смежных ячейках памяти. Единственный индекс обозначает номер позиции элемента в последовательности. Адрес L0 первого байта, выделенного для первого элемента вектора, называется адресом базы вектора. Вектор в целом определяется адресом базы, размером элементов и их числом или размером элементов и диапазоном изменения индекса.

2.2 Последовательное и связанное представление данных

По способу представления данных в памяти СОД различают структуры хранения с последовательным и связанным представлением данных. При последовательном представлении данные в памяти размещаются в соседних последовательно расположенных ячейках. При этом физический порядок следования записей полностью соответствует логическому порядку. Совокупность записей, размещенных в последовательно расположенных ячейках памяти, называется последовательным списком. Для хранения информационного массива в виде последовательного списка в памяти выделяется блок свободных ячеек под максимальный размер массива. Так, массив записей, имеющий логический порядок Запись В Запись А Запись F Запись C . . . . . . . . Запись N разместится в памяти ЭВМ. При появлении новых записей они будут размещаться в конце блока на свободном участке памяти. Если число новых записей окажется больше чем 37 свободный объем памяти под их размещение, то разместить их не удастся, если меньше – память окажется недоиспользованной. В процессе ведения информационного массива записи добавляются и удаляются. Новые записи пристраиваются в конец списка, удаленные записи образуют свободные участки памяти.

Заключение

Подводя итоги данной курсовой работы, можно сделать следующий вывод: исходные информационные системы на базе баз данных имели строго централизованную архитектуру. Данные были сконцентрированы физически и логически на одном компьютере. Централизованная организация базы данных облегчает обеспечение ее безопасности, целостности и согласованности данных. Однако рост базы данных и количества пользователей, получающих к ней доступ, территориальное развитие организации (и связанная с этим необходимость распределенной обработки данных) приводят к ряду проблем, присущих централизованной архитектуре - большой объем обмена данными (высокий трафик); - снижение надежности обмена данными; - снижение общей производительности; - увеличение затрат на разработку базы данных. Возможным решением этих проблем является организация децентрализованного хранения данных. Децентрализация обеспечивает: - параллельную обработку данных и балансировку нагрузки; - повышение эффективности обработки данных при выполнении удаленных запросов; - снижение затрат на обработку данных; - упрощение процедуры управления ИС. Целью распределенной обработки данных является выполнение обработки наиболее подходящим процессором. Распределение не подразумевает параллелизма, но можно "распараллелить" распределенную обработку.

Распределенная, или общая, или общая программа: запуск программы на двух или более компьютерах, подключенных к сети. Пользователь не заботится о расположении различных ресурсов, необходимых для успешного выполнения программы, которую он выполняет со своего рабочего места; таким образом, распределенная база данных представляет собой набор отношений, хранящихся в разных узлах компьютерной сети и логически связанных таким образом, чтобы сформировать единый набор данных. Распределенная система: система, которая работает на нескольких компьютерах и предоставляет пользователю логически единый доступ ко всем файлам в сети. Организация распределенной базы данных имеет множество преимуществ: сокращение времени отклика, повышение надежности данных, снижение аппаратных затрат за счет сокращения объемов данных, хранящихся на одном сервере. Эффективность такой информационной системы зависит от интенсивности движения: чем она ниже, тем быстрее окупаются вложенные в ее строительство средства.

Ключом к успешному внедрению этих систем является правильная организация распространения и хранения информации. Идеальным способом снижения трафика в каналах связи является использование технологии" клиент-сервер", которая получила широкое распространение в последние годы. Использование технологии "клиент-сервер" позволило создать надежные (с точки зрения целостности данных) многопользовательские информационные системы с централизованной базой данных, независимой от аппаратной (а зачастую и программной) части сервера баз данных и поддерживающей графический интерфейс пользователя на клиентских станциях, соединенных локальной сетью. Кроме того, значительно сократились затраты на разработку приложений. Поэтому неудивительно, что данная технология приобрела большую популярность среди разработчиков прикладного программного обеспечения, а приложения на ее основе широко распространены на рынке информационных систем. Несмотря на объективные трудности и предубеждения пользователей, ситуация меняется - все большее число девелоперских фирм пытаются, несмотря на трудности, перейти на использование этой передовой технологии.

Существуют инструменты и технологии для создания информационных систем, включая трехуровневую модель.

Список используемой литературы

1. Автоматизированные информационные технологии в экономике: Учебник. / Под ред. проф. Г.А. Титоренко. – М.: Компьютер, ЮНИТИ, 2010. – 400 с. 

2. Веснин В.Р. В 38 Менеджмент в вопросах и ответах: Учебн. пособие. – М.:ТК Велби , Изд-во Проспект, 2007. – 176 с.

3. Вершигора Е.Е. Менеджмент: Уч. пособие – 2-е изд., перер. и доп. – М.: ИНФРА –М,2008–283с. 

4. Грабауров В.А. Информационные технологии для менеджеров. – М.: Финансы и статистика, 2009. – 368 с.

5. Гайдамакин Н.А. Автоматизированные информационные системы, базы и банки данных. Вводный курс. [Текст]/Н.А. Гайдамакин - М: Гелиос АРВ, 2007 г. - 368 с. 

6. Избачков Ю. С. Информационные технологии. Учебное пособие. [Текст]/Ю.С. Избачков, В.Н. Петров – Спб: Питер, 2007г. – 656 с. 

7. Информационные технологии управления: Учеб. пособие / Под ред. Г.А. Титоренко. – М.: ЮНИТИ-ДАНА, 2009. – 280 с.

8. Тиори Т., Фрай Дж. Проектирование структур баз данных / Пер. с англ. М.: Мир, 1985. 320с.

9. Майоров С.А., Новиков Г.И. Принципы организации цифровых машин. – Л.: Машиностроение (Ленингр. отд-е), 1974. – 432 с.

10. Кузнецов О.П., Адельсон-Вельский Г.М. Дискретная математика для инженера. – М.: Энергоатомиздат, 1988. – 480 с.

11. Сигорский В.П. Математический аппарат инженера. Изд-во «Техника», 1975. 768с.

12. Информатика: Рекомендовано Министерством образования РФ в качестве учебника для студентов экономических специальностей ВУЗов / Н. В. Макарова, Л. А. Матвеев, В. Л. Бройдо и другие; Под редакцией В. Н. Макаровой – 3-е изд.; перераб. – М.: Финансы и статистика, 2005. – 768 с.

13. Леонтьев В.П. «ПК: универсальный справочник пользователя». М 2014.239с.

14. Варфоломеев В.И., «Программные средства офисного назначения. Практикум», М., МГУК, 2011.196с.

15. Информатика. Базовый курс / Под ред. С.В. Симоновича, СПб., 2000.

16. Компьютерные технологии обработки информации./Под. ред. С.В. Назарова. – М.: Финансы и статистика, 2008. 258с.

Приложение

Приложение 1

Примеры предоставления целых (а) и дробных (б) двоичных чисел с фиксированной точкой, а, б.

Знак числа

2n 2n-1.......................................................................................2I20

0

0

4-й байт

3-й байт

2-й байт

1-й байт

a

Знак числа

2-1 2-2...................................................................................2-n 2-(n+1)

0

0

1-й байт

2-й байт

3-й байт

4-й байт

Приложение 2

Пример предоставления двочных чисел с плавающей точкой

Знак числа Модуль порядка Модуль мнтиссы