Автор Анна Евкова
Преподаватель который помогает студентам и школьникам в учёбе.

Операции, производимые с данными (теоретические основы и понятия)

Содержание:

Введение

Цель исследования: изучить операции, производимые с данными.

Задачи исследования: изучить основные операции с данными, теоретические основы и понятия, связанные с операциями, производимыми с данными.

Объект исследования: данные.

Предмет исследования: операции, производимые с данными.

Актуальность исследования: во всем современном мире миллионы людей озадачены теми или иными операциями, производимыми с данными. Практически на каждом рабочем месте выполняются особые операции, позволяющие, управлять культурными, экономическими, научными и промышленными процессами. Работа с информацией имеет огромную трудоемкость, поэтому технический прогресс идет по пути автоматизации производимых над данными операций.

Понятия и теоретическая информация, используемая для написания курсовой работы, относится к основам знаний по информатике, поэтому литература, содержащая необходимые сведения не всегда является современной. Раскрыть тему и глубже изучить вопрос производимых с данными операций помогают пособия не только по информационным технологиям и программированию, но и по философии и экономике.

Глава 1. Понятие данных

Данные — поддающееся многократной интерпретации представление информации в формализованном виде, пригодном для передачи, связи или обработки. [13]

Данные в памяти могут быть организованы в различные виды структур данных, таких как массивы, связанные списки или объекты. Структуры данных могут хранить данные различных типов, включая числа, строки и другие структуры данных. [3] Согласно архитектуре фон-Неймана, на основании которой построены все современные компьютеры, данные и программы могут храниться в одной и той же области памяти, потому что и то и другое выражается, как правило, в виде двоичного кода.

Глава 2. Обработка данных

Обработка в общем понимании этого слова - это воздействие на объект с целью придать ему новые свойства. В ходе информационного процесса данные преобразуются из одного вида в другой с помощью различных методов. Таким образом, обработка данных – ни что иное, как преобразование данных под воздействием различных методов с целью придать им новые определенные свойства. И эта обработка может включать в себя множество операций.

Научно-технический прогресс, точнее, быстрое появление новых типов носителей, средств и способов передачи информации, появление новых условий и требований к обработке данных приводят к усложнению этого процесса и влекут за собой увеличение трудозатрат.

Глава 3. Возможные операции по обработке данных

Среди действий или операций с данными выделяют основные, такие как:

  • сбор;
  • формализация;
  • фильтрация;
  • сортировка;
  • архивация;
  • хранение;
  • защита;
  • транспортировка;
  • преобразование;
  • тиражирование;
  • кодирование;
  • обработка.

Приведенный список можно дополнить и другими операциями, например: запись, систематизация, накопление, уточнение (обновление, изменение), извлечение, использование, передача (распространение, предоставление, доступ), обезличивание, блокирование, удаление, уничтожение.

Разберем каждую из основных операций с информацией.

Под сбором понимается процесс получения данных от источников их регистрации, т.е. их фиксирование на носителях данных (документах, машинных носителях и т.п.). [4] и таким образом, накопление информации, которая обеспечивает достаточную полноту принятия решений. Собранные данные вводятся в информационную систему, в которой они и будут обрабатываться, храниться и передаваться. Цель сбора данных – обеспечение готовности информации к дальнейшему продвижению в информационной системе и представление информации в различных формах. В процессе сбора данных можно выделить два метода: механический сбор и наблюдение. Механический сбор – процесс регистрации механическим способом изменений физического состояние некоторого объекта источником информации, например, каким-либо событием или опытом. Наблюдение – метод сбора, который заключается в регистрации, воспроизводимого по памяти человека наблюдения. При механическом сборе информации системой датчиков степень достоверности получаемой информации заранее известна и постоянна, она определяется классом точности измеряющего прибора. Человек же при сборе данных вносит их субъективно, таким образом внося неопределенность, снижающую точность, но позволяя интерпретировать информацию. При сборе информации человеком используют разные формы: запись данных вручную, запись информации с помощью вспомогательных средств, таких как консоль, магнитные и цифровые записывающие устройства. [12]

Информация, которая не может быть собрана механическими средствами, собирается человеком. Регистрация данных при этом сборе данных происходит способом записи на носителе. Носителями может служить бумага для записи, перфолента, магнитный носитель, клавиатура, микрофон. Из-за интерпретации человеком информации при таком способе ввода точность данных падает.

В процессе сбора данные могут поступать в информационные системы в следующих видах:

  • аналоговый,
  • дискретный,
  • кодовый.

Аналоговый вид представляет из себя некоторую непрерывную функцию времени, отображающую изменение информации.

Дискретный вид – это «да» и «нет», 0, 1 и так далее, то есть изменение состояния скачком.

В кодовом или цифровом виде информация представляется в форме сочетаний «0» и «1», соответствующих определённым символам. [7]

Формализация в философии - это отображение объектов некоторой предметной области с помощью символов какого-либо языка. Простейший вид формализации – прямое обозначение (именование, описание) объектов с помощью терминов [5]. В нашем же случае, с точки зрения информатики, формализация – это приведение различных данных к единой форме для того, чтобы обеспечить возможность сопоставить их между собой и таким образом повысить их уровень доступности.

Фильтрация - это по сути проверка и отбор чего-либо с различными целями. Например, отсеивание «лишних» данных, в которых нет необходимости и которые мешают анализу «нужных» данных. При этом должен уменьшаться уровень «шума», а достоверность и адекватность данных должны возрастать.

Сортировка представляет из себя последовательное расположение или разбиение на группы данных по заданному признаку и в зависимости от выбранного критерия.

Архивация - подготовительная обработка (сбор, классификация, каталогизация, сжатие (для цифровой информации)) данных для долгосрочного хранения или передачи. Архивация служит для снижения трудо- и экономических затрат по хранению и дальнейшему поиску данных, повышает общую надежность информационного процесса.

Хранение информации – процесс обеспечения сохранности документов или данных, удовлетворительного состояния материального носителя, защиты от несанкционированного доступа и недозволенного использования.

Под защитой данных понимают комплекс мероприятий технического, организационного и организационно-технического характера, направленных на защиту информации от утраты, воспроизведения и модификации. [6]

Транспортировка - прием и передача данных между удаленными участниками информационного процесса. При транспортировке информации по сети передача данных производится путем разбиения на компьютере - отправителе исходных файлов на пакеты с последующей их сборкой на компьютере-получателе.

Реализация процедур передачи данных определяется следующими вводными данными:

  • типом носителя информации,
  • структурой информационных систем, между которыми передаются данные,
  • задачами информационных систем,
  • требованиями к надежности (сохранения целостности) передаваемых данных.

Этими требованиями определяется предельно допустимая пропуская способность информационной системы. Информационные системы, носителями информации в которых является бумага, обладают наименьшей скоростью передачи данных, а информационные системы с оптическими линиями связи – наибольшей. Самым распространенным типом носителя является сигнал, как электромагнитное колебание. Структура информационной системы и решаемые ею задачи тесно связаны.

Преобразование данных – это процесс видоизменения данных, направленный на выполнение условий того или иного метода обработки. Видоизменение может быть произведено из одной формы в другую или из одной структуры в другую. Часто, преобразование информации требуется для записи данных на другой тип носителя, отличный от того, где данные хранились изначально. Примером необходимости преобразования данных может служить сканирование фотографий – перевод изображения из бумажной формы в форму, позволяющую хранить эти данные в электронной форме на диске. При транспортировке информации, о которой рассказано выше, так же возникает необходимость предобразования данных. Если же транспортировка осуществляется средствами, не предназначенными для передачи нужного типа данных, без множественного преобразования информации не обойтись. Например, так часто используемые в двухтысячных годах телефонные модемы передавали информацию по кабелю телефонной сети посредством аналоговых сигналов, таким образом, преобразовывая данные в звуковые сигналы в определенном диапазоне частот.

Тиражирование, чаще называемое репликацией данных – это технология распространения изменений, первоначально выполненных на одной копии блока данных, на другие копии. Такая технология повышает эффективность доступа к информации при условии своевременного и регулярного обновления и синхронизации копий.

Кодирование – выражение данных одного типа через данные другого типа. Для обеспечения удобной и эффективной обработки данных с помощью какой-либо совокупности правил применяют кодирование для замены объекта на условное обозначение (или код). Примером кодирования могут служить человеческие языки, азбука, система записи математических выражений, криптографические шифры и двоичное кодирование, позволяющее кодировать текстовую, числовую, графическую, звуковую информацию. Наиболее важным является кодирование сообщений двоичными наборами знаков (система кодирования понятий в вычислительной технике). Двоичный код – это набор знаков, 0 и 1, который применяется для хранения данных в памяти компьютера. Так же его называют машинным кодом. [8]

На рисунке 3.1 показаны различные варианты систем кодирования.

Рисунок. 3.1. Системы кодирования.

Обработка данных – это так же преобразование информации в удобный для дальнейшего продвижения в информационной системе вид. Обработка информации производится в несколько этапов:

  • преобразование,
  • идентификация,
  • изменение.

Начнем разбирать этапы обработки данных со второго, самого важного этапа – идентификация. Это распознавание информации. Распознавание осуществляется по признакам и по идентифицирующим ключам. Наиболее распространенный метод распознавания данных – по признакам. Происходит такое распознавание таким образом: сначала фиксируется набор признаков (например, сочетания 0 и 1), затем полученный набор признаков сравнивается с фиксированными признаками и выносится решение о принадлежности данных к тому или иному типу. Такой метод используется для распознавания символов и реализуется в виде дешифрации кодов.

Для идентификации речевых сигналов используется специальная система признаков: частота основного тона, число формант и их расположение по частоте, нестационарность и так далее. При использовании таких признаков идентификация неоднозначна. Для идентификации графических объектов используется ключ. Ключом может являться кодовое слово, бит признака и так далее). В таком случае для идентификации используется только один признак – ключ и такая идентификация будет однозначна.

Вернемся к первому этапу обработки информации. Это преобразование данных, кодирование в вид, позволяющий обрабатывать такой вид информации в данной информационной системе. Для примера, электромагнитные колебания нужно преобразовать в акустические колебания (звуковые) или оптические объекты, потому как человек, тоже в каком-то роде, являющийся информационной системой, не может воспринимать информацию в виде электромагнитных колебаний. В общем, для информационных систем, преобразование – это представление символов в формате распознаваемого типа.

Третий этап - целенаправленное изменение информации. К операциям изменения данных относятся:

- выполнение арифметических операций (расчетов),

- дополнение и объединение информации с уже имеющейся в информационной системе,

- реализация процедур принятия решения при оценке информации от различных источников (моделирования ситуаций, экспертные оценки и так далее),

- представление информации в удобном для потребителя виде (изображение, звук и так далее). [8]

Среди множества операций, производимых с данными, для рассмотрения в этой главе я выделил несколько наиболее интересных. Описание операций позволит в большей мере освоить основы программирования.

Глава 4. Операции с данными при их автоматизированной обработке

Существует понятие - автоматизированная система обработки данных. Это такая система обработки данных, основанная на использовании электронных вычислительных машин (компьютеров) в отличие от систем, где обработка данных ручная. Возможны два принципа организации такой обработки. В первом случае информация собирается и обрабатывается специально для решения каждой задачи, во втором — для решения различных задач наряду с переменной (специфической для каждой задачи) информацией используются общие нормативно-справочные (условно-постоянные) данные. [6] Обработка информации начинается с доступа к требуемым данным, которая может быть инициирована либо самим компьютером, либо пользователем. В последнем случае, пользователь формирует запрос, куда входит вид необходимого доступа или операции (например, добавление, изменение, удаление, просмотр и тому подобное) и указание на то, над какими данными должны быть выполнены действия. Рассмотрим виды операций, включаемые в запрос, подробней и по-отдельности.

Добавление информации в неструктурированные данные происходит путем пополнения новыми данными в информационный массив, в неструктурированные данные добавление информации происходит добавлением нового файла. В таком случае помимо вида операции в запросе должны присутствовать и сами новые данные. Рассматриваемое действие приводит к увеличению массива данных.

Удаление данных является действием, обратным добавлению. Этот процесс вызывает исключение указанных в запросе данных. Такое действие приводит к уменьшению информационного массива.

Изменение данных не связано с действием над файлом, а направлено на его составляющие – поля записи файла или его текст, который содержится в файле. Изменение представляет собой удаление прежних значений полей или строк текста или добавление новых. В таком запросе будет содержаться дополнительная информация, указывающая на требуемые составляющие изменяемого элемента, а также сами новые значения этих составляющих. В случае изменения неструктурированных данных, объем информационного массива не изменится, а если изменяется структурированный массив, объем информационного массива может измениться.

Предоставление данных пользователю на устройстве вывода (мониторе, принтере и тому подобное) называется просмотром. Запрос в таком случае содержит информацию о том, какую информацию из файла следует просмотреть. Если же такой информации в запросе нет, просматривается весь элемент.

Операции, производимые с данными помимо уже рассмотренного, могут включать в себя арифметические операции.

Выполнение любой операции из указанных выше начинается с поиска нужного элемента данных в информационном массиве. В случае добавления нового элемента поиск похожего элемента так же выполняется, чтобы избежать дублирования данных. Под поиском данных понимается определение их местонахождения в информационном массиве. Из всего сказанного следует вывод, что любой доступ включает в себя поиск.

На рисунках 4.1, 4.2 и 4.3 показаны технологии доступа при выполнении операции изменения, добавления и удаления данных.

Рисунок 4.1. Технология доступа при выполнении операции изменения данных.

Рисунок 4.2. Технология доступа при выполнении операции добавления данных.

Рисунок 4.3. Технология доступа при выполнении операции удаления данных.

На рисунках, иллюстрирующих технологии доступа, сплошные линии означают управляющие связи, а пунктирные – информационные связи. Различие в схемах в том, что по технологии, показанной на рисунках 1 и 2, воздействие на информационный массив осуществляется с целью его изменения, для чего в него передаются данные, а по технологии, показанной на рисунке 3, воздействие на массив данных не связано с передачей данных.

На рисунке 4.4 показана технология просмотра данных. По схеме этой технологии данные выводятся из информационного массива без его изменения. [11]

Рисунок 4.4. Технология доступа при выполнении операции просмотра данных.

С ростом объема обрабатываемы данных особое внимание уделяется времени обработки запроса. Для его уменьшения стремятся к применению таких структур данных, которые позволяют оптимизировать поисковые операции, как правило за счет дополнительных описаний данных. К сожалению, такая структура хранения повышает расход памяти. Для достижения адекватных целей при проектировании моделей данных учитывается предполагаемый режим эксплуатации информационного массива. Этих режимов может быть два: интерактивный и пакетный. Интерактивный режим эксплуатации информационного массива (запросный, диалоговый) означает то, что передача и обмен информацией в массиве происходит в режиме диалога. Пакетный же режим обозначает, что каждая порция информации (пакет) обрабатывается без вмешательства извне, этот режим ещё называют фоновым. Если выбран интерактивный режим, то основное внимание уделяется минимизации времени доступа к данным, а если режим пакетный, то минимизируют требуемую память. Предметная область, отражаемая в структурах хранения, так же влияет на выбор модели и может иметь свои особенности. [11]

В связи с тем, что поисковые операции определяют продолжительность необходимых действий над информационным массивом, много внимания уделяется задачам организации хранения данных и поиска по ключам, которые включаются в запрос пользователя.

Как уже говорилось в выше, основной задачей, возникающей при работе с данными и в частности с базами данных, является задача поиска. В связи с тем, что объемы обрабатываемой информации постоянно растет, как и растут базы данных, в которых эта информация содержится, в первую очередь, появляется задача именно эффективного поиска данных, то есть поиска за относительно короткое время с максимально большой точностью. Для оптимизации производительности запросов по поиску необходимо производить индексирование хранимых данных.

На рисунке 4.5 показан пример использования индекса.

Рисунок 5. Индексирование данных.

Индекс – это структура, определяющая соответствие значения ключа записи и местоположения этой записи. [10] Индексы обычно хранятся в отдельной базе данных или отдельном файле. Использование индексов позволяет реализовать более быстрый поиск нужной информации в массиве данных. Без индекса поиск начинается с самого начала массива данных до тех пор, пока запрашиваемая информация не будет найдена. Чем больше объем хранимых данных, тем больше накладные расходы.

В связи с постоянным ростом обрабатываемых данных автоматизация процесса работы с данными просто необходима. Внедрение автоматизированных систем обработки данных позволит увеличить скорость обработки данных, снизить расходы на дополнительный персонал (что включает в себя расходы не только на заработную плату, но и на достойные условия труда). Так же автоматизация работы с информацией улучшит качество, в том числе точность, обработки данных, позволит наиболее качественно обеспечить информационную безопасность, что не маловажно при обработке конфиденциальной информации. На современном предприятии практически все системы обработки данных переведены на автоматизированную обработку. Это бухгалтерский учет, учет движения сырья, оформление заказов и контроль за их выполнением, составление проектов, управление складом и так далее.

Заключение

Написав курсовую работу, я пришел к выводу, что над данными производятся четыре основных операции: создание, удаление, доступ, обновление. Полный список возможных операций составить невозможно, но я постарался описать все найденные мной в доступной литературе операции, где это было возможно, изобразил схематично процесс обработки данных при выполнении определенной операции.

Тема данных затрагивается во множестве современных и устаревших пособий по информатике, содержащих базовые знания по информационным технологиям и базам данных. Более подробно эта тема поднимается в узко специализированных изданиях, но уже в другом ключе – на обработке информации внимание ни один из авторов не заостряет.

Список литературы

  1. Роберт Седжвик. Алгоритмы на С++. Лекция 3: Элементарные структуры данных. М.: НОУ «ИНТУИТ», 2015. URL: http://www.intuit.ru/studies/courses/12181/1174/lecture/25250 (Дата обращения 01.04.2017)
  2. Л. И. Лопатников. Экономико-математический словарь: Словарь современной экономической науки. М.: Дело.. 2003. 520 c.
  3. Философия: Энциклопедический словарь / Под ред. А.А. Ивина. М.: Гардарики, 2004. 1072 с.
  4. Англо-русский толковый словарь по системотехнике ЭВМ: Для пользователей ПЭВМ / Е. С. Алексеев, А. А. Мячев; Под ред. А. А. Мячева. М. Финансы и статистика, 1993. 256 с.
  5. Завгордний В. И. Комплексная защита информации в компьютерных системах. М. Логос, 2001. 264 с.
  6. Малюк А.А., Пазизин С.В., Погожин Н.С. Введение в защиту информации в автоматизированных системах. М.: Горячая линия-телеком, 2001. 148 с.
  7. Журнал «Информатика». Цикл статей «Энциклопедия учителя информатики». М.: Изд. дом «1 сентября», 2007. URL: http://inf.1september.ru/2007/12/00.htm (Дата обращения 01.04.2017)
  8. Симонович С. В. Информатика. Базовый курс. СПб: Питер, 2001. 638 с.
  9. Гарнаев А. Ю. Самоучитель VBA. СПб.: БХВ – Петербург, 2002. 504 с.
  10. ГОСТ 20886-85. Организация данных в системах обработки данных. Термины и определения. М.: Стандартинформ, 2005. С. 3.
  11. Д. В. Шлаев. Компьютерные информационные технологии. Курс лекций. Ставрополь. Ставропольский государственный аграрный университет. 2014. URL: http://www.stgau.ru.
  12. Олег Граничин, Владимир Кияев. Информационные технологии в управлении предприятием. Лекция 11: Изменение вычислительно-информационной парадигмы: новые подходы и модели. М.: НОУ «ИНТУИТ», 2014. URL: http://www.intuit.ru/studies/courses/13833/1230/lecture/24077 (Дата обращения 01.04.2017)
  13. ISO/IEC 2382:2015 Information technology — Vocabulary. Международная организация по стандартизации (ИСО), 2015. URL: http://www.iso.org/obp/ui/#iso:std:iso-iec:2382:ed-1:v1:en (Дата обращения 01.04.2017)