Автор Анна Евкова
Преподаватель который помогает студентам и школьникам в учёбе.

Операции, производимые с данными»

Содержание:

Введение

1. Определение термина «данные»

Приведем определения понятия “данные” из различных словарей:

Большой энциклопедический словарь: ДАННЫЕ в информатике - информация, представленная в формализованном виде, что обеспечивает возможность ее хранения, обработки и передачи.

Научно-технический энциклопедический словарь - ДАННЫЕ, информация, например, списки слов, перечень результатов измерений или коды, представляющие запись изображения. Обработкой данных занимаются КОМПЬЮТЕРНЫЕ ПРОГРАММЫ. Ввод данных может осуществляться с клавиатуры или с другого устройства ввода; хранятся они в виде файлов на КОМПЬЮТЕРНОМ ДИСКЕ. Данные могут также поступать из ИНТЕРНЕТА либо других источников.

Экономико-математический словарь: Данные [data] — сведения о состоянии любого объекта —экономического или не экономического, большой системы или ее элементарной части (элемента), о человеке и машине и т. д., представленные в формализованном виде и предназначенные для обработки(или уже обработанные). Данные не обязательно должны быть числовыми: например, статистические показатели работы предприятий и анкетные сведения о человеке — все это данные

В различных ГОСТ также вводятся определения данного термина:

ГОСТ 15971-90 (Системы обработки информации. Термины и определения), ГОСТ Р 50304-92 (Системы для сопряжения радиоэлектронных средств интерфейсные. Термины и определения) - данные - Информация, представленная в виде, пригодном для обработки автоматическими средствами при возможном участии человека

ГОСТ 17657-79 (Передача данных. Термины и определения) - данные - Сведения, являющиеся объектом обработки в информационных человеко-машинных системах.

ГОСТ 34.320-96 (Информационные технологии. Система стандартов по базам данных. Концепции и терминология для концептуальной схемы и информационной базы)  - данные - Информация, представленная в формализованном виде, пригодном для передачи, интерпретации или обработки с участием человека или автоматическими средствами.

Во многих определениях используется понятие “информация”. Согласно современным подходам к разграничению данных терминов, данные - это совокупность сведений, зафиксированных на определенном носителе в форме, пригодной для постоянного хранения, передачи и обработки, тогда как информация - это результат преобразования и анализа данных. Отличие информации от данных состоит в том, что данные - это фиксированные сведения о событиях и явлениях, которые хранятся на определенных носителях, а информация появляется в результате обработки данных при решении конкретных задач. Например, в базах данных хранятся различные данные, а по определенному запросу система управления базой данных выдает требуемую информацию.

В другой интерпретации, данные – это любые зарегистрированные сигналы, а информация - данные, полученные индивидом и уменьшающие степень его неосведомленности. (по определению К. Шеннона, информация -  снятая неопределенность наших знаний о чем-то) Предполагается, что получение информации дает получившему ее возможность принимать решения, действовать, осуществлять выбор или пополнить (и/или реструктурировать) свою систему знаний. Если полученные данные не приводят ни к чему из перечисленного, то с субъективной точки зрения считается, что для получателя они информации не несут, хотя и занимают определенный объем его памяти.

В Экономико-математическом словаре разница между понятиями “Данные” и “информация” объясняется следующим образом: данные —величина, число или отношение, вводимые в процесс обработки или выводимые из него. Информация же определяется как знание, полученное из этих данных. Следовательно, обработка данных. есть приведение их к такому виду, который наиболее удобен для получения из них информации, знания. Для того, чтобы из минимального количества данных извлечь максимум информации, используются различные способы записи массивов данных, методы агрегирования и др. Для того, чтобы быть воспринятыми и стать информацией, данные. проходят как бы тройной фильтр: физический (ограничения по пропускной способности канала),семантический (соответствие правил кодирования и записи данных)) и прагматический, где оценивается полезность данных.

2. Операции, производимые над данными

В ходе информационного процесса данные преобразуются из одного вида в другой с помощью методов. Обработка данных включает в себя множество различных операций. По мере развития научно-технического прогресса и общего усложнения связей в человеческом обществе трудозатраты на обработку данных неуклонно возрастают. Прежде всего, это связано с постоянным усложнением условий управления производством и обществом. Второй фактор, также вызывающий общее увеличение объемов обрабатываемых данных, тоже связан с научно-техническим прогрессом, а именно с быстрыми темпами появления и внедрения новых носителей данных, средств их хранения и доставки.

В структуре возможных операций с данными можно выделить следующие основные:

  • Сбор данных – накопление информации с целью обеспечения достаточной полноты для принятия решения;
  • Хранение – это комплексный процесс обеспечения целостности, доступности и защищенности данных;
  • Удаление – это процесс, который позволяет уничтожить те или иные данные;
  • Поиск, фильтрация данных – отсеивание тех данных, в которых нет необходимости для принятия решения; при этом должны возрастать достоверность и адекватность информации;
  • Сортировка данных – упорядочение данных по заданному признаку с целью удобства их использования; при этом должна повышаться доступность информации;
  • Архивация данных – организация хранения данных в удобной и легкодоступной форме; служит для снижения  экономических затрат по хранению данных и повышает общую надёжность информационного процесса в целом;
  • Преобразование данных – перевод данных из одной формы в другую или из одной структуры в другую;
  • Защита данных – комплекс мер, направленных на предотвращение утраты, воспроизведения и модификации данных;
  • Транспортировка данных – приём и передача данных между удалёнными участниками информационного процесса.

2.1 Сбор данных

Сбор подразумевает получение максимально выверенной исходной информации, является важнейшим этапом при работе с информацией. Подразумевает определённые методы и технические средства.

Сбор завершается формализацией информации, то есть получением данных. Он должен обеспечивать необходимую полноту и минимальную избыточность хранимой информации.

Средства сбора зависят от информационного примитива (звук, видео, текст, графика, числа). В промышленных масштабах используют средства сбора числовых данных, которые называются средствами автоматической идентификации. К ним относят 5 средств:

1. Технология штрихового кодирования;

2. Технология радиочастотной идентификации (GPS-навигатор, радиомаяки и т.п.);

3. Карточные технологии (зарплатная банковская карта, карта-пропуск);

4. Технологии сбора данных (охранные системы, датчики ориентации экрана в телефоне, датчик измерения объёма воздуха в автомобиле и пр.);

5. Новые технологии (распознавание голоса, оптическое распознавание текста) - пока не приобрели собственного названия.

План сбора данных:

1. Определение проблемной ситуации и постановка цели сбора;

2. Обсуждение проблемной ситуации с экспертами;

3. Разработка концепции сбора на основании выработанной гипотезы о результате;

4. Определение источников информации (первичных и вторичных);

5. Сбор вторичных данных *зачем изобретать велосипед?*;

6. Оценка вторичных данных;

7. Планирование сбора первичных данных и их сбор;

8. Оценка полученных данных;

9. Формализация информации и передача данных на хранение.

Методы сбора:

1. Опрос;

2. Интервью;

3. Наблюдение;

4. Эксперимент;

5. Панель - систематический опрос одной и той же группы наблюдаемых;

6. Экспертная оценка.

2.2 Хранение данных

Для ввода в ЭВМ информация об условиях задачи и методе её решения должна быть перенесена на специальный носитель, с которого она воспринимается ЭВМ.

Ранее использовались бумажные карты (перфокарты) или ленты (перфоленты), на которые буквы, цифры, другие символы наносились с помощью специальной системы знаков, например, совокупности пробитых и не пробитых позиций.

Также применялись магнитная лента, гибкие диски (дискеты).

В настоящее время применяются жёсткие диски, компакт-диски, DVD, флеш-карты и др.

Хранение данных - формирование и поддержка в памяти ЭВМ структуры хранения данных. На данный момент одной из самых распространенных структур хранения данных выступает файл.

Файл - физически: область внешней памяти, обладающая уникальным именем; логически: структура данных, способ хранения данных во внешней памяти.

Также данные хранятся в специально организованном программном обеспечении под общим названием базы данных.

База Данных - упорядоченная совокупность данных, предназначенных для хранения, накопления и обработки с помощью ЭВМ. Для создания и ведения базы данных (обновления, обеспечения доступа к ним по запросам и выдачи их пользователю) используется набор языковых и программных средств, называемых системой управления базы данных (СУБД).

Требования к структурам хранения:

1. Независимость от программ, которые используют данные;

2. Обеспечение полноты и минимальной избыточности данных;

3. Возможность актуализации данных (внесения изменений в файл);

4. Возможность сортировки и поиска данных по критериям (возможность извлечения данных)

На сегодняшний день файлы зависимы от программы, что является большим минусом. Полнота данных определяется субъективно пользователем. Файл удовлетворяет третьему требованию, но не существует возможности полной актуализации. Также файл не удовлетворяет четвёртому требованию - отчёт нужно составлять вручную. Если брать конкретно СУБД, то в ней нужно задать вопрос, на который автоматически происходит поиск решения, пользователь в процессе не участвует.

Данные могут храниться в виде копий резервных либо архивных копий, а также в формате структурированного хранения.

Резервное копирование - создание копий файлов для быстрого восстановления при аппаратном или программном сбое.

Виды резервного копирования:

  • Полное - еженедельное копирование всего пакета данных;
  • Инкрементальное - ежедневное копирование файлов, которые изменились со времени последнего копирования;
  • Дифференциальное - копирование файлов, которые изменились со времени последнего полного, инкрементального или дифференциального копирования.

Архивное копирование - процесс копирования файлов для бессрочного хранения, происходящий гораздо реже резервного.

Виды архивного копирования:

  • Полное;
  • Инкрементальное;
  • Дифференциальное.

Структурированное хранение - организация иерархической структуры накопителя информации, когда на верхнем уровне находятся жёсткие, а на нижнем - съёмные накопители. В своей совокупности представляют собой 2-4 жёстких диска и несколько накопителей извне.

2.3 Удаление данных

Существует как минимум три режима удаления данных: удаление, уничтожение и стирание, хотя операционные системы обеспечивают только два первых режима (режим надежного стирания данных можно обеспечить лишь специальными программными средствами).

Удаление файлов является временным. В операционных системах семейства Windows оно организовано с помощью специальной папки, которая называется Корзина. При удалении файлов и папок они перемещаются в Корзину. Эта операция происходит на уровне файловой структуры операционной системы (изменяется только путь доступа к файлам). На уровне файловой системы жесткого диска ничего не происходит — файлы остаются в тех же секторах, где и были записаны.

При уничтожении файлов файл полностью удаляется из файловой структуры операционной системы, но на уровне файловой системы диска с ним происходят лишь незначительные изменения. В операционных системах Windows это происходит при очистке Корзины. В этом случае в таблице размещения файлов он помечается как удаленный, хотя физически остается там же, где и был. Это сделано для минимизации времени операции. При этом открывается возможность записи новых файлов в кластеры, помеченные как «свободные».

Операция стирания файлов, выполняемая специальными служебными программами, состоит именно в том, чтобы заполнить якобы свободные кластеры, оставшиеся после уничтоженного файла, случайными данными. Поскольку даже после перезаписи данных их еще можно восстановить специальными аппаратными средствами (путем анализа остаточного магнитного гистерезиса), для надежного стирания файлов требуется провести не менее пяти актов случайной перезаписи в одни и те же сектора. Эта операция весьма продолжительна, и поскольку массовому потребителю она не нужна, то ее не включают в стандартные функции операционных систем.

2.4 Поиск данных

Поиск информации представляет собой процесс выявления в некотором множестве документов (текстов) всех тех, которые посвящены указанной теме (предмету), удовлетворяют заранее определенному условию поиска (запросу) или содержат необходимые (соответствующие информационной потребности) факты, сведения,данные.

Центральная задача данной операции  — помочь пользователю удовлетворить его информационную потребность. Так как описать информационные потребности пользователя технически непросто, они формулируются как некоторый запрос, представляющий из себя набор ключевых слов, характеризующий то, что ищет пользователь.

Помимо данной основной задачи, на сегодня системы поиска информации служат также следующим целям:

  • Вопросы моделирования;
  • Классификация документов;
  • Фильтрация документов;
  • Кластеризация документов;
  • Проектирование архитектур поисковых систем и пользовательских интерфейсов;
  • Извлечение информации, в частности аннотирования и реферирования документов;
  • Языки запросов.

Также, перед движками информационного поиска ставятся некоторые задачи по обработке естественных языков, что включает в себя морфологический анализ, разрешение лексической многозначности и так далее.

В общем случае поиск информации состоит из четырех этапов:

  • Определение (уточнение) информационной потребности и формулировка информационного запроса;
  • Определение совокупности возможных держателей информационных массивов (источников);
  • Извлечение информации из выявленных информационных массивов;
  • Ознакомление с полученной информацией и оценка результатов поиска

Основные виды поиска информации:

Полнотекстовый поиск — поиск по всему содержимому документа. Пример полнотекстового поиска — любой интернет-поисковик, например www.yandex.ru,www.google.com. Как правило, полнотекстовый поиск для ускорения поиска использует предварительно построенные индексы. Наиболее распространенной технологией для индексов полнотекстового поиска являются инвертированные индексы.

Поиск по метаданным — это поиск по неким атрибутам документа, поддерживаемым системой — название документа, дата создания, размер, автор и т. д. Пример поиска по реквизитам — диалог поиска в файловой системе (например, MS Windows).

Поиск изображений — поиск по содержанию изображения. Поисковая система распознает содержание фотографии (загружена пользователем или добавлен URL изображения). В результатах поиска пользователь получает похожие изображения. Так работают поисковые системы: Polar Rose, Picollator и др.

Одним из самых распространенных инструментов поиска данных является фильтрация. С помощью фильтров осуществляется выбор из базы данных тех записей, которые удовлетворяют требованиям пользователя. Фильтр — это условие, по которому производится поиск и отбор записей. Фильтрация позволяет взглянуть на объекты с разных сторон, отбросив лишнюю, не представляющую интереса для данного случая информацию. Таим образом, фильтрация данных - это отбор необходимой информации по определенным критериям - условиям запроса. В разрезе информационных технологий фильтрация данных чаще всего рассматривается на примере данных, представленных в виде двухмерных таблиц. С подобной точки зрения, фильтрация данных — это быстрый и простой способ найти подмножество данных и работать с ним в диапазоне ячеек или в столбце таблицы. В отфильтрованных данных отображаются только строки, соответствующие заданным условия, а ненужные строки скрываются. Можно также отфильтровать несколько столбцов.

2.5 Сортировка данных

Сортировка записей представляет собой упорядочивание элементов в списке. В сфере информационных технологий сортировка встречается повсеместно, в том числе при работе с записями в базах данных и двухмерных таблицах. В этом случае, Сортировка базы данных - это упорядочение записей по значениям одного из полей. Сортировка записей производится по какому-либо полю. Значения, содержащиеся в этом поле, располагаются в порядке возрастания или убывания. В процессе сортировки целостность записей сохраняется, т. е. строки таблицы перемещаются целиком.

При сортировке по возрастанию данные различных типов выстраиваются в следующем порядке:

  • Числа — от наименьшего отрицательного до наибольшего положительного числа;
  • Текст — в алфавитном порядке (числа, знаки, латинский алфавит, русский алфавит);
  • Дата и время — в хронологическом порядке. При сортировке по убыванию данные выстраиваются в порядке, обратном вышеуказанному.

В базах данных можно проводить вложенные сортировки, т. е. сортировать данные последовательно по нескольким полям. При вложенной сортировке строки, имеющие одинаковые значения в ячейках первого поля, будут упорядочены по значениям в ячейках второго поля, а строки, имеющие одинаковые значения во втором поле, будут упорядочены по значениям третьего поля.

2.6 Архивация данных

Архивация - это сжатие одного или более файлов с целью экономии памяти и размещение сжатых данных в одном архивном файле, уменьшение физических размеров файлов, в которых хранятся данные, без значительных информационных потерь.

Архивация проводится, в том числе, в следующих случаях:

  • Когда необходимо создать резервные копии наиболее ценных файлов;
  • Когда необходимо освободить место на диске;
  • Когда необходимо передать файлы по каналам с ограниченной пропускной способностью.

Возможность уплотнения данных основана на том, что информация часто обладает избыточностью, которая зависит от вида информации. Случайная потеря 10% фотографии, скорее всего, не повлияет на ее информативность. Если на странице книги отсутствует 10% строк, то понять ее содержание уже трудно. Если взять программный код, в котором утрачено 10% информации, то восстановить его, скорее всего, уже не удастся. У этих видов данных разная избыточность. Несмотря на то, что объемы внешней памяти ЭВМ постоянно растут, потребность в архивации не уменьшается. Это объясняется тем, что архивация необходима не только для экономии места в памяти, но и для надежного хранения копий ценной информации, а также для быстрой передачи информации по сети на другие ЭВМ. Кроме того, возможность отказа магнитных носителей информации, разрушающее действие вирусов заставляет пользователей делать резервное копирование ценной информации на другие (запасные) носители информации.

Процесс записи файла в архивный файл называется архивированием (упаковкой, сжатием), а извлечение файла из архива – разархивированием (распаковкой).

Упакованный (сжатый) файл называется архивом. Архив содержит оглавление, позволяющее узнать, какие файлы содержатся в архиве. В оглавлении архива для каждого содержащегося в нем файла хранится следующая информация:

  • Имя файла;
  • Сведения о каталоге, в котором содержится файл;
  • Дата и время последней модификации файла;
  • Размер файла на диске и в архиве;
  • Код циклического контроля для каждого файла, используемый для проверки целостности архива.

В настоящее время разработано много алгоритмов архивации без потерь. Однако все они используют, в основном, 2 простые идеи.

  • Метод Хаффмана (1952) – основан на учете частот символов. Часто встречающиеся символы кодируются короткими последовательностями битов, а более редкие символы – длинными последовательностями битов. К каждому сжатому архиву прикладывается таблица соответствия имеющихся символов и кодов, заменяющих эти символы.
  • Метод RLE (Run Length Encoding) – основан на выделении повторяющихся фрагментов. В сообщениях часто встречаются несколько подряд идущих одинаковых байтов, а некоторые последовательности байтов повторяются многократно. При упаковке такие места можно заменить командами вида: «повторить данный байт n раз» или «взять часть текста длиной k байт, которые встречалась m байтов назад». При упаковке графической информации чаще встречается первая ситуация, при упаковке текстов – вторая.

2.7 Преобразование данных

Преобразование данных, часто называемое конвертацией представляет собой преобразование данных из одного формата в другой, либо из одной структуры в другую, обычно с сохранением основного логически-структурного содержания информации. Преобразование данных часто связано с изменением типа носителя, например, книги можно хранить в обычной бумажной форме, но можно использовать для этого и электронную форму, и микрофотопленку. Необходимость в многократном преобразовании данных возникает также при их транспортировке, особенно если она осуществляется средствами, не предназначенными для транспортировки данного вида данных. В качестве примера можно упомянуть, что для транспортировки цифровых потоков данных по каналам телефонных сетей (которые изначально были ориентированы только на передачу аналоговых сигналов в узком диапазоне частот) необходимо преобразование цифровых данных в некое подобие звуковых сигналов, чем и занимаются специальные устройства - телефонные модемы.

Конвертация данных может происходить как при операциях с файлами (операции файл->файл), так и «на лету» (например при импорте или экспорте данных, или при операциях с использованием конвейеров).

2.8 Защита данных

Защита информации – это применение различных средств и методов, использование мер и осуществление мероприятий для того, чтобы обеспечить систему надежности передаваемой, хранимой и обрабатываемой информации.

Объект защиты – это такой компонент системы, в котором находится защищаемая информация. Элементом защиты является совокупность данных, которая может содержать необходимые защите сведения.

Защита информации включает в себя:

  • Обеспечение физической целостности информации, исключение искажений или уничтожения элементов информации;
  • Недопущение подмены элементов информации при сохранении ее целостности;
  • Отказ в несанкционированном доступе к информации лицам или процессам, которые не имеют на это соответствующих полномочий;
  • Приобретение уверенности в том, что передаваемые владельцем информационные ресурсы будут применяться только в соответствии с обговоренными сторонами условиями.

Процессы по нарушению надежности информации подразделяют на случайные и злоумышленные (преднамеренные). Источниками случайных разрушительных процессов являются непреднамеренные, ошибочные действия людей, технические сбои. Злоумышленные нарушения появляются в результате умышленных действий людей.

Проблема защиты информации в системах электронной обработки данных возникла практически одновременно с их созданием. Ее вызвали конкретные факты злоумышленных действий над информацией.

Важность проблемы по предоставлению надежности информации подтверждается затратами на защитные мероприятия. Для обеспечения надежной системы защиты необходимы значительные материальные и финансовые затраты. Перед построением системы защиты должна быть разработана оптимизационная модель, позволяющая достичь максимального результата при заданном или минимальном расходовании ресурсов. Расчет затрат, которые необходимы для предоставления требуемого уровня защищенности информации, следует начинать с выяснения нескольких фактов: полного перечня угроз информации, потенциальной опасности для информации каждой из угроз, размера затрат, необходимых для нейтрализации каждой из угроз.

Для обеспечения безопасности проводятся разные мероприятия, которые объединены понятием «система защиты информации».

Система защиты информации – это совокупность организационных (административных) и технологических мер, программно-технических средств, правовых и морально-этических норм, которые применяются для предотвращения угрозы нарушителей с целью сведения до минимума возможного ущерба пользователям и владельцам системы.

Организационно-административными средствами защиты называется регламентация доступа к информационным и вычислительным ресурсам, а также функциональным процессам систем обработки данных. Эти средства защиты применяются для затруднения или исключения возможности реализации угроз безопасности. Наиболее типичными организационно-административными средствами являются:

  • Допуск к обработке и передаче охраняемой информации только проверенных должностных лиц;
  • Хранение носителей информации, которые представляют определенную тайну, а также регистрационных журналов в сейфах, недоступных для посторонних лиц;
  • Учет применения и уничтожения документов (носителей) с охраняемой информацией;
  • Разделение доступа к информационным и вычислительным ресурсам должностных лиц в соответствии с их функциональными обязанностями.

Технические средства защиты применяются для создания некоторой физически замкнутой среды вокруг объекта и элементов защиты. При этом используются такие мероприятия, как:

  • Ограничение электромагнитного излучения через экранирование помещений, в которых осуществляется обработка информации;
  • Реализация электропитания оборудования, отрабатывающего ценную информацию, от автономного источника питания или общей электросети через специальные сетевые фильтры.

Программные средства и методы защиты являются более активными, чем другие применяемые для защиты информации в ПК и компьютерных сетях. Они реализуют такие функции защиты, как разграничение и контроль доступа к ресурсам; регистрация и изучение протекающих процессов; предотвращение возможных разрушительных воздействий на ресурсы; криптографическая защита информации.

Под технологическими средствами защиты информации понимаются ряд мероприятий, органично встраиваемых в технологические процессы преобразования данных. В них также входят:

  • Создание архивных копий носителей;
  • Ручное или автоматическое сохранение обрабатываемых файлов во внешней памяти компьютера;
  • Автоматическая регистрация доступа пользователей к различным ресурсам;
  • Выработка специальных инструкций по выполнению всех технологических процедур и др.

Правовые и морально-этические меры и средства защиты включают в себя действующие в стране законы, нормативные акты, регламентирующие правила, нормы поведения, соблюдение которых способствует защите информации.

3. Практическое применение операций над данными

Для иллюстрации различных операций над данными воспользуемся базой данных, схема которой состоит из  четырех таблиц:

Product(maker, model, type, date)

PC(code, model, speed, ram, hd, cd, price)

Laptop(code, model, speed, ram, hd, price, screen)

Printer(code, model, color, type, price)

Таблица Product представляет производителя (maker), номер модели (model), тип ('PC' - ПК, 'Laptop' - ПК-блокнот или 'Printer' - принтер) и дату занесения сведений в базу данных (date). Предполагается, что номера моделей в таблице Product уникальны для всех производителей и типов продуктов.

В таблице PC для каждого ПК, однозначно определяемого уникальным кодом – code, указаны модель – model (внешний ключ к таблице Product), скорость - speed (процессора в мегагерцах), объем памяти - ram (в мегабайтах), размер диска - hd (в гигабайтах), скорость считывающего устройства - cd (например, '4x') и цена - price.

Таблица Laptop аналогична таблице РС за исключением того, что вместо скорости CD содержит размер экрана -screen (в дюймах).

В таблице Printer для каждой модели принтера указывается, является ли он цветным - color ('y', если цветной), тип принтера - type (лазерный – 'Laser', струйный – 'Jet' или матричный – 'Matrix') и цена - price.

3.1 Сбор данных

Собранные данные необходимо внести в базу данных. Согласно стандарту ANSI, в языке манипулирования данными для этого используется оператор INSERT.

Добавим в таблицу Printer запись о цветном принтере с уникальным кодом 7, моделью 5607, неизвестным типом и ценой 450:

INSERT INTO LAPTOP (CODE, MODEL, COLOR, PRICE)

VALUES (7, 5607, Y, 450)

3.2 Удаление данных

Для удаления данных используется оператор DELETE. Команда DELETE удаляет из таблицы все записи, удовлетворяющие условию. Если условие WHERE не задано, то из таблицы удаляются все записи.

Команда DELETE возвращает количество удаленных записей.

Следует учитывать, что если в команде DELETE не задано условие WHERE, то команда возвратит 0, хотя записи были удалены.

Некоторые ключевые слова:

LOW_PRIORITY - Если указано это ключевое слово, то удаление записей из таблицы не будет произведено до тех пор, пока другие процессы не закончат чтение их этой таблицы.

QUICK - Если указано это ключевое слово, то при удалении записей обработчик таблицы не будет объединять индексы, что может ускорить операцию удаления.

LIMIT - Задает максимальное количество строк, которые могут быть удалены за текущий запрос.

Удалим запись о принтере с уникальным кодом 7 из таблицы Printer

DELETE FROM PRINTER

WHERE CODE=7

3.3 Поиск, фильтрация.

Для поиска и фильтрации используется оператор SELECT. Данный оператор позволяет очень гибко фильтровать и одновременно обрабатывать данные, в том числе и из разных таблиц и схем. Полный синтаксис SELECT очень сложен.

Основные атрибуты и ключевые слова:

WHERE  - основной фильтр по записям;

GROUP BY - объединение записей с одинаковыми значениями в определенном поле;

HAVING - условие, прилагаемое к сгрупированным записям;

ORDER BY - сортировка по возрастанию/убыванию по определенному полю.

Для обработки данных в запросе могут быть использованы агрегатные функции:

COUNT определяет количество строк или значений поля, выбранных посредством запроса и не являющихся NULL-значениями;

SUM вычисляет арифметическую сумму всех выбранных значений данного поля;

AVG вычисляет среднее значение для всех выбранных значений данного поля;

МАХ вычисляет наибольшее из всех выбранных значений данного поля;

MIN вычисляет наименьшее из всех выбранных значений данного поля.

Найдем для каждого производителя, выпускающего ПК-блокноты c объёмом жесткого диска не менее 10 Гбайт, скорости таких ПК-блокнотов, выведем производителя и скорость

SELECT DISTINCT PRODUCT.MAKER, LAPTOP.SPEED

FROM PRODUCT JOIN

LAPTOP ON LAPTOP.MODEL=PRODUCT.MODEL

WHERE LAPTOP.HD>=10

Найдем среднюю скорость ПК, выпущенных производителем A.

SELECT AVG(SPEED) FROM

PRODUCT JOIN PC

ON PRODUCT.MODEL=PC.MODEL

WHERE MAKER='A'

Фильтрация данных

Фильтрация данных осуществляется с помощью оператора ORDER BY.

Функции данного оператора:

  • Упорядочение результирующего набора запроса по заданному списку столбцов и (дополнительно) ограничение числа возвращаемых строк указанным диапазоном. Порядок, в котором строки возвращаются в результирующем наборе, не гарантируется, если не указано предложение ORDER BY.
  • Определение порядка, в котором значения ранжирующей функции применяются к результирующему набору.

Найдем номер модели, скорость и размер жесткого диска ПК, имеющих 12x или 24x CD и цену менее 600 дол., и расположим результаты в порядке убывания стоимости

SELECT DISTINCT MODEL,SPEED, HD

FROM PC

WHERE PRICE <600 AND (CD='12X' OR CD='24X')

ORDER BY PRICE

3.4 Преобразование данных

В SQL преобразование данных может быть явного и неявного типа: при явном преобразовании в коде указывается, в какой тип данных преобразовываются данные и в какой формат. При неявном преобразовании СУБД самостоятельно распознает разницу в форматах и типах данных и преобразует данные.

Найдем производителей ПК с процессором не менее 450 Мгц и занесенных в базу до 01.01.2015. Выведем только производителя.

SELECT DISTINCT MAKER

FROM PRODUCT JOIN PC

ON PC.MODEL=PRODUCT.MODEL

WHERE SPEED >='450' AND

DATA<TO_DATE(‘01.01.2015’, ‘DD.MM.YY’)

Заключение

Список литературы

  • Большой энциклопедический словарь/под ред. А. М. Прохорова – 2 изд. – Москва: Научное издательство Большая Российская энциклопедия, 1997 – 1456 с.
  • Интернет-портал «Programmer.ru» [Электронный ресурс] - Понятие информации, данных, знаний – режим доступа: http://the-programmer.ru/publ/informatika/informatika/ponjatie_informacii_dannykh_znanij/13-1-0-29, свободный.
  • И.Г. Гниденко, С.А. Соколовская. Информатика – Санкт-Петербург: Издательский дом «Нева», 2004. – 234 с.
  • Симонович С.В. Информатика, базовый курс, учебник для вузов. –3-е изд. Стандарт третьего поколения – Санкт-Петербург: Питер, 2011. – 640 с.
  • Информационно-познавательный журнал Виктория [Электронный ресурс] – Курс лекций «Основы информатики» – режим доступа: http://victoria.lviv.ua/html/informatika, свободный.
  • Воройский Ф.С. Информатика. Новый систематизированный толковый словарь – 3-е изд., перераб. и доп. – М.: ФИЗМАТЛИТ, 2003. — 760 с.
  • Попова О.В. Информатика, учебное пособие - Красноярск: Красноярский институт экономики Санкт-Петербургской академии управления и экономики (НОУ ВПО), 2007. — 186 с.