Автор Анна Евкова
Преподаватель который помогает студентам и школьникам в учёбе.

Реферат на тему: Информационные технологии распознавания изображений

Реферат на тему: Информационные технологии распознавания изображений

Содержание:

Введение

Любая организованная деятельность основана на информации. Отличительной особенностью информационных ресурсов является их универсальность, поскольку они необходимы в любой сфере деятельности человека. Поэтому в наши дни на первый план выходит информатизация общества. Информационные технологии внедряются во все сферы общественной жизни. Объем информации, необходимой человеку в повседневной работе, постоянно растет, структура и организация данных усложняются. Поэтому в жизни современных людей использование компьютерных технологий становится не роскошью, а необходимостью, без которой функционирование многих объектов и систем становится крайне затруднительным, а зачастую даже невозможным.     

Искусственный интеллект - это раздел информатики, посвященный моделированию интеллектуальной деятельности человека. Задачи, решаемые методами искусственного интеллекта, характеризуются достаточно сложной формализуемостью. 

Одним из основных направлений искусственного интеллекта является разработка интеллектуальных информационных систем или систем, основанных на знаниях. Основная цель построения таких систем - выявление, исследование и применение знаний высококвалифицированных специалистов для решения сложных проблем, возникающих на практике. Альтернативой предыдущему как в идеологическом, так и в практическом плане считается направление, использующее нейросетевые и нейрокомпьютерные технологии. Искусственные нейронные сети и нейрокомпьютеры во многом заимствуют принципы человеческого мозга. Существует довольно большое количество направлений, в которых ведутся активные и многочисленные исследования в области искусственного интеллекта: разработка интерфейсов естественного языка и машинный перевод, генерация и распознавание речи, обучение и самообучение, игры и машинное творчество, новые компьютерные архитектуры, интеллектуальные роботы и распознавание образов. Распознавание образов включает в себя широкий спектр задач: распознавание изображений, символов, текстов, запахов, звуков, шумов.     

Данная работа представляет собой анализ ситуации, касающейся проблемы распознавания графических изображений, а также разработки на них системы распознавания символов.

Постановка проблемы и технико-экономическое обоснование

Распознавание образов (предметов, сигналов, ситуаций, явлений или процессов) - пожалуй, самая распространенная задача, которую человеку приходится решать чуть ли не каждую секунду с первого до последнего дня своего существования. Для решения этой задачи человек использует огромные ресурсы своего мозга, включающие одновременно около 10-12 миллиардов нейронов. Это то, что позволяет людям мгновенно узнавать друг друга, читать печатные и рукописные тексты на высокой скорости, безошибочно управлять автомобилем в сложном транспортном потоке, отбраковывать детали, решать коды, древнеегипетскую клинопись и т. д.  

Распознавание - это задача преобразования входной информации, в качестве которой целесообразно рассматривать некоторые параметры, особенности распознанных шаблонов, в выходные данные, которые являются выводом о том, к какому классу принадлежит распознанный шаблон.

В повседневной жизни человек настолько легко справляется с задачами узнавания, что это воспринимается как должное. Между тем попытки смоделировать эти высокоинтеллектуальные функции на компьютере наталкиваются на очень серьезные трудности. 

В настоящее время наибольшие успехи достигнуты в распознавании печатных знаков. Широкое распространение получили известные программы распознавания текстовой информации Fine Reader и CuneiForm. Функции обнаружения и распознавания военных целей противника давно встроены в бортовые компьютеры самолетов, ракет, кораблей и подводных лодок. Распознавание образов также играет важную роль в создании технического зрения для интеллектуальных роботов.   

В целом проблему распознавания можно разделить на две части: обучение и распознавание. Обучение проводится путем показа отдельных предметов с указанием их принадлежности к тому или иному классу. В результате обучения система распознавания должна приобрести способность одинаково реагировать на все объекты одного класса и по-разному - на все объекты разных классов. В случае обучения можно действовать с позиции перебора: ввести в компьютер как можно больше известных паттернов-шаблонов и сравнить с ними неизвестные паттерны, поступающие на вход системы для распознавания. На первый взгляд этот путь кажется перспективным, но рассмотрим систему светочувствительных элементов - 32x48 (1536 элементов), с помощью которых визуальный образ будет считываться для распознавания. Современные матрицы светочувствительных элементов имеют более продвинутые технические характеристики - до 10 мегапикселей, то есть до 10 миллионов элементов. Рассматриваемая система имеет значительно меньшее количество элементов, но даже на такой грубой сетке можно воспринимать около 10460 возможных изображений. Происходит комбинаторный взрыв. Хранить в памяти такое количество шаблонных изображений и сравнивать с ними поступающие изображения невозможно, по крайней мере, для современных технических средств. Поэтому на практике системы распознавания на первом этапе обязательно обрабатывают изображение и выделяют характерные черты, качественные или количественные. Таким образом, количество информации для распознавания значительно сокращается. Одна из центральных задач распознавания - выбор начального описания объекта: геометрический или структурный подход. Геометрический основан на различии форм предметов. Структурный подход основан на анализе элементов объекта. В этом случае в первую очередь идентифицируются фрагменты всех предметов и характеристики их взаимного расположения. Все это формирует исходную базу данных - словарь, позволяющий строить различные гипотезы. Из них выбираются наиболее значимые для данного конкретного случая, а затем выполняется описание одного изображения объектов, которое используется для идентификации других объектов.                      

Сложная проблема распознавания образов требует разработки гибкой системы распознавания, которая могла бы классифицировать любой узор на изображении. Цели данной работы - попытка разработать такую ​​систему с использованием как хорошо известных инструментов, так и новых, недавно разработанных; воплотить разработанную систему в программном продукте. Результатом исследовательской работы должен стать прототип программного средства, позволяющего анализировать и тестировать различные подходы к решению поставленной задачи.   

Назначение и сфера применения разработанного инструмента

Разработанная интеллектуальная система предназначена для распознавания объектов на графических изображениях.

Система может быть использована в различных сферах человеческой деятельности. Например, при разработке интеллектуальных роботов, в системах видеонаблюдения и слежения, системах автомобильной навигации и других системах, где требуется визуальное распознавание. Такая система также может служить качественной основой для дальнейших исследований в области нейротехнологий и при доработке может использоваться не только для распознавания зрительных образов, но и других.  

В рамках этого проекта разрабатывается программный инструмент, работающий под управлением операционной системы Microsoft Windows XP Professional. Этот программный инструмент может работать в других операционных системах семейства Windows NT. С небольшими изменениями его можно перекомпилировать для Windows, не относящейся к семейству NT, например Windows 98, как написано в Delphi 7. При необходимости его можно портировать на Linux.    

Эта разработка может быть использована как базовая для дальнейших исследований.

Обоснование показателей эффективности проделанной работы.

Технико-экономическое обоснование разработки

Разработанная система имеет следующие преимущества.

Система будет использоваться с одной из самых распространенных операционных систем Windows XP. Эти системы обладают высоким уровнем безопасности и стабильности. Разработанный программный инструмент дополняет набор существующих инструментов данной операционной системы.  

Нейронная сеть анализирует информацию и дает возможность оценить, соответствуют ли данные характеристикам, которые ее научили распознавать. В то время как степень соответствия представления нейронной сети может достигать 100%, надежность выбора полностью зависит от качества системы при анализе примеров поставленной задачи (так называемое обучение). 

Наличие исходных кодов разработанного программного средства позволяет проводить его дальнейшее совершенствование и изучение с точки зрения постановки учебного процесса с минимальными затратами.

В реальных системах его можно использовать для:

  • обнаружение на изображении объектов, интересных с точки зрения поставленной задачи;  
  • классификация объектов;  
  • контроль за перемещением объектов или изменением формы объекта;  
  • отслеживание степени удаленности объекта.  

Экономическое обоснование 

На данный момент создание программного обеспечения для распознавания изображений находится на стадии исследований и тестирования. На момент написания этой статьи не было информации о существовании реально работающих систем подобного рода. В любом случае стоимость коммерческих систем такого типа при их появлении будет составлять десятки тысяч долларов, а разработка такой системы потребует значительного времени. Данная разработка, в случае доработки и отсутствия таких систем, претендует на звание реального сектора рынка интеллектуальных информационных систем.   

Разрабатываемая система может быть использована как для изучения различных аспектов использования искусственного интеллекта для распознавания образов, так и в качестве системы распознавания визуальных образов.

Было проведено технико-экономическое обоснование и показаны преимущества разработки такой системы.

Обзор существующих методов решения

Обзор текущей ситуации в развитии средств распознавания образов.

Несмотря на долгое время, потраченное на исследования в области искусственного интеллекта, на данный момент не существует оптимальных методов однозначного решения проблемы распознавания образов. Это направление находится на стадии исследований и разработок. Многие компании и исследовательские институты вкладывают большие средства в решение этой проблемы. Все успехи относятся к категории ноу-хау, стоят больших денег и не являются достоянием общественности. Нет известных систем, которые успешно работают. Также нет широко доступных компонентов и модулей для прикладных программистов.     

В настоящее время наибольшие успехи достигнуты в распознавании визуальных образов, таких как печатные символы. Нет сомнений в полезности известных программ распознавания текста - FineReader и CuneiForm. Распознавание персонажей по их графическому изображению - одна из самых старых и традиционных задач искусственного интеллекта. Еще в 1960-1970-е гг. Написаны десятки диссертаций и предложены сотни методов решения этой проблемы. Однако только теперь, когда сканеры и компьютеры стали общедоступными, распознавание символов получило полное практическое применение.     

Сегодня системы распознавания текста являются важной частью большинства технологий хранения и обработки документов.

Обзор существующих подходов к процессу признания

Выделяют 4 группы методов распознавания.

Сравнение с образцом. В этом случае применяется геометрическая нормализация и учитывается расстояние до прототипа. Наиболее очевидное применение этого метода - распознавание текста. Допустим, у нас есть изображение отсканированного символа и набор образцов изображений (все буквы алфавита). Необходимо определить, какая буква алфавита соответствует отсканированному изображению. Решение сводится к масштабированию символа до размера выборки и сопоставлению с каждой выборкой. Выбирается образец, расстояние до которого минимальное (т.е. максимальный подобный символ).      

Статистические методы. Распределение строится для каждого класса и классифицируется в соответствии с правилом Байеса. Распределение можно построить с помощью обучающей коллекции. Учебный сборник - набор объектов, для которых известны их изображения. Например, коллекция аудиозаписей для каждого звука или коллекция изображений каждой буквы алфавита. Правило Байеса гласит: Пусть даны два распределения A, B и значение X, порожденное одним из этих распределений. Задача состоит в том, чтобы определить, какое из этих распределений привело к значению X.      

Нейронные сети. Выбирается тип нейронной сети (более подробно описывается в следующих главах) и настраиваются коэффициенты. На сетевой вход подается узнаваемое изображение. Первый слой содержит группу рецепторов, каждый из которых отвечает за получение своего характерного свойства распознаваемых объектов. Последний слой содержит группу эффекторов, каждый из которых соответствует одному из изображений. Выбирается один из эффекторов с максимальным значением.     

Настройка коэффициентов - это этап обучения. На этом этапе коэффициенты настраиваются так, чтобы алгоритм корректно работал на образцах. Чем больше выборка входных данных, то есть выборки, тем больше вероятность того, что алгоритм примет правильное решение по остальным данным.   

Структурные и синтаксические методы. Объект разбирается на элементы. Правило строится в зависимости от наличия / отсутствия отдельных элементов и их последовательностей.    

Выбор общей модели функционирования программного обеспечения

В то время как потребность в системах, способных точно идентифицировать изображения, в том числе визуальные, растет, в настоящее время нет подходящей альтернативы системам распознавания, основанным на комбинации методов, которые нейтрализуют существующие недостатки.

Один из важных подходов к проблеме предполагает использование разделяющих функций. В условиях, когда у нас мало априорной информации об узнаваемых образцах, при построении системы распознавания лучше всего использовать процедуру обучения. Высокая сложность задачи, большой объем входных данных требует гибкой системы безопасности, способной анализировать огромный объем информации нетрадиционным способом. Система распознавания на основе нейронных сетей может решить многие проблемы в будущем.   

Преимущества нейросетевых систем распознавания образов

Первое преимущество использования нейронных сетей для обнаружения вторжений - это гибкость, которую обеспечивают эти сети. Нейронная сеть способна анализировать данные, даже если эти данные неполные или искаженные, имеет возможность анализировать данные в нелинейном режиме. Более того, возможность обработки данных из большого количества источников в нелинейном режиме особенно важна, поскольку некоторые изображения имеют довольно сложную структуру. А в будущем есть возможность обработки по нескольким значимым параметрам. Поскольку проблема распознавания требует достаточной производительности компьютера, скорость обработки в нейронной сети может быть достаточной для решения в реальном времени, которое может использоваться в динамических системах, в которых требуется распознавание и классификация любых образов.      

Характерно, что выходные данные нейронной сети выражаются в виде вероятности, нейронная сеть предоставляет возможность прогнозирования (предсказания). Система обнаружения вторжений, основанная на нейронной сети, определяет вероятность того, что одно событие или серия событий указывают на параметры изображения, которые могут быть отнесены к определенному классу, независимо от разницы между представленным изображением и изображением, хранящимся в база данных. По мере того, как нейронная сеть набирается опыта, она улучшит свою способность определять класс изображения. Однако наиболее важным преимуществом нейронных сетей является способность нейронных сетей узнавать новые характеристики и параметры изображений и выявлять элементы, не похожие на те, что наблюдались ранее.     

Нейронную сеть можно обучить распознавать известные классы шаблонов с высокой степенью точности. Хотя это очень ценная способность, поскольку некоторые классы имеют ряд постоянных атрибутов, которые можно использовать для точного определения принадлежности к классу, сеть также может использовать эти знания для определения классов, которые не соответствуют характеристикам предыдущих изображений. 

Заключение

В ходе этой работы был создан прототип программного инструмента, который выполняет автоматическое обнаружение вторжений посредством анализа файлов системного журнала.

Разработаны и обоснованы основные принципы построения данного типа программного обеспечения, определены основные направления дальнейшего совершенствования. В процессе разработки было применено значительное количество оригинальных методик и качественно новых решений, некоторые из которых основаны на базовых концепциях современных интеллектуальных систем. 

Также был проведен тщательный анализ текущей ситуации в развитии средств обнаружения атак и существующих подходов к обнаружению атак в целом.

Список литературы

  1. Ф. Вассерман, Нейрокомпьютерная инженерия, М., Мир, 1999
  2. Розенблатт Ф. Принципы нейродинамики. Москва: Мир. 1968
  3. Минский М.Л., Пайперт С. Персепроны. Москва: Мир. 1977     
  4. Итоги науки и техники: физико-математические модели нейронных сетей, том 1 - М.: ВИНИТИ, 1997
  5. Нейронные сети. STATISTICA Neural Networks: Пер. с англ. - М.: Горячая линия-Телеком, 2000
  6. С.А. Терехов. Лекции по теории и приложениям искусственных нейронных сетей - Снежинск, Лаборатория искусственных нейронных сетей НТО-2, ВНИИТФ 2000
  7. Осовский С. Нейронные сети для обработки информации.: Пер. от польского И.Д. Рудинского. - М.: Финансы и статистика, 2011   
  8. Ясницкий Л.Н. Введение в искусственный интеллект: Учебник. Пособие для студентов. выше. изучение. учреждений - М.: Издательский центр Академия, 2014