На бирже курсовых и дипломных проектов можно найти образцы готовых работ или получить помощь в написании уникальных курсовых работ, дипломов, лабораторных работ, контрольных работ, диссертаций, рефератов. Так же вы мажете самостоятельно повысить уникальность своей работы для прохождения проверки на плагиат всего за несколько минут.

ЛИЧНЫЙ КАБИНЕТ 

 

Здравствуйте гость!

 

Логин:

Пароль:

 

Запомнить

 

 

Забыли пароль? Регистрация

Повышение уникальности

Предлагаем нашим посетителям воспользоваться бесплатным программным обеспечением «StudentHelp», которое позволит вам всего за несколько минут, выполнить повышение уникальности любого файла в формате MS Word. После такого повышения уникальности, ваша работа легко пройдете проверку в системах антиплагиат вуз, antiplagiat.ru, etxt.ru или advego.ru. Программа «StudentHelp» работает по уникальной технологии и при повышении уникальности не вставляет в текст скрытых символов, и даже если препод скопирует текст в блокнот – не увидит ни каких отличий от текста в Word файле.

Результат поиска


Наименование:


реферат Приложения для автоматического распознавания текста

Информация:

Тип работы: реферат. Добавлен: 02.06.2012. Сдан: 2010. Страниц: 8. Уникальность по antiplagiat.ru: < 30%

Описание (план):


Федеральное агентство по образованию
Федеральное государственное образовательное  учреждение
Среднего  профессионального образования
«Волгоградский  технологический колледж» 
 
 
 
 
 

Кафедра «Дизайн» 
 

Реферат 

По  дисциплине: «Мультимедиа»
На  тему: «Приложения для автоматического распознавания текста» 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Выполнила
студентка группы Р-4-1:
Рожок Н.В.
Проверил преподаватель:
Данилькевич А.В. 
 
 
 
 
 

Волгоград – 2010
Содержание 

Введение…………………………………………………………………………..3
I. Программы для распознавания текстов………………………………………5
II. ABBYY  FineReader………………………………………….………………..6
1. Различие  версий в семействе FineReader 8.0………………………………...6
2.  Возможности ABBYY FineReader 8.0 Professional…………………………7
3. Интерфейс программы ABBYY FineReader 8.0……………………………..9
4. Дополнительные сведения. Сегментация текста на этапе распознавания…..12
III. CuneiForm …………………………………………………………………...14
1. Особенности  CuneiForm……………………………………………………...14
IV. Cсравнительный  анализ программ для распознавания текста…………..15
1. Скорость и  качество………………………………………………………….16
2. Таблицы  ………………………………………………………………………18
3. Блоки…………………………………………………………………………..19
4. Распознавание  цвета………………………………………………………….20
V. Заключение…………………………………………………………………...23
VI. Список используемой литературы…………………………………………24 
 
 
 
 
 
 
 
 
 
 
 

Введение 

    В практической деятельности часто встречаются ситуации, когда необходимо перевести в электронный вид документ, напечатанный на бумаге. В этом случае можно просто набрать документ на компьютере, что довольно трудно, либо воспользоваться сканером — устройством, специально предназначенным для перевода документов в электронный вид. Для организации сканирования изображения помимо непосредственно сканера требуется одна из специальных программ систем оптического распознавания текста.
Системы оптического распознавания текста (Optical Character Recognition — OCR-системы) предназначены для автоматического ввода печатных документов в компьютер.
Современные программы распознавания текста не только ошибаются реже, чем живой человек, но и обеспечивают проверку орфографии, автоматическое форматирование текста и массу других дополнительных удобств.
Последние годы ведущие позиции на российском рынке «распознавалок» удерживают программы FineReader и CuneiForm. Несмотря на свои замысловатые названия, обе программы отечественного производства вполне хорошего качества. По своим возможностям и сервису они примерно равноценны. Рассмотрим возможности и технологический процесс внимательнее.
   
 
 
 
 
 
 
 
 

    Основным методом перевода бумажных документов в электронную форму является сканирование. Сканирование — это технологический процесс, в результате которого создается графический образ бумажного документа. Существует несколько разных видов сканеров, но в их основе лежит один и тот же принцип. Документ освещается светом от специального источника, а отраженный свет воспринимается светочувствительным элементом. Минимальный элемент изображения интерпретируется сканером как цветная (или серая) точка. Таким образом, в результате сканирования документа создается графический файл, в котором хранится растровое изображение исходного документа. Растровое изображение состоит, как известно, из точек. Количество точек определяется как размером изображения, так и разрешением сканера.
    После обработки документа сканером получается графическое изображение документа (графический образ). Но графический образ еще не является текстовым документом. Человеку достаточно взглянуть на лист бумаги с текстом, чтобы понять, что на нем написано. С точки зрения компьютера, документ после сканирования превращается в набор разноцветных точек, а вовсе не в текстовый документ.
Проблема  распознавания текста в составе  точечного графического изображения является весьма сложной. Подобные задачи решают с помощью специальных программных средств, называемых средствами распознавания образов. Реальный технический прорыв в этой области произошел лишь в последние годы. До этого распознавание текста было возможно только путем сравнения обнаруженных конфигураций точек со стандартным образцом (эталоном, хранящимся в памяти компьютера). Авторы программ задавали критерий «похожести», используемый при идентификации символов.
    Подобные системы назывались OCR  (Optical Character Recognition — оптическое распознавание символов) и опирались на специально разработанные шрифты, облегчавшие такой подход. Если приходилось сталкиваться с произвольным и, тем более, сложным шрифтом, программы такого рода начинали давать серьезные сбои.
    Современные научные достижения в области распознавания образов буквально перевернули представление об оптическом распознавании символов. Современные программы вполне могут справляться с различными (и весьма вычурными) шрифтами без перенастройки. Многие распознают даже рукописный текст. 

I. Программы для распознавания текстов 

    Поскольку потребность в распознавании текста отсканированных документов достаточно велика, неудивительно, что имеется значительное число программ, предназначенных для этой цели. Так как разные научные методы распознавания текста развивались независимо друг от друга, многие из этих программ используют совершенно разные алгоритмы.
    Эти алгоритмы могут давать  разные результаты на разных  документах. Например, упоминавшиеся  выше системы OCR способны распознавать  только стандартный специально подготовленный шрифт и дают на этом шрифте наилучшие результаты, которые не может превзойти ни одна из более универсальных программ.
    Современные алгоритмы распознавания  текста не ориентируются ни  на конкретный шрифт, ни на  конкретный алфавит. Большинство  программ способно распознавать текст на нескольких языках. Одни и те же алгоритмы можно использовать для распознавания русского, латинского, арабского и других алфавитов и даже смешанных текстов. Разумеется, программа должна знать, о каком алфавите идет речь. 

    Нас, прежде всего, интересуют программы, способные распознавать текст, напечатанный на русском языке. Такие программы выпускаются отечественными производителями. Наиболее широко известны и распространены программы Fine Reader и CuneiForm. 

II. ABBYY  FineReader 

    Одной из популярных программ оптического распознавания текстов является программа FineReader, созданная компанией ABBYY Software House.
FineReader — омнифонтовая система оптического распознавания текстов. Это означает, что она позволяет распознавать тексты, набранные практически любыми шрифтами. Особенностью программы FineReader является высокая точность распознавания и малая чувствительность к дефектам печати, что достигается благодаря применению технологии «целостного целенаправленного адаптивного распознания».
    Программа ABBYY FineReader - один из немногих качественных пакетов для распознавания текстов (OCR) и практически единственный, действительно хорошо поддерживающий кириллицу. Каждая новая версии данной утилиты всегда демонстрировала более качественное и быстрое распознавание текстовых документов с несложными таблицами.  

1. Различие версий  в семействе FineReader 8.0 

    Линейка продуктов ABBYY FineReader 8.0 включает в себя пять различных версий программы. Друг от друга их отличает способ распространения, возможности и, естественно, цена.
    ABBYY FineReader 8.0 Sprint - упрощенная версия программы, поставляется в комплекте со многими новыми сканерами и МФУ. Стоит отметить, что, даже сегодня купив новый сканер, в комплекте с ним может поставляться устаревшая версия программы (к примеру, 5.0). Эта проблема решается обновлением через Интернет.
    ABBYY FineReader 8.0 Home Edition - немного упрощенная, если сравнивать с Professional, версия программы. Предназначена, прежде всего, для домашнего использования. Данная версия программы способна распознавать несложные документы и простенькие таблицы. Результат распознавания можно сохранять в распространенные форматы документов.
Самая интересная версия программы - ABBYY FineReader 8.0 Professional Edition обладает наибольшим количеством функций и нововведений по сравнению с программами, вышедшими до восьмой редакции. Далее, в статье будет рассматриваться именно FineReader 8.0 Professional. Поэтому, описание этой программы выведено в отдельный подраздел данного реферата.
    ABBYY FineReader 8.0 Corporate Edition - корпоративная версия программы. Она предназначена для использования в локальной сети в полиграфических и издательских организациях, а также других компаниях, активно работающих с текстовыми документами/таблицами. Программа обладает мощными возможностями для работы в локальной сети.
    ABBYY FineReader XIX - уникальная разработка компании. Обладает возможностями Corporate Edition, а также способна распознавать старинные европейские шрифты. Программа способна распознавать такие шрифты, как Fraktur, Schwabacher и большое количество готических шрифтов с учетом особенностей орфографии и мифологии того времени. Цена на данную версию FineReader не известна, так как эти по истине уникальная разработка, и каждый ее покупатель тоже будет уникальным. 

2.  Возможности ABBYY FineReader 8.0 Professional 

   Часто случаются ситуации, когда нужно ввести и распознать большой объем текста со сканера или МФУ в компьютер. Подобные задачи востребованы переводчиками, редакторами изданий, студентами... FineReader способен распознавать изображения с минимальным качеством от 200 точек на дюйм. Так, отныне на ввод в ПК одной страницы формата А4 уйдет не более минуты, а в высокоскоростных сканерах - менее 30 секунд. Стоит отметить, что снижение требований к качеству изображений позволяет программе без особых трудностей распознавать текст со снимков фотокамеры (начиная от двух мегапикселей).
   Подпрограмма для обучения пользователей, интеграция с последними версиями Microsoft Word, и подпрограмма для распознавания текста со скриншотов вашего монитора значительно облегчит работу по распознаванию текста. Встроенная подпрограмма «обучение на примерах» научит работать с FineReader любого пользователя, не знакомого ранее с этой программой. На выбор вам предоставляется множество готовых примеров работы с разными типами документов и изображений: простое письмо, многоязычный документ, книжный разворот, факс, газета, PDF-документ, таблица, визитная карточка и т.д. Кроме того, вы найдете множество полезных советов по разнообразным задачам, с которыми справляется FineReader. Для «непосвященных» предусмотрен раздел «быстрое знакомство».
    Screenshot Reader - поставляемая вместе с FineReader программа (в демоверсии - недоступна), предназначенная для распознавания текста со снимков экрана вашего монитора. Работает она по простому принципу: сначала выполняется снимок с экрана (данная процедура - аналог действия клавиши PrintScreen), послу чего FineReader «поднимает" это изображение из буфера обмена и распознает тексты, таблицы и другие стандартные объекты документов. То же самое можно сделать и вручную, но Screenshot Reader позволяет значительно сэкономить время. О востребованности подпрограммы можно спорить, но бесполезной ее назвать нельзя. Во-первых, она значительно экономит время, во-вторых, это один из немногих способов "достать" исходный текст защищенных текстовых файлов и документов. 
 
 
 

3. Интерфейс программы  ABBYY FineReader 8.0 

   Стартует программа с предложения - ввести документ с помощью Мастера Scan&Read, запустить обучающее приложение или показать работу пакета в демонстрационном режиме. Демо-пример, стоит отметить, отличный способ ознакомиться с принципом работы пакета для новичков.
   Окно программы содержит строку меню, ряд панелей инструментов и рабочую область. 

     

     Рисунок 1 – Порядок распознавания текстовых  документов 

   Преобразование бумажного документа в электронный происходит поэтапно или автоматически. Для автоматической работы используется инструмент Scan&Read. 

   Поэтапное распознавание:
   Первый этап работы – сканирование.
   Если документ был уже отсканирован ранее, его открывают. Если изображение находится на бумажном носителе, то на первом этапе выбирают действие сканировать.
   Программа FineReader использует для сканирования устройство, заданное по умолчанию. По завершении процесса сканирования полученное графическое изображение автоматически выгружается в рабочую область программы FineReader. 

     

     Рисунок 2 - Программа FineReader 

   Второй этап – распознавание текста. 

   Прежде чем включать текст в документ, он разбивается на блоки, содержащее цельные фрагменты. Эту операцию программа может выполнить автоматически, хотя разбиение не всегда проходит удачно.
    Границы и типы блоков можно устанавливать вручную. Эту возможность мы рассмотрим чуть позже.
   Процесс распознавания отображается в специальном информационном окне: 
 
 
 
 

    - Полученный текст помещается в окно «Текст». 


     Рисунок 3 – Тестовое окно FineReader 

   Третий этап - проверка. 

   На данном этапе программа выполняет поиск ошибок распознавания. FineReader выделяет цветом те символы, которые она сама рассматривает как неоднозначно опознанные.
   С помощью диалогового окна Проверка можно отредактировать нераспознанные символы. 

     

     Рисунок 4 –Процесс распознавания 

   Если вариант интерпретации программы верный нажимаем кнопку Пропустить.
    В случае обнаружения символов неверно распознанных программой ошибки исправляют вручную и фиксируют исправления нажатием кнопки Подтвердить. 

   Четвёртый этап – сохранение текста. 

   Программа FineReader предусматривает возможность прямой передачи полученного текста в Word:
    Сохранение текстового документа выполняют в программе Word. 

4. Дополнительные сведения. Сегментация текста на этапе распознавания. 

   При автоматической сегментации программа разбивает отсканированный документ на блоки различных типов: текстовые, графические и т. д.
   Если исходный текст содержит рисунки, подрисуночные подписи, таблицы, примечания и другие элементы, автоматическое распознавание текста может пройти неудачно.
   В таких случаях границы блоков указывают вручную. Для этого используют кнопки специальной панели инструментов Изображение.
       

     Рисунок 5 – Настройка изображения
 

  Кнопки панели инструментов Изображение соответствуют различным типам блоков.
    Блоки выделяются прямоугольными рамками различных цветов. Чтобы выделить блок необходимо:
     1. Выбрать соответствующую кнопку панели инструментов;
     2. Протягиванием определить границы блока.
  Анализ макета страницы - выполняет автоматическое разбиение на блоки.
   Выделить зону распознавания – позволяет выбрать щелчком мыши тот или иной блок, если автоматическое разбиение на блоки уже выполнено, и определить зону для автоматического разбиения методом протягивания, если оно ещё не выполнено.
   Выделить блок Текст. Удаление блока. Выделить блок Таблица. Выделить блок Картинка. Ластик - удаляет фрагмент отсканированного документа. Обрезка - позволяет вырезать любой фрагмент документа. 

5. Вывод
   Безусловно, FineReader 8.0 - лучший пакет для распознавания текстов. По крайней мере, для распознавания кириллицы пока ничего лучшего не придумали. 179 языков, доступных для распознавания, 20% из которых обладают словарями, возможность проверки орфографии после распознавания текста, новая возможность распознавания изображений низкого качества - все это содержит в себе новая версия пакета FineReader.
   О недостатках программы можно было бы говорить только в случае, если бы у нее были достойные конкуренты. А за неимением таковых, почти монопольный статус программы от ABBYY ставит ее в категорию лучших. Так что, можно считать, что явных недостатков в программе нет. 
 
 
 

III. CuneiForm  

   CuneiForm (англ. Клинопись) — свободно распространяемая открытая система оптического распознавания текстов российской компании Cognitive Technologies.
   Первоначально система CuneiForm была  разработана компанией Cognitive Technologies как коммерческий продукт. CuneiForm поставлялся с некоторыми моделями сканеров. Однако после нескольких лет перерыва разработки, 12 декабря 2007 года анонсировано открытие исходных текстов программы, которое состоялось 2 апреля 2008 года 

1. Особенности CuneiForm
   CuneiForm позиционируется как система преобразования электронных копий бумажных документов и графических файлов в редактируемый вид с возможностью сохранения структуры и гарнитуры шрифтов оригинального документа в автоматическом или полуавтоматическом режиме. Система включает в себя две программы для одиночной и пакетной обработки электронных документов.
   CuneiForm — Шрифтонезависимая система.
OCR CuneiForm может распознавать любые полиграфические,  машинописные гарнитуры всех начертаний и шрифты, получаемые с принтеров за исключением декоративных и рукописных. В систему встроены специальные алгоритмы для распознавания текста с матричного принтера, плохих ксерокопий факсов и машинописи.  
 
 
 
 
 

IV. Cсравнительный  анализ программ для распознавания текста 

   В последние несколько лет стали очень популярны программы распознавания текста. Используются они не только в офисах для перевода документов в электронный вид, но и дома для распознавания различного вида текстов для написания рефератов и курсовых, что облегчает жизнь студентам и научным сотрудникам. Проблема выбора программного продукта для решения какой-либо задачи всегда стояла перед пользователем. Для того чтобы разрешить ее, необходимо было сравнить хотя бы несколько программ одного назначения. При этом тратились время и деньги, и достаточно часто выбор был далеко не оптимальным. На данный момент всего два программных продукта - Fine Reader 5.0 и Cuneiform 2000 - предлагают решение данной проблемы. Рассмотрим их.
 
 
 
 
 

                        Рисунок 6                                      Рисунок 7 

   Рис. 6. Fine Reader 5.0 после запуска. Если нажать на кнопку Scan&Read, то автоматически запустится мастер сканирования и распознавания. Рис. 7. Cuneiform 2000 готов к работе. Как и в Fine Reader 5.0, первая большая кнопка вызывает мастер сканирования и распознавания.
  Обе программы предлагают несколько дополнительных возможностей помимо распознавания текста:
    проверка орфографии для различных языков;
    сканирование;
    сохранение в различных форматах и передача в другие программы распознанного документа;
    обработка картинок;
    пакетная обработка множества изображений;
    форматирование текста.
   Но нас интересуют не столько предлагаемые функции (они практически одинаковые), сколько отличия для пользователя в работе данных программ. Для этого мы проведем исследование по пунктам, которые являются основными для пользователя. 

1. Скорость и качество 

   Эти характеристики являются одними из самых критичных в применении данных программ, т. к. распознавание должно экономить время, затраченное на страницу текста, а складывается оно в итоге из скорости и качества. Скорость - это время, необходимое самой программе на распознавание, а от качества зависит, придется ли вам исправлять полученный текст и насколько время исправления меньше времени набора того же самого текста. Как показывает опыт, качество напрямую зависит от исходного материала, а также от уровня интеллекта программы распознавания.
   Для начала мы посмотрим, как программы будут распознавать страницу, не содержащую ничего, кроме обычного текста. Затем рассмотрим несколько вариантов различной сложности.
   Для этого мы берем лист формата А4 с текстом, распечатанным на лазерном принтере, сканируем его в черно-белом режиме с разрешением 300 точек на дюйм и сохраняем в формате TIFF (с этими параметрами будут отсканированы и остальные образцы, взятые для тестов). 
 
 
 
 

Рис. 8. Вот так выглядит взятый для проверки текст. Здесь нет каких-либо трудностей для распознавания  
 
 
 

                Рисунок 8 

   Теперь мы открываем это изображение в Fine Reader 5.0, выделяем область для распознавания и нажимаем кнопку "Распознать". На этот процесс у программы уходит около 4 с. Производим подобную операцию в Cuneiform 2000 и спустя 8 с получаем распознанный текст.
   Таким образом, Fine Reader 5.0 работает быстрее, чем Cuneiform 2000. Теперь о качестве: первая программа совершила только одну ошибку (рис. 9), ну а вторая ошиблась только поставив ненужный пробел (рис. 10).
 
 
 
 
 

                            Рисунок 9                                      Рисунок 10 

   Теперь давайте посмотрим, какая картина будет, если мы возьмем для распознавания разворот учебника с формулами.
Рис. 11. Пример для распознавания учебника. Прежде чем распознавать, эту картинку пришлось поворачивать. Такую операцию не обязательно проводить средствами Photoshop, с ней легко справляются наши программы.
                  Рисунок 11 

   Производим распознавание и видим, что Fine Reader затратил около 43 с, а Cuneiform - порядка 18 с.
    Интересно: Fine Reader здесь показал не лучший результат по скорости, но по качеству - у него преимущество. В основном ошибки распознавания оказались только в формулах, а Cuneiform умудрился совершить их и в тексте.
 
 
 
 
 

                               Рисунок 12                                      Рисунок 13 

2. Таблицы  

   На этом этапе мы рассмотрим, насколько точно будет производиться определение таблиц и форм. Для того чтобы провести его более точно, мы возьмем два основных вида таблиц и один документ договора.
    Рис. 14. Пример простой таблицы. Такого типа таблицы очень часто встречаются в экономической литературе и справочниках.  

             Рисунок 14
    Рис. 15. Результат распознавания Fine Reader 5.0 — здесь требуется доработка. Рис. 16. Результат распознавания Cuneiform 2000 наиболее близок к оригиналу.
Таким образом, мы получили две идентичные таблицы (за исключением форматирования), недостатки которых в наших программах следующие: в Fine Reader 5.0 каждая ячейка заканчивается ненужным вводом (рис. 15), а Cuneiform 2000 (рис. 16) сохраняет разбивку на строки за счет вставки символа "конец строки" (Shift+Enter в MS Word).
 
 
 
 
 

                              Рисунок 15                                     Рисунок 16 

3. Блоки 

   Не последнее место при работе с программами распознавания занимает автоматическая разбивка на блоки. В автоматическом режиме на разбивку тратится несколько секунд, а в ручном - гораздо больше времени.
   Для начала возьмем изображение нашего договора. Как уже говорилось, Cuneiform 2000 разбил этот единый документ на множество блоков, а Fine Reader только на 3 части, и в них не вошли лишь последние точки в документе (ей можно в принципе доверять). Для нормального распознавания в наших программах таблицы в тексте (тем более, если она не простая) лучше всего ее выделять самостоятельно. Ну а если она похожа на первый образец, то можно спокойно не обращать на нее внимание, т. к. она правильно определится обеими программами. И все-таки программа Fine Reader здесь тоже выходит на первое место: она наиболее точно определяет тип распознаваемых блоков и распределяет их тоже не плохо.
             Рисунок 17                 Для примера возьмем разворот учебника с картинками и посмотрим, как справятся наши программы с разбивкой на блоки. 

    Cuneiform 2000 нашел таблицу и около 30 текстовых блоков, причем некоторые выделяли область рисунков. После этого мы ожидали увидеть примерно такую же картину и в Fine Reader 5.0, но все иллюстрации были распознаны правильно (хотя и не совсем точны были определены границы), текстовые блоки были выделены тоже достаточно корректно, ну а мифических таблиц эта программа не обнаружила, т. к. их действительно не было.
и т.д.................


Перейти к полному тексту работы


Скачать работу с онлайн повышением уникальности до 90% по antiplagiat.ru, etxt.ru или advego.ru


Смотреть полный текст работы бесплатно


Смотреть похожие работы


* Примечание. Уникальность работы указана на дату публикации, текущее значение может отличаться от указанного.