На бирже курсовых и дипломных проектов можно найти образцы готовых работ или получить помощь в написании уникальных курсовых работ, дипломов, лабораторных работ, контрольных работ, диссертаций, рефератов. Так же вы мажете самостоятельно повысить уникальность своей работы для прохождения проверки на плагиат всего за несколько минут.

ЛИЧНЫЙ КАБИНЕТ 

 

Здравствуйте гость!

 

Логин:

Пароль:

 

Запомнить

 

 

Забыли пароль? Регистрация

Повышение уникальности

Предлагаем нашим посетителям воспользоваться бесплатным программным обеспечением «StudentHelp», которое позволит вам всего за несколько минут, выполнить повышение уникальности любого файла в формате MS Word. После такого повышения уникальности, ваша работа легко пройдете проверку в системах антиплагиат вуз, antiplagiat.ru, etxt.ru или advego.ru. Программа «StudentHelp» работает по уникальной технологии и при повышении уникальности не вставляет в текст скрытых символов, и даже если препод скопирует текст в блокнот – не увидит ни каких отличий от текста в Word файле.

Результат поиска


Наименование:


курсовая работа Технология поиска изображений в Интернете. Метапоисковые системы

Информация:

Тип работы: курсовая работа. Добавлен: 04.06.2012. Сдан: 2010. Страниц: 6. Уникальность по antiplagiat.ru: < 30%

Описание (план):


ОГЛАВЛЕНИЕ 

 


    Введение

     Информационный  поиск — большая междисциплинарная  область науки, стоящая на пересечении  когнитивной психологии, информатики, информационного дизайна, лингвистики, семиотики, и библиотечного дела.
     Информационный  поиск рассматривает поиск информации в документах, поиск самих документов, извлечению метаданных из документов, поиску текста, изображений, видео и звука в локальных реляционных базах данных, в гипертекстовых базах данных таких, как Интернет и локальные интранет-системы.
     Существует  некоторая путаница, связанная с  понятиями поиска данных, поиска документов, информационного поиска и текстового поиска. Тем не менее, каждое из этих направлений исследования обладает собственными методиками, практическими  наработками и литературой.
     В настоящее время информационный поиск — это бурно развивающаяся область науки, популярность которой обусловлено экспоненциальным ростом объемов информации, в частности в сети Интернет. Информационному поиску посвящена обширная литература и множество конференций.
     Говоря  о системах информационного поиска, употребляют термины запрос и объект запроса.
     Запрос  — это формализованный способ выражения информационных потребностей пользователем системы. Для выражения  информационной потребности используется язык поисковых запросов, синтаксис варьируется от системы к системе. Кроме специального языка запросов, современные поисковые системы позволяют вводить запрос на естественном языке.
     Объект  запроса — это информационная сущность, которая хранится в базе автоматизированной системы поиска. Несмотря на то, что наиболее распространенным объектом запроса является текстовый документ, не существует никаких принципиальных ограничений. В частности, возможен поиск изображений, музыки и другой мультимедиа информации. Процесс занесения объектов поиска в информационной поисковой системе называется индексацией. Далеко не всегда информационная поисковая система хранит точную копию объекта, нередко вместо неё хранится суррогат.
     Центральная задача информационного поиска — помочь пользователю удовлетворить его информационную потребность. Так как описать информационные потребности пользователя технически непросто, они формулируются как некоторый запрос, представляющий из себя набор ключевых слов, характеризующий то, что ищет пользователь.
     Поиск информации представляет собой процесс  выявления в некотором множестве  страниц (документов), которые посвящены  указанной теме, удовлетворяют заранее  определенному условию поиска (запросу) или содержат необходимые (подходящие информационной потребности) факты, сведения, данные.
     Поиск включает последовательность операций, направленных на сбор, обработку и  предоставление необходимой информации заинтересованным лицам.
     Можно выделить 4 этапа поиска:
     1) определение информационной потребности  и формулировка информационного запроса;
     2) определение совокупности возможных  источников;
     3) извлечение информации из выявленных  информационных массивов;
     4) ознакомление с результатами  поиска и их оценка.
     Полнотекстовый  поиск — поиск по всему содержимому  документа. Пример полнотекстового поиска — любой Интернет-поисковик. Как правило, полнотекстовый поиск для ускорения поиска использует предварительно построенные индексы. Наиболее распространенной технологией для индексов полнотекстового поиска являются инвертированные индексы.
     Поиск по метаданным — это поиск по нескольким атрибутам документа, поддерживаемым системой — название документа, дата создания, размер, автор и т. д. Пример поиска по реквизитам — диалог поиска в файловой системе.
    Поисковые системы
                История поисковых систем
     Поисковая система это:
     1) Онлайн сервис, предоставляющий  возможность поиска информации  на сайтах в Интернете, а  также (иногда) в новостных группах  и ftp-серверах.
     2) (англ. search engine, синонимы: поисковой  сервер, поисковая система) - инструмент для поиска информации в сети Интернет. Работа поисковика состоит из двух этапов: индексации и поиска в индексе, с выдачей результатов поиска пользователю.
     3) система, предназначенная для  поиска и доставки информации. Сделана с целью каталогизации данных. Обычно использует индексацию страниц, чтобы в дальнейшем было легко находить обработанную информацию.
     4) специальный сайт, на котором  по заданному запросу можно  получить информацию о ресурсах  в Интернете, соответствующих  данному запросу.
     Первой поисковой системой для Всемирной паутины был «Wandex», уже не существующий индекс, который создавал «World Wide Web Wanderer» — бот, разработанный Мэтью Грэйем (англ. Matthew Gray) из Массачусетского технологического института в 1993. Также в 1993 году появилась поисковая система «Aliweb», работающая до сих пор. Первой полнотекстовой (т. н. «crawler-based» — то есть индексирующей ресурсы при помощи робота) поисковой системой стала «WebCrawler», запущенная в 1994. В отличие от своих предшественников, она позволяла пользователям искать по любым ключевым словам на любой веб-странице, с тех пор это стало стандартом во всех основных поисковых системах. Кроме того, это был первый поисковик, о котором было известно в широких кругах. В 1994 был запущен «Lycos», разработанный в университете Карнеги Мелона.
     Вскоре  появилось множество других конкурирующих  поисковых машин, таких как «Excite», «Infoseek», «Inktomi», «Northern Light» и «AltaVista». В некотором смысле они конкурировали  с популярными Интернет-каталогами, такими, как «Yahoo!». Позже каталоги соединились или добавили к себе поисковые машины, чтобы увеличить функциональность. В 1996 году русскоязычным пользователям Интернета стало доступно морфологическое расширение к поисковой машине Altavista и оригинальные российские поисковые машины Rambler и Aport. 23 сентября 1997 года была открыта поисковая машина Яндекс.
     Помимо  поисковых машин для Всемирной  паутины существовали и поисковики для других протоколов, такие как Archie для поиска по анонимным FTP-серверам и «Veronica» для поиска в Gopher.
                Глубокая  паутина
     Глубокая  паутина (иногда упоминается как  невидимая паутина и скрытая  паутина) — часть веб-страниц  Всемирной паутины, не индексированная  поисковыми системами. Термины произошли  от англ. deep web, invisible web, hidden web. Не следует смешивать понятие глубокая паутина с понятием тёмная паутина, под которым имеются в виду сетевые сегменты, вообще не подключённые к сети Интернет.
     В глубокой паутине находятся веб-страницы, которые никак не связаны с  другими — например, страницы, динамически создаваемые по запросам к базам данных. В глубокой паутине также находятся сайты, доступ к которым открыт только для зарегистрированных участников. Поисковые системы используют специальные роботы (англ. web crawler), которые переходят по гиперссылкам и индексируют содержимое веб-страниц, на которых они оказываются. Обыкновенно такие роботы не направляют запросы к базам данных (за исключением случаев, когда запрос помещается в отдельную гиперссылку на странице). Вот почему огромная часть Всемирной паутины оказывается «на глубине», скрытой от взоров поисковых систем.
     В 2000 году поисковая компания «BrightPlanet»  провела исследование, которое показало, что в глубокой паутине находится  в 500 раз больше документов, чем доступно через поисковые системы. Конечно, к этим цифрам следует относиться с осторожностью. Например, существует проблема с различением разных представлений одного и того же материала в базах данных. Но тем не менее, цифры поражают воображение, и неэффективность поисковых систем просто шокирует.
     В 2005 году компания «Yahoo!» сделала серьёзный  шаг к решению этой проблемы. Компания выпустила поисковый движок «Yahoo! Subscriptions», который производит поиск  по сайтам (пока немногочисленным), доступ к которым открыт только зарегистрированным участникам этих сайтов.
     Это, однако, полностью не решило имеющейся  проблемы. Эксперты поисковых систем по-прежнему пытаются найти технические  возможности для индексации содержимого  баз данных и доступа к закрытым веб-сайтам.
 

     
    Технология  поиска изображений в Интернете
                Визуальные  примитивы и механизм поиска по образцу
     До  недавнего времени традиционным считался поиск визуальной информации, опирающийся на индексирование текстовых  описаний, ассоциированных с изображением или фильмом. Однако поиск по названию, авторам, теме, словам описания содержания и по другой текстовой информации, ассоциированной с изображениями коллекции,  представляется недостаточным. Неоднозначность соответствия между визуальным содержанием и текстовым описанием снижает показатели точности и полноты поиска.
     Для организации электронных библиотек, связанных с визуальными данными, требуются методы создания и использования  поисковых образов, отражающих визуальное содержание изображений. Методы распознавания  образов и  понимания сцены в настоящее время из-за отсутствия эффективных универсальных алгоритмов применяются в узких предметных областях. Современная универсальная технология доступа к коллекциям изображений связана с сопоставлением изображению набора визуальных примитивов (характеристик цвета, формы, текстуры, а для видео еще и параметров движения сцены и объектов) и определением количественной оценки близости изображений по значениям примитивов.
     Визуальные  примитивы - это характеристики изображения, которые автоматически вычисляются по оцифрованным визуальным данным, позволяют эффективно индексировать их и обрабатывать запросы с использованием визуальных свойств изображения. Поисковый образ изображения, сгенерированный из визуальных примитивов, невелик по размеру в сравнении с самим изображением и удобен для организации поиска. Вычисление подобия изображений заменяет принятую в традиционных СУБД операцию установления соответствия запросу. Хотя запросом в такой системе может быть описание набора примитивов,  более удобен запросный механизм поиска по образцу, когда система отыскивает изображения, визуально похожие на предоставленный образец. Система анализирует образец аналогично тому, как это делается при составлении поисковых образов изображений базы. Вычисление подобия изображения-образца изображениям коллекции осуществляется на основании сравнения значений отдельных визуальных примитивов, при этом система определяет меру их отличия, а затем сортирует изображения базы в соответствии с близостью к образцу по всем параметрам, с учетом указываемой в запросе степени важности каждого параметра. Поиск на таком уровне абстракции не предполагает идентификацию объектов. Скажем, если в качестве образца взято изображение собаки, то система будет искать изображения, похожие на образец по цветовой гамме, композиции, наличию определенных форм и т.п., но нет никакой гарантии, что среди них окажется изображение именно этого животного. Тем не менее, метод поиска по образцу на основании визуальных примитивов представляется на сегодняшний день достаточно эффективным и универсальным средством доступа к коллекциям оцифрованных изображений.
     Различными  группами исследователей уже накоплен определенный опыт реализации алгоритмов, позволяющих автоматически описывать  изображения в терминах простых  вычислимых визуальных свойств, а также определять меру их отличия.
     Исследования в этой области направлены на дальнейшее развитие методов вычисления и сравнения визуальных примитивов. Реализован метод количественной оценки близости статичных изображений по их цветовым гистограммам. Решена задача пространственного сегментирования изображения. Разработан и реализован алгоритм, осуществляющий вычисление параметров форм для выделенных объектов картинки и сравнение форм по их параметрам. Проводятся работы и имеются результаты, которые позволят выполнять локальное индексирование, отражающее распределение на изображении цветовых множеств.
                Цветовые  гистограммы
     Метод цветовых гистограмм – наиболее популярный из методов, использующих цветовые характеристики для индексирования изображений. Возможно также использование таких показателей, как средний или основной цвета, а также множества цветов; эти характеристики имеет смысл использовать для локального индексирования областей изображения.
     Цветовое RGB-пространство рассматривается как трехмерный куб, каждая ось которого соответствует одному из трех основных цветов (красному, зеленому или синему), деления на осях пронумерованы от 0 до 255 (большее значение соответствует большей интенсивности цвета). При таком рассмотрении любой цвет RGB-изображения может быть представлен точкой куба. Для построения цветовой гистограммы каждая сторона делится на n (n=4) равных интервалов,  соответственно RGB-куб делится на N (N=64) прямоугольных параллелепипедов. Vi – множество цветов, все компоненты которых попадают в определенные интервалы. Гистограмма изображения отражает распределение точек RGB-пространства, соответствующих цветам пикселей изображения, по параллелепипедам.
     Выбор размерности гистограммы определялся  из следующих соображений. При n=2 (N=8) считались бы одинаковыми, например, {126,128,126} и {0, 255, 0}, что, естественно, недопустимо. Установка n=8 (N=512) приводит к тому, что базовая палитра становится более строгой, чем 8-битная. Такая точность не только автоматически дает некорректную обработку 256-цветных изображений, но и на остальных изображениях приводит к неестественным результатам. Очевидно, что при росте n ситуация только ухудшается. Поэтому было установлено n=4.
     В качестве расстояния между гистограммами  используется покомпонентная сумма модулей разности между ними. Несмотря на предельную простоту подхода, он показывает довольно стабильные результаты. Распознаются схожие по цветовой гамме серии картинок, если они имеются в базе.
     Более точное сравнение изображений достигается с помощью техники квадродеревьев, когда методы вычисления и сравнения цветовых гистограмм применяются не ко всему изображению, а к его четверти (одной шестнадцатой и т. д.). Сейчас программа позволяет работать не только с полными изображениями, но и с их разбиением на четверти. Для реализации этой возможности, при построении гистограммы автоматически считаются и гистограммы всех четырех квадрантов изображения. Сравнение изображений основывается на расстоянии, определенном как Евклидово в пространстве расстояний между гистограммами их частей - вместо вычисления расстояния между полными гистограммами, рассчитываются расстояния между четвертями, итоговым результатом считается корень из суммы их квадратов. Этот метод дает результат, семантически отличный от других вариантов: изображения, отличные только по взаимному расположению похожих по цвету объектов,  считаются различными, а не практически идентичными, как было бы без использования этой техники. Целесообразность ее применения определяется значением для пользователя расположения на картинке-образце определенных цветовых областей.
                Объекты изображения
     Пространственное  сегментирование изображения может  осуществляться автоматически, когда  выделяются области с некими общими свойствами - одинаковыми или сильно схожими значениями того или иного примитива. Полученные в результате области характеризуются расположением на изображении и размерами. Кроме того, они связываются со значениями примитивов – характеристиками формы, цвета, текстуры.
     Контур - граница объекта - представляет собой замкнутую последовательность точек. Задача выявления контуров связана с локализацией на изображении резких перепадов яркости цвета или изменений параметров, характеризующих текстуру.
     Определение границ объектов изображения выполняется  по следующей схеме:  цветное изображение переводится в черно-белое полутоновое и сглаживается, осуществляется пространственное дифференцирование - вычисляется градиент функции интенсивности в каждой точке изображения и, наконец, подавляются значения меньше установленного порога. За основу взят метод Собеля, использующий для вычисления градиента первого порядка функции интенсивности специальные ядра, известные как «операторы Собеля».
     Ядра  применяются к каждому пикселу  изображения: он помещается в центр  ядра, и значения интенсивности в соседних точках умножаются на соответствующие коэффициенты ядра, после чего полученные значения суммируются. Х- оператор Собеля, примененный к 3х3 матрице исходного изображения, дает величину горизонтальной составляющей градиента интенсивности в центральной точке этой матрицы, а Y-оператор Собеля дает величину вертикальной составляющей градиента. Коэффициенты ядра выбраны так, чтобы при его применении одновременно выполнялось сглаживание в одном направлении и вычисление пространственной производной – в другом.
     Величина  градиента определяется как квадратный корень из суммы квадратов значений горизонтальной и вертикальной составляющих градиента.
     В результате образуется массив чисел, характеризующих  изменения яркости в различных  точках изображения. Затем выполняется операция сравнения с порогом и определяется положение элементов изображения с наиболее сильными перепадами  яркости. Выбор порога является одним из ключевых вопросов выделения перепадов. В нашей реализации он отличается от оригинального метода Собеля. В качестве основного порога берется средняя для изображения величина градиента. Для достаточно большого изображения с малым числом точек, обладающих сильным перепадом яркости, данной пороговой величины недостаточно, т.к. оказывается весьма сильным влияние шума. Для ликвидации этой проблемы для каждой точки изображения считается величина равная средней величине градиента в области 3х3 вокруг анализируемой точки.
     В результате обработки получается бинарная матрица, где единицам соответствуют точки со значительным перепадом яркости, нулям – все остальные. В качестве дополнительной меры в борьбе с шумом и ликвидации возможных разрывов в контурах применяются морфологические операции.
     Следующий этап – сегментация изображения. Целью сегментации является выделение на изображении контуров объектов. В бинарной матрице единицами представлены точки, принадлежащие искусственно утолщенным на предыдущем этапе границам объектов. Для выделения границы одного объекта в матрице по определенному алгоритму ищется элемент, равный единице, не отнесенный ранее ни к какому другому  объекту; далее считается, что все соседние элементы, равные единице, также принадлежат этому объекту; и т. д. Для выделения точек внешнего контура используется обход полученного объекта по внешней его стороне, начиная с нижней левой точки объекта и заканчивая ею же. Обход точек ведется последовательно против часовой стрелки. В результате получаем массив точек, образующий замкнутый контур объекта. Из него равномерно выбирается 128 точек, которые используются для вычисления предназначенных для индексирования характеристик формы. (Небольшие объекты исключаются из рассмотрения)
                CBIR-системы
     Аббревиатура CBIR расшифровывается как Content Based Image Retrieval (поиск изображений по содержанию). Данный термин впервые был использован в 1992 г. для обозначения поиска изображения в базе данных на основе анализа таких характеристик, как цвета, текстура и очертания его элементов. Со временем содержание термина расширилось, и теперь с его помощью обозначают достаточно широкий спектр технологий поиска изображений, основанных на анализе содержимого картинок. Интерес к таким технологиям поиска был вызван тем, что традиционные методы индексирования больших баз изображений — не самый эффективный способ такой работы. Автоматическая индексация грешит неточностью, а "ручной" режим, при котором изображения индексируются человеком, требует больших затрат времени и тоже не всегда гарантирует полноту описания.
     В самом общем виде CBIR-система работает подобно любому другому поисковику — в два этапа. На первом этапе индексирования каждое изображение описывается и заносится в базу данных. Вот только в этом случае систему интересуют не ключевые слова или имена файлов, а определенные параметры самого изображения, анализируемые с помощью специальных алгоритмов. Обычно это уже названные выше параметры цвета, текстуры и очертаний. Полученные данные сохраняются в индексной базе. После этого можно вести поиск по определенным значениям таких параметров, сравнивать их между собой или с представленной системе картинкой. Это уже второй этап — нахождение в базе изображений с близкими признаками — другими словами, визуально похожих. На этапе поиска свойства одной картинки сравниваются с аналогичными данными других изображений, хранящихся в индексной базе.
     Таким образом, в CBIR-системе работают алгоритмы, сначала извлекающие необходимые  данные из изображения, а затем сравнивающие их. Если быть точным, то такие пары алгоритмов разрабатываются для каждого используемого в поиске признака. Преимущества CBIR над обычными, "словесно- описательными", технологиями поиска изображений очевидны — они не зависят от квалификации и внимательности человека (как веб-галереи с индексацией изображений их авторами) и работают непосредственно с характеристиками изображения, а не с косвенными признаками, как это делают обычные универсальные поисковики. В результате можно автоматически обрабатывать большие массивы изображений. Кроме того, эта технология предлагает новые инструменты составления поисковых запросов. В идеале CBIR-система должна понимать запросы на обычном, человеческом языке — например, "натюрморт из фруктов на зеленом блюде" или "портрет человека средних лет на фоне морского побережья вечером". Создание таких систем пока удел будущего, ну, а современные CBIR-поисковики работают с характеристиками попроще — так сказать, "низкоуровневыми". В настоящее время принято выделять несколько типов CBIR-систем в зависимости от разновидности поисковых запросов, с которыми они работают. Первый тип работает с графическим запросом — системе предъявляют изображение-запрос, а она ищет подобные картинки в своей индексной базе.
     Второй  тип работает с наброском, который делает пользователь, постепенно находя все более и более похожие изображения. Третий тип дает возможность составлять и уточнять запросы на основе заданных пользователем характеристик цвета, текстуры и очертаний. Поисковый запрос в такой системе представляет собой перечень значений различных параметров. Некоторые современные системы используют сразу несколько видов запросов. Одним автоматическим анализом дело не ограничивается. Большинство CBIR-систем для уточнения результатов поиска использует дополнительный контур — обратную связь с пользователем. Обычно это опции "похоже", "не похоже" и "нейтрально", выводимые с найденными изображениями. Такие ответы пользователей позволяют уточнять искомые характеристики изображений подобно языку сложных запросов на обычных Интернет-поисковиках. Благодаря этому дополнительному контуру удается оценить, насколько "низкоуровневые" характеристики изображения соответствуют запросу конкретного пользователя. Тем самым перекидывается мостик между характеристикой качеств изображения и его смысловой нагрузкой, что можно использовать как непосредственно в ходе поиска, так и для совершенствования алгоритмов поисковой системы.
                CBIR-системы на практике
     С внутренним устройством CBIR-систем мы более-менее  ознакомились, пора переходить к практическому применению. Если Вы когда-нибудь искали изображения на универсальных поисковиках с включенным "родительским контролем", то вы уже пользовались CBIR-технологиями. Дело в том, что именно они применяются для выделения потенциально неблагопристойных изображений. Вот только влиять на работу этих инструментов нам — пользователям поисковика — можно было в очень ограниченной степени — на уровне "включить-выключить". Вооруженные знанием общей механики работы CBIR-систем, мы теперь можем сказать, что в данном случае, во-первых, напрочь отсутствует контур обратной связи с пользователем и, во-вторых, работает только один тип поиска (на сравнение) из нескольких возможных, причем вся эта механика по возможности спрятана подальше от глаз пользователя. Большинство современных CBIR-систем открытого доступа пока либо находятся в стадии бета-версий, либо играют роль демо-версий коммерческих пакетов. Поэтому мы не будем сейчас перечислять такие проекты, а начнем со знакомства с одним из наиболее удачных свободных CBIR-поисковиков, из работы с которым простой нормальный посетитель уже сейчас может извлечь некоторую пользу.
     Рассмотрим  на примере экспериментального поисковика Tiltomo (www.tiltomo.com) — независимый проект, предназначенный для отработки технологий Интернет-поиска изображений с помощью CBIR. В настоящее время для посещения открыта бета-версия этого сервиса. Изначально это была программа, предназначенная для сортировки личных коллекций авторов. Через какое-то время после нескольких доработок алгоритма им стало интересно проверить свою систему на какой-нибудь действительно крупной базе изображений. В результате и появился сайт Tiltomo. Для такого эксперимента требовалось большое собрание реальных фотографий. Долго искать, видимо, не пришлось — было решено использовать базу бесплатного сервиса Flickr. Это сервис, предназначенный для хранения и дальнейшего использования пользователем своих цифровых фотографий и видеороликов. Популярность Flickr позволила авторам Tiltomo быстро привлечь к своему проекту достаточное количество заинтересованных тестеров. Tiltomo в настоящее время ищет не по всей коллекции Flickr, а только по двум тестовым базам данных, в которых хранится всего порядка 300 тысяч фотоснимков — видимо, сказывается статус "беты". Начинать поиск можно либо со случайного набора снимков с различными характеристиками, либо отобрав снимки по определенному тегу. Ради примера попробуем искать по тегу "apple" — к сожалению, пока можно искать только по тегам, состоящим из одного слова.
     Мы  получили страницу, содержащую несколько десятков миниатюр, соответствующих нашему тегу. Сразу же проявляется синонимия термина — здесь у нас и компьютерная продукция компании Apple, и яблоки и яблони разных сортов, и даже фотографии улиц Нью-Йорка, известного также как "Big Apple". Если бы мы пользовались обычным поисковиком, то на данном этапе пришлось бы придумывать более точный и сложный запрос. Здесь же нам доступны два новых варианта: уточнение темы запроса и поиск по характеристикам изображения. Как показывает практика, лучше вначале максимально уточнить тему. Для этого достаточно выбрать понравившуюся миниатюру и щелкнуть по ссылке "Find Similar by Theme", которая находится под каждой из них. Допустим, нам требуются фотоснимки яблоневых садов — выбираем снимок-пример, щелкаем по ссылке и получаем соответствующий набор фотографий. Также существует опция "Show ONLY images from the reference photographer", которая активна при "тематическом" поиске — она переключает нас в режим поиска работ автора выбранного нами снимка. На странице новых результатов снимки самые разные: снятые при ярком солнечном свете и в пасмурную погоду, с близкого расстояния, когда видна разве что одна ветка с несколькими яблоками, и издали. Теперь опробуем второй инструмент, который запускается ссылкой "Find Similar by Color/Texture". Запускается поиск изображений, похожих на выбранное нами по характеристикам цвета и очертаний.
     Попадания могут быть достаточно точными: если, допустим, у нас на снимке была лужайка, мы получим фотоснимки с изображением зеленой травы, если это было дерево на фоне неба — то нам покажут другие похожие на заданный снимки. "Тематический" фильтр при этом начинает сильно «гулять», и для получения максимально точного результата приходится повторять описанную процедуру несколько раз. С другой стороны, это достаточно интересное времяпрепровождение. Потенциал у данного поисковика хороший — по сути, это полностью рабочая система, выдающая действительно полезные результаты. Tiltomo — не единственный CBIR-поисковик, работающий с базой Flickr. Tiltomo выделяется из ряда конкурентов именно своей завершенностью и дружественностью к пользователям. Главный недостаток системы — ограниченный размер тестовых баз данных.
     Технологии  интернет-поиска картинок по содержанию являются весьма перспективным средством, предоставляющим новые довольно любопытные возможности. CBIR-технологии вряд ли полностью вытеснят обычные способы индексации изображений, разве что в некоторых специфических областях. Как нетрудно заметить, даже Tiltomo объединяет несколько технологий поиска изображений: по тегам и с помощью CBIR. Они очень удачно дополняют друг друга, поскольку позволяют работать с разными характеристиками изображения. Скорее всего, именно за такими комбинированными веб-проектами будущее поиска изображений в Интернете.
и т.д.................


Перейти к полному тексту работы


Скачать работу с онлайн повышением уникальности до 90% по antiplagiat.ru, etxt.ru или advego.ru


Смотреть полный текст работы бесплатно


Смотреть похожие работы


* Примечание. Уникальность работы указана на дату публикации, текущее значение может отличаться от указанного.