На бирже курсовых и дипломных проектов можно найти образцы готовых работ или получить помощь в написании уникальных курсовых работ, дипломов, лабораторных работ, контрольных работ, диссертаций, рефератов. Так же вы мажете самостоятельно повысить уникальность своей работы для прохождения проверки на плагиат всего за несколько минут.

ЛИЧНЫЙ КАБИНЕТ 

 

Здравствуйте гость!

 

Логин:

Пароль:

 

Запомнить

 

 

Забыли пароль? Регистрация

Повышение уникальности

Предлагаем нашим посетителям воспользоваться бесплатным программным обеспечением «StudentHelp», которое позволит вам всего за несколько минут, выполнить повышение уникальности любого файла в формате MS Word. После такого повышения уникальности, ваша работа легко пройдете проверку в системах антиплагиат вуз, antiplagiat.ru, etxt.ru или advego.ru. Программа «StudentHelp» работает по уникальной технологии и при повышении уникальности не вставляет в текст скрытых символов, и даже если препод скопирует текст в блокнот – не увидит ни каких отличий от текста в Word файле.

Результат поиска


Наименование:


контрольная работа Информационно-аналитическая система Internet Analyst

Информация:

Тип работы: контрольная работа. Добавлен: 14.09.2012. Сдан: 2011. Страниц: 23. Уникальность по antiplagiat.ru: < 30%

Описание (план):


Федеральное агентство по образованию
Филиал  Санкт-Петербургского государственного
инженерно-экономического университета в г. Череповце 
 
 

Кафедра естественнонаучных дисциплин 
 
 
 
 
 
 

Контрольная работа 
 
 
 

По дисциплине  «Информационные системы в экономике»
Тема  № 14: «Информационно-аналитическая система Internet Analyst» 
 
 
 
 
 
 
 
 
 
 
 

                  Студента 3 курса
                  Группы  2ФКП-06
                  Саввина А.М. 
                   
                   
                   
                   
                   
                   
                   
                   
                   
                   
                   
                   
                   

Череповец
2008
СОДЕРЖАНИЕ:
1. ВВЕДЕНИЕ           3
2. ФУНКЦИОНАЛЬНАЯ  СТРУКТУРА СИСТЕМЫ      4
   2.1. ПОЛУЧЕНИЕ  И ПЕРВИЧНАЯ ОБРАБОТКА ИНФОРМАЦИИ   5
      2.1.1. Получение информации из источников  и ее очистка    5
      2.1.2. Рубрикация информации        7
      2.1.3. Создание рубрикаторов экспертами. Авто-рубрикация    9
      2.1.4. Расширение рубрикатора пользователями. Персональные профили  10
      2.1.5. Рубрикатор как средство мониторинга.  Рассылка документов   11
   2.2. ВЫБОРКА  ИНФОРМАЦИИ. РАБОТА С КОНТЕКСТОМ    12
      2.2.1. Поиск документов в Internet Analyst      13
      2.2.2. Поиск известного (сужение контекста)      14
      2.2.3. Поиск неизвестного (расширение контекста)     16
      2.2.4. Поиск связей (пересечение контекстов)      18
      2.2.5. Использование временных рядов       19
   2.3. АНАЛИЗ  РЕЗУЛЬТАТОВ И ПОДГОТОВКА ОТЧЕТНОСТИ    21
      2.3.1. Выявление фактов         21
      2.3.2. Подсветка ключевых и контекстных  терминов     22
      2.3.3. Аннотирование документов        22
      2.3.4. Выявление дубликатов        23
      2.3.5. Поиск похожих документов        25
      2.3.6. Работа с Корзиной и подготовка  итогового Отчета    26 
 
 
 
 
 
 
 
 
 
 
 
 

     1. Введение
     Управление  любым бизнесом основано на постоянном сборе и анализе информации, необходимой для принятия своевременных решений. Качество управления напрямую зависит как от полноты исходной информация, так и от глубины ее анализа.
     При этом должны учитываться как внутренние факторы бизнеса, так и параметры внешней бизнес среды, т.е. необходимую для принятия решений информацию можно разделить на две категории:
    информация о внутренних объектах организации (персонал, продукты, внутренние финансовые и товарные потоки и т.д.);
    информация о внешних объектах (технологии, рынки, конкуренты, клиенты, государство и т.д.).
     Причем, характер информации о внешних и  внутренний объектах бизнеса качественно различается. Это обусловлено как степенью нашего влияния на источники информации, так и степенью ее структурированности.
     Информация  о внутренних объектах организации  является структурированной (все объекты имеют соответствующие им наборы формальных атрибутов) и контролируемой (мы сами можем определять ее структуру, формат и источники). Это позволяет организовать ее систематический учет и анализ с помощью различных модулей систем класса ERP и CRM.
     Информация  о внешних объектах, напротив неструктурированна (представлена в виде текстов на естественном языке, рассчитанных на восприятие человеком, а не машиной) и неконтролируема (ее формат, место и время появления определяется не нами). Оба этих обстоятельства чрезвычайно затрудняют создание автоматических систем для систематического учета и анализа внешней информации, аналогичных по своим возможностям ERP системам.
     Между тем, количество информации в открытых источниках так велико, что ее просто невозможно обработать и систематизировать без специализированных инструментов, помогающих выделить в информационном потоке информацию, критически важную для ведения каждого конкретного бизнеса. В итоге, решения принимаются на основе неполной информации, что оборачивается для бизнеса потерями из-за упущенных возможностей и не замеченных вовремя угроз.
     Непрерывный процесс систематического мониторинга, обработки и анализа информации из внешних источников, позволяет осуществить специализированная информационная система - Internet Analyst. Это программа позволяет без особых усилий:
    Всегда быть в курсе событий вокруг имеющегося бизнеса
    «На лету» формировать досье по любому вопросу и на любого контрагента
    Находить связи между событиями, физическими и юридическими лицами
    Оценивать состояние дел и прогнозировать развитие событий в любой отрасли рынка
   Система Internet Analyst является информационным «фильтром», который позволит охватив весь объем доступной внешней информации, выбрать самое необходимо и важное для обеспечения процесса принятия решений (Рис. 1). 


Рис. 1. Применение системы Internet Analyst 

     2. Функциональная структура  системы
     Внешняя информация в ходе ее получения и  переработки в системе Internet Analyst
проходит  три стадии:
    Получение и первичная обработка. Из всей доступной в сети Internet информации выбирается та, которая имеет отношение к имеющемуся бизнесу. Полученные документы проходят первичную очистку, рубрикацию и рассылаются заинтересованным в них респондентам в режиме «персональной газеты».
    Выборка информации. Для работы с накопленной информацией пользователь осуществляет выборки. В ходе «диалога» с системой, из всего информационного массива в Хранилище данных пользователь отбирает факты, необходимые ему для текущей работы.
    Анализ информации и Подготовка отчетов. При получении необходимой выборки документов пользователь работает с фактами и документами, а так же осуществляет подготовку аналитических отчетов.
     Ниже  мы рассмотрим содержание всех трех этапов более подробно. 

     2.1. Получение и первичная  обработка информации
     Цель  данного этапа - получение необходимой  информации, ее очистка, сортировка, рассылка и архивация.
     Последовательно решаются следующие задачи:
    получение информации из внешних источников
    очистка документов от служебной информации и приведение их к единому формату
    индексирование документов в Хранилище (корпоративном Архиве)
    рубрикация и рассылка документов заинтересованным пользователям.
 
     2.1.1. Получение информации из источников и ее очистка
     Система Internet Analyst позволяет полностью автоматизировать рутинную работу по скачиванию и очистке первичных документов из внешних источников информации. За получение информации отвечает модуль Робот, который на основании заданного списка источников и графика загрузки автоматически загружает информацию в Модуль очистки (Рис. 2). Списки источников и график загрузки определяются администратором системы. Предварительная настройка осуществляется на этапе внедрения. 


Рис. 2. Получение и очистка информации 

     Модуль  очистки производит извлечение содержательной информации из поступающих в различных форматах документов. А именно:
    удаление служебной информации и элементов дизайна источника
    выявления атрибутов документов (название, дата публикации, источник и т.д.)
    форматирование документа для удобства дальнейшей работы пользователей
    индексирование содержания и атрибутов документов при помещение их в Хранилище данных
     Для работы Модуля очистки в ходе внедрения  системы разрабатываются сценарии очистки (различные для различных источников), которые, при необходимости, могут изменяться в процессе эксплуатации.
     На  рисунке (рис. 3.) приведен вид документа  до, и после его обработки модулем  очистки. 


Рис. 3. Документ, обработанный модулем очистки 

     2.1.2. Рубрикация информации
     Для удобства работы с большим количеством  документов, получаемых из внешних источников, полезно сразу же по поступлении в систему разбивать их по темам корпоративного рубрикатора. Структура последнего определяется на этапе внедрения и отражает основные темы или субъекты рынка, мониторинг которых необходим для понимания внешней ситуации.
     В зависимости от своего содержания, какие-то документы могут попасть  одновременно в несколько рубрик, а какие-то не попасть ни в одну из них. Таким образом происходит «фильтрация» информации и снижение уровня информационного шума от внешних источников (Рис. 4.). 


     Рис. 4. Рубрикация информации 

     Например: сообщение о назначении нового полномочного представителя президента в регионе, может относиться как к категории «Регионы/Полпреды», так и к категории «Макроэкономика и структурные реформы» (Рис. 5). 


     Рис. 5. Размещение документа в нескольких рубриках 

     Над одним и тем же Хранилищем данных можно развернуть несколько рубрикаторов, так чтобы, например, каждое подразделение фирмы видело свой специфический срез внешней информации. 
 
 
 

     2.1.3. Создание рубрикаторов  экспертами. Авто-рубрикация
     Рубрикатор  представляет собой иерархический  набор информационных фильтров, которые формируются на этапе внедрения (а затем могут модифицироваться в процессе эксплуатации).
     Фильтрация  происходит с учетом атрибутов документов и их содержания. Содержание документов, в свою очередь, задается как обязательными фразами (и их сочетаниями), так и тематикой документа, определяемой произвольно большим списком контекстных терминов и словосочетаний, взвешенных в соответствии с их значимостью. Можно, например, отбирать все документы, в которых упоминается интересующая фирма или субъект (в любом варианте его написания). А можно отслеживать любые документы по определенной, причем весьма узкой, тематике.
     Гибкое  сочетание обязательных и контекстных  терминов и словосочетаний позволяет производить точную настройку информационных фильтров.
     Настройка рубрикатора производится экспертами совместно с предметными специалистами - пользователями Системы - на этапе ее внедрения. Создание рубрик кардинально упрощается тем, что происходит в диалоговом режиме, когда Система сама подсказывает эксперту понятия, уточняющие описание рубрики.
     Для облегчения процесса создания больших  рубрикаторов, в Системе предусмотрен Модуль кластеризации, способный автоматически строить тематические рубрикаторы. На вход этого модуля подается обучающий массив документов из заданной предметной области. Модуль автоматически организует эти документы в иерархическую систему кластеров, содержащих документы со схожей тематикой. Сформированная таким образом иерархическая структура тематик экспортируется в формате тематического рубрикатора и может быть загружена в Систему «как есть» или в качестве первого приближения для ее тонкой настройки экспертами (Рис. 6).
     Автоматическое  создание рубрикаторов незаменимо при  обработке больших архивов документов или баз данных, содержащих документы неизвестного заранее содержания. Модуль кластеризации в этом случае создает иерархическую структуру тематик и помогает разобраться с истинным содержанием информационных массивов. 


     Рис. 6. Авторубрикация (кластеризация) информации 

     2.1.4. Расширение рубрикатора  пользователями. Персональные профили
     На  стадии внедрения эксперты создают  «постоянную часть» рубрикатора, общую  для всех пользователей. Однако, каждый пользователь Системы может самостоятельно создавать для себя дополнительные категории рубрикатора. Такие персональные категории называются профилями и по сути ничем не отличаются от рубрик, кроме того, что их создает, редактирует и использует каждый пользователь по своему усмотрению и для решения своих задач (рис. 7). Остальные пользователи не имеют к ним доступа.
     При создании профиля задаются текстовый фильтр из ключевых словосочетаний, тематический контекст и пороговая релевантность (степень соответствия документов данному контексту). С помощью этих инструментов можно очень точно настроить свои персональные профили - рубрики своей персональной газеты.
     Профиль представляет собой «замороженный» запрос, и процедура его создания будет более подробно описана в следующем разделе. Кроме этого можно указать почтовый ящик на который автоматически будут отсылаться документы поступающие в данную рубрику-профиль. Система автоматически наполняет профиль документами в момент его создания, после чего пользователь сразу может осуществлять выборки с учетом данного профиля. 


     Рис. 7. Создание персонального профиля 

     2.1.5. Рубрикатор как  средство мониторинга. Рассылка документов
     Поскольку рубрикация документов происходит в  момент их поступления в Систему, рубрикатор является идеальным средством для мониторинга внешней информации. Каждая рубрика (или персональный профиль) является одновременно тематической новостной лентой, показывающей развитие событий по данному вопросу. Internet Analyst предоставляет очень удобную возможность подписаться на любой набор профилей и получать соответствующие документы в реальном времени по электронной почте, без необходимости обращаться к Системе с соответствующими запросами. Система генерирует название профилей в обратном адресе сообщения, позволяя сортировать полученные документы по тематическим папкам средствами почтового клиента.
     Для любого руководителя естественно желание не пропустить какие-то «горячие» события, информационные всплески по любым вопросам, касающимся его бизнеса. Система Internet Analyst обеспечивает автоматический режим отслеживания информационных всплесков по всему набору «объектов учета» (рубрик и профилей) (рис. 8).
     Те  категории, в которых в настоящий  момент выявлено резкое изменение потока документов, подсвечиваются красным цветом. Порог чувствительности мониторинга, косвенно определяющий количество «горячих тем», определяется в настройках (при желании эту опцию можно отключить).

     Рис. 8. Увеличение количества сообщений  в рубриках 

     Таким образом, одного взгляда на рубрикатор достаточно, чтобы понять где на информационном поле в данный момент происходят основные события.
     Система предоставляет также возможность ретроспективного поиска информационных всплесков в развитии каждой темы в прошлом. Эта возможность будет описана ниже в разделе о работе с временными рядами. 

     2.2. Выборка информации. Работа с контекстом
     Выборка информации по определенному критерию фокусирует внимание аналитика на интересующем его вопросе, предлагая ограниченный набор документов для их изучения и анализа.
     Получить  набор необходимых документов можно  различными способами. Например, просто «раскрыв» одну из папок рубрикатора, Вы получите подборку документов по данной тематике, отсортированную по времени.
     С помощью Панели запросов, можно формировать  новые, весьма прецизионные выборки документов, комбинируя ключевые понятия с поясняющими их смысл контекстными терминами и словосочетаниями (под контекстом мы понимаем текущий «смысл» в котором упоминается то или иное слово. Например, фраза «управление финансами» может употребляться как в контексте «управление финансами государства», так и в контексте «управление корпоративными финансами». Чем точнее определен контекст, тем лучше результаты поиска. Именно отсутствием контекста объясняются трудности пользования обычными поисковыми серверами). Любой такой запрос можно сохранить в качестве постоянно действующего профиля для мониторинга соответствующей темы. Кроме того, можно анализировать развитие этой темы во времени с помощью технологии временных рядов.
     Отличительной чертой системы Internet Analyst является диалоговый режим формирования контекста, при котором Система помогает сформулировать прецизионные информационные фильтры, содержащие до нескольких сотен контекстных терминов и словосочетаний буквально за несколько минут и с минимальными затратами усилий со стороны пользователя. 

     2.2.1. Поиск документов в Internet Analyst
     Поиск документов в системе Internet Analyst реализуется  Модулем поиска по Запросу пользователя. Запрос содержит как ключевые (обязательные), так и контекстные (поясняющие контекст запроса) слова и словосочетания.
     Ключевые слова и словосочетания работают как фильтр, пропуская через себя лишь документы, содержащие их определенные комбинации. Как у большинства поисковых машин, в поле ключевых терминов можно употреблять логические операторы (И, ИЛИ, НЕ и некоторые другие).
     Контекстные слова и словосочетания ранжируют прошедшие через логический фильтр документы в соответствии с количеством и расположением этих терминов в документах. Чем больше контекст, тем точнее определены информационные потребности пользователя, и тем легче находятся нужные ему документы.
     Отсутствие  возможности определить контекст запроса  в традиционных поисковых серверах является главной причиной низкого качества поиска - большого количества документов «не в тему». Действительно, по двум-трем ключевым словам в принципе невозможно понять в каком из своих многочисленных смыслов (о многих из которых пользователь и не подозревал) употребляются эти слова в найденных документах. Контекстные слова и словосочетания помогают Системе понять, что именно интересует пользователя в данный момент (рис. 9).
     Важно, что Система постоянно подсказывает варианты уточнения контекста Запроса, превращая процесс поиска в человеко-машинный диалог. Машина становится своего рода «усилителем интеллекта» эксперта, мгновенно просматривая за него сотни документов в поисках наиболее характерных контекстных терминов и тем самым помогая пользователю наиболее точно сформулировать свои информационные потребности. 


     Рис. 9. Выборка информации в диалоговом режиме 

     Работа  в режиме человеко-машинного диалога открывает перед экспертами совершенно новые возможности. В качестве примеров, ниже мы рассмотрим несколько способов выборки документов в системе Internet Analyst:
      поиск известного (сужение контекста);
      поиск неизвестного (расширение контекста);
      поиск связей (пересечение контекстов).
 
     2.2.2. Поиск известного (сужение  контекста)
     Этот  вид поиска используется в тех  случаях, когда эксперт понимает какая информация ему в данный момент необходима. Пользователь задает нужную ему комбинацию обязательных ключевых терминов, а затем уточняет контекст запроса в специальном контекстном окне. При этом выборка сужается, и наверх «поднимаются» документы, соответствующие указанному контексту. 


     Рис. 10 Поиск известного 

     Например: количество документов по запросу «Финансы» составляет 10000, по запросу «Финансы» в контексте «Ипотечное кредитование» - 1500, по запросу «Финансы» в контексте «Пенсионная реформа» - 1000, по запросу «Финансы» в контексте «Банковская реформа» - 3000 (рис. 10).
     При этом варианты контекстных терминов и словосочетаний, поясняющие смысл ключевых терминов подсказываются Системой. Пользователь может добавить в контекст любое понятие или их комбинацию для конкретизации своего запроса.
     Например, при запросе «Ипотечное кредитование», сформирована выборка в 920 документов, при этом система предлагает добавить в контекст различные слова и словосочетания, например: «АИЖК» (федеральное Агентство по ипотечному жилищному кредитованию), «закладных», «рефинансированию», «жилищного кредитования», «МИЭЛЬ». При добавлении в контекст одного из предложенных слов, происходит сужение контекста («Ипотечное кредитование» в контексте «АИЖК») и уменьшение выборки до 105 документов. При этом происходит обновление контекстных подсказок с учетом содержания документов из новой выборки (рис. 11). 


     Рис. 11. Сужение контекста 

     2.2.3. Поиск неизвестного (расширение  контекста)
     Менее очевидна, но гораздо более интересна  возможность поиска неизвестного, когда эксперт НЕ ЗНАЕТ точно что он ищет. Такая ситуация возникает в тех случаях, когда эксперт сталкивается в своей работе с новой предметной областью (например с новой технологией или с новым рынком) и, зная лишь узкий аспект предметной области, пытается охватить ее целиком.
     Пример 1: Эксперт столкнулся в своей  работе с компанией АИЖК и хочет понять суть работы компании. Для этого ему надо осознать, что она работает на рынке «ипотечного кредитования» (хотя до этого, эксперт мог даже не знать о таком понятии), занимаясь, по сути, созданием этого рынка в России.
     Пример 2: Маркетолог работает над расширением рынка своей компании, однако в рамках его текущего видения рынка он не видит новых возможностей. Для того, чтобы увидеть их, ему необходимо «подняться» над ситуацией - посмотреть на нее шире, чем он смотрит в настоящий момент. Другими словами - расширить контекст его текущего видения.
     Пример 3: Конструктор создает новый продукт. В своей работе он часто сталкивается с задачами, которые не имеют решения в рамках его текущего опыта и знаний. Для того чтобы решить их, ему надо расширить свое видение предметной области. Т.е. расширить контекст предмета с которым он работает (рис. 12). 


     Рис. 12. Поиск неизвестного 

     Система Internet Analyst позволяет решать задачи поиска неизвестных эксперту сущностей и понятий, расширения его кругозора. В такой ситуации пользователь просто оставляет поле ключевых слов свободным, и работает лишь с контекстными терминами и словосочетаниями.
     При расширении контекста в отсутствии ключевых слов, объем начальной выборки увеличивается за счет привлечения дополнительных терминов и понятий, связанных с начальными. Однако, по мере роста числа контекстных терминов, первые места в Панели результатов занимают документы наиболее отвечающие заданной тематике. Таким образом, расширение выборки не мешает пользователю получить, скажем “Top 10” лучших документов по любой тематике, даже если ее контекст содержит сотни понятий, и вся выборка целиком становится необозримой. Причем, чем больше контекст, тем более надежна выборка “Top 10”. Интерактивное формирование богатого контекста позволяет легко и безошибочно находить документы по любой тематике.
     Пример  расширения контекста средствами системы Internet Analyst приведен на рисунке (рис. 13). 


     Рис. 13. Расширение контекста 

     2.2.4. Поиск связей (пересечение  контекстов)
     Работа  с контекстом позволяет экспертам находить не только документы, но и понятия, связывающие различные информационные объекты.
     Например: существует контекст «Александр Семеняка» - известный управленец, работавший на различных позициях в компании Газпром, и контекст «Ипотечное кредитование», содержащий документы по данной тематике. Между этими двумя контекстами существует соединяющий контекст «АИЖК» (в настоящий момент Александр Семеняка является генеральным директором компании АИЖК). Internet Analyst позволяет выявлять связи между различными объектами за счет выявления связующих контекстов (рис. 14). 


     Рис. 14. Соединяющий контекст 

     Как видно на рисунке (рис. 15) , в запросе  задано два различных контекста («Александр Семеняка» и «Ипотечное кредитование») при выполнении запроса, в качестве контекстных подсказок выдаются контексты наиболее «сильно» связанные с указанными в запросе. Как видно на схеме наиболее явной связью между заданными объектами является компания АИЖК. 


     Рис. 15 Поиск связей 

     2.2.5. Использование временных рядов
     В системе Internet Analyst выборки документов можно представлять в виде временных рядов, показывающих каким образом документы распределены во времени. Это позволяет отслеживать информационные «всплески» и тренды в любых выборках выдаваемых системой.
     На  рисунке ниже, представлено временное  распределение документов по запросу  «Дилог-оптим» за 2004 год. Как видно  из графика, наиболее количество документов по данной теме было получено в июле (время кризиса банка Диалог-оптим) (рис. 16).
и т.д.................


Перейти к полному тексту работы


Скачать работу с онлайн повышением уникальности до 90% по antiplagiat.ru, etxt.ru или advego.ru


Смотреть полный текст работы бесплатно


Смотреть похожие работы


* Примечание. Уникальность работы указана на дату публикации, текущее значение может отличаться от указанного.