На бирже курсовых и дипломных проектов можно найти образцы готовых работ или получить помощь в написании уникальных курсовых работ, дипломов, лабораторных работ, контрольных работ, диссертаций, рефератов. Так же вы мажете самостоятельно повысить уникальность своей работы для прохождения проверки на плагиат всего за несколько минут.

ЛИЧНЫЙ КАБИНЕТ 

 

Здравствуйте гость!

 

Логин:

Пароль:

 

Запомнить

 

 

Забыли пароль? Регистрация

Повышение уникальности

Предлагаем нашим посетителям воспользоваться бесплатным программным обеспечением «StudentHelp», которое позволит вам всего за несколько минут, выполнить повышение уникальности любого файла в формате MS Word. После такого повышения уникальности, ваша работа легко пройдете проверку в системах антиплагиат вуз, antiplagiat.ru, etxt.ru или advego.ru. Программа «StudentHelp» работает по уникальной технологии и при повышении уникальности не вставляет в текст скрытых символов, и даже если препод скопирует текст в блокнот – не увидит ни каких отличий от текста в Word файле.

Результат поиска


Наименование:


реферат Индексация документов

Информация:

Тип работы: реферат. Добавлен: 09.10.2012. Сдан: 2012. Страниц: 17. Уникальность по antiplagiat.ru: < 30%

Описание (план):


Содержание

Введение 2
Глава 1 Справочные информационные системы 3
Глава 2 Индексация, проблемы и плюсы 8
Заключение 16
Список использованной литературы 17


Введение

Операционные системы и языки программирования не ориентированы на специфические параметры логической и физической организации баз данных; для описания баз данных недостаточно стандартных прикладных программ, требуется специальное программное обеспечение, создаваемое и обрабатываемое с помощью программных средств (языки программирования СУБД); доступ к данным требует разработки специальных алгоритмов и управляющих программ.
В операционных системах и языках программирования не разработаны вопросы специальной обработки баз данных (целостность и не противоречивость данных, декомпозиция запросов, параллельное выполнение транзакций; не предусмотрены операции реляционной алгебры, которые необходимы в реляционных базах данных.
Индексация - проставление при регистрации порядковых номеров и необходимых условных обозначений, указывающих место составления или хранения документа. В качестве условных обозначений могут использоваться порядковые номера (коды) из классификатора постоянных корреспондентов, структурных подразделений или должностных лиц, вопросов деятельности и т.д.
Полнотекстовая индексация. Совершенствование и распространение систем оптического распознавания текста, а также совершенствование алгоритмов, основанных на элементах искусственного интеллекта, вывели на сцену метод автоматической полнотекстовой индексации (Full Text Retrieval).
Цель данной работы: изучить понятие индексации документов. Задача провести анализ плюсов и минусов индексации документов.

Глава 1 Справочные информационные системы

По своей сущности система управления базами данных (СУБД) является инструментом расширения возможностей операционной системы при работе с базами данных.
Организацию баз данных (БД) можно анализировать с двух сторон: под углом зрения внемашиной логики взаимосвязи объектов и с точки зрения ее последующей внутримашинной физической реализации [132, с. 104-119]. Логические представления о свойствах и отношениях объектов предметной области определяют построением внешней, информационно-логической модели, которая не зависит от способов физического размещения данных. В такой модели объекты представлены типами записей, свойства — полями записей, а отношения — связями между типами и полями записей.
Наглядное изображение логической модели возможно двумя способами: графическим, когда схема строится в виде ориентированного графа с вершинами типов записей и дугами связей, и табличным, где каждому типу записи (объекту) соответствует таблица с множеством полей и (свойств). Известны три разновидности информационно-логической модели.
• Иерархическая модель баз данных (ИМД) основана на графическом способе и предусматривает поиск данных по одной из ветвей «дерева», в котором каждая вершина имеет только одну связь с вершиной более высокого уровня. Для осуществления поиска необходимо указать полный путь к данным, начиная с корневого элемента.
• Сетевая модель баз данных (СМД) также основана на графическом способе, но допускает усложнение «дерева» без ограничения количества связей, входящих в вершину. Это позволяет строить сложные поисковые структуры.
• Реляционная модель баз данных (РМД) реализует табличный способ. В РМД таблица называется отношением, строка — кортежем, а столбцы — атрибутами.
Область, в которой находится подмножество возможных значений атрибута, является областью определения атрибута — доменом. Характер таблицы (отношения) определяется не только количеством кортежей числом атрибутов п, которое определяет арность отношения.
При над одного атрибута (п=1) отношение называется унарным, двух атрибутов (п=2) — бинарным, трех атрибутов (п=3) — тернарным и т.д. Основное требование к отношению РМД состоит в том, что значения атрибутов должны быть элементарной, неделимой информационной единицей, что создает возможность применения в целях обработки математического аппарата реляционной алгебры.
Следует также учитывать, что: во-первых фиксированный порядок следования атрибутов не играет особой роли и допустима любая последовательность их обработки; во-вторых, порядок следования картежей безразличен; в-третьих, отношение не может иметь двух одинаковых кортежей.
Работа с реляционной моделью часто включает удаление и добавление кортежей и атрибутов, что ведет к искажению информации и вызывает необходимость нормализации — приведения отношений к нормализации – приведение отношений к нормальной форме (НФ) в соответствии с описанными ранее основными требованиями. Используются четыре нормальные формы: первая (1 НФ), вторая (2 НФ) третья (3 НФ), четвертая (4 НФ). Каждая из форм нормализации достигается проведением соответствующего этапа нормализации.
Все отношения обязательно должны находиться в форме 1 НФ, что обеспечивается применением декомпозиции (разделения) отношения на эквивалентную совокупность отношений более низкого уровня.
Конкретные способы и средства размещения данных, описанные в логической модели, в физической среде хранения, определяют построение внутренней, физической модели организации баз данных. Физическая модель должна отвечать следующим требованиям:
• сохранению смыслового содержания логической модели;
• максимальной экономии внешней памяти;
• минимизации затрат по управлению данными;
• максимальному быстродействию при поиске и при обработке запросов;
Физическое моделирование осуществляется средствами СУБД: языком описания данных (ЯОД), языком манипулирования данными (ЯМД), структурами хранения и поиска. Создаваемые модели могут базироваться на структуре хранения данных, или сочетать структуру хранения с поисковыми структурами. В последнем случае, после завершения этапа физического моделирования в памяти ЭВМ появляются файл базы данных и файлы поисковых структур. К поисковым относят следующие: .............

Заключение

Проблема поиска документов реально существует. По некоторым данным, на поиск необходимой информации может понадобиться до 30% рабочего времени, при этом гарантия нахождения нужного документа отсутствует – до 10% документов теряются безвозвратно и создаются заново.
При применении системы управления документами в организациях и компаниях с развитым делопроизводством чрезвычайно эффективным может оказаться реквизитный поиск.
Как правило, в этих случаях речь идет об обработке большого количества одинаковых по структуре стандартных документов (приказов, актов, писем и др.).
Полнотекстовый поиск, конечно же, применим и здесь, но не всегда эффективен: пользователь в результате запроса может получить весь ассортимент изданных приказов, различающихся номером, датой и, может быть, фамилией исполнителя. Отыскание нужного приказа в этих условиях может стать затруднительным.
Однако такой документ, как правило, элементарно может быть найден по значению соответствующего реквизита – регистрационного номера, даты или имени исполнителя (возможны варианты). Незаменим реквизитный поиск и при работе с корпоративным электронным архивом, содержащим нетекстовые документы.
В целом, комплексное и творческое применение двух вышеописанных методов поиска обеспечивает выполнение ключевой задачи управления электронными документами.


Список использованной литературы

1. Прокопчук Л.О., Козырев А.А. Применение компьютерных программных прдуктов - СПб.: Издательство СПбГТУ, 2001.
2. Прокопчук Л.О., Козырев А.А. Стратегическое планирование: конспект лекций. - СПб.: Изд-во Михайлова В.А., 2003
3. Козырев АА. Стратегическое управление. Учебное пособие. -СПб.: Изд-во «Нестор», 2002
4. Пур А. Технология записываемых дисков DVD... // PC Magazine/Russian dition. - 2004№ 7. - С.48.
5. Пэйшент С. Сверхзвук// КомпьютерПресс. - 2003№ 3. - С. 199.
6. Райер К., Ротенберг М. Photoshop 5.0 - новая версия известного пакета C Magazine Russian Edition. -2004 - С. 167-169.
7. Рогожкин И. Жидкие кристаллы против ЭЛТ // PCWeek/RE. - 2002 24. - С.38.
8. Рогожкин И.Б. Новые стандарты в мониторах Samsung // Мир ПК. – 2005 7-8. - С. 130.
9. Рогожкин И.Б., Романов А.В. Модули памяти для ПК // Мир ПК. - 2004 10. - С. 27.
10. Романовский А. Матричные, струйные, лазерные// CompUnity. - 2001 4(8). - С. 84.
11. РоуледжД. Ваш персональный компьютер (серия «Без проблем»). - М.: БИНОМ,2002.
12. Рош УЛ. Библия по техническому обеспечению Уинна Роща / Пер. с англ. - н.: МХХК «Динамо»", 1992.
13. Рынок серверных систем 2006 битва архитектур // C-News: computers, communications, e-commerce, cnews.ru/comments/servers/ (12 авг. 2006г.).



Перейти к полному тексту работы


Скачать работу с онлайн повышением уникальности до 90% по antiplagiat.ru, etxt.ru или advego.ru


Смотреть похожие работы


* Примечание. Уникальность работы указана на дату публикации, текущее значение может отличаться от указанного.