На бирже курсовых и дипломных проектов можно найти образцы готовых работ или получить помощь в написании уникальных курсовых работ, дипломов, лабораторных работ, контрольных работ, диссертаций, рефератов. Так же вы мажете самостоятельно повысить уникальность своей работы для прохождения проверки на плагиат всего за несколько минут.

ЛИЧНЫЙ КАБИНЕТ 

 

Здравствуйте гость!

 

Логин:

Пароль:

 

Запомнить

 

 

Забыли пароль? Регистрация

Повышение уникальности

Предлагаем нашим посетителям воспользоваться бесплатным программным обеспечением «StudentHelp», которое позволит вам всего за несколько минут, выполнить повышение уникальности любого файла в формате MS Word. После такого повышения уникальности, ваша работа легко пройдете проверку в системах антиплагиат вуз, antiplagiat.ru, etxt.ru или advego.ru. Программа «StudentHelp» работает по уникальной технологии и при повышении уникальности не вставляет в текст скрытых символов, и даже если препод скопирует текст в блокнот – не увидит ни каких отличий от текста в Word файле.

Работа № 27120


Наименование:


Диплом Создание автоматизированной системы обработки и хранения библиографических данных

Информация:

Тип работы: Диплом. Предмет: Базы данных. Добавлен: 01.03.2011. Сдан: 2010. Страниц: 66. Уникальность по antiplagiat.ru: 0.

Описание (план):


МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ
ДАЛЬНЕВОСТОЧНЫЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
Институт физики и информационных технологий
Факультет информационных технологий
Кафедра компьютерных систем


Создание автоматизированной системы обработки и хранения библиографических данных для лаборатории нанотехнологий ДВГУ

СОДЕРЖАНИЕ
ПЕРЕЧЕНЬ УСЛОВНЫХ ОБОЗНАЧЕНИЙ 3
ВВЕДЕНИЕ 4
1 Системы управления баз данных 6
2 Электронные каталоги 13
2.1 ОБЩИЕ СВЕДЕНИЯ ОБ ЭЛЕКТРОННОЙ КАТАЛОГИЗАЦИИ 13
2.2 ВАРИАНТ СОЗДАНИЯ БД В ВИДЕ ТАБЛИЦЫ MICROSOFT EXCEL 17
2.3 ВАРИАНТ СОЗДАНИЯ БД С ПОМОЩЬЮ СУБД VISUAL FOXPRO 20
2.3 ВАРИАНТ СОЗДАНИЯ БД С ПОМОЩЬЮ СУБД MICROSOFT ACCESS 22
3 Автоматизированная система обработки и хранения данных для лаборатории нанотехнологии ДВГУ 26
3.1 БАЗА ДАННЫХ НАУЧНЫХ ПУБЛИКАЦИЙ 26
3.2 АВТОМАТИЗАЦИ ЗАПОЛНЕНИЯ БД 33
ЗАКЛЮЧЕНИЕ 38
СПИСОК ЛИТЕРАТУРЫ 39
Приложение А (справочное) Код макроса VBA 41









ПЕРЕЧЕНЬ УСЛОВНЫХ ОБОЗНАЧЕНИЙ
БД – база данных
АИС – автоматизированную информационную систему
СУБД – система управления баз данных
SDL – язык определения схемы БД
DML – язык манипулирования данными
SQL – Structured Query Language
MARC – Machine-Readable Cataloging
DOI – идентификатор цифрового объекта
PACS – Physics and Astronomy Classification Scheme
PDF – Portable Document Format
VBA – Visual Basic for Applications






ВВЕДЕНИЕ
Труд ученого, инженера, конструктора тесно связан с переработкой “информационной руды”, причем процесс этот в наше время усложняется обилием информационных источников и их рассредоточенностью по многим странам и регионам. Невозможность аналитически охватить все научные публикации в мире приводит к частичному дублированию исследований, увеличению сроков разработок, отставанию в системе образования и т. д. В результате в мире сложилась ситуация, когда поток генерируемой информации начал опережать возможности человечества по ее переработке и эффективному использованию. Объясняется это прежде всего тем, что единственным инструментом переработки информации был и остается человеческий мозг.
Вполне понятно, что в создавшейся ситуации необходимо направить достижения науки и техники, связанные с переработкой и передачей информации, на совершенствование информационного обслуживания общества. Очевидно, что поиск необходимой информации в настоящее время без привлечения автоматизированных систем и широкой кооперации на основе электронных средств передачи информации оказывается малоэффективным и не может обеспечить производство и научные исследования на уровне требований времени. Необходимо применение принципиально новых методов и средств обработки, хранения и передачи информации, оперирующих с большими ее объемами в реальном времени.
Автоматизированные информационные системы (АИС), основу которых составляют БД, появились в 60-х годах в военной промышленности и в бизнесе – там, где были накоплены значительные объемы полезных данных. Первоначально АИС были ориентированы лишь на работу с информацией фактического характера – числовыми или текстовыми характеристиками объектов. Затем, по мере развития техники, появилась возможность обрабатывать текстовую информацию на естественном языке. Документальные АИС служат для работы с документами на естественном языке. Наиболее распространенный тип документальной АИС – информационно-поисковые системы, предназначенные для накопления и подбора документов, удовлетворяющих заданным критериям. Они могут выполнять просмотр и подборку монографий, публикаций в периодике, сообщений пресс-агентств, текстов законодательных актов и т.д. [1].
Обработка данных – специальный класс решаемых на ЭВМ задач, требуемый при создании АИС, связанных с вводом, хранением, сортировкой, отбором и группировкой записей данных однородной структуры. Системы управления базами данных (СУБД) играют существенную роль в современном мире, обеспечивая актуальной информацией специалистов, пользователей в той или иной предметной области. Умение работать с БД сегодня является одним из важнейших навыков в работе с компьютером.
Целью моей дипломной работы является разработка и создание АИС для лаборатории нанотехнологий ДВГУ, состоящей из БД научных публикаций и системы обработки данных, которая может получать ключевую информацию для поиска.
Основные задачи дипломной работы:
• Изучение методов обработки данных применимых к научным статьям и публикациям
• Создание БД публикаций
• Автоматизация заполнения БД


1 Системы управления баз данных
С самого начала развития вычислительной техники образовались два основных направления ее использования. Первое направление – применение вычислительной техники для выполнения численных расчетов, которые слишком долго или вообще невозможно производить вручную. Второе направление, которое непосредственно касается темы нашего курса, это использование средств вычислительной техники в автоматических или автоматизированных информационных системах. В самом широком смысле информационная система представляет собой программный комплекс, функции которого состоят в поддержке надежного хранения информации в памяти компьютера, выполнении специфических для данного приложения преобразований информации и/или вычислений, предоставлении пользователям удобного и легко осваиваемого интерфейса. Обычно объемы информации, с которыми приходится иметь дело таким системам, достаточно велики, а сама информация имеет достаточно сложную структуру. Классическими примерами информационных систем являются банковские системы, системы резервирования авиационных или железнодорожных билетов, мест в гостиницах и т.д.
После этого краткого экскурса в историю файловых систем рассмотрим возможные области их применения. Прежде всего, конечно, файлы применяются для хранения текстовых данных: документов, текстов программ и т.д. Такие файлы обычно образуются и модифицируются с помощью различных текстовых редакторов. Структура текстовых файлов обычно очень проста: это либо последовательность записей, содержащих строки текста, либо последовательность байтов, среди которых встречаются специальные символы (например, символы конца строки). Файлы с текстами программ используются как входные тексты компиляторов, которые в свою очередь формируют файлы, содержащие объектные модули. С точки зрения файловой системы, объектные файлы также обладают очень простой структурой – последовательность записей или байтов. Система программирования накладывает на эту структуру более сложную и специфичную для этой системы структуру объектного модуля. Подчеркнем, что логическая структура объектного модуля неизвестна файловой системе, эта структура поддерживается программами системы программирования. Аналогично обстоит дело с файлами, формируемыми редакторами связей и содержащими образы выполняемых программ. Логическая структура таких файлов остается известной только редактору связей и загрузчику – программе операционной системы. Примерно такая же ситуация с файлами, содержащими графическую и звуковую информацию. Одним словом, файловые системы обычно обеспечивают хранение слабо структурированной информации, оставляя дальнейшую структуризацию прикладным программам. В перечисленных выше случаях использования файлов это даже хорошо потому, что при разработке любой новой прикладной системы опираясь на простые, стандартные и сравнительно дешевые средства файловой системы можно реализовать те структуры хранения, которые наиболее естественно соответствуют специфике данной прикладной области.
СУБД решают множество проблем, которые затруднительно или вообще невозможно решить при использовании файловых систем. При этом существуют приложения, для которых вполне достаточно файлов, приложения, для которых необходимо решать, какой уровень работы с данными во внешней памяти для них требуется, и приложения, для которых нужны БД [2].
Основные функции СУБД:
1. Непосредственное управление данными во внешней памяти. Обеспечение необходимых структур внешней памяти как для хранения данных, непосредственно входящих в БД, так и для служебных целей, например, для убыстрения доступа к данным в некоторых случаях (обычно для этого используются индексы).
2. Управление буферами оперативной памяти. СУБД обычно работают с БД значительного размера; по крайней мере этот размер обычно существенно больше доступного объема оперативной памяти. Понятно, что если при обращении к любому элементу данных будет производиться обмен с внешней памятью, то вся система будет работать со скоростью устройства внешней памяти. Практически единственным способом реального увеличения этой скорости является буферизация данных в оперативной памяти. в развитых СУБД поддерживается собственный набор буферов оперативной памяти с собственной дисциплиной замены буферов.
3. Управление транзакциями. Транзакция – это последовательность операций над БД, рассматриваемых СУБД как единое целое. Либо транзакция успешно выполняется, и СУБД фиксирует изменения БД, произведенные этой транзакцией, во внешней памяти, либо ни одно из этих изменений никак не отражается на состоянии БД. Понятие транзакции необходимо для поддержания логической целостности БД. То свойство, что каждая транзакция начинается при целостном состоянии БД и оставляет это состояние целостным после своего завершения, делает очень удобным использование понятия транзакции как единицы активности пользователя по отношению к БД.
4. С управлением транзакциями в многопользовательской СУБД связаны важные понятия сериализации транзакций и сериального плана выполнения смеси транзакций. Под сериализаций параллельно выполняющихся транзакций понимается такой порядок планирования их работы, при котором суммарный эффект смеси транзакций эквивалентен эффекту их некоторого последовательного выполнения. Сериальный план выполнения смеси транзакций – это такой план, который приводит к сериализации транзакций.
5. Журнализация. Одним из основных требований к СУБД является надежность хранения данных во внешней памяти. Под надежностью хранения понимается то, что СУБД должна быть в состоянии восстановить последнее согласованное состояние БД после любого аппаратного или программного сбоя. Обычно рассматриваются два возможных вида аппаратных сбоев: так называемые мягкие сбои, которые можно трактовать как внезапную остановку работы компьютера (например, аварийное выключение питания), и жесткие сбои, характеризуемые потерей информации на носителях внешней памяти. Поддержание надежности хранения данных в БД требует избыточности хранения данных, причем та часть данных, которая используется для восстановления, должна храниться особо надежно. Наиболее распространенным методом поддержания такой избыточной информации является ведение журнала изменений БД. Журнал – это особая часть БД, недоступная пользователям СУБД и поддерживаемая с особой тщательностью (иногда поддерживаются две копии журнала, располагаемые на разных физических дисках), в которую поступают записи обо всех изменениях основной части БД.
6. Поддержка языков БД. Для работы с базами данных используются специальные языки, в целом называемые языками баз данных. В ранних СУБД поддерживалось несколько специализированных по своим функциям языков. Чаще всего выделялись два языка – язык определения схемы БД (SDL) и язык манипулирования данными (DML). SDL служил главным образом для определения логической структуры БД, т.е. той структуры БД, какой она представляется пользователям. DML содержал набор операторов манипулирования данными, т.е. операторов, позволяющих заносить данные в БД, удалять, модифицировать или выбирать существующие данные. В современных СУБД обычно поддерживается единый интегрированный язык, содержащий все необходимые средства для работы с БД, начиная от ее создания, и обеспечивающий базовый пользовательский интерфейс с базами данных. Стандартным языком наиболее распространенных в настоящее время реляционных СУБД является язык Structured Query Language (SQL). SQL сочетает средства SDL и DML, т.е. позволяет определять схему реляционной БД и манипулировать данными.
В некоторых системах эти части выделяются явно, в других – нет, но логически такое разделение можно провести во всех СУБД [3,4].
Обычно современная СУБД содержит следующие компоненты:
1. ядро, которое отвечает за управление данными во внешней и оперативной памяти, и журнализацию
2. процессор языка БД, обеспечивающий оптимизацию запросов на извлечение и изменение данных, и создание, как правило, машинно-независимого исполняемого внутреннего кода
3. подсистему поддержки времени исполнения, которая интерпретирует программы манипуляции данными, создающие пользовательский интерфейс с СУБД
4. сервисные программы (внешние утилиты), обеспечивающие ряд дополнительных возможностей по обслуживанию информационной системы.
Классификация СУБД по модели данных:
1. Иерархические модели данных. Иерархические БД состоит из объектов с указателями от родительских объектов к потомкам, соединяя вместе связанную информацию. Иерархические БД могут быть представлены как дерево, состоящее из объектов различных уровней. Верхний уровень занимает один объект, второй — объекты второго уровня и т. д. Между объектами существуют связи, каждый объект может включать в себя несколько объектов более низкого уровня. Такие объекты находятся в отношении предка (объект более близкий к корню) к потомку (объект более низкого уровня), при этом возможна ситуация, когда объект-предок не имеет потомков или имеет их несколько, тогда как у объекта-потомка обязательно только один предок. Объекты, имеющие общего предка, называются близнецами.
2. Сетевая модель данных. К основным понятиям сетевой модели БД относятся: уровень, элемент (узел), связь. Узел — это совокупность атрибутов данных, описывающих некоторый объект. На схеме иерархического дерева узлы представляются вершинами графа. В сетевой структуре каждый элемент может быть связан с любым другим элементом. Сетевые БД подобны иерархическим, за исключением того, что в них имеются указатели в обоих направлениях, которые соединяют родственную информацию.
3. Реляционная СУБД – СУБД, управляющая реляционными базами данных. Понятие реляционный (от англ. relation – отношение) связано с разработками известного английского специалиста в области систем баз данных Эдгара Кодда. Эти модели характеризуются простотой структуры данных, удобным для пользователя табличным представлением и возможностью использования формального аппарата алгебры отношений и реляционного исчисления для обработки данных. Реляционная модель ориентирована на организацию данных в виде двумерных таблиц.
4. Объектно-ориентированная (объектная) СУБД – система управления базами данных, основанная на объектной модели данных. Эта система управления обрабатывает данные как абстрактные объекты, наделённые свойствами, в виде неструктурированных данных, и использующие методы взаимодействия с другими объектами окружающего мира.
Классификация СУБД по степени распределённости:
1. Локальные СУБД (все части локальной СУБД размещаются на одном компьютере).
2. Распределённые СУБД (части СУБД могут размещаться на двух и более компьютерах).
Классификация СУБД по способу доступа к БД
1. В файл-серверных СУБД файлы данных располагаются централизованно на файл-сервере. СУБД располагается на каждом клиентском компьютере (рабочей станции). Доступ СУБД к данным осуществляется через локальную сеть. Синхронизация чтений и обновлений осуществляется посредством файловых блокировок. Преимуществом этой архитектуры является низкая нагрузка на ЦП сервера. Недостатки: потенциально высокая загрузка локальной сети; затруднённость централизованного управления; затруднённость обеспечения таких важных характеристик как высокая надёжность, высокая доступность и высокая безопасность. Применяются чаще всего в локальных приложениях, которые используют функции управления БД.
2. Клиент-серверная СУБД располагается на сервере вместе с БД и осуществляет доступ к БД непосредственно, в монопольном режиме. Все клиентские запросы на обработку данных обрабатываются клиент-серверной СУБД централизованно. Недостаток клиент-серверных СУБД состоит в повышенных требованиях к серверу. Достоинства: потенциально более низкая загрузка локальной сети; удобство централизованного управления; удобство обеспечения таких важных характеристик как высокая надёжность, высокая доступность и высокая безопасность [5].

2 Электронные каталоги
2.1 Общие сведения об электронной каталогизации
Описание библиографического ресурса в электронной форме является неотъемлемой частью процесса автоматизации библиотечной деятельности. Многообразие видов библиографических ресурсов и способов их описания для задач систематизации и каталогизации, а также поиска накладывает дополнительные требования на качество аппарата описания этих ресурсов. В настоящее время для описания библиографических данных используются структуры стандарта ISO-2709. В мире наиболее распространены два формата USMARC – от англ. Machine-Readable Cataloging(MARC), созданный в Библиотеке Конгресса США и являющийся основным стандартом каталогизации в Соединенных Штатах и формат UNIMARC, созданный International Federartion Library Association – организацией объединяющей библиотеки более 200 стран мира. В России разработан стандарт RUSMARC, основанный на стандарте UNIMARC, но имеющий некоторые особенности и включающий ряд полей описания стандарта USMARC. Процесс описания библиографических ресурсов – это сложный с технологической и производственной точки зрения процесс.
В крупных библиотеках для описания одной книги высококвалифицированному каталогизатору требуется 2-2,5 часа, чтобы описать ее как ресурс и внести все точки доступа и составить необходимые ссылки на авторитетные данные об этой книге. От качества ввода описательной информации о ресурсе зависит в дальнейшем работа большой цепочки программ автоматизации электронного поиска, электронного и кафедрального заказа, книговыдачи, статистики, регистрации и учета читателей, учета движения фонда как внутри одной библиотеки, так и в рамках межбиблиотечного абонемента [6].
В узком понимании этого слова электронный каталог – это база данных о книгах в одной библиотеке, которая хранит список всех книг для осуществления учета поступления, поиска, заказа, книговыдачи, статистических данных и книгообеспеченности.
При столь узком рассмотрении появляется возможность автоматизации работы библиотеки при создании “конвейера книговыдачи”. Если оценить работу библиотеки не с позиции ежеминутной автоматизации (как магазин), где срок хранения информационного объекта и соответственно ссылки на него определяется максимум несколькими годами, в библиотеке информационный ресурс хранится веками и соответственно формат хранения информации должен быть продуман на длительный срок [7].
Так в крупнейших библиотеках страны автоматизация началась с 1973 года, и в те годы началось создание электронных каталогов, которое идет и по сей день и будет продолжаться в течение не одного десятилетия. Библиотека Новосибирска является четвертой по объемам носителей в России, и это значение составляет 16 млн. единиц хранения. В её электронном каталоге нашли отражение лишь 270 тысяч документов в конце 2003 года. Аналогичная ситуация и с другими библиотеками, в том числе областными, краевыми и некоторыми центральными городскими. При таком длительном сроке автоматизации нет смысла говорить о приоритете какого-либо программного обеспечения, поскольку срок жизни программного обеспечения составляет не более 5-7 лет. Также сложно говорить о форматах хранения данных и носителях информации. Насколько изменился спектр программного обеспечения и возможности оборудования с 1990 года, например, не говоря о семидесятых годах.
За столь длительный период времени изменяются не только технические средства, но и мировоззрения людей. Таким образом, встает вопрос о стандартизации с одной стороны и гибкости в описании ресурсов нового поколения с другой. Так, вновь требующие описания электронные ресурсы на магнитных и оптических носителях, определяют дополнительные сложности в создании стандартов описания этих ресурсов.
На начальном этапе автоматизация библиотек понималась лишь как создание электронных каталогов для ускорения и упрощения поиска читателей, однако в процессе развития технологий автоматизации стало ясно, что становится возможным создание технологии для библиотеки, в которой не будет библиотекарей, как это не парадоксально звучит. И единственным связующим звеном в передачи информации от первой идеи электронных каталогов к идеи полной автоматизации и ее воплощению стал формат передачи данных, упомянутый ранее (форматы семейства MARC) .
Электронная каталогизация – это ввод информации об информационном носителе в соответствующие поля, необходимые для описания ресурса (ввод информации в ячейки БД).
Сложности поддержки таких структур баз данных:
• Заранее невозможно сказать, сколько полей потребуется для описания того или иного ресурса и какие они будут. Не секрет, что для описания книги требуется совсем другой набор описательных признаков (точек доступа), чем для описания журнала.
• Невозможно сказать про объем вносимой в поле информации. Так, заглавие может состоять из одного слова, а может составлять до 3 кб текста, если это заглавие к изменению закона. Еще сложнее дело обстоит с вводом аннотаций и содержаний.
• Невозможно сказать про количество ряда полей при описании. Например, у книги может не быть автора, а может быть более 100, если это сборник трудов конференции.
• При работе с библиографическими данными встает вопрос о многоуровневых поисковых системах, например, журнал – номера журналов, имеющиеся в библиотеке с расписанным содержанием и ссылками на используемую литературу авторами статей – описание отдельной статьи журнала – полный текст найденной статьи.
• Использование многоуровневых связок с внешними базами данных, как тезаурусы, словари синонимов, словари переводов, авторитетных файлов, разночтений авторов и заглавий организаций, и т.п.
На основе вышеописанных особенностей можно сделать вывод о неспособности реляционной модели данных удовлетворить всем изложенным требованиям. В результате начали возникать библиографические модели хранения данных. Первая такая модель появилась в 1962 году в США. На данное время список библиографических СУБД, очень схожих с технологией объектных баз данных представлен не менее 10 типами.
В большинстве российских библиотек процесс автоматизации находится в очень плохом состоянии. Обусловлено это, прежде всего, низким уровнем финансирования и низким профессиональным уровнем работающих с вычислительной техникой. Если вопросы обслуживания ЭВМ освещены и достаточно просты, то вопросы создания автоматизированных технологий в библиотеках нигде не описаны. Кроме всего этого у большинства работников библиотек, занятых в автоматизации нет видения этих процессов даже на ближайшие несколько лет. И в большинстве библиотек ни состав программистов, ни руководящий состав не даст гарантии за качество работ по автоматизации.
Проблемы электронной каталогизации. Ввод информации в электронные каталоги библиотек осуществляется, как правило, каталогизаторами, которые тоже самое делали на печатных машинках. Однако, ввод информации в электронную базу данных намного сложнее, чем просто печать. И долгое время единственным критерием качества работы каталогизаторов с электронным каталогом – это количество распечатанных карточек за единицу времени. Утрирование труда наполнения баз данных произошло также за счет появившихся на рынке программных продуктов, где не затронуты вопросы комплексной автоматизации как таковой, а лишь поверхностно получены технические решения. Кроме всего этого в программах автоматизации для ускорения работы были исключены элементы формально-логического контроля вводимых данных на входе, что также не способствовало качественному вводу данных в электронные каталоги библиотек. Кроме всего этого в середине 90-х годов наметилась волна собственных разработок библиотек, которые представляли собой структурированные списки данных, и не более того. Возможности для модульного расширения и модернизации в этих системах отсутствовали [6].
При создании АИС я буду рассматривать только электронные каталоги по способу доступа локальные – доступны только в пределах конкретного помещения (в том числе – с компакт-диска), и по отображаемым ресурсам централизованные – создаются в одном месте.


2.2 Вариант создания БД в виде таблицы Microsoft Excel
Самый простой способ создать электронный каталог – создать простую таблицу и вносить все требуемые данные вручную. Например, в Microsoft Excel в качестве БД можно использовать список.
Список — это способ представления данных, при котором данные в таблице взаимосвязаны и структура таблицы определяется заранее. При выполнении обычных операций с данными, например, при поиске, сортировке или обработке данных, списки автоматически распознаются как БД, при этом курсор должен находиться в любом месте внутри таблицы. Если таблицу считают базой данных, то:
1. столбцы списков становятся полями БД;
2. заголовки столбцов становятся именами полей БД;
3. каждая строка списка преобразуется в запись данных.
Все действия со списками (базой данных) выполняет команда главного меню ДАННЫЕ.
Ограничение накладываемые при созданию списка на размер и расположение списка:
• На листе не следует помещать более одного списка. Некоторые функции обработки списков, например фильтры, не позволяют обрабатывать несколько списков одновременно.
• Между списком и другими данными листа необходимо оставить по меньшей мере одну пустую строку и один пустой столбец. Это позволяет Microsoft Excel быстрее обнаружить и выделить список при выполнении сортировки, наложении фильтра или вставке вычисляемых автоматически итоговых значений.
• В самом списке не должно быть пустых строк и столбцов. Это упрощает идентификацию и выделение списка.
• Важные данные не следует помещать у левого или правого края списка; после применения фильтра они могут оказаться скрытыми.
Ограничение накладываемые при созданию списка на заголовки столбцов:
• Заголовки столбцов должны находиться в первом столбце списка. Они используются Microsoft Excel при составлении отчетов, поиске и организации данных.
• Шрифт, выравнивание, формат, шаблон, граница и формат прописных и строчных букв, присвоенные заголовкам столбцов списка, должны отличаться от формата, присвоенного строкам данных.
• Для отделения заголовков от расположенных ниже данных следует использовать границы ячеек, а не пустые строки или прерывистые линии.
Ограничение накладываемые при созданию списка на содержание строк и столбцов:
• Список должен быть организован так, чтобы во всех строках в одинаковых столбцах находились однотипные данные.
• Перед данными в ячейке не следует вводить лишние пробелы, так как они влияют на сортировку.
• Не следует помещать пустую строку между заголовками и первой строкой данных.
Команда ДАННЫЕ ФОРМА
Форма – это способ представления данных из таблицы, когда на экране представлено содержимое только одной записи.
С помощью формы можно:
1. заносить данные в таблицу;
2. просматривать или корректировать данные;
3. удалять данные;
4. отбирать записи по критерию.
Лучше создать систему таблиц, чем пытаться поместить все в одну таблицу. При модульной конструкции есть один лист для сведений и другой лист для каждого типа анализа. В комплексной модульной системе может быть десяток листов, каждый из которых создан для определенной задачи.
Конечно с одной стороны простота создания и одновременная эффективность (при малых объемах данных) такого вида БД, но с другой стороны ограничения, накладываемые на создаваемую табличную БД достаточно высоки. Довольно известна история о бухгалтере, которые добавил строку внизу диапазона ячеек, но забыл изменить формулы для подсчета общей суммы. В результате он был уволен, поскольку "потерял" 200 тысяч долларов.




2.3 Вариант создания БД с помощью СУБД Visual FoxPro
Visual FoxPro является постоянно развивающейся системой. По сравнению с предыдущей версией, в Visual FoxPro 8.0 сделан еще один шаг в расширении функциональных возможностей системы, улучшены имеющиеся средства, касающиеся интерфейса среды разработки.
Visual FoxPro 8.0 поддерживает технологию IntelliSense, облегчающую создание программного кода. Суть данной технологии состоит в том, что при вводе операторов, свойств и функций FoxPro предлагает на выбор возможные варианты написания. Это уменьшает количество вводимого вручную кода и избавляет разработчика от необходимости лишний раз обращаться к документации. Технология IntelliSense Visual FoxPro содержит следующие функции:
• показывает список допустимых дочерних объектов (свойств, событий, методов) для указанного объекта. Для СОМ-объектов информация считывается из библиотеки типов;
• показывает окно подсказки, содержащее список допустимых параметров или аргументов для команд, функций, свойств, методов и событий.
В редактор Visual FoxPro были добавлены следующие возможности:
• использование для выделения текста на выбор пробела или табулятора с настраиваемыми параметрами;
• настройка строк комментария;
• поддержка в редакторе гиперссылок на Web-страницы или документацию;
• поддержка Dirty File Indicator для отображения времени внесения изменений в код;
• удобная установка точек прерывания в программном коде;
• использование закладок для быстрого возврата на нужный фрагмент кода.
Для настройки параметров редактора используются новые вкладки Editor (Редактор) и IDE (Интерактивная среда разработки) диалогового окна Options (Параметры), которое открывается при выполнении команды Options (Параметры) из меню Tools (Сервис).
Для облегчения работы пользователя с несколькими окнами, такими как Command (Команда), Properties (Свойства) и окном редактора, Visual FoxPro 8.0 позволяет перемещать и закреплять окна, т. е. манипулировать ими по своему усмотрению. Например, вы можете установить командное окно и окно свойств в одно окно-контейнер и привязать его к правому краю экрана, а окно редактора – в другое окно-контейнер, привязав его к левому краю экрана [8].
СОМ-компоненты Visual FoxPro могут использовать свойства, события и методы СОМ-интерфейса, определенного в другом СОМ-компоненте. В Visual FoxPro появилось средство Task List (Список заданий), позволяющее пользователю формировать список задач в проекте и управлять их выполнением.
Приложение Object Browser (Браузер объекта), входящее в состав Visual FoxPro и запускаемое из меню Tools (Сервис), позволяет просматривать свойства, методы и события СОМ-объектов, что очень удобно при работе с объектами, на которые нет документации.
В Visual FoxPro появились новые средства управления XML-файлами:
XMLTOCURSOR – преобразовывает XML-текст в курсор или таблицу Visual FoxPro;
CURSORTOXML – преобразовывает курсор Visual FoxPro в XML-текст. Поддержка Active Accessibility в Visual FoxPro позволяет создавать приложения, которые могут использовать люди с проблемами зрения, слуха или моторики.
В базе данных, созданной в Visual FoxPro, вы можете использовать события, связанные с базой данных, такие как открытие таблицы, добавление или удаление таблицы для проверки прав доступа при открытии таблицы, трассировки выполняемых действий и т. п.
Для работы системы необходимы следующие ресурсы:
• Операционная система (для среды) Microsoft Windows 2000 с Service Pack 2 и выше или Microsoft Windows XP. Microsoft Windows NT 4.0 не поддерживается.
• IBM-совместимый компьютер с процессором не хуже Pentium.
• Наличие мыши.
• Не менее 64 Мбайт оперативной памяти (рекомендуется 128 Мбайт).
• 20 Мбайт свободной памяти – для минимальной установки, 165 Мбайт – для типичной и максимальной установки.
• Монитор типа 800x600 или более высокой разрешающей способности с палитрой 256 цветов (Рекомендуется 16-битовый High Color) [9].
Данная СУБД обладает полным набором функций требуемых для создания требуемой БД и превосходит по возможностям СУБД Microsoft Access описанную в подразделе 2.3, однако Visual FoxPro предназначена для более широких задач и разработка в данной СУБД требуемой задачи будет нерациональна.



2.3 Вариант создания БД с помощью СУБД Microsoft Access
СУБД Microsoft Access является системой управления базами данных реляционного типа. Данные хранятся в такой базе в виде таблиц, строки (записи) которых состоят из наборов полей определенных типов. С каждой таблицей могут быть связаны индексы (ключи), задающие нужные пользователю порядки на множестве строк. Таблицы могут иметь однотипные поля (столбцы), и это позволяет устанавливать между ними связи, выполнять операции реляционной алгебры. Типичными операциями над базами данных являются определение, создание и удаление таблиц, модификация определений (структур, схем) существующих таблиц, поиск данных в таблицах по определенным критериям (выполнение запросов), создание отчетов о содержимом БД.
СУБД позволяет задавать типы данных и способы их хранения. Можно также задать критерии (условия), которые СУБД будет в дальнейшем использовать для обеспечения правильности ввода данных. В самом простом случае условие на значение должно гарантировать, что не будет введен случайно в числовое поле буквенный символ. Другие условия могут определять область или диапазоны допустимых значений вводимых данных.
Microsoft Access предоставляет максимальную свободу в задании типа данных (текст, числовые данные, даты, время, денежные значения, рисунки, звук, электронные таблицы). Можно задавать также форматы хранения представления этих данных при выводе на экран или печать. Для уверенности, что в базе хранятся только корректные значения, можно задать условия на значения различной степени сложности.
Так как Microsoft Access является современным приложением Windows, можно использовать в работе все возможности DDE (динамический обмен данными) и OLE (связь и внедрение объектов). DDE позволяет осуществлять обмен данными между Microsoft Access и любым другим поддерживающим DDE приложением Windows. В Microsoft Access можно при помощи макросов или Access Basic осуществлять динамический обмен данными с другими приложениями.
OLE является более изощренным средством Windows, которое позволяет установить связь с объектами другого приложения или внедрить какие-либо объекты в базу данных Access. Такими объектами могут быть картинки, диаграммы, электронные таблицы или документы из других поддерживающих OLE приложений Windows.
В Microsoft Access для обработки данных базовых таблиц используется мощный язык SQL (структурированный язык запросов). Используя SQL можно выделить из одной или нескольких таблиц необходимую для решения конкретной задачи информацию. Access значительно упрощает задачу обработки данных. Совсем не обязательно знать язык SQL. При любой обработке данных из нескольких таблиц Access использует однажды заданные связи между таблицами.
В Microsoft Access имеется также простое и в то же время богатое возможностями средство графического задания запроса – так называемый «запрос по образцу», которое используется для задания данных, необходимых для решения некоторой задачи. Используя для выделения и перемещения элементов на экране стандартные приемы работы с мышью в Windows и несколько клавиш на клавиатуре, можно буквально за секунды построить довольно сложный запрос.
Microsoft Access спроектирован таким образом, что он может быть использован как в качестве самостоятельной СУБД на отдельной рабочей станции, так и в сети – в режиме «клиент-сервер». Поскольку в Microsoft Access к данным могут иметь доступ одновременно несколько пользователей, в нем предусмотрены надежные средства защиты и обеспечения целостности данных. Можно заранее указать, какие пользователи или группы пользователей могут иметь доступ к объектам (таблицам, формам, запросам) БД. Microsoft Access автоматически обеспечивает защиту данных от одновременной их корректировки разными пользователями. Access также опознает и учитывает защитные средства других подсоединенных к базе данных структур (таких, как БД Paradox, dBASE и SQL).
Практически все существующие СУБД имеют средства разработки приложений, которые могут использованы программистами или квалифицированными пользователями при создании процедур для автоматизации управления и обработки данных.
Microsoft Access предоставляет дополнительные средства разработки приложений, которые могут работать не только с собственными форматами данных, но и с форматами других наиболее распространенных СУБД. Возможно, наиболее сильной стороной Access является его способность обрабатывать данные электронных таблиц, текстовых файлов, файлов dBASE, Paradox, Btrieve, FoxPro и любой другой БД SQL, поддерживающей стандарт ODBE. Это означает, что можно использовать Microsoft Access для создания такого приложения Windows, которое может обрабатывать данные, поступающие с сетевого сервера SQL или БД SQL на главной ЭВМ[10].
Для работы с СУБД Microsoft Access 2003 требуются:
• Персональный компьютер с процессором Intel Pentium 233 Мгц (рекомендуется процессор Pentium III)
• 128 Мб RAM или более.
• 180 Мб свободного пространства на жестком диске.
• Мышь (желательно).
• Super VGA (800 × 600) или монитор с более высоким разрешением.
• Операционная система Microsoft Windows® 2000 с Service Pack 3 (SP3), Microsoft Windows XP или более поздние версии[11].
Все выше сказанное позволило остановить выбор на СУБД Access для решения поставленной задачи создания БД для АИС.


3 Автоматизированная система обработки и хранения данных для лаборатории нанотехнологии ДВГУ
3.1 База данных научных публикаций
Процесс проектирования БД был разбит на последовательное решение нескольких задач:
1. Исследование информационного пространства БД.
2. Составление списка информационных объектов.
3. Выбор полей первичных ключей.
4. Рассмотрение и установление связей между объектами.
Данные в базу данных могут поступать через импорт файла Microsoft Excel установленного образца либо через добавление пользователем. Интерфейс пользователя должен быть построен основе форм Access.
Набор сохраняемых в базе данных сведений о публикации должен быть близок к набору, который содержится в каталожных карточках обычных библиотек. Он должен быть достаточен для оперативного поиска электронных документов средствами БД и отображения на экране компьютера списка документов, соответствующих критериям поиска. Формы поиска документов должны быть простыми, а методики работы с ними должны быть похожими на методики работы пользователя в обычных библиотеках. Поиск документов должен осуществляться как по отдельному свойству (фамилия автора, издательство и т.д.), так и по произвольному набору свойств[12,13]. Следует выделить следующие атрибуты публикаций:
1. Название (заглавие) публикации.
2. Идентификатор цифрового объекта (DOI).
3. Расположения публикации в формате doc.
4. Расположение публикации в формате PDF.
5. Набор и шести видов дат – received, revised, published, corrected, accepted, in final form.
6. Название каталога, к которому принадлежит публикация.
7. Серия каталога.
8. Выпуск каталога.
9. Подраздел каталога.
10. Автор (фамилия и имена (инициалы) или псевдоним каждого автора).
11. Код Physics and Astronomy Classification Scheme (PACS) и его расшифровка
12. Ключевые слова и фразы.
Анализ определенных выше атрибутов позволяет выделить сущности проектируемой БД и, приняв решение о создании реляционной БД с помощью Microsoft Office Access, построить ее инфологическую модель на языке “Таблицы-связи” (смотри рисунок 1)
К стержневым сущностям можно отнести:
1. Дата (ID даты, дата 1, дата 2, дата 3, дата 4, дата 5, дата 6, счет1).
Введение дополнительных целочисленных атрибутов счет1, счет2, код0, код1, код2, код3 необходимо при внесении и фильтрации данных.
2. Каталог(ID каталога, Название каталога, Серия, Выпуск, Подраздел, счет2).
Ключевая сущность, описывающая публикацию и её конкретные экземпляры, оказываются зависимой от других сущностей, и попадает в класс обозначений:
1. Статья(ID Статьи, Название, Введение, ID даты, DOI, Расположение DOC, ID каталога, Поле Ole, код0)[Дата, Каталог]
Стержневые сущности и обозначения связаны между собой ассоциациями:
1. Авторы статей [Статья M, Авторы N](ID статьи, ID автора)
2. Набор ключевых слов [Статья M, Ключ слова N] (ID статьи, ID Ключа)
3. Набор PACS [Статья M, PACS с расшифровкой N] (ID статьи, ID PACS)
























Рисунок 1 – Инфологическая модель БД научных публикаций

В данном проекте не нарушены какие-либо принципы нормализации, т.е. что любое неключевое поле каждой таблицы:
• функционально зависит от полного первичного ключа, а не от его части (если ключ составной);
• не имеет функциональной зависимости от другого неключевого поля.
• Сущности Авторы статей, Набор ключевых слов, Набор PACS не имеющие неключевых полей нормализованы [14].
Определившись с проектом БД, были созданы девять основных таблиц и три вспомогательных:
1. “catalog1” – таблица, создаваемая автоматически при внесении нового каталога (в неё добавляются данные из таблицы Microsoft Excel)
2. временная – таблица, для корректировки данных при фильтрации
3. временная1 – в ней содержатся все отфильтрованные через поиск ID статьи
В таблицах данные распределяются по столбцам (которые называют полями) и строкам (которые называют записями). Все данные, содержащиеся в поле таблицы, должны иметь один и тот же тип. Каждое поле таблицы характеризуется наименованием, типом и шириной поля. При задании типа данных поля можно также указать размер, формат и другие параметры, влияющие на отображение значения поля и точность числовых данных
Запросы позволяют выбирать данные из одной или нескольких связанных таблиц. Результатом выполнения запроса является результирующая таблица, которая наряду с другими таблицами может быть использована при обработке данных. С помощью запросов можно также обновлять, удалять или добавлять данные в таблицы. Основным назначением запросов является отбор данных по критериям поиска[15].
Было создано шестьдесят девять запросов, из них двадцать четыре запроса на выборку, тридцать запросов на добавление, семь запросов на обновление и восемь запросов на удаление. Некоторые из этих запросов увидеть на рисунке 2. Большое количество запросов объясняется их простотой, и использованием в связках в макросах.


















Рисунок 2 – Запросы БД научных публикаций.

Формы – одно из основных средств для работы с базами данных в Access – используются для ввода новых записей (строк таблиц), просмотра и редактирования уже имеющихся данных, задания параметров запросов и вывода ответов на них и др.
В моей базе данных было создано четыре формы, внешний вид которых показан на рисунке 3, из которых одна форма основная и формы три подчиненные (т.е. внедренные в уже существующую форму). Вид основной формы строго зафиксирован, как одиночная форма, а подчиненные формы

Рисунок 3 – Готовый вид формы БД научных публикаций.

В основной форме “Статья” находятся поля с данными:
1. “Название каталога”.
2. “Серия”.
3. “Выпуск”.
4. “Подраздел”.
5. “Название статьи”.
6. “DOI”.
7. “Расположение DOC”.
8. “received”, “revised”, “published”, “corrected”, “accepted”, “in final form” – различные даты характеризующие публикацию.
9. “Переход на источник” (поле открывающее публикацию в формате PDF).
10. “Поиск статей” – используется для ввода поисковых данных, данные можно вносить через запятую.
В основной форме “Статья” находятся кнопки:
1. “Внесение данных” – вносит в БД новые публикация из данных в документе Microsoft Excel полученных после автоматизированного сбора данных.
2. “Удаление повторений” – удаляются полные дубли строк в таблице(ключевые поля не учитываются) во всех таблицах(кроме таблицы “Статья”) и обновляются данные в связанных таблицах.
3. “Сменить форму вывода авторов” – позволяет изменять режим вывода подчиненной формы “Подчиненная форма Авторы”.
4. “Сменить форму вывода ключевых слов”.
5. “Сменить форму вывода PACS”.
6. “Дополнительный поиск” – кнопка вызывающая стандартный поиск
7. “искать” – выполняется поиск и фильтрация текущих статей по введенным данным в поле “Поиск статей”.
8. “показать все статьи” – показывает все статьи находящиеся в базе данных (отменяет фильтрацию выполненную кнопкой “искать”).
9. “Удалить текущую статью” – удаляет выбранную статью.
10. Кнопки встроенной фильтрации по полям.
11. Кнопка очисть встроенные фильтры.
12. Кнопка выхода из БД.
В подчиненной форме “Подчиненная форма Авторы” находятся поля с данными:
1. “Автор” – поле со списком, позволяющее указать одного из существующих авторов.
В подчиненной форме “Подчиненная форма ключевые слова” находятся поля с данными:
1. “Ключевое слово” – поле со списком, позволяющее указать одно из существующих ключевых слов.
В подчиненной форме “Подчиненная форма PACS” находятся поля с данными:
1. “Название PACS”.
2. “Расшифровка PACS”.
3. “укажите требуемый PACS” – поле со списком, позволяющее указать одно из существующих ключевых PACS (доступно только в режиме одиночной формы).
В каждой из подчиненных форм в режиме одиночной формы находится кнопка позволяющая удалить выбранного автора, ключевое слово или PACS соответственно.
Таким образом, БД представляет собой законченную структуру пригодную к эксплуатации.


3.2 Автоматизация заполнения БД
Изначально были проанализированы несколько десятков научных публикаций. Результатом анализа было несколько выводов:
1. Все публикации находятся в формате Portable Document Format (PDF) — кроссплатформенный формат электронных документов, созданный фирмой Adobe Systems с использованием ряда возможностей языка PostScript.
2. Все документы отличатся по структуре расположения данных, т.е. невозможно их разбить на несколько подтипов для написания программы поиска данных.
3. В большинстве научных публикаций присутствует DOI — стандарт обозначения представленной в сети информации об объекте (обычно, но не обязательно электронном документе или цифровом объекте). Информация, содержащаяся в DOI электронного документа содержит указатель его местонахождения (например, URL), его название, прочие идентификаторы объекта и ассоциированный с объектом набор описывающих его метаданных в структурированном и расширяемом виде.
Все DOI были разбиты на 4 группы по интернет ресурсам, содержащим структурированные данные о статьях.
Формат PDF сохраняет точную визуальную копию документа, но не его логическую структуру. Как следствие, PDF достаточно сложно редактировать. Соответственно его необходимо перекодировать в любой другой формат удобный для редактирования и поиска DOI. В качестве такого формата был выбран стандартный формат doc. Для конвертации файлов используется специализированная программа Solid Converter PDF версии 6.0 способная быстро и качественно преобразовывать выбранные файлы. Программа имеет интуитивно понятный интерфейс, три возможных режима преобразования PDF документа и три возможных формата вывода. На рисунке 4 показан внешний вид основного окна этой программы.

Рисунок 4 – Внешний вид программы Solid Converter PDF.

Я использовал последовательный режим преобразования, который восстанавливает форматированный текст и графику. Этот режим лучше сохраняет текстовые данные научных публикаций и рисунки документа, но не восстанавливает данные по колонкам и выполняется оптимальное время по сравнению с другими режимами.
Получив набор текстовых документов в Microsoft Word с помощью макросов Visual Basic for Applications (VBA), была написана подпрограмма способная в указанной пользователем папке:
1. находятся все текстовые документы формата doc
2. последовательно открываются текстовые документы формата doc (если найдены)
3. производить поиск DOI в каждом документе
4. в результате работы макроса появляется новая таблица Excel с соответствиями путь к статье в формате doc – DOI
Этот макрос проверен и работает как в Office 2007, так и Office 2003.
Написан макрос VBA в Microsoft Excel код, которого можно посмотреть в приложении А. Все полученные данные из макроса VBA выполняющего поиск DOI должны быть помещены на лист data.
1. Сначала этот макрос определяет, к какому из четырех определенных заранее типов по своей структуре соответствует текущий DOI
2. Затем происходит закачка и сохранение как с:\Plex(xla).xls интернет страницы с соответствующего интернет адреса образованного из DOI и сайтов интернет журналов.
3. После этого происходит в соответствии с типом DOI открытие скачанной страницы и изъятие информации. Для каждого из четырех типов страниц написаны свои методы извлечения информации.
4. После извлечения по всем публикациям данных запускается корректировка данных.
В результате полученная таблица имеет удобный вид для переноса в базу данных.
Составлена подробная инструкция по сбору данных:
1. Изначально нужно установить программу Solid Converter PDF (если программа не установлена).
2. Конвертировать с помощью программы Solid Converter PDF требуемые научные публикации в формат *.doc в режиме “последовательный” (для удобства можно указать, чтобы все полученные документы сохранялись в одну папку).
3. Запустите макрос “Поиск_Дои” из документа Microsoft Word ПоискDOI.doc и укажите путь к папке, содержащей научные публикации в формате doc.
4. После завершения работы макроса, полученные данные перенесите в документ Microsoft Excel КАТАЛОГ.xls расположенном в корневом каталоге диска С:\ (данные поместить на лист “data”).
5. Настроить Microsoft Excel (если не настроено)
• кнопка Office – параметры Excel – дополнительно – параметры веб-документа – загружать с веб-страниц рисунки, не созданные в Excel(выключить) (для Office 2007) .
• кнопка Office – параметры Excel – дополнительно – перемещать объекты вместе с ячейками (выключить)
6. В документе КАТАЛОГ.xls запустить макрос “Kach” (При повторном запуске все данные стираются).
















ЗАКЛЮЧЕНИЕ
В данной дипломной работе разработан и реализован один из вариантов реализации АИС для лаборатории нанотехнологий ДВГУ. В ходе дипломной работы используя возможности инструментальной среды быстрой разработки и исполнения приложений СУБД Access, и объектно-ориентированным языком программирования VBA была создана АИС с дружественным пользовательским интерфейсом. АИС дает возможность упрощенного занесения данных и быстрого поиска требуемой публикации для научных сотрудников лаборатории. В результате система является законченной и может использоваться по прямому назначению.
Так как интеграция информационных систем во все сферы жизни увеличивается с каждым днем, то актуально становится разработка подобных АИС. При этом разработчик должен учитывать то, что наиболее простые БД могут быть подвержены избыточности, но при этом нельзя и увлекаться делением БД на много составных таблиц. Также современные средства дружественного интерфейса позволяют разработать интуитивно понятные приложения, что является одним из основных требований заказчика. При создании АИС необходимо принять во внимание область, для которой разрабатывается база данных.
Также изучая проблематику вопроса, сделан вывод о нерациональности тиражирования реляционных БД для библиографических данных, поскольку не позволяют использовать особенности предметной области – библиотечного дела и особенности библиографических коммуникационных форматов семейства MARC, на основе которых построены все библиотечные АИС в мире.
СПИСОК ЛИТЕРАТУРЫ
1. Агибалов А.В., Горюхина Е.Ю. Автоматизированные системы обработки экономической информации. Учебное пособие - 3-е изд., доп.: Воронеж.: ВГАУ, 2000.
2. Апокин И.А., Майстров Л.Е. Развитие вычислительных машин. - М.: Наука, 1974.
3. Кузнецов С.Д. Основы баз данных. - 2-е изд. - М.: Интернет-Университет Информационных Технологий; БИНОМ. Лаборатория знаний, 2007. - 484 с.
4. Кузнецов С.Д. Проектирование и разработка корпоративных информационных систем. [Электронный ресурс] - Электрон. текстовые дан. - 1998. - Режим доступа к ресурсу: www.citforum.ru/cfin/prcorpsys, свободный
5. Система управления баз данных [Электронный ресурс] - Электрон. текстовые дан. - Режим доступа: ru.wikipedia.org/wiki/СУБД, свободный
6. Карауша А.С. Проблема создания электронного описания библиографического ресурса [Электронный ресурс] - Электрон. текстовые дан. - 2005. - Режим доступа: karaush.ru/?p=24, свободный
7. Терминологический словарь по библиотечному делу и смежным отраслям знания. / Сост.: З.Г. Высоцкая (отв. ред.), В.А. Врубель, А.Б. Маслов, Л.К. Розеншильд; РАН. Б-ка по естественным наукам. М., 1995. 268 с.
8. Мусина Т.В. Visual FoxPro 8.0 Учебный курс - К.: ВЕК+, СПб.: КОРОНА принт, 2004. – 464с.
9. Омельченко Л. Visual FoxPro 8.0. Самоучитель, С-П: БХВ-Петербург, 2003.
10. Кауфельд Д. Microsoft Office Access 2003 для "чайников". - М.: Диалектика, 2004. - 320с.
11. Системные требования для установки Microsoft Office 2003 [Электронный ресурс] - Электрон. Текстовые дан. - 2005. - Режим доступа к ресурсу: support.microsoft.com/default.aspx?SCID=kb;ru;822129, свободный
12. Бойко В.В., Савинков В.М. Проектирование баз данных информационных систем. - М.: Финансы и статистика, 1989. - 351 с.
13. Замулин А.В. Типы и модели данных // Банки данных: Материалы 3-й Всесоюзной конф. (Таллин, 24-26 сентября 1985 г.). – Таллин: ТПИ, 1985. - C. 3-15.
14. Диго С.М. Базы данных: проектирование и использование. Учебное пособие для вузов. - Москва.: Финансы и статистика, 2005.
15. Кошелев В.Е. Access 2007. Эффективное использование. - М.: Бином-Пресс, 2008. - 592с.






















Приложение А (справочное) Код макроса VBA

Private Declare Function URLDownloadToFile Lib "urlmon" Alias "URLDownloadToFileA" (ByVal pCaller As Long, ByVal szURL As String, ByVal szFileName As String, ByVal dwReserved As Long, ByVal lpfnCB As Long) As Long


Public Function DownloadFile(URL As String, LocalFilename As String) As Boolean
Dim lngRetVal As Long
lngRetVal = URLDownloadToFile(0, URL, LocalFilename, 0, 0)
If lngRetVal = 0 Then DownloadFile = True
End Function


Sub Kach()
один лист - "catalog", другой "macros", третий "data" + функции
Workbooks("КАТАЛОГ.xls").Activate
Worksheets("macros").Select
Dim ipasc()
Dim idate()
Dim b As Object
Dim s As Range
Dim ss As Range

Workbooks("КАТАЛОГ.xls").Activate
Worksheets("catalog").Select
Worksheets("catalog").Columns("A:Z").Select
Selection.ClearContents
Worksheets("data").Select
Worksheets("data").Range("A1:U1").Select
Selection.Copy
Worksheets("catalog").Select
Worksheets("catalog").Range("A1:U1").Select
ActiveSheet.Paste
Worksheets("data").Select
Worksheets("data").Columns("A:B").Select
Selection.Copy
Worksheets("catalog").Select
Worksheets("catalog").Columns("A:B").Select
ActiveSheet.Paste

Workbooks("КАТАЛОГ.xls").Activate
Worksheets("macros").Select
Worksheets("macros").Range("E1").Select
ActiveCell.FormulaR1C1 = "=CONCATENATE(R[5]C,R[1]C)"
Worksheets("macros").Range("A16").Select
ActiveCell.FormulaR1C1 = "=FIND(""Phys"",R[-14]C[4])"
Worksheets("macros").Range("B16").Select
ActiveCell.FormulaR1C1 = "=FIND(""Rev"",R[-14]C[3])"
Worksheets("macros").Range("C16").Select
ActiveCell.FormulaR1C1 = "=VALUE(MID(R[-14]C[2],FIND(""/"",R[-14]C[2])+1,1))"
Worksheets("macros").Range("D16").Select
ActiveCell.FormulaR1C1 = "=SEARCH(""/"",R[-14]C[1],SEARCH(""/"",R[-14]C[1])+1)"
Worksheets("macros").Range("D17").Select
ActiveCell.FormulaR1C1 = "=ISERROR(R[-1]C)"
Worksheets("macros").Range("C17").Select
ActiveCell.FormulaR1C1 = "=ISNUMBER(R[-1]C)"
Worksheets("macros").Range("B17").Select
ActiveCell.FormulaR1C1 = "=ISERROR(R[-1]C)"
Worksheets("macros").Range("A17").Select
ActiveCell.FormulaR1C1 = "=ISERROR(R[-1]C)"

For l = 2 To 100000
Workbooks("КАТАЛОГ.xls").Activate
Worksheets("macros").Select
Worksheets("macros").Range("A20:AA300").Select
Selection.NumberFormat = "General"
Selection.ClearContents
Worksheets("macros").Cells(20, 1) = ""
If Worksheets("catalog").Cells(l, 2) = "" Then выход когда заканчиваются все дои
Exit For
Else
Worksheets("catalog").Cells(l, 21) = l - 1
End If
If Worksheets("catalog").Cells(l, 2) = "не найдено дои" Then
Else 4 варианта для выбора скачивания дои
Worksheets("macros").Cells(6, 5) = "dx.doi.org/"
Worksheets("macros").Cells(2, 5) = Worksheets("catalog").Cells(l, 2)
poisk = 4
If Worksheets("macros").Cells(17, 1) = ЛОЖЬ Or Worksheets("macros").Cells(17, 2) = ЛОЖЬ Then
Worksheets("macros").Cells(6, 5) = "link.aip.org/link/doi/"
Worksheets("macros").Cells(2, 5) = Worksheets("catalog").Cells(l, 2)
poisk = 1
ElseIf Worksheets("macros").Cells(17, 3) = ЛОЖЬ Then
Worksheets("macros").Cells(6, 5) = "dx.doi.org/"
Worksheets("macros").Cells(6, 5) = Worksheets("macros").Cells(12, 3) скачивание со спрингера springerlink.com/
poisk = 2
ElseIf Worksheets("macros").Cells(17, 4) = ЛОЖЬ Then
Worksheets("macros").Cells(6, 5) = "iop.org/"
Worksheets("macros").Cells(6, 5) = Worksheets("macros").Cells(12, 4) скачивание с иоп iop.org/
poisk = 3
End If
Worksheets("macros").Range("E1").Select
ActiveCell.FormulaR1C1 = "=CONCATENATE(R[5]C,R[1]C)" связывание дои с интернет адресом
Selection.Copy
Worksheets("macros").Range("E3").Select
ActiveSheet.Paste
Selection.PasteSpecial Paste:=xlPasteValues, Operation:=xlNone, SkipBlanks:=False, Transpose:=False
DownloadFile Worksheets("macros").Cells(3, 5), "C:\Plex(xla).xls" функция скачки
a = "C:\plex(xla).xls"
objWord.Visible = True
Application.DisplayAlerts = False
Workbooks.Open ("C:\plex(xla).xls")
Application.DisplayAlerts = True
Set wdDocOpen = objWord.Workbooks.Open(Filename:=a)
If poisk = 1 Then
Workbooks("Plex(xla).xls").Activate
Worksheets("Plex(xla)").Activate
With ActiveSheet
.Cells.Find(What:="Article", After:=ActiveCell, LookIn:=xlFormulas, LookAt:=xlPart, SearchOrder:=xlByColumns, SearchDirection:=xlNext, MatchCase:=False, SearchFormat:=False).Activate
End With
t = ActiveCell.Column
o = ActiveCell.Row
Worksheets("Plex(xla)").Cells(o, t - 1).Select
tt = ActiveCell
Workbooks("КАТАЛОГ.xls").Activate
Worksheets("macros").Cells(20, 1) = tt
Worksheets("macros").Range("A21").Select
ActiveCell.FormulaR1C1 = "=SEARCH(""»"",R[-1]C,SEARCH(""»"",R[-1]C)+1)"
Worksheets("macros").Range("B21").Select
ActiveCell.FormulaR1C1 = "=SEARCH(""»"",R[-1]C[-1],1+RC[-1])"
Worksheets("macros").Range("C21").Select
ActiveCell.FormulaR1C1 = "=SEARCH(""»"",R[-1]C[-2],1+RC[-1])"
Worksheets("macros").Range("A22").Select
ActiveCell.FormulaR1C1 = "=MID(R[-2]C,R[-1]C+2,R[-1]C[1]-R[-1]C-2)"
Worksheets("macros").Range("B22").Select
ActiveCell.FormulaR1C1 = "=MID(R[-2]C[-1],R[-1]C+2,R[-1]C[1]-R[-1]C-2)"
Worksheets("macros").Range("C22").Select
ActiveCell.FormulaR1C1 = "=MID(R[-2]C[-2],R[-1]C+2,100)"
Worksheets("macros").Range("A22:C22").Select
Selection.Copy
Worksheets("macros").Range("A23:C23").Select
ActiveSheet.Paste
Selection.PasteSpecial Paste:=xlPasteValues, Operation:=xlNone, SkipBlanks:=False, Transpose:=False
Worksheets("macros").Cells(23, 1).Select
Selection.Copy
Sheets("catalog").Select
Cells(l, 3).Select
ActiveSheet.Paste
Sheets("macros").Select
Sheets("macros").Cells(23, 2).Select
Selection.Copy
Sheets("catalog").Select
Cells(l, 4).Select
ActiveSheet.Paste
Sheets("macros").Select
Sheets("macros").Cells(23, 3).Select
Selection.Copy
Sheets("catalog").Select
Cells(l, 5).Select
ActiveSheet.Paste
Workbooks("Plex(xla).xls").Activate
Worksheets("Plex(xla)").Activate
Worksheets("Plex(xla)").Cells(o + 4, t).Select
Selection.Copy
Workbooks("КАТАЛОГ.xls").Activate
Sheets("catalog").Select
Worksheets("catalog").Cells(l, 6).Select
ActiveSheet.Paste
Selection.PasteSpecial Paste:=xlPasteValuesAndNumberFormats, Operation:=xlNone, SkipBlanks:=False, Transpose:=False
ActiveCell.UnMerge
Workbooks("Plex(xla).xls").Activate
Worksheets("Plex(xla)").Activate
With ActiveSheet
.Cells.Find(What:="published", After:=ActiveCell, LookIn:=xlFormulas, LookAt:=xlPart, SearchOrder:=xlByRows, SearchDirection:=xlNext, MatchCase:=False, SearchFormat:=False).Activate
End With
u = ActiveCell.Column
uu = ActiveCell.Row
dddff = 0
For mn = o + 11 To uu - 2
Worksheets("Plex(xla)").Cells(mn, t).Select
If Len(ActiveCell) < 3 Then
dddff = 12
Else
End If
Next mn
If dddff = 12 Then
Workbooks("КАТАЛОГ.xls").Activate
Sheets("macros").Select
Worksheets("macros").Cells(26, 1) = ""
Worksheets("macros").Cells(28, 1) = ""
Worksheets("macros").Cells(27, 1).Select
Application.CutCopyMode = False
ActiveCell.FormulaR1C1 = "=CONCATENATE(R[-1]C,"" "",R[1]C)"
For mn = o + 11 To uu - 2
Workbooks("Plex(xla).xls").Activate
Worksheets("Plex(xla)").Activate
Worksheets("Plex(xla)").Cells(mn, t).Select
Selection.Copy
Workbooks("КАТАЛОГ.xls").Activate
Sheets("macros").Select
Worksheets("macros").Cells(26, 1).Select
ActiveSheet.Paste
Selection.PasteSpecial Paste:=xlPasteValuesAndNumberFormats, Operation:=xlNone, SkipBlanks:=False, Transpose:=False
ActiveCell.UnMerge
Worksheets("macros").Cells(27, 1).Select
Selection.Copy
Worksheets("macros").Cells(28, 1).Select
Selection.PasteSpecial Paste:=xlPasteValues, Operation:=xlNone, SkipBlanks:=False, Transpose:=False
ActiveCell.UnMerge
mn = mn + 2
Next mn
Workbooks("КАТАЛОГ.xls").Activate
Worksheets("catalog").Cells(l, 7) = Worksheets("macros").Cells(28, 1)
Else
Worksheets("Plex(xla)").Cells(o + 11, t).Select
Selection.Copy
Workbooks("КАТАЛОГ.xls").Activate
Sheets("catalog").Select
Worksheets("catalog").Cells(l, 7).Select
ActiveSheet.Paste
Selection.PasteSpecial Paste:=xlPasteValuesAndNumberFormats, Operation:=xlNone, SkipBlanks:=False, Transpose:=False
ActiveCell.UnMerge
End If
Workbooks("Plex(xla).xls").Activate
Worksheets("Plex(xla)").Activate
Worksheets("Plex(xla)").Cells(uu, u).Select
Selection.Copy
Workbooks("КАТАЛОГ.xls").Activate
Sheets("macros").Select
Worksheets("macros").Range("A31:I37") = ""
Worksheets("macros").Cells(31, 1).Select
ActiveSheet.Paste
Selection.PasteSpecial Paste:=xlPasteValuesAndNumberFormats, Operation:=xlNone, SkipBlanks:=False, Transpose:=False
ActiveCell.UnMerge
Worksheets("macros").Cells(31, 1).Select
Application.DisplayAlerts = False
Selection.TextToColumns Destination:=Range("A31"), DataType:=xlDelimited, TextQualifier:=xlDoubleQuote, ConsecutiveDelimiter:=False, Tab:=False, Semicolon:=False, Comma:=False, Space:=False, Other:=True, OtherChar:=";", FieldInfo:=Array(Array(1, 1), Array(2, 1), Array(3, 1), Array(4, 1), Array(5, 1), Array(6, 1), Array(7, 1), Array(8, 1)), TrailingMinusNumbers:=False
Application.DisplayAlerts = True
Worksheets("macros").Cells(32, 1).Select
ActiveCell.FormulaR1C1 = "=TRIM(R[-1]C)"
Selection.Copy
Worksheets("macros").Range("A32:I32").Select
ActiveSheet.Paste
Worksheets("macros").Cells(33, 1).Select
ActiveCell.FormulaR1C1 = "=TRIM(MID(R[-1]C,SEARCH("" "",R[-1]C,1),100))"
Selection.Copy
Worksheets("macros").Range("A33:I33").Select
ActiveSheet.Paste
Worksheets("macros").Range("A33:I33").Select
Selection.Copy
Worksheets("macros").Range("A34:I34").Select
Selection.PasteSpecial Paste:=xlPasteValues, Operation:=xlNone, SkipBlanks:=False, Transpose:=False
Worksheets("macros").Cells(35, 1).Select
ActiveCell.FormulaR1C1 = "=


Подать заявку на покупку Диплом по Базам данных

Ваше предложение по стоимости за работу: