На бирже курсовых и дипломных проектов можно найти образцы готовых работ или получить помощь в написании уникальных курсовых работ, дипломов, лабораторных работ, контрольных работ, диссертаций, рефератов. Так же вы мажете самостоятельно повысить уникальность своей работы для прохождения проверки на плагиат всего за несколько минут.

ЛИЧНЫЙ КАБИНЕТ 

 

Здравствуйте гость!

 

Логин:

Пароль:

 

Запомнить

 

 

Забыли пароль? Регистрация

Повышение уникальности

Предлагаем нашим посетителям воспользоваться бесплатным программным обеспечением «StudentHelp», которое позволит вам всего за несколько минут, выполнить повышение уникальности любого файла в формате MS Word. После такого повышения уникальности, ваша работа легко пройдете проверку в системах антиплагиат вуз, antiplagiat.ru, etxt.ru или advego.ru. Программа «StudentHelp» работает по уникальной технологии и при повышении уникальности не вставляет в текст скрытых символов, и даже если препод скопирует текст в блокнот – не увидит ни каких отличий от текста в Word файле.

Результат поиска


Наименование:


курсовая работа Компьютерный перевод как разновидность перевода

Информация:

Тип работы: курсовая работа. Добавлен: 12.05.2012. Сдан: 2011. Страниц: 10. Уникальность по antiplagiat.ru: < 30%

Описание (план):


ГОУ ВПО  «Aaaanoaineee ainoaa?noaaiiue einoeooo ia?iaii» 
 

Кафедра перевода и переводоведения 
 

Курсовая  работа 
 

Компьютерный  перевод как разновидность  перевода 
 
 

Дата  предзащиты____________                                                         Выполнила:
Дата  защиты_______________                                              Студентка 4 к. 1 гр.
Оценка____________________                                                      
Подпись__________________                                          Научный руководитель: 
 
 
 
 
 
 
 

М 2011
Содержание 
 

Введение
Глава I. Машинный перевод………………………………………………… 5
          1.1. История школы машинного перевода……………….................... 7
          1.2. Классификация систем машинного перевода………………….. 10
Вывод по Главе  I ………………………………………………………….… 21
Глава II. Система МП PROMT XT…………………………………………..22
          2.1. Общая характеристика системы………………………………….22
          2.2. Применение системы МП PROMT XT на практике…………….26
Вывод по Главе  II ………………………………………………………….…33
Заключение…………………………………………………………………... 34
Список литературы …………………………………………………………. 36 
 
 
 
 
 
 
 
 
 
 
 
 

     Введение
     Развитие  кибернетики сделало возможным  машинный перевод, т.е. перевод, строящийся на использовании машиной определенных и постоянных для данного вида материала соответствий между словами и грамматическими явлениями разных языков. В настоящее время имеется достаточно широкий выбор пакетов программ, облегчающих труд переводчика, которые условно можно подразделить на две основные группы: электронные словари и системы машинного перевода. Системы машинного перевода обеспечивают связный перевод текстов, учитывающий морфологические, синтаксические и семантические связи членов предложения. Сегодня программы-переводчики умеют строить осмысленные фразы, и за последние несколько лет качество перевода улучшилось. Однако компьютер еще плохо разбирается в грамматических нюансах, поэтому его главное назначение – переводы деловых бумаг, руководств, писем из электронной почты, Web-страниц.
     Настоящую тему исследования можно считать вполне современной, поскольку история развития и внедрения в повседневную жизнь персональных компьютеров насчитывает едва ли более пятнадцати лет. Особую актуальность эта тема приобретает, если учесть тот факт, что именно в настоящее время Россия все более интегрируется в международное сообщество и что, наряду с экономическими и политическими барьерами, препятствуют этому во многом барьеры языковые. Вместе с тем, профессиональных переводчиков, способных и желающих осуществлять подобный процесс коммуникации сообществ во всех сферах науки и культуры, не так много, следствием чего является тот факт, что услуги их недешевы. Поэтому именно сейчас особенно актуален поиск путей максимально автоматизировать процесс перевода, осуществляемого человеком, чтобы, с одной стороны, максимально облегчить нелегкий труд человека-переводчика, а с другой – сделать этот труд максимально эффективным. Осуществить подобное можно, лишь максимально интегрировав усилия специалистов в областях кибернетики, программирования, психологии, а главное – лингвистики.
     Цель  данной работы – определение того, насколько можно использовать современные программные продукты для осуществления перевода, а также выявление наиболее перспективных, на наш взгляд, направлений исследований в области его автоматизации.
     В соответствии с поставленной целью, задачами исследования являются:
     - определение максимально эффективного  способа организации электронных  словарей;
     - уяснение различий между разнообразными  системами МП и классификации  последних;
     - анализ работы одной из систем машинного перевода.
     Объектом  исследования данной работы являются машинный перевод.
     Во  введении определяются актуальность, цель, задачи, объект и материал, описывается структура работы. В первой главе, состоящей из двух разделов, ставится задача ознакомления со школой машинного перевода и систематизация различных классификаций. Во второй главе проводится анализ работы систем машинного перевода на примере Prompt XT. В заключении подводятся итоги проведенного исследования и делаются выводы. Список литературы включает 17 научных исследований, связанных с темой курсовой работы.
     При написании данной курсовой работы была изучена учебная, научная, справочная и периодическая литература, а  также информация в сети Интернет.
     Глава 1: Машинный перевод
     По  мере того как расширяется информатизация современного общества при переходе к обществу будущего, возрастает значение прикладной (вычислительной, компьютерной, инженерной) лингвистики, науки, находящейся на стыке глубоко человечной, гуманитарной науки лингвистики (языкознания), изучающей законы развития и пользования могучим средством мышления и коммуникации - языком, - и компьютерного знания, с помощью которого машине передастся все большая часть интеллектуального
труда человека [Винокуров, 1997:5].
     Переводом называется процесс и результат  создания на основе исходного текста на одном языке равноценного ему  в коммуникативном отношении  текста на другом языке. При этом коммуникативная равноценность, или эквивалентность, понимается как такое качество текста перевода, которое позволяет ему выступать:
      в процессе общения носителей разных языков;
      в качестве полноправной замены исходного текста (оригинала);
      в сфере действия языка перевода.
     Развитие  кибернетики сделало возможным  машинный перевод, т.е. перевод, строящийся на использовании машиной определенных и постоянных для данного вида материала соответствий между словами и грамматическими явлениями разных языков.
     В настоящее время имеется достаточно широкий выбор пакетов программ, облегчающих труд переводчика, которые условно можно подразделить на две основные группы:
      электронные словари (electronic dictionary)
      системы машинного перевода (machine translation system)[Архипов, 1991: 34].
     Системы машинного перевода (СМП) текстов  с одних естественных языков на другие моделируют работу человека-переводчика. Их полезность зависит от того, в какой степени в них учитываются объективные законы языка и мышления. Законы эти пока еще изучены плохо. Поэтому, решая задачу машинного перевода, необходимо учитывать опыт межнационального общения и опыт переводческой деятельности, накопленный человечеством. В процессе перевода в качестве основных единиц смысла выступают не отдельные слова, а фразеологические словосочетания, выражающие понятия. Именно понятия являются элементарными мыслительными образами. Только используя их можно строить более сложные образы, соответствующие переводимому тексту [Шаляпина, 1996:215]. 

Сравнительная характеристика
Перевод СМП Перевод человеком
Синтаксически несогласованные предложения Правильно построенные предложения
Стилистика  текста не учитывается Стилистически оформленные тексты, где учитывается  даже подтекст
Используется  наиболее употребляемое значение слова, а не терминологическое значение Подбор необходимого термина, в соответствии с тематикой и другими особенностями текста
Требует доработки Перевод «под ключ»
 
     При рассмотрении данной характеристики становится очевидным, что машинный перевод  во многом уступает человеческому фактору. 
 
 

     1.1. История школы машинного перевода 

     Впервые мысль о возможности машинного перевода высказал Чарльз Бэббидж (1791-1871), разработавший в 1836-1848 гг. проект цифровой аналитической машины - механического прототипа электронных цифровых вычислительных машин, появившихся через 100 лет. Идея Ч. Бэббиджа состояла в том, что память объемом 1000 50-разрядных десятичных чисел (по 50 зубчатых колес в каждом регистре) можно использовать для хранения словарей [Апокин, 1981:210].
     Фактически  история машинного перевода начинается с "Джорджтаунского эксперимента". В январе 1954 г. состоялась первая публичная демонстрация машинного перевода с русского языка на английский, осуществленного на машине ИБМ-701.
     Это событие явилось толчком для начала работ по машинному переводу в СССР. Первый опыт перевода с английского языка на русский с помощью машины БЭСМ был получен уже к концу 1955 г. Программы для БЭСМ составляли Н. П. Трифонов и Л. Н. Королев, кандидатская диссертация которого была посвящена методам построения словарей для машинного перевода [Ермаков, 2002:67].
     Первое  поколение систем машинного перевода базировалось на алгоритмах последовательного перевода "слово за словом", "фраза за фразой". Возможности таких систем определялись доступными размерами словарей, прямо зависящими от объема памяти компьютера. Перевод текста осуществлялся отдельными предложениями, смысловые связи между ними никак не учитывались. Такие системы называют системами прямого перевода. На смену им со временем пришли системы последующих поколений, в которых перевод от языка к языку осуществлялся на уровне синтаксических структур. В алгоритмах перевода использовался набор операций, позволяющий путем анализа переводимого предложения построить его синтаксическую структуру по правилам грамматики языка входного предложения, а затем преобразовать ее в синтаксическую структуру выходного предложения и синтезировать выходное предложение, подставляя нужные слова из словаря. Такие системы называются Т-системами (от английского слова "transfer - преобразование").
     Наиболее  совершенным считается подход к  построению систем машинного перевода на основе получения некоторого, независимого от языков, смыслового представления входного предложения путем его семантического анализа. Затем производится синтез выходного предложения по полученному смысловому представлению. Такие системы называют И-системами (от слова "интерлингва"). Считается, что следующие поколения систем машинного перевода будут относиться к классу И-систем.
     Как большой ученый, которому свойственно  видеть всю проблему в целом, А. А. Ляпунов с самого начала работ  по машинному переводу говорил о переводе путем извлечения смысла переводимого текста и его представления на другом языке. Однако такая постановка проблемы перевода оказалась в то время преждевременной. Слишком много трудностей и неясностей было в том, как нужно формализовать и строить алгоритмы для работы с текстами, какие словари надо вводить в машину, какие лингвистические закономерности следует использовать при машинном переводе и каковы вообще эти закономерности [Бреус, 2000:94].
     Выяснилось, что традиционная лингвистика не располагает ни фактическим материалом, ни идеями и представлениями, нужными для построения систем машинного перевода, которые использовали бы смысл переводимого текста.
     Потребность в создании теоретических основ  машинного перевода привела к формированию нового направления в лингвистике, называемого структурной, прикладной, математической лингвистикой. Формирование этого направления в СССР относится ко второй половине 50-х годов. Ведущую роль в нем сыграли математики А. А. Ляпунов, В. А. Успенский, О. С. Кулагина, лингвисты В. Ю. Розенцвейг, П. С. Кузнецов, А. А. Реформатский, И. А. Мельчук, В. В. Иванов.
     С 1960 г. началась подготовка кадров в  области автоматической переработки  текстов на филологическом факультете МГУ, в Ленинградском и Новосибирском университетах, МГПИИЯ. Под математической лингвистикой понималось изучение языка как абстрактной знаковой системы с целью построения теоретической основы машинного перевода и создания конкретных алгоритмов перевода.
     Задача  аксиоматизации лингвистики была выдвинута одним из виднейших лингвистов московской школы П. С. Кузнецовым как задача формализации грамматики, восходящая к идеям выдающегося русского языковеда Ф. Ф. Фортунатова (1848-1914).
     В те же годы формальная теория грамматик развивалась в США в трудах Н. Хомского, ставших классическими для области искусственных языков, в частности языков программирования.
     В 70-х годах разработку основ технологии машинного перевода продолжила группа специалистов в ВИНИТИ под руководством профессора Г. Г. Белоногова. В результате в 1993 г. была создана промышленная версия системы RETRANS фразеологического машинного перевода с русского языка на английский и обратно, которая применялась в министерствах обороны, путей сообщения, науки и технологий, а также во ВНТИЦ.
     Практическое  применение принципов смыслового анализа  текстов потребовалось при создании систем машинного перевода с иероглифических  языков (китайского, японского и  др.). Вопросы создания таких систем были разработаны в диссертации  В. М. Зелко в 80-х годах.
     Первые  коммерческие продукты машинного перевода, нашедшие практическое использование, появились в середине 80-х годов. Они были реализованы на персональных компьютерах и являлись системами  прямого перевода, возможности которых  базировались на огромных (по сравнению с первыми системами) словарях, а не на умении анализировать и синтезировать тексты [Читалина, 1975:278].
     Современные коммерческие продукты машинного перевода предлагают отечественные фирмы: "Виста Текнолоджиз" и "Адвентис", образованные в 1991 г. коллективом разработчиков, выделившихся из ВИНИТИ; ПРОМТ, образованная в 1991 г.; "Медиа Лингва".
     История машинного перевода насчитывает  немногим более 50 лет. За это время  сменилось несколько поколений  систем машинного перевода - от первых программ, использовавших ограниченные ресурсы универсальных компьютеров первого поколения до современных коммерческих продуктов, использующих мощные ресурсы серверов и персональных компьютеров, включая ПК, в которых можно размещать карманные словари, а также компьютерные сети. 

     1.2. Классификация систем машинного перевода
     Системы машинного перевода могут использовать метод перевода основанный на лингвистических  правилах. Наиболее подходящие слова  из исходного языка просто заменяются словами переводного языка.
     Как правило, метод перевода основанный на правилах использует символическое представление (посредника), на основе которого создается текст на переводном языке. А если учитывать природу посредника, то можно говорить об интерлингвистическом машинном переводе или трансфертном машинном переводе. Эти методы требуют очень больших словарей с морфологической, синтаксической и семантической информацией и большого набора правил.
     Если  у системы машинного перевода будет достаточное количество данных, то можно получить перевод хорошего качества. Основная трудность заключается в формировании этих данных. Например, большие корпуса текста необходимые для статистических методов перевода, для перевода основанного на грамматике оказываются недостаточными. Более того, для последних требуется дополнительное задание грамматики.
     Для перевода родственных языков (русский, украинский) может оказаться достаточной  простая замена слов.
     Современные системы машинного перевода делят  на три большие группы:
    основанные на правилах;
    основанные на примерах;
    статистические [Бархударов, 1975:180].
     Системы машинного перевода основанные на правилах – общий термин, который обозначает системы машинного перевода на основе лингвистической информации об исходном и переводном языках в основном получены из (двуязычных) словари и грамматики, охватывающих основные семантические, морфологические, синтаксические и закономерности каждого языка. Такой подход к машинному переводу еще называют классическим.
     На  основе этих данных исходный текст  последовательно, по предложениям, преобразуется в текст перевода. Часто, такие системы противопоставляют системам машинного перевода основанных на примерах.
     Основной  принцип работы таких систем –  связь структуры входного и выходного  предложения. Перевод при этом получается не особенно хорошего качества. Но на простых примерах работает.
     Перевод с английского на немецкий будет выглядеть так:
A girl eats an apple. a Ein Madchen isst einen Apfel.
Эти системы  делятся на три группы:
    системы пословного перевода;
    трансфертные системы;
    интерлингвистические;
     Системы пословного перевода используются сейчас крайне редко из-за низкого качества перевода. Слова исходного текста преобразуются в слова переводного текста. Часто такое преобразование происходит без лемматизации и морфологического анализа. Это самый простой метод машинного перевода. Он используется для перевода длинных списков слов (например, каталогов).
     В основе трансфертных систем лежит та же идея, что и - в системах интерлингвистических. Для перевода необходимо иметь посредника, который в себе несет смысл переводимого выражения. В интерлингвистических системах посредник не зависит от пары языков, в то время как в трансфертных – зависит.
     Трансфертные  системы работают по очень простому принципу: к входному тексту применяются  правила, которые ставят в соответствие структуры исходного и переводного языков. Начальный этап работы включает в себя морфологический, синтаксический (а иногда и семантический) анализ текста для создания внутреннего представления. Перевод генерируется из этого представления с использованием двуязычных словарей и грамматических правил. Иногда на основе первичного представления, которое было  получено из исходного текста, строят более «абстрактное» внутреннее представление. Это делается для того, чтобы акцентировать места важные для перевода, и отбросить несущественные части текста. При построении текста перевода преобразование уровней внутренних представлений происходит в обратном порядке.
     При использовании этой стратегии получается достаточно высокое качество переводов, с точностью в районе 90% (хотя это сильно зависит от языковой пары). Работа любой системы трансфертного перевода состоит как минимум из пяти частей:
    морфологический анализ;
    лексическая категоризация;
    лексический трансфер;
    структурный трансфер;
    морфологическая генерация.
     При морфологическом анализе слова исходного текста классифицируются по частям речи. Выявляются их морфологические признаки. Определяются леммы слов [Егорушкин, 2002:167].
     В тексте некоторые слова могут  иметь более чем одно значение, вызывая неоднозначность в анализе. При лексической категоризации выявляется контекст слова. Возможны различного рода пометки и уточнения.
     Лексический трансфер характеризуется тем, что  на основе двуязычного словаря происходит перевод лемм слов. Действие очень похоже на пословный перевод.
     При структурном трансфере слова согласуются в предложении.
     А в процессе морфологической генерации  на основе выходных данных структурного трансфера создаются словоформы переводного текста.
     Одной из основных особенностей трансфертных систем машинного перевода является этап, во время которого промежуточное представление текста на языке оригинала «передается» в промежуточное представление текста в целевом языке. Это может работать на одном из двух уровней лингвистического анализа, или сразу на обоих.
     Уровни:
    Поверхностный (синтаксический) трансфер. Этот уровень характеризуется передачей «синтаксических структур» между исходным и переводным языком. Подходит для языков в той же семье или того же типа, например, в романских языков, между итальянским испанским, каталонским, французским, и т.д.
    Глубинный (семантический) трансфер. Уровень характеризуется семантическим представлением. Оно зависит от языка оригинала. Это представление может состоять из ряда структур, которые представляют значение. Перевод также обычно требует структурного трансфера. Этот уровень используется для перевода между более отдаленными языками.
     Интерлингвистический  машинный перевод – один из классических подходов к машинному переводу. Исходный текст трансформируется в абстрактное  представление, которое не зависит от языка (в отличие от трансфертного перевода). Переводной текст создается на основе этого представления.
     Кроме того, в рамках такого подхода можно:
    реализовать «пересказ текста», перефразирование исходного текста в рамках одного языка;
    относительно просто осуществить перевод сильно отличающихся языков, таких как, например русский и арабский [Каничев, 1998:59].
     Однако, до сих пор не существует реализаций такого подхода, которые бы корректно  работали бы хотя бы для двух языков. Многие эксперты высказывают сомнения в возможности такой реализации. Сама большая сложность для создания подобных систем заключается в проектировании межъязыкового представления. Оно должно быть одновременно абстрактным и независящим от конкретных языков, но в тоже время оно должно отражать особенности любого существующего языка. С другой стороны, в рамках искусственного интеллекта, задача выделения смысла текста на данный момент до сих пор не решена.
     В этом методе перевода, межъязыковое представление  можно рассматривать как способ описания анализа текста, на языке оригинала. При этом, в представлении сохраняются морфологические, синтаксические характеристики текста. Предполагается, что таким образом можно передать «смысл» при создании переводного текста.
     При этом иногда используется два межъязыковых представления. Одно из них более отражает характеристики исходного языка. Другое – языка перевода. Перевод в данном случае производится в два этапа.
     В некоторых случаях используются два и более представления  одного уровня (одинаково близкие к обоим языкам), но разнящиеся по тематике. Это необходимо для повышения качества перевода специфических текстов.
     Такой подход не является чем-то новым для лингвистики. Он основан на идеи близости языков. Для улучшения качества перевода, естественный язык используется в качестве моста между двумя другими языками. Например, при переводе с украинского на английский, иногда используется русский язык [Кормалев, 2003:17].
     Для использования системы интерлингвистического  машинного перевода необходимы:
    словари для анализа и генерации текстов;
    описание грамматик языков;
    база знаний понятий (для создания межъязыкового представления);
    правила проекции понятий для языков и представления.
     Самым сложным моментом при создании такого типа является невозможность построить базу для широких областей знаний. А те базы, которые создаются для очень специфичной тематики, обладают высокой вычислительной сложностью.
     Перевод основанный на примерах – один из подходов к машинному переводу, при котором  используется двуязычный корпус текста. Этот корпус текста во время перевода используется как база знаний. Грубо говоря, это перевод по аналогии.
     Например:
Английский Немецкий
How much is that red umbrella?  Was kostet dieser rote Regenschirm?
How much is that small camera?  Was kostet diese kleine Kamera?
 
     Языковые  пары — тексты, содержащие предложения  на одном языке и соответствующие  им предложения на втором, могут  быть как вариантами написания двух предложений человеком — носителем  двух языков, так и набором предложений и их переводов, выполненных человеком.
     Можно заметить, что предложения из примера  отличаются только двумя словами. И  это можно видеть для обоих  языков. В данном случае для перевода нужно знать только три единицы  информации:
    How much is that X ? Was kostet dies?
    red umbrella der rote Regenschirm
    small camera die kleine Kamera
     Важно отметить, что правила перевода используемые в этом методе, отличаются от простых  грамматических правил классических методов. Перевод, основанный на примерах, лучше всего подходит для таких явлений как фразовые глаголы. Значения фразовых глаголов сильно зависит от контекста. Фразовые глаголы очень часто встречаются в разговорном английском языке. Они состоят из глагола с предлогом или наречием. Смысл такого выражения невозможно получить из смыслов составляющих частей. Классические методы перевода в данном случае неприменимы.
     Этот  метод перевода можно использовать для определения контекста предложений.
     Что касается двуязычных корпусов текста, возникает ожидаемый вопрос, где брать такие пары. Примерами двуязычных корпусов текстов можно назвать парламентские отчеты в Канаде, Гонконге и других странах. Тексты представляют собой протоколы дебатов в парламенте. Кроме того, хорошим примером являются официальные документы Европейского экономического сообщества. Они издаются на 11 языках. Организация объединенных наций публикует документы на нескольких языках [интернет-ссылка: 17].
и т.д.................


Перейти к полному тексту работы


Скачать работу с онлайн повышением уникальности до 90% по antiplagiat.ru, etxt.ru или advego.ru


Смотреть полный текст работы бесплатно


Смотреть похожие работы


* Примечание. Уникальность работы указана на дату публикации, текущее значение может отличаться от указанного.