Проблемы автоматизации перевода математической литературы с английского языка на русский

20765
знаков
5
таблиц
0
изображений

III научно-практическая конференция школьников

по математике, её приложениям и информационным технологиям

«Поиск»

Учебно-исследовательская работа

«Проблемы автоматизации перевода математической литературы с английского языка на русский »

Ученицы 9 класса

Гиназии №71 г. Гомеля

Барановой Валерии Викторовны

Научный руководитель —

Горский С.М.,

учитель информатики

Гомель, 2008


Содержание

Введение

1. Пересчет размерностей

2. Импликации в английских научно-технических текстах

3. Математические штампы

Заключение

Список использованных источников

Приложение 1


Введение

 

Обилие математической литературы вынуждает искать способы автоматического перевода, но низкое качество программ-переводчиков вынуждает использовать технику перевода «машина-человек», то есть в начале текст обрабатывает программа, а затем его корректирует человек, что существенно снижает затраты на перевод.

К сожалению, современные программы-переводчики, такие как Prompt, не поддерживают формат TeX, ставший стандартом представления математических текстов. Так же совершенно не поддерживается передача символов, названий функций, имен собственных, ставших традиционными для русскоязычной математической литературы.

Данная работа пытается восполнить этот пробел на стадии допереводческого анализа текста. В первом разделе работы обсуждаются вопросы передачи формул (пересчет при необходимости). Второй раздел посвящен импликациям в математических текстах, что так же не учитывается программами-переводчиками. В третьем разделе показывается, что при переводе математического текста можно применять технологию Translation Memory, и приведены основные математические штампы [Сосинский].

Исследования, связанные с данной работой позволили написать несколько программ на языке Perl для анализа и частичного выполнения перевода. Недостаток объема текста не позволяет их рассмотреть подробно. Перечислим данные программы:

1. Программа для передачи символов, имен собственных, названий функций, названий теорем и т. п., сокращений.

2. Программа для анализа диалекта английского языка (British English или American) поскольку это влияет на перерасчет формул.

3. Программа для нахождения комментариев в текстах программ и указания, можно ли производить перевод переменных. Данная программа актуальна, поскольку в языках программирования типа Perl, Python невозможно отличить комментарии от программы, не зная синтаксиса комментариев (На Perl даже сочиняют поэмы).

4. Программа для поиска импликаций в тексте для облегчения редактирования машинного перевода.


1. Пересчет размерностей

Рассматриваются примеры пересчета размерностей при переходе от британской системы единиц к метрической либо к международной системе (СИ). Эта операция – не простая и ответственная, особенно когда в исходном тексте размерность величины представлена неправильно или необычно, либо когда нужно определить численный коэффициент в полуэмпирической расчетной формуле. Приведем обоснование терминов, использованных при рассмотрении примеров.

Обычный пересчет размерности

Такой пересчет размерности сводится к перемножению всех составляющих ее единиц измерения, каждая из которых умножена на свой коэффициент пересчета. В нижеследующей таблице приведены коэффициенты пересчета наиболее ходовых единиц измерения из британской системы единиц в международную. Аналогичные таблицы существуют для пересчета британских единиц в метрические и метрических единиц в международные.

 

Наименование величины Значение (Х) величины в британской системе Коэффициент пересчета из британской системы единиц в СИ Результат пересчета, представленный в СИ
Длина Х foot (ft) 0,3048 0,3048 Х м
Площадь

Х foot square (ft2)

0,3048 × 0,3048

0,0929 Х м2

Объем

Х cubic foot (ft3)

0,30483 = 28,317 × 10-3

28,317 × 10-3 Х м3

Масса

Х pound of mass (lbm)

0,4536 0,4536 Х кг
Время Х second (s) 1 Х сек, или Х с
Сила

Х pound of force (lbf)

4,448 4, 448 Х Н
Скорость Х f/s 0,3048/1 = 0,3048 0,3048 Х м/с
Работа

Х lbf x ft

4,448 × 0,348 = 1,356 1,356 Х Нм
Давление

Х lbf/in2 (psi)

4,448/(0,0254)2 = 6895

6895 Х Н/м2


Например, в исходном тексте говорится, что рабочее давление резервуара равно 980 psi. В СИ это давление записывается как 6,757 МПа (пересчет: 6895 × 980 Н/м2 = 6757100 Н/м2 » 6,757 МПа).

Конечно, таблица отражает лишь малую часть практических случаев. Взять хотя бы длину. В английском языке для ее измерения кроме фута широко используются дюйм, ярд, миля, мил, микродюйм, и, следовательно, количество сочетаний с использованием единиц измерения длины в размерностях велико. Кроме системных единиц измерения существует множество внесистемных (или «ведомственных»). Например, помимо системной международной единицы измерения давления Паскаль (т.е. Н/м2), в русской технической литературе используются кгс/см2 = кГ/см2, кГ/м2, атм. (атмосфера), торр (мм ртутного столба), бар (приблизительно равен атмосфере и точно равен 100 кПа), пьеза, миллиметр водяного столба.

Определение размерности путем ее анализа

Рассмотрим пример. В статье по обработке металлов резанием приводится таблица значений удельной работы резания Ut, причем размерность этой величины имеет вид h.p./in3/min. Такая неочевидная запись размерности недопустима, поскольку ее можно понять как (h.p./in3):min и как h.p.(in3/min).

Чтобы перед пересчетом определить правильную запись размерности, переводчик рассуждает следующим образом: h.p. — мощность, т.е. работа в единицу времени; если ее поделить на in3, получим удельную мощность (т.е. мощность, затрачиваемую на единицу объема металла); чтобы из удельной мощности получить удельную работу, нужно удельную мощность помножить на время. Таким образом, правильная запись должна выглядеть как (h.p./in3)·min, или h.p.·min/in3.

Определение размерности путем оценки значения величины

В статье, посвященной расчету градирни, дается пример:

As an example, if l = 35 deg, T1= 520 deg, approach = 16.5 deg, then P = 0.47 and ψ? = 4.9.

В этом примере I – разность начальных температур воды и воздуха в радиаторной градирне, T1 – температура воздуха на входе в градирню, a approach — температурный напор на холодном конце. Спрашивается, в каких градусах — Фаренгейта, Цельсия, Рэнкина или Кельвина – даны значения параметров?

Первая и третья величины суть температурные разности, поэтому удобнее для проверки выбрать вторую величину, то есть T1. Если даже принять температуру воды на выходе из градирни совпадающей с T1 (на самом деле она, как мы видим, выше на 16,5°С), то ясно, что вода при давлении, близком к атмосферному, не может существовать при 520°F (т.е. 271°С), поскольку она закипает при 100°С., cследовательно, градусы Фаренгейта и Цельсия отпадают, и температура T1 взята по термодинамической шкале Кельвина либо Рэнкина.

Проверяем «градусы» Кельвина (точнее кельвины):


Информация о работе «Проблемы автоматизации перевода математической литературы с английского языка на русский»
Раздел: Информатика, программирование
Количество знаков с пробелами: 20765
Количество таблиц: 5
Количество изображений: 0

Похожие работы

Скачать
166736
32
0

... вербальными средствами, а за счет сочетания линейного текста с математическими формулами, графиками, таблицами, рисунками, диаграммами, картами. 2. ПРИЕМЫ И СПОСОБЫ ПЕРЕВОДА ТЕХНИЧЕСКОЙ СОПРОВОДИТЕЛЬНОЙ ДОКУМЕНТАЦИИ 2.1 Основные сложности перевода научно-технического текста Искусство организации рабочего времени (time-management) в последнее время обретает всё большую популярность и ...

Скачать
18793
0
0

... системы Trados в России и других странах СНГ. Для совместного использования своих МТ-программ и продуктов Trados фирма ПРОМТ предлагает специальные средства их сопряжения. История машинного перевода насчитывает немногим более 50 лет. За это время сменилось несколько поколений систем машинного перевода - от первых программ, использовавших ограниченные ресурсы универсальных компьютеров первого ...

Скачать
123813
0
0

... за несколько секунд. Причем искать можно в любой форме. Некоторые, например Lingvo, встраиваются во все основные офисные приложения и выделенное слово можно переводить нажатием нескольких клавиш. Преимущества электронных словарей При традиционном подходе минимальной единицей доступа является лексема (имя словарной статьи): нужно прочесть всю статью, чтобы определить, содержится ли в ней ответ ...

Скачать
83100
0
1

... (САПР) и пр.; -           ПС, используемые в обучении – электронные учебники, тренажеры, тесты и пр.; -           игровые программы; -           программы, созданные пользователем с помощью сред программирования. Еще один класс программного обеспечения – специальное ПО. Основное его отличие от системного ПО в том, что пользователь сам решает, будет ли он использовать эти ПС или нет, а отличие ...

0 комментариев


Наверх