Автор: Роман Базаров Опубликовано в журнале "CIO" №10 от 29 ноября 2007 года
Эпоха компьютерных технологий и широчайшей доступности информации предоставила современному человеку массу неведомых прежде возможностей. Но вместе с этими возможностями перед ним возникло и немало новых проблем. Среди тех проблем, с которыми многим из нас приходится сталкиваться чуть ли не ежедневно, одной из самых острых и трудноразрешимых является языковой барьер.
Сколькими иностранными языками — хотя бы на уровне «читаю и перевожу со словарем» — владеет сегодняшний среднестатистический специалист с высшим техническим или, скажем, экономическим образованием? Как правило, одним. Гораздо реже — двумя. Каждый индивидуум, способный сейчас похвастаться пусть даже поверхностным и несовершенным знанием трех-четырех языков, с полным правом может претендовать на звание полиглота. При этом тот же среднестатистический специалист в той или иной области техники или экономики (науки и бизнеса, промышленности и сельского хозяйства, медицины и юриспруденции — далее по списку) в своей повседневной деятельности очень часто имеет дело с информацией, представленной отнюдь не на его родном и даже не на более-менее знакомом не родном языке.
Поскольку нынешнее состояние развития ИТ-индустрии позволяет нам достаточно эффективно решать проблему получения информации, кажется вполне естественным обратиться к ней и для перевода этой информации с одного языка на другой. Иными словами, если современный компьютер с успехом помогает нам добывать практически любые сведения из огромного количества источников глобального информационного пространства (и не менее успешно справляется с задачами бухгалтерского учета и контроля, управления производственными операциями, оптимизации торговых сетей и т. д., и т. п.), то мы вправе ожидать от него способности столь же квалифицированно трансформировать эти сведения в удобный для нас языковой формат.
Но не так-то все просто. Оказывается, научить самый замечательный компьютер логике лингвистики гораздо сложнее, чем логике математических вычислений, статистического анализа или моделирования процессов. Пока ни один алгоритм и ни одна технология машинного перевода по своей эффективности не может сравниться с теми алгоритмами и технологиями, которые закладываются школами и вузами в основу языковых знаний живых профессиональных и непрофессиональных переводчиков. Поэтому при всей своей объективной необходимости существующие ныне программные системы автоматизированного перевода еще очень далеки от совершенства, и ситуация в занимаемом этими системами сегменте мирового рынка складывается таким образом, что постоянно растущее и видоизменяющееся предложение никак не может удовлетворить достаточно стабильный и неизменный в своих требованиях спрос.
Нелегкая судьба кибернетических полиглотов
Вопросами кодирования своего языка для обеспечения его восприятия иноземцами представители самых разных живущих на земле наций и народностей стали заниматься очень и очень давно. Эту проблему пытались решить древние египтяне, вавилоняне, индийцы и китайцы. На протяжении многих столетий предпринимались попытки воплощения идеи о создании единого общечеловеческого языка, понятного всем, построенного исключительно на логике и использующего в своей письменности некие универсальные символы-пиктограммы. Однако ни один искусственный язык, каковых за всю историю существования человечества было разработано великое множество, так и не смог заменить собой языки естественные, которые, как показала практика, чрезвычайно сложно поддаются кодированию. Мысль о применении для перевода с одного языка на другой специальных механизмов впервые была высказана выдающимися математиками, естествоиспытателями и философами XVII в. Готфридом Вильгельмом Лейбницем и Рене Декартом. А первая цифровая вычислительная машина, пригодная для выполнения аналитических операций, была спроектирована в 1836–1848 гг. Чарльзом Бэббиджем. Правда, сооружение реального прототипа машины Бэббиджа так и не было завершено, и сколько-нибудь продуктивных результатов претворения в жизнь мечты о машинном переводе пришлось ждать целых сто лет — вплоть до того времени, когда в природе появились первые работоспособные образцы вычислительной техники, а Норберт Винер заложил теоретические основы кибернетики как науки.
Датой рождения машинного перевода в качестве самостоятельного направления исследований и разработок принято считать март 1947 г., когда руководитель отделения естественных наук Рокфеллеровского фонда и специалист по криптографии Уоррен Уивер в своем письме Норберту Винеру предложил рассматривать задачу перевода текстов с одних языков на другие как еще одну область применения алгоритмов и технологий дешифрования. «У меня перед глазами текст, написанный по-русски, но я собираюсь сделать вид, что на самом деле он написан по-английски и закодирован при помощи довольно странных знаков, — писал Уивер. — Все что мне нужно — это взломать код, чтобы извлечь информацию, заключенную в этом тексте». Аналогия между переводом и дешифрованием была вполне естественной в обстановке послевоенной эпохи, если учитывать успехи, которых достигла криптография в годы Второй мировой войны. Развивая свои идеи, Уоррен Уивер после целого ряда дискуссий составил в 1949 г. специальный меморандум, в котором теоретически обосновал принципиальную возможность создания систем машинного перевода. Положения этого меморандума вызвали довольно широкий и активный интерес международного сообщества ученых и инженеров и положили начало «концепции interlingva», предусматривавшей разделение процесса перевода на два этапа: первый из них включал перевод исходного текста на язык-посредник (созданный на базе упрощенного английского языка), а второй — представление результатов промежуточного перевода средствами итогового языка.
Помимо очевидных практических нужд важную роль в становлении машинного перевода сыграло то обстоятельство, что предложенный в 1950 г. английским математиком Аланом Тьюрингом знаменитый «тест на разумность» («тест Тьюринга») фактически заменил вопрос о том, может ли машина мыслить, вопросом о том, может ли машина общаться с человеком на естественном языке таким образом, что тот не в состоянии будет отличить ее от собеседника-человека. Тем самым проблемы компьютерной обработки естественно-языковых сообщений оказались в эпицентре исследований в области кибернетики и искусственного интеллекта, а между математиками, программистами и разработчиками вычислительной техники, с одной стороны, и лингвистами — с другой стало налаживаться невиданное прежде взаимопонимание и сотрудничество. Серьезное внимание работам в сфере автоматизации переводов начали уделять органы государственной власти и структуры частного бизнеса, выделявшие на финансирование этой деятельности немалые средства: достаточно сказать, что за десятилетний период с середины 50-х до середины 60-х одни только Соединенные Штаты истратили на подобные исследования и эксперименты около 40 млн долл. — вдвое больше, чем на космическую программу «Аполлон».
В 1954 г. общественности были предъявлены первые результаты: фирма IBM совместно с Джорджтаунским университетом продемонстрировала успешный опыт, в ходе которого система, использовавшая словарь из 250 слов и грамматику из шести синтаксических правил, осуществила перевод 49 заранее отобранных предложений. В том же году первый эксперимент по машинному переводу был проведен в Советском Союзе И. К. Бельской (лингвистическая часть) и Д. Ю. Пановым (программная часть) в Институте точной механики и вычислительной техники Академии наук СССР, а первый промышленно пригодный алгоритм машинного перевода и система машинного перевода с английского языка на русский на универсальной вычислительной машине были разработаны коллективом под руководством Ю. А. Моторина. После этого работы начались во многих информационных центрах, научных лабораториях и учебных учреждениях страны.
Идея машинного перевода стимулировала развитие исследований в теоретическом и прикладном языкознании во всем мире. Появились теории формальных грамматик, большое внимание стало уделяться моделированию языка и отдельных его аспектов, языковой и мыслительной деятельности, вопросам языковой формы и количественных распределений лингвистических явлений. Возникли новые направления лингвистической науки — вычислительная, математическая, инженерная, статистическая, алгоритмическая лингвистика и ряд других отраслей прикладного и теоретического языкознания. В течение 50-х гг. прошлого века в учебных центрах многих стран мира были открыты отделения прикладной лингвистики и машинного перевода.
Изучение проблем машинного перевода (МП) за свою пятидесятилетнюю историю переживало не только подъемы, но и спады. В середине 60-х гг. завершился первый этап этих исследований, и сопровождавшая его эйфория сменилась настроениями скепсиса и критицизма, чему в немалой степени способствовала публикация «черной книги машинного перевода» — доклада специального комитета по прикладной лингвистике (ALPAC) Национальной академии наук США, в котором был сделан вывод о невозможности создания в обозримом будущем универсальных систем высококачественного машинного перевода. Следствием этой публикации было сокращение финансирования и общее снижение интереса к проблематике МП, однако полного сворачивания исследований, особенно теоретических, не произошло.
Следующий этап активизации работ в области МП начался в 70-х гг. Он был обусловлен большими достижениями в решении вопросов компьютерного моделирования интеллектуальной деятельности. В процессе развития идей и создания промышленных систем машинного перевода за это время были разработаны способы автоматического морфологического анализа для основных европейских языков, методы автоматического обнаружения синтаксических структур, сформулированы требования к семантическим компонентам систем. В рамках международного сотрудничества и обмена терминологией были скомплектованы объемные электронные словари с разнообразной лексической информацией и базы терминологических данных по разным тематическим областям науки и техники. Результаты работ по развитию МП в значительной мере стимулировали успешные инициативы в сфере автоматизации информационного поиска, логического анализа естественно-языковых текстов, экспертных систем, способов представления знаний в вычислительных системах и т. д.
И все же сложность и масштабность задач, стоявших перед разработчиками систем машинного перевода, оказались явно чрезмерными для аппаратно-программных средств, которыми они располагали в 70-х гг. прошлого века. Количество одних только правил грамматики и орфографии, которые необходимо было учитывать при создании подобных систем, исчислялось десятками тысяч. Объемов памяти и быстродействия существовавших тогда компьютеров для хранения и обработки таких массивов данных было совершенно недостаточно. Поэтому «вторая волна» активных разработок в области МП тоже постепенно сошла на нет. Общественное внимание к этой проблематике вернулось только в начале 90-х гг., которые принесли с собой стремительный прогресс и огромные достижения всей индустрии инфокоммуникационных технологий, включая персональную компьютерную технику, средства и методы программирования, инфраструктуру сетей и, наконец, Интернет, сделавший перспективы международного и многоязычного информационного обмена поистине безграничными. В таких условиях дальнейшее развитие и совершенствование систем МП стало делом гораздо более реальным, а его результаты — еще более востребованными.
Вместо человека или вместе с человеком
По мере появления все новых и новых алгоритмов, методик и программных решений, нацеленных на компьютерный перевод текстовой информации, мировой рынок в конце прошлого — начале нынешнего века стал заполняться коммерческими продуктами соответствующего назначения, производители которых независимо друг от друга декларировали наличие у своих систем целого ряда «бесспорных» преимуществ перед обычным «рукотворным» переводом. По утверждению их создателей, эти системы обеспечивают:
высокую скорость перевода (использование МП позволяет значительно сократить время, требуемое для перевода больших объемов текста);
снижение его стоимости (с помощью МП можно сэкономить на оплате услуг профессиональных переводчиков);
конфиденциальность переводимой информации (участие компьютера в обработке конфиденциальных документов в гораздо большей степени гарантирует нераспространение их содержания, чем участие переводчика);
универсализацию процесса перевода (даже самый квалифицированный переводчик, как правило, специализируется в определенных областях знаний и тематических направлениях, тогда как системы МП достаточно универсальны, и их работа зависит только от проведения необходимых настроек — подключения нужных электронных словарей и т. п.).
Последняя характеристика особенно важна при оценке качества МП: эффективность работы любой современной программы-переводчика находится в прямой зависимости от возможностей пользователя настроить ее на конкретные параметры того информационного материала, с которым данной программе предстоит иметь дело, — на определенную лексику и ограниченный набор грамматических средств, характерных для текстов данной предметной области, а также на определенные типы документов. Эта непростая задача требует от пользователя достаточной подготовки, предварительного (хотя бы самого общего) знакомства с переводимым материалом а, следовательно, и времени на выполнение настройки.
Чем лучше формализован стиль исходного документа, тем выше качество перевода. Самых лучших результатов при использовании машинного перевода можно достичь для текстов, написанных в техническом и официально-деловом стиле. Тексты, написанные с той или иной степенью художественности, системам МП обычно оказываются не под силу: ведь они не владеют тонкими языковыми нюансами, не понимают иносказаний и намеков, не воспринимают игру слов. Понимания как такового при машинном переводе не происходит: его методология предусматривает лишь расчленение составленных на исходном языке предложений на части, выделение стандартных конструкций, слов и словосочетаний и их упорядоченную трансформацию в соответствии с находящимися в памяти машины словарями. Затем переведенные элементы собираются в конструкцию другого языка по его правилам. Но всего этого, согласитесь, для полноценного перевода недостаточно. Поэтому современный машинный, или автоматический перевод осуществляется с помощью человека: пред-редактора, который тем или иным образом предварительно обрабатывает подлежащий переводу текст, интер-редактора, который участвует в процессе перевода, или пост-редактора, который исправляет ошибки и недочеты в переведенном машиной тексте.
Еще в 1990 г. видный американский специалист по машинному переводу Ларри Чайлдс предложил свою «генеральную классификацию» систем МП: MAHT (Machine-assisted human translation) — системы перевода, осуществляемого человеком с использованием компьютера в качестве вспомогательного средства; HAMT (Human-assisted machine translation) — системы машинного перевода с участием человека; FAMT (Fully-automated machine translation) — системы полностью автоматизированного машинного перевода, не требующего вмешательства человека. Но жизненная практика свидетельствует о том, что в функционировании всех существующих на сегодняшний день систем МП в большей или меньшей степени необходимо участие человека-редактора. Разработчики, утверждающие, что им удалось создать механизм стопроцентно автоматизированного машинного перевода, в процессе которого человек не нужен, просто-напросто лукавят.
По мнению Ричарда Стерна, специалиста по технологиям распознавания речи из университета Карнеги Меллона, алгоритмы автоматизированной проверки грамматики и орфографии никогда не сравняются со сложностью работы человеческого разума: «Компьютер может решать, в какой мере похожа та или иная фраза на правильную, но все это не более чем игра в проценты», — заявляет Стерн. «Полностью компьютеризованный перевод с одного языка на другой — это миф, — утверждает Линн Сешедри, консультант известной транснациональной корпорации Electronic Data Systems (EDS), принимавший участие в создании глобальной интрасети этой фирмы. — Допускаю, что системами МП в определенных рамках можно пользоваться при обработке технической документации, но во всех остальных случаях вы получаете 15% смысла и 85% бессмыслицы. Именно поэтому EDS — компания в высшей степени технологически развитая и очень хорошо умеющая считать деньги — для перевода своих сетевых материалов до сих пор пользуется услугами квалифицированных профессиональных переводчиков».
Впрочем, такого мнения придерживаются сейчас далеко не все предприятия и учреждения мира — многих качество современного машинного перевода вполне устраивает. К примеру, дирекция крупной парижской общественной организации «Фонд развития гуманизма» (FPH) в свое время также стояла перед выбором: тратить ли существенную часть своего бюджета на оплату переводчиков или испробовать средства машинного перевода. В конце концов выбор был сделан в пользу системы МП фирмы Globalink, которая была установлена на сервере электронной почты FPH и стала поддерживать процесс интернациональной переписки персонала этой организации. «Это хорошая и полезная система, — говорит теперь Марина Урквиди, один из ведущих специалистов FPH. — Многие наши корреспонденты предпочитают работать не на французском или английском, а на своем родном языке. Теперь у них есть такая возможность. Вполне естественно, что система МП имеет свои недостатки, но если человек настроен на работу в режиме машинного перевода, его эти недостатки не пугают, и он всегда сможет понять общий смысл перевода, сделанного компьютером».
Принимая во внимание обе точки зрения, все-таки приходится сделать вывод о том, что возможность продуктивного применения МП пользователями, не имеющими представления о языке, на котором написан переводимый текст, минимальна, если не равна нулю. По крайней мере, таково положение дел на сегодняшний день. Конечно, людям зачастую требуется лишь уловить суть переводимого текста, без его тщательного редактирования, в подобных случаях эффективность систем МП, позволяющих оперативно получить черновой вариант перевода, кажется очевидной и бесспорной. Но хорошо, если пользователь знаком с тем языком, на котором составлен исходный текст, и в состоянии проконтролировать точность «черновика» по оригиналу. Если же язык оригинала ему совершенно незнаком, то даже самая незначительная неточность или погрешность в машинном переводе может принципиальным образом повлиять на его смысл и полностью исказить ту самую «суть», которую пользователь стремится постичь.
Однако многие современные производители систем МП вместо того, чтобы акцентировать внимание потенциальных потребителей своей продукции на этих нюансах и предостерегать их от опасностей безоглядного доверия содержанию электронных переводов, продолжают безудержно рекламировать всемогущество выпускаемых ими программных комплексов и их абсолютную готовность к решению задач любой сложности без помощи человека — переводчика или редактора. Так, несколько лет назад фирма LanguageForce громогласно объявила о создании компьютерной системы, способной совершенно самостоятельно осуществлять переводы с любого и на любой из 50 освоенных ею языков. Поскольку стоимость системы была невысокой, объемы ее продаж до определенного момента стремительно росли и достигли огромного масштаба — пока, наконец, покупатели не осознали, что качество предлагаемого им перевода не выдерживает никакой критики. Столь откровенное надувательство вызвало крупный скандал, и с тех пор о LanguageForce на рынке ничего не слышно.
Революционная ситуация и перспективы ее разрешения
Тем не менее сегодня на международном рынке систем машинного перевода представлено достаточно много вполне достойных и добросовестных производителей, предлагающих широчайший спектр продукции самого разного уровня и функционального назначения. Есть среди них и такие «великовозрастные» и заслуженные компании, как основанная в 1968 г. фирма Systran — признанный ветеран этого направления программных разработок, внесший в свое время заметный вклад в его становление. К другим наиболее известным предприятиям этого сегмента относятся американские компании Trados и Logos, швейцарская Star, бельгийская L&H (Lernout & Hauspie) и др. Довольно богатый опыт технологических разработок в области МП накопили Language Engineering Corporation, Transparent Language, Nova Incorporated, Trident Software, Atril, LingoWare, Ata Software, Lingvistica B.V. Созданием подобных систем занимаются и супергиганты современной мировой ИТ-индустрии вроде IBM (которая, как мы помним, стояла у истоков развития МП-технологий) или Google (которая относительно недавно стала предлагать своим пользователям услуги собственной системы МП, позволяющей, в частности, осуществлять перевод текстов из интернет-источников в онлайновом режиме).
Достаточно видное место в этой сфере деятельности принадлежит и российским разработчикам. В июле теперь уже далекого 1990 г. на выставке PC Forum в Москве была представлена первая в России коммерческая система машинного перевода под названием PROMT (PROgrammer’s Machine Translation). Для дальнейшего развития работ в этом перспективном направлении в 1991 г. была организована компания ПРОМТ, которая год спустя выиграла конкурс NASA на поставку систем МП (будучи, к слову сказать, единственной неамериканской фирмой, участвовавшей в этом тендере). В 1998 г. выпускается целая серия программ под новым названием PROMT 98. Еще через год ПРОМТ выпустила пакет программ для работы в Интернете (PROMT Internet) и переводчик для корпоративных почтовых систем (PROMT Mail Translator). Для корпоративных клиентов были разработаны специальные серверные решения — корпоративный сервер переводов PROMT Translation Server (PTS) и интернет-решение PROMT Internet Translation Server (PITS). В 2000 г. ПРОМТ обновляет всю линию своих программных продуктов, выпустив МП-системы нового поколения: PROMT Translation Office 2000, PROMT Internet 2000 и Magic Gooddy 2000. Кроме того, перевод в онлайновом режиме при поддержке системы PROMT начинает использоваться сразу на нескольких отечественных и зарубежных сайтах (translate.ru, infinit.reverso.net/traduire.asp и др.).
В настоящее время компания ПРОМТ является безусловным лидером среди российских разработчиков МП-решений. Ее специалистами создано несколько программ машинного перевода, систем Translation Memory и электронных словарей, завоевавших ряд престижных наград отечественного и международного значения. В номенклатуре ПРОМТ имеются системы машинного перевода и электронные словари для семи европейских языков: английского, немецкого, французского, испанского, итальянского, португальского и русского языков — в сумме 24 направления перевода для ста с лишним предметных областей. Компания предлагает решения для настольных компьютеров, интранета, Интернета и карманных компьютеров. ASP-сервис перевода компании ПРОМТ предоставляет клиентам возможность взять в аренду «движок» перевода, находящийся на сервере Translate.ru.
После двух лет напряженного труда в апреле нынешнего года специалисты компании представили очередную версию своих МП-систем PROMT 8.0, способную лучше переводить, легче настраиваться и поддерживать Microsoft Vista и Office 2007. Как отмечают независимые эксперты, в системе PROMT 8.0 прослеживается тенденция выбора корректного перевода для многовариантных терминов в зависимости от основной тематики. Изменения коснулись и порядка слов в предложении: например, в английском и русском языках в одинаковых ситуациях нередко используются совершенно разные грамматические конструкции, и новая версия по возможности учитывает это, в частности, изменяет форму глагола и автоматически определяет место наречия в предложении согласно правилам русской грамматики, а также не игнорирует безличные предложения. По сравнению с предыдущей версией результаты перевода в целом стали более связными, однако некоторые грамматические конструкции, как и ранее, программой не воспринимаются, да и проблемы с терминологией сохранились. Как и прежде, серьезную проблему для системы PROMT представляют тексты, которые трудно отнести к какой-либо определенной тематике. Именно в них чаще всего используется большое количество многовариантных слов и неверно распознаются грамматические конструкции, причем порой даже те, с которыми не возникает никаких проблем при явном указании специализации. Это хорошо заметно при переводе с других поддерживаемых языков, кроме английского. Чаще всего качество результата зависит не столько от принадлежности исходного текста к той или иной языковой группе, сколько именно от наличия соответствующих тематик, возможности их настройки и объема словарей (в том числе и дополнительных).
По мнению обозревателей рынка, PROMT 8.0 пока не в состоянии совершить революцию в соответствующей технологической области. Хотя, судя по заявлениям руководства компании ПРОМТ, такая революция не за горами и планы ее осуществления уже прорабатываются. Определенную роль в подготовке перемен может сыграть «корпусная лингвистика», изучающая язык на основе тексто-ориентированных баз данных, в том числе индексированных — т. е. снабженных подробной грамматической информацией. Особенно перспективными представляются динамические корпусы текстов (сравнительно небольшого размера), предназначенные для отслеживания современных изменений грамматики и лексики в специализированных областях. Кстати, компания ПРОМТ недавно приобрела у корпорации Google корпус, объем которого в архивированном виде составляет 24 TB, так что речь, видимо, идет о не слишком отдаленной перспективе. В любом случае сочетание нескольких подходов, несомненно, пойдет на пользу системам МП и повысит качество выдаваемых ими результатов. Однако вопрос — когда они смогут сравняться с профессиональными переводчиками — по-прежнему остается открытым.
Сведут ли в конце концов технологии МП работу профессиональных переводчиков к функциям редакторов? Дискуссии по этому поводу ведутся уже не одно десятилетие. Программисты предсказывают наступление эры главенства компьютерных переводов не позднее 2010 г., а лингвисты, в свою очередь, говорят об общем ухудшении качества переводов и о том, что ситуация усугубляется именно использованием программ МП. Так или иначе, нельзя оспорить тот факт, что общество получает определенные преимущества, используя современные технологии — более свободный доступ к большему количеству информации, ускоренное развитие различных сфер человеческой жизнедеятельности, облегчение процесса общения. Как бы то ни было, а изменения неизбежны, и для того чтобы сосуществовать с этим миром, мы должны адаптироваться к ним.
Перспективы развития машинного перевода связаны с дальнейшей разработкой и углублением теории и практики перевода, как машинного, так и «человеческого». Для развития теории важны результаты сопоставительного языкознания, общей теории перевода, теории закономерных соответствий, способов представления знаний, оптимизации и совершенствования лингвистических алгоритмов. Новые более эффективные словари с необходимой словарной информацией, строгие теории терминологизации лексики, теория и практика работы с подъязыками помогут повысить качество перевода лексических единиц. Формальные грамматики, ориентированные на перевод, дадут возможность оптимизировать алгоритмы нахождения переводных соответствий в данной коммуникативной ситуации, которая может быть описана в рамках соответствующих прикладных теорий представления знаний. Наконец, новые возможности программирования и вычислительной техники также будут вносить свой вклад в совершенствование и дальнейшее развитие теории и практики машинного перевода.
Основные даты в истории машинного перевода
1629 — Рене Декарт предложил универсальный язык, в котором один символ выражает эквивалентные идеи различных естественных языков.
1933 — русский изобретатель Петр Смирнов-Троянский получил патент на «машину для подбора и печатания слов при переводе с одного языка на другой».
1939 — компания Bell Labs на Всемирной ярмарке в Нью-Йорке демонстрирует первое электронное устройство синтеза речи.
1947 — Уоррен Уивер, руководитель отделения естественных наук Рокфеллеровского фонда, написал письмо Норберту Винеру, в котором рассматривал задачу перевода текстов с одних языков на другие как еще одну область применения техники дешифрования. За этим письмом последовало множество дискуссий.
1952 — проходит первая конференция по машинному переводу, организованная Йешуа Бар-Хиллелом, главным штатным исследователем проблем машинного перевода Массачусетского технологического университета.
1954 — в Джорджтаунском университете состоялась первая публичная демонстрация системы машинного перевода. Система IBM Mark II переводила 49 предложений с русского языка на английский с использованием словаря, содержащего 250 слов, и шести грамматических правил.
1960 — Бар-Хиллел публикует отчет, в котором утверждается, что корректный автоматический перевод в принципе невозможен.
1964 — Национальная академия наук США основала Комитет по проблемам автоматической обработки речи (ALPAC).
1966 — ALPAC публикует отчет по машинному переводу с выводами о том, что годы исследований в данном направлении не принесли ожидаемого результата. Это привело к прекращению финансирования государством программ развития МП.
1968 — Питер Тома, лингвист и бывший сотрудник Джоджтаунского университета, основывает одну из первых фирм — разработчиков систем МП — «Система автоматического перевода и электронные коммуникации» (LATSEC).
1969 — в Миддлтауне (штат Нью-Йорк) Чарльз Бирн и Бернард Скотт основали фирму Logos с целью разработки систем МП.
1978 — в рамках проекта Network Speech Compression (NSC) переданы первые слова естественного языка в объединенной сети американского Управления перспективного планирования научно-исследовательских работ (ARPA). \
1983 — представлена автоматическая система обработки речи (ALPS) — первая программа МП для микрокомпьютеров.
1985 — Управление перспективного планирования оборонных научно-исследовательских работ (DARPA) начинает программу исследований в области распознавания речи.
1986 — в Японии организована Лаборатория исследования в области перевода и телекоммуникаций (ATL-ITL).
1988 — ученые из Исследовательского центра Томаса Дж. Уотсона компании IMB возвращаются к разработке статистического метода МП, при котором сравниваются параллельные тексты и подсчитывается вероятность соответствия слов.
1990 — компания Dragon Systems выпускает программу DragonDictate, первую систему преобразования устной речи в письменную, способную распознавать 30 тыс. слов. DARPA запускает программу «Системы разговорной речи» (SLS) с целью разработки приложений, обеспечивающих голосовое взаимодействие между человеком и машиной.
1991 — появилась первая рабочая станция переводчика, объединяющая программы STAR Transit, IBM TranslationManager, Canadian Translation Services PTT и Eurolang Optimizer.
1992 — ART-ITL основала Консорциум исследований в области перевода с естественных языков (C-STAR), который организует первую публичную демонстрацию телефонного перевода между английским, немецким и японским языками.
1993 — в Германии идет работа над проектом Verbmobil. Исследователи сосредоточили свое внимание на переносных системах обеспечения перевода деловых переговоров с английского на немецкий и японский. Фирма BBN Technologies демонстрирует первую готовую рабочую станцию МП с поддержкой автоматического распознавания речи в реальном времени на основе двадцатитысячного словаря.
1994 — бесплатный перевод при помощи системы Systran становится доступным на форумах CompuServe.
1997 — Babel Fish на портале AltaVista предлагает онлайновый перевод с использованием системы Systran. Появляются программы NaturallySpeaking (Dragon Systems) и ViaVoice (IBM) — первые системы распознавания речи для ПК, основанные на подробных словарях. Parlance Corporation, дочерняя компания BBN Technologies, выпускает программу Name Connector, первую международную АТС, которая перенаправляет телефонные звонки на основе распознавания произнесенных вслух имен.
1999 — фирма Logos выпускает программу e.Sense Enterprise Translation, первый многоязычный веб-переводчик на базе единого сервера. IBM анонсирует систему ViaVoice, ориентированную на компьютеры Macintosh — первую систему такого рода для платформы Мас. Кевин Найт из Института информационных исследований (ISI) при университете Южной Калифорнии возглавил межуниверситетскую команду с целью разработки программы Egypt для построения систем статистического МП. Egypt выявляет статистику соответствий в двуязычном тексте, анализирует эти соответствия и использует результаты для обеспечения автоматического перевода.
2000 — в Лаборатории им. Авраама Линкольна при Массачусетском технологическом институте Ян Сук Ли и Клиффорд Вейнстейн демонстрируют продвинутый прототип системы перевода устной речи с корейского на английский. В ISI при университете Южной Калифорнии реализована обратная транслитерация имен собственных, которые заменяются приближенными фонетическими соответствиями.
2001 — в Институте языковых технологий (LTI) университета Карнеги Меллон, возглавляемом Хаиме Карбонелем, создается система устного перевода для «малых» языков, используемых малочисленными народами и народностями. Специалисты в области биомедицинской инженерии Теодор Бергер и Хим Ши Лио создали новую нейросетевую систему распознавания речи, которая понимает разговорные языки лучше самих людей.
Составители: Кристин Демос и Марк Фраунфельдер. (Источник: компания ПРОМТ)
(В статье использованы материалы онлайновой энциклопедии «Кругосвет», информационного агентства ITC Online, журнала «MСonline», интернет-ресурсов Dialog-21.ru и CMNT.ru)
От SAM, как и от судьбы, не уйти Практика Software Asset Management доказала, что результаты управления таким объектом нематериальных активов, как программное обеспечение, могут быть прогнозируемыми и измеримыми.
HP: в новый год – с новыми серверами Компания HP к концу 2010 г. полностью обновила линейку Integrity и представила комплекты обновлений для прежних версий этих серверов. Компания также значительно упростила сетевую архитектуру своих систем.
Мобильная мощность Мобильная рабочая станция Dell Precision™ M6500 – самая мощная в мире рабочая станция с четырьмя слотами памяти, обеспечивает идеальное сочетание производительности, надежности, безопасности и мобильности.
Четверть века с Windows Самая популярная в мире ОС недавно отметила 25-летие – за этот срок Microsoft прошла путь от версии Windows 1.0 с элементарной многозадачностью до сверхуспешной «семёрки» с технологией мультитач-управления.
Раймонд Армес: cloud - единственный шанс для России Компания NEC в конце 2010 года провела объединение своих российских дочерних предприятий на базе ЗАО «NEC Нева Коммуникационные Системы». Раймонд Армес размышляет о стратегии NEC на рынке ИТ России.