понедельник, 27 октября 2008 г.

Многоязычная самообучающаяся система автоматизированного перевода

http://eugene-online.blogspot.com/2008/03/blog-post.html
Евгений Бражко

Буквально сегодня мне понадобилось перевести несколько небольших текстов с украинского языка на русский. Оказывается, ситуация с переводчиками текстов в Linux такая же, как и с системами распознавания - выбора, по большому счету, на данный момент нет никакого. Единственный более-менее вменяемый вариант (которым я и воспользовался) - это "Переводчица" - многоязычная самообучающаяся система автоматизированного перевода. На сайте проекта доступны два вида перевода - перевод текста и перевод файла. В обоих случаях размер переводимого фрагмента/текста ограничен 100 Кб. По сравнению с другими online-переводчиками, где ограничение составляет 500-1000 символов, 100 Кб - очень даже неплохо. Поддерживаемые типы файлов: rtf, xml, html, а также все форматы OpenOffice.org. Поддерживаемые языки для перевода (имеющиеся в наличии): русский, украинский, английский. Но словари можно сделать для любого языка.

Систему можно также установить на локальный компьютер. Со страницы загрузки доступны исходные тексты программы и словарей, а также собранные пакеты для ALT Linux, ASP Linux (Fedora Core), Gentoo Linux и MS Windows. Для Ubuntu/Debian пакетов к сожалению нет.

Следует отметить, что для программы имеется графический интерфейс на wxWidgets.

Перед установкой переводчика необходимо установить несколько пакетов:

 $ sudo apt-get install libarchive-zip-perl libconfig-general-perl libhtml-simpleparse-perl libtext-csv-perl
$ sudo apt-get install ncftp
и модули Perl, которых в репозитории нет:
 $ sudo cpan RTF::Tokenizer
$ sudo cpan Wx
Затем скачиваем пакет Lingua-Pere-0.2.0.tar.gz, распаковываем, собираем и устанавливаем его:
$ tar xvfz Lingua-Pere-0.2.0.tar.gz
$ cd Lingua-Pere-0.2.0
$ perl Makefile.PL
$ make
$ sudo make install
То же самое проделываем с пакетом wxpere-0.2.0.tar.gz:
$ tar xvfz wxpere-0.2.0.tar.gz
$ cd wxpere-0.2.0
$ perl Makefile.PL
$ make
$ sudo make install
Теперь очередь словарей. Словари берем из http://pere.org.ua/dwn/src/dic/ (dmp или src; пакеты src меньше в 3 раза, но их сборка займёт больше времени; у меня русско-украинский словарь собирался из исходников 3,5 часа; за это время я успел скачать архивы с дампами и восстановить словари из них). Для каждого словаря после распаковки выполняем команду вида:
$ ./install.sh ~/dic/en-us_ru-ru_dzer-tyzh en-us_ru-ru_dzer-tyzh.dmp
На этом установка окончена. Теперь можно запустить wxpere:

Если переводить тексты необходимо время от времени, то нет смысла устанавливать "Переводчицу" - намного проще воспользоваться online-переводом.

Комментариев нет: