Работа с текстом
Для преобразования текстов из формата MS Word служат catdoc и wv.
Программа catdoc (автор - Виктор Вагнер) читает файлы MS Word (разных версий) и выводит их на стандартное устройство вывода (обычно - текстовый терминал) в виде плоского текста. Самый простой вариант использования:
catdoc my.doc > my.txt
Вы можете определять кодировки входного и выходного текста, а также работать с catdoc в интерактивном графическом интерфейсе, который предоставляет программа wordview из того же пакета.
Если Вам нужна не только текстовая информация из файла MS Word, то к вашим услугам программа wvHtml из пакета wv. Она преобразует файл документа в html, пробуя сохранить картинки и фреймы. По умолчанию вывод
осуществляется в Unicode html, если Вам это не нужно. то можно указать кодировку результирующего файла при помощи параметра -c:
wxHtml -c koi8r my.doc > my.htm
OpenOffice - это целая офисная система, являющаяся свободным вариантом StarOffice, и включающая в себя текстовый процессор, электронные таблицы, систему подготовки презентаций, графический редактор, редактор формул.
Достоинством системы является хорошая совместимость с форматами MS Office, а ее главным недостатком - полное отсутствие в данной версии системы печати. В результате в ней удобно готовить документы, но печатать их пока
приходится из других приложений.