"Создание электронных книг в формате FictionBook 2.1: практическое руководство" - читать интересную книгу автора (Кондратович Михаил Иосифович)

§ 3.4 doc2fb

Приложение doc2fb предназначено для преобразования в FB2 файлов RTF и M$ Word DOC.

Чтобы утилита могла работать, на ПК должен быть установлен M$ Word 2003. Также должен наличествовать JavaScript версии не ниже 5 (входит в состав IE).

Собственно утилита представляет собой XSL-скрипт и оболочку — HTA-приложение. [3.1]

Интерфейс оболочки прост и понятен. Сразу бросается в глаза, что программка рассчитана на пакетное преобразование. То есть выбрать можно не конкретный файл, а только папку.

Утилита умеет выделять главы и подглавы, жирный шрифт и курсив, сноски и ссылки, а также добавляет картинки.

При этом векторные картинки Word, например, WMF, в итоговый файл не попадают. Растровые картинки, отличные от формата JPEG, преобразуются в PNG.

Меню программки состоит из трех пунктов: «Файлы», «Настройки» и «Инфо»

Пункт «Файлы» позволяет вызвать главную рабочую страницу оболочки (активна сразу после запуска). В строке «Папка» щелкаем кнопку с изображением «gt;gt;» и выбираем папку, которая содержит нужные DOC-файлы.

После этого становится активной кнопка «преобразовывать».

Нажимаем ее. Файлы тихо и быстро конвертируются в FB2.

Ход операции отображается в области «Журнал», которая находится под кнопкой «преобразовывать».

Настройки оболочки весьма немногочисленны.

«Показывать MS Word при преобразовании», «Закрывать doc2fb после преобразования», «Удалять пустые строки» — назначение этих опций ясно без дополнительных комментариев.

«Заменять Line-break на Paragraph-break» — заменяет коды принудительные разрывы строки на коды конца абзаца.

Что есть такое принудительный разрыв строки? Обратимся к документации M$ Word.

При вставке принудительного разрыва строки текущая строка обрывается, и текст продолжается на следующей строке. Предположим, например, что стиль абзаца включает в себя отступ перед первой строкой. Чтобы избежать появления отступа перед короткими строками текста (допустим, в написании адреса или в стихотворении), каждый раз, когда нужно начать новую строку, вместо того чтобы нажимать клавишу ENTER, вставляйте принудительный разрыв строки.

Укажите место разрыва строки. Нажмите клавиши SHIFT+ENTER.

«Определять сноски как lt;регулярное выражениеgt;» и «Определять пояснения как... lt;регулярное выражениеgt;» — перед конвертацией в FB2 M$ Word преобразует описанное регулярными выражениями в сноски и пояснения.

«Сохранять изменения как версию документа» —  в процессе конвертации в документ вносятся изменения. Если опция включена, то эти изменения будут сохранены в документе как версия редактирования.

Бич описанных выше программных средств — излишняя самостоятельность — проявил себя и тут. Стихи с отступами определяются как цитаты, для заголовков в две строчки делаются две секции и т.д.

Как и в ExportXML, чтобы помочь программе найти элементы, документ можно дополнительно разметить. На страничке автора программы можно найти dot-файл с соответствующими стилями. Добавляются они в рабочий файл точно так же, как и стили ExportXML.

Резюме. В целом программа отвечает своему назначению. Несмотря на некоторое своеволие, она позволяет быстро сконвертировать большое количество файлов.