"Г.Г.Кудрявцев. Как на самом деле делаются книги для lib.ru " - читать интересную книгу автора

Г.Г.Кудрявцев (с замечаниями М.Н.Бычкова).

Как на самом деле делаются книги для lib.ru


---------------------------------------------------------------
Максим Бычков (bmn(a)lib.ru)
Date: 24 Oct 2003
---------------------------------------------------------------



Предположим, что вами овладела жажда сделать что-нибудь по-настоящему
великое. Предположим, что для этой цели у вас имеется только компьютер,
сканер, программа распознавания текста, несколько книг и непомерное
самомнение, а войти в историю и там побарахтаться сильно хочется. Тогда все
что вам остается сделать, это взять любимую (желательно хорошую и
интересную, но можно и просто нужную народу или редкую) книгу, проверить,
нет ли ее текста в электронном виде где-нибудь в Интернете и приступить к
работе.


СКАНИРОВАНИЕ

Установка сканера по яркости.
Если материал представлен в виде качественной (высокой, офсетной)
печати шрифтом 10 и более пунктов, то черно-белое сканирование в разрешении
300 точек с ручной установкой яркости дает более чем приемлемые результаты.
Количество ошибок на лист A4 стремится к нулю и колеблется в районе 1-5
неправильно распознанных знаков. Установку яркости можно подобрать опытным
путем, сводя к минимуму помехи в виде рассыпанной по листу "сыпи", но в
основном, яркость на уровне 45-55% обеспечивает хорошее качество
распознавания.
В некоторых случаях резонно увеличить разрешение сканирования до 400
точек на дюйм (сложные или нестандартные шрифты, нечеткая печать).
К сканированию с разрешением 600 точек на дюйм стоит прибегать только в
случаях если оригинал напечатан шрифтом 9 и менее пунктов.


РАСПОЗНАВАНИЕ

Установив в FineReader'e 6.0 (далее FR) опцию Tools -> Options ->
Scan/Open Image -> Use TWAIN-Source interface вы получите возможность
непосредственно управлять процессом сканирования через клиентскую программу
своего сканера. То есть вам не надо будет лихорадочно перелистывать книжку,
во время обратного хода лампы, и сканирования следующего разворота будет
начинаться только после того, как вы отдадите команду путем тыканья кнопки
"Scan" (или аналогичной) в программе сканирования.
Можно установить опцию "Разрезать на страницы" (Tools -> Options ->
Scan/Open Image -> Split dual pages), которая облегчит контроль за