"Г.Г.Кудрявцев. Как на самом деле делаются книги для lib.ru " - читать интересную книгу автораГ.Г.Кудрявцев (с замечаниями М.Н.Бычкова).
Как на самом деле делаются книги для lib.ru --------------------------------------------------------------- Максим Бычков (bmn(a)lib.ru) Date: 24 Oct 2003 --------------------------------------------------------------- Предположим, что вами овладела жажда сделать что-нибудь по-настоящему великое. Предположим, что для этой цели у вас имеется только компьютер, сканер, программа распознавания текста, несколько книг и непомерное самомнение, а войти в историю и там побарахтаться сильно хочется. Тогда все что вам остается сделать, это взять любимую (желательно хорошую и интересную, но можно и просто нужную народу или редкую) книгу, проверить, нет ли ее текста в электронном виде где-нибудь в Интернете и приступить к работе. СКАНИРОВАНИЕ Установка сканера по яркости. печати шрифтом 10 и более пунктов, то черно-белое сканирование в разрешении 300 точек с ручной установкой яркости дает более чем приемлемые результаты. Количество ошибок на лист A4 стремится к нулю и колеблется в районе 1-5 неправильно распознанных знаков. Установку яркости можно подобрать опытным путем, сводя к минимуму помехи в виде рассыпанной по листу "сыпи", но в основном, яркость на уровне 45-55% обеспечивает хорошее качество распознавания. В некоторых случаях резонно увеличить разрешение сканирования до 400 точек на дюйм (сложные или нестандартные шрифты, нечеткая печать). К сканированию с разрешением 600 точек на дюйм стоит прибегать только в случаях если оригинал напечатан шрифтом 9 и менее пунктов. РАСПОЗНАВАНИЕ Установив в FineReader'e 6.0 (далее FR) опцию Tools -> Options -> Scan/Open Image -> Use TWAIN-Source interface вы получите возможность непосредственно управлять процессом сканирования через клиентскую программу своего сканера. То есть вам не надо будет лихорадочно перелистывать книжку, во время обратного хода лампы, и сканирования следующего разворота будет начинаться только после того, как вы отдадите команду путем тыканья кнопки "Scan" (или аналогичной) в программе сканирования. Можно установить опцию "Разрезать на страницы" (Tools -> Options -> Scan/Open Image -> Split dual pages), которая облегчит контроль за |
|
|