"Журнал «Компьютерра» № 13 от 03 апреля 2007 года" - читать интересную книгу автора (Компьютерра)

Неразборчивый почерк маслом

Автор: Алексей Климов

Многие веб-ресурсы претендуют на индивидуальность обращения с посетителем. Вход на подобные сайты обставлен атрибутикой элитного клуба: ник, пароль, отзыв… Однако создатели мало задумываются о том, как популярная ныне авторизация влияет на восприятие сайта в целом.

По замыслу разработчиков клавиатурный диалог с программным «швейцаром» в форме разглядывания и последующего ввода в отведенное поле так или иначе искаженных символов обеспечивает некий «фейс-контроль», защищающий от незваных гостей. Но при этом интуитивно присущее большинству грамотных людей чувство гармонии шрифта подвергается некоторому поруганию. Попытки умышленного запутывания букв характерны для школьников, желающих «замаскировать» суть письменного ответа за невнятностью — авось поленится учитель разбирать закорючки и подарит «три» не читая.

Если верить специализированной литературе [В серии «Библиотека криминалиста» вышла парадоксальная брошюра: Алесковский С. Ю., Комиссарова Я.В. Основы графологии. — Изд-во «Юрлитинформ», 2006. 216 с. В ней нет иллюстраций вообще! По задумке авторов читателю предлагается понять взаимосвязь почерка с личностными особенностями пишущего, не глядя на рукопись], «грамотных людей» не так уж мало. Начиная с младших классов некоторые ученики обладают недетской осведомленностью о распространении восприятия письменного документа на его автора: «…школьникам удается придать своему почерку аккуратность и даже оригинальность с тем, чтобы можно было вообразить, будто эти качества присущи их характерам. Допустимо назвать это [умышленным] оптическим искажением сигнала».

Таким образом, рациональное противодействие программному распознаванию шрифта должно избегать «неряшливости» начертания.

Изложенная информация, будучи сопоставима привкусом с начинкой литературных пирожков Голубицкого, имеет прямое отношение к рассматриваемому сегодня фотошоп-плагину SnapArt от фундаменталиста графических утилит www.alienskin.com.

Не беда, что производитель позиционирует свою новинку в качестве конвертера фотографий в рисунки, акварели и прочую живопись. И дело не в том, что результаты обработки портретов иногда проходят тест Тьюринга у людей, знакомых с живописью. В этой заметке мы предлагаем использовать недокументированные возможности SnapArt с несколько неожиданной целью — для имитации рукописных шрифтов.

Может статься, что после публикации рассматриваемая программа послужит совершенствованию методики сегрегирования живых посетителей сайтов и роботов по уровню возможности распознавания зашумленного текста. Ведь нельзя исключить, что OCR-программы уже научились решать привычные ребусы.

Иное дело — рукопись, где за всю жизнь мы даже собственный автограф не способны повторить со стопроцентной тождественностью. Потому усилия по созданию программ распознавания почерка столь велики, что должны были бы, как всякое действие, породить не только коммерческий продукт, но и противодействие.

Вектор противодействия следует искать в направлении генерации псевдорукописных шрифтов с плавающим начертанием букв. Например, шрифт может динамически меняться в зависимости от манеры набора текста на клавиатуре конкретным оператором (уверенно, импульсивно, торопливо и т. п.). Однако намеченного противодействия усилиям по распознаванию почерка в софтверной индустрии не наблюдается, что говорит как минимум об ином направлении приложения декларируемых [Например в диссертации Давида Яна, руководителя ABBYY] усилий.

Восполним пробел впереди паровоза. Программно сымитируем основное свойство рукописного текста — повторяющуюся неповторимость каждой буквы (например, "w" на рис. 1).

Из средств SnapArt лучше всего использовать для этой цели фильтр Stylize (с учетом рекомендаций из упомянутых «Основ графологии»). Опытным путем (подробнее см. публикацию «FineReader как детектор лжи» в «Домашнем Компьютере») установлена наибольшая стойкость к алгоритму OCR у контурных букв. Именно такие, нет, не шрифты, а исходники для их создания, генерирует фильтр Stylize практически из любых начертаний, сохраненных в растровом формате. Собственно, для означенной цели этих букв-картинок достаточно [Процесс создания шрифта из растровых заготовок подробно описан в материале «Чтение? Дело привычки» в «Домашнем компьютере»].

Остается отметить постпраздничную актуальность использования рассмотренного пакета фильтров по прямому назначению. Во-первых, размытые тремором рук кадры обрабатываются столь же четко, как и идеальные студийные фотографии. Во-вторых, «отдых», запечатленный «маслом» (рис. 2), смотрится гораздо изящнее документального снимка (который я даже не стану приводить в уменьшенном масштабе).