"Журнал "Компьютерра" №707" - читать интересную книгу автора (Компьютерра)

ОГОРОД КОЗЛОВСКОГО: Tai Bi Technologies

Автор: Евгений Козловский

За последний год или около того я побывал на пяти или шести презентациях фирмы ABBYY, которая, по старой памяти, остается для меня BIT’ом Давида Яна, - причем только на презентациях, относящихся, что называется, к пользовательским продуктам (для нормальных людей), пропустив не меньше презентаций, посвященных продуктам корпоративным.

Ну знаете: распознавание крестиков и ноликов в анкетах, оцифровка и введение в соответствующие программы разных счетов-фактур и прочие безусловно важные для нормального функционирования общественной жизни вещи, которые попросту не занимают лично меня - имеет же право быть у меня некий определенный круг интересов?! На каждой из непропущенных презентаций представлялось что-то новенькое, причем - в области любимых мною ABBYY’евских продуктов: словаря ЛИНГВО, FineReader’а (которого я еще в незапамятные времена перевел как "Клевый Чтец"), наконец, небольшой утилитки ABBYY Reader, которой я изредка, но постоянно и с большой пользой для себя пользуюсь, - однако ни по одной я не написал ни "Огорода", ни "Козлонки" в "Домашний компьютер", что, как мне кажется, несколько огорчало ABBYY’евских PR-барышень. Огорчало, впрочем, вполне естественно. Я поневоле чувствовал себя виноватым, пытался объясняться: мол, хотя ABBYY я люблю давно и искренне и хотя новые версии старых программ очевидно лучше предыдущих, а выпуск, скажем, словаря для КПК и телефончиков или бумажного двухтомника - креативно и коммерчески, конечно, интересные и симпатичные затеи, но ни одна из них не дает повода для полноценной колонки, в которых я всякий раз пытаюсь ухватить что-то концептуальное. Не согласиться со мной вроде бы было довольно сложно - и барышни поменяли тактику: пригласили меня на пять дней на анатолийское побережье Средиземного моря, на конференцию партнеров ABBYY - мероприятие серьезное, но меня как журналиста, пишущего не про бизнес, а про hi-tech, интересовавшее мало, - однако ездить я люблю, в Турции не бывал никогда (всегда как-то сторонился по ряду причин, объяснению которых в "Огороде" не место), а ухватить в преддверии первого московского снега несколько дней солнечного пляжа и волшебного моря - соблазн велик. Условие поездки, высказанное, правда, в полушутливой форме, было - написать-таки колонку про ABBYY. Попытаюсь оправдаться перед читателями: при всей любви к странствиям я принимаю приглашения, даже самые заманчивые, далеко не от любой фирмы, но только когда можно, что называется, совместить приятное с полезным. А в случае с ABBYY полезного все-таки поднакопилось немало, - и вот я решил, что пусть поездка будет поводом, чтобы все это "немало" наконец высказать.

Когда, валяясь на анатолийском пляже, я думал над этим "Огородом", меня посетила следующая аналогия: вот уже лет, можно сказать, пятьдесят (ну, тридцать-то уж во всяком случае) автомобили принципиально не меняются. Инжектор, передний привод, автоматическая коробка передач, кондиционер, все чаще оборачивающийся климат-контролем… Модель от модели отличается, право же, несущественно и непринципиально. Появляется, от версии к версии совершенствуясь, антиблокировка колес, нормой становятся подушки безопасности, материалы меняются на все более прочно-податливые, которые при, не дай бог, аварии наносят людям, находящимся внутри автомобиля, минимальный вред, - но по сути-то дела (то есть - исключая моду дизайна) автомобиль десятилетней давности от сегодняшнего отличается очень мало. Мне довелось прокататься на моей прежней машинке целых семь лет, и, порадовавшись после ее смены на новую модель (того же, кстати, производителя), я прикололся цифровым спидометром и моторчиками приводов зеркал, осознал, что в случае аварии буду защищен сильнее, - но, в общем-то, разницы не ощутил. Тем не менее прогресс в автомобилестроении не останавливается ни на минуту, сотни журналов следят за ним, и всякая мелочь интерфейса кажется им значительной, - и так оно и есть. А что автомобили пока еще не умеют взлетать над пробками или ездить без водителя, - что ж, всему свое время: неужели перестать следить за их развитием, ожидая этих самых концептуальных перемен? Похожий процесс идет сегодня и в области hi-tech: компьютеры моложе автомобилей на добрую сотню лет, так что первое десятилетие, хорошо многим из нас памятное, принципиальные открытия и изобретения происходили чуть ли не раз в месяц, - теперь же и железо, и софт достигли определенного уровня совершенства, а технология движется путем мелких усовершенствований да той же самой смены дизайна: тут ничего не поделаешь, жить-то надо, - а стало быть, за неимением гербовой бумаги писать на простой - привлекать покупателя красотой кнопок и корпусов…

Итак, самая старая из пропущенных мною (не вообще - а в "Огородах") новинок от ABBYY - это, пожалуй, крохотная утилитка под названием ABBYY Reader. Она позволяет захватить задаваемый вами фрагмент экрана, распознать его и передать по выбору в буфер ли обмена, в Word ли, в Excel, в FineReader или в графический файл - если захватывается картинка. Если у вас на компьютере стоят, скажем, FineReader и какой-никакой графический редактор - проделать все это можно и не прибегая к специальной утилите: снять весь экран или активное окно посредством PrintScreen, вставить содержимое в графический редактор, вырезать, если нужна только картинка - ее и запомнить в отдельном файле, а текстовый фрагмент тоже запомнить и подать FineReader’у на распознавание. Однако все это довольно муторно, FineReader сравнительно громоздок, да и стоит не на каждой машине, - а тут раз - и все готово. А ведь потребность снять что-то именно с экрана возникает то и дело: либо с какой-нибудь информационной таблички, либо - из Help’а или с настроечной закладки. Концептуально? Не особенно. Практично? Удобно? Безо всякого сомнения! Спасибо? Огромное спасибо!

Идем дальше: словарь ЛИНГВО двенадцатой версии. Скажу сразу, что пользуюсь этим словарем, начиная с его давней, первой, еще DOS’овской, версии, и пользуюсь с огромной пользой и огромным удовольствием. Подавать на перевод выделенное слово комбинацией Ctrl+Ins+Ins давно превратилось для меня в движение рефлекторное. Довольно бедный в лексическом смысле поначалу, он неизменно оказывался у меня в фаворитах потому, что мои, не специально лингвистические, потребности и тогда покрывал с головой, и хотя время от времени я ставил на компьютер словари более - по тем временам - серьезные: с транскрипциями и грамматическими комментариями, - никогда к ним не обращался. ЛИНГВО же рос во всех отношениях и мало-помалу (не специалист - наверняка сказать не могу) догнал и обогнал всех конкурентов: число словарей стало необозримым, скорость перевода, которая одно время (в одной-двух промежуточных версиях) слегка замедлилась, снова подросла, словарь научился понимать длинные словосочетания и все такое прочее. Одним из главных удовольствий от последних версий стало наличие в них не только чисто "переводчиских" словарей, но и, скажем, английского толкового Collins и - что, безусловно, главнее для меня - русских Даля (первоначального, а не в том кастрированном виде, в котором он издавался при большевиках, - даже если издания были как бы репринтные), Ушакова и Современного толкового. Не будучи человеком религиозным, я, тем не менее, всегда хочу иметь под рукой полную Библию - как потрясающий склад разного рода эпиграфов и цитат, - и ЛИНГВО позволяет мне и это. Особенно интересно, что ЛИНГВО всегда давал возможность желающим создавать словари собственные, - и, кстати заметить, именно из этих, любительских, проросли упомянутые Даль, Библия и кое-что еще. Последние годы ABBYY координирует эту словаретворческую работу народа на специальных сайтах, в том числе - на сайте "Ассоциация лексикографов Lingvo" (www.lingvoda.ru/dictionaries/index.asp).

Получив на очередной презентации очередную версию ЛИНГВО - двенадцатую, - я тут же, рефлекторно, установил ее на свои компьютеры и продолжил пользоваться, как пользуюсь ЛИНГВО уже больше десяти лет, а мелкие улучшения по сравнению с версией одиннадцатой открывались постепенно и казались, что ли, вполне естественными, хоть на самом деле, конечно, требовали от создателей специальной и вполне творческой работы.

Пожалуй, единственной моей претензией к ABBYY по поводу ЛИНГВО можно счесть некую кривизну портирования словаря на Palm (которая, как мне кажется, так до конца и не исправлена), но с тех пор как я перешел с Palm на Pocket PC, она (претензия) стала чисто теоретической, больше меня не задевающей, - а на Pocket PC словарь всегда становился легко, безошибочно и как влитой. Он настолько полно удовлетворяет меня на моем "Артемке", что я даже не думаю о словарях от других производителей.

Тут уместно коснуться следующей, сравнительно недавней презентации - презентации специальной редакции ЛИНГВО для устройств на Windows Mobile и Symbian (как видно, от поддержки Palm-платформы решил отказаться не только я, но и они); ABBYY выпустила некий малый джентльменский словарный набор: 12 с английским языком, 9 - с немецким, по 4 - с французским, итальянским и испанским и один - русско-русский, - сразу на карточке microSD (с переходником на miniSD), так, чтобы, когда вставляешь ее в смартфон или коммуникатор, работающий на одной из двух упомянутых семейств систем, - словарь автоматически установился и был готов к употреблению в тот же миг, без встряхивания и взбалтывания. При этом на гигабайтной карточке остается больше двух третей свободного места - для другого употребления, а словарь на карточке стоит непринципиально дороже чистой карточки того же размера.

Тут высоких технологий, кажется, совсем немного: владелец "большого" ЛИНГВО в качестве бонуса уже имеет все словари для КПК, включая Palm’ы, - и установить их - дело, на мой вкус, элементарное: подключаешь КПК к Большому Брату, запускаешь установщик, выбираешь, что из словарей хотел бы иметь в кармане (можно и пользовательские), - дальше все происходит автоматом. Однако я понимаю, что владельцев всяческих смартфонов/коммуникаторов уже сегодня гораздо больше тех, кто хоть чуть-чуть, да разбирается в большом компьютере, - и оно все растет и будет расти и дальше, - так что, без сомнения, найдутся люди, которые не отказались бы от удовольствия иметь в своем телефончике такой могучий словарь, частично - даже говорящий, - но никогда бы не поняли, что, чтобы его иметь, надо приобрести большой ЛИНГВО и проделать некие компьютерные манипуляции. А тут - всё к вашим услугам. Замечательный, на мой непрофессиональный взгляд, маркетинговый ход и прелестная, завлекающая упаковка… То есть на сей раз лично я отдельное спасибо ABBYY говорить, наверное не стану (уже сказал, по сумме, когда благодарил за большой словарь), однако предполагаю, что людей, которые скажут, наберется немало. И тут, извините, кроме маркетинга появляется уже и чистый hi-tech. Точнее - его более широкое продвижение в массы, то есть, в конечном счете, увеличение материальной базы для его развития.

Следующая презентация была по преимуществу концептуально-художественной и тоже касалась ЛИНГВО. Если кто еще не знает, основатель и председатель совета директоров ABBYY Давид Ян последнее время, присматривая одним глазом за развитием компании, от души увлекся художественно-ресторанным бизнесом: сперва открыл в Газетном переулке (на бывшей улице Огарева) ресторанчик "FAQ", весь наполненный концептуальным искусством и собирающий соответствующую публику, а теперь еще и второй, под названием "ArteFAQ", - на Большой Дмитровке (бывшей Пушкинской), в том самом здании, где когда-то, на заре минувшего века, располагался знаменитый "Бубновый валет". И, конечно, выбрать именно "ArteFAQ" местом очередной презентации было исключительно точным решением, ибо один из пионеров перевода бумаги в цифру представлял результат обратного процесса, - правда, конечно, на следующем витке спирали. Этот результат - толстый и красивый, в красной обложке, двухтомный "Большой англо-русский словарь ABBYY Lingvo". В конце прошлого века, когда, думаю, еще не существовало FineReader’а даже ранних версий, ребята сидели и набивали на допотопных XT’шках словарные статьи, - теперь же, после более чем десятилетнего их существования, с огромными онлайновыми и прочими возможностями, электронные словари набрали мощи и своеобразия, - и похоже, пришла пора вернуть их на бумагу, создав полиграфическое явление, которое вряд ли могло появиться в эпоху доцифровую. Цифра улучшила, отполировала, если можно так сказать, бумагу, сделала ее мощнее и изящнее. В новом словаре куда больше статей, чем в каком-нибудь бумажном переиздании чего-нибудь традиционного, включены современные компьютерные и сленговые слова, а некоторые статьи (например, "car", "автомобиль") представлены в виде картинок с подписями к каждой детали… Кто и, главное, по каким соображениям будет сегодня пользоваться словарем бумажным - сказать трудно: кнопка Find или Search настолько удобнее листания, даже если, как в "Большом англо-русском…", оно облегчено вынесенными к обрезу красными марками-буквами; сам многокилограммовый словарь рядом с невесомой microSD-карточкой кажется попросту неподъемным, как паровоз рядом с Peugeot 107, да и по нынешним ценам на квадратные метры жилья - поди еще найди для него место в квартире! Однако выпускать словарь из рук не хотелось: то ли вспоминались давние юные времена, то ли в бумажной книге заложен какой-то стимулирующий мыслительную деятельность нерациональный механизм. Ну как, знаете (я несколько раз уже писал об этом), кажется, что изящный, между тремя пальчиками, стилус wacom’а имеет куда большее отношение к мыслительной и/или художественной деятельности, чем обезьяний камень мыши, грубо зажатый ладонью… Впрочем, возможно, все это инерция привычки: пятьсот лет назад и печатные книги казались многим столь же несерьезно-легковесными по сравнению с рукописными, а еще тысячу - и рукописные рядом с привычными свитками пергамента…

Говорят, что рассуждать о каком-то не то чтобы доходе - хотя бы об окупаемости книги до ее третьего тиража, - просто смешно. А будет ли этот третий (даже и второй) тираж у красного двухтомника - тоже неизвестно. Так что проект этот, по моему пониманию, не просто невыгодный, а возможно, и демонстративно антикоммерческий. Ну то есть - сам по себе. Зато крайне художественный и концептуальный, - что, очень возможно, обернется даже и прибылью - только не прямой, а опосредованной. Или считайте выпуск такого словаря крайне узкой или чрезвычайно изысканной рекламной акцией. Во всяком случае, меня на презентации посетила мысль довести суть проекта до абсолюта: выпустить двухтомник на веленевой (впрочем, на веленевой не сошьется, - на рисовой!) бумаге, в красном сафьяне, с золотым обрезом, возможно - с нумерованными экземплярами. И пусть цена его вырастет вчетверо, - человек, захотевший поставить на полку этот странный памятник современной старины, вряд ли вообще станет интересоваться его ценой.

Последней из пропущенных мною в "Огородах" презентацией - да и последней по времени, совсем уже недавней, - стала презентация очередной, девятой, версии FineReader’а, "Клевого Чтеца". Я работаю с FineReader’ом практически с момента его появления, не помню, с первой ли, но уж во всяком случае - со второй версии. Вторая была неважной, висла и плохо распознавала большинство текстов. Третья уже оказалась вполне работоспособной. В те поры я, помнится, проводил большую тестовую работу, скрупулезно сравнивая FineReader с аналогичной программой "Евфрат" главных конкурентов из Cognitive Technologies и целым рядом забугорных программ (разумеется, в первую очередь меня интересовало распознавание русскоязычных текстов). У буржуинов FineReader выигрывал вчистую и всухую, у "Евфрата" - менее разительно, но тоже безусловно. Четвертая версия FineReader’а - во всяком случае, для моих довольно скромных задач: оцифровки некоторых бумажных книг и распознавания обложек компакт-дисков, - казалась мне практически идеальной, и с тех пор я, хоть и менял версии по мере их выхода, принципиального изменения в этой части моей жизни не замечал. Но, конечно, каждая следующая версия была хоть чем-нибудь, да совершеннее предыдущей, и по поводу каждой авторы писали, что точность распознавания повысилась на столько-то и столько-то процентов. Насчет процентов я понимал (и понимаю до сих пор) очень мало: четвертая (если не третья) версия распознавала хороший типографский текст буквально стопроцентно, так что добавлять процентики к этой сотне получалось, как при подсчете голосов у нас на выборах где-нибудь на Кавказе, - а если тексты были, что называется, неудобными - точность распознавания зависела скорее от степени этого неудобства, чем от версии. Единственная претензия, которую я стал высказывать FineReader’у, после того как изумление от самого факта распознавания стало несколько утихать, - это некоторая его глупость - в том смысле, что, не разобрав, например, в списке одну из циферок, он не умел догадаться, что это список и, стало быть, непонятная фигура между шестеркой и восьмеркой должна быть, безусловно, семеркой.

Девятая версия получила новый интерфейс, соответствующий интерфейсной моде (ну, как у автомобилей), и - по пресс-релизу - добрые два десятка добавок: повышенная точность сохранения оформления документов, определение и восстановление логической структуры документа, сохранение колонтитулов, нумерации страниц и подписей к картинкам, автоматическое распознавания языка… и еще много подобных мелких приятностей, наверное, важных для перевода в цифру кипы каких-нибудь там документов, но не слишком существенных при редком распознавании отдельных художественных книжек. Другими словами, "девятка" принесла больше радостей корпоративным пользователям, нежели пользователям домашним. Впрочем, для домашних тоже появились свои удовольствия - вроде, например, режима распознавания повышенной точности, когда плохо пропечатанные буковки или жирное пятно на странице перестают быть непреодолимой преградой.

Голубицкому "девятка" вообще очень понравилась, так что о ценности этих нововведений, думаю, вам скоро будет поведано в "Голубятне", не стану отбивать хлеб. Что же касается поумнения (в смысле списков с обложек компакт-дисков), - я не заметил, чтобы в ABBYY особенно в этом направлении работали, - да и бог с ним.

Дело в том, что я почти перестал эти списки распознавать: приобретая новый диск, ты мгновенно находишь информацию с его обложки (и зачастую - даже гораздо больше информации) в Интернете, уже в цифровом виде. И это, кстати, относится отнюдь не только к дискам. По мере течения нашего цифрового времени все меньше оказывается надобностей в оцифровке текстов: книга попадает в Сеть либо (чаще всего) сразу в цифровом виде, либо сканируется и оцифровывается любителями раньше, чем возникает потребность получить ее как файл на свой КПК или Sony Reader. И хотя, как и прежде, я числю FineReader программой в числе первых, устанавливаемых на голую систему, - обращаться к нему стал все реже и реже.

И тут меня посетило интересное наблюдение: постоянно совершенствуясь в области распознавания текстов, ABBYY работает на концептуально, по вектору, отмирающем направлении. Число еще не переведенных в цифру культурных текстовых ценностей постоянно уменьшается, стремясь в пределе к нулю, новые текстовые ценности возникают сразу в цифровом виде, - то есть FineReader’ные усовершенствования напоминают мне старания какой-нибудь фирмы, стремящейся довести до идеала конструкцию паровоза: повысить КПД с семи до невероятных одиннадцати процентов, придать внешний лоск и все такое прочее. Разумеется, если б по тем или иным причинам на паровозы все еще был спрос, такие фирмы наверняка бы существовали. На распознавание текстов, а особенно - всяких бюрократических и финансовых документов, - спрос пока есть и падает куда медленнее (если вообще падает, а не растет), чем нам, энтузиастам безбумажности, хотелось бы, - так что ABBYY правильно делает, что на этом спросе зарабатывает. Но если посмотреть совсем концептуально… (Кстати сказать, подобные же мысли приходили мне в голову во время экскурсии на сверхсовременный завод по производству концептуально устаревающих - подобно тем же паровозам - винчестеров.)

Так или иначе, если пока не удается побороть бумажные лавины, циркулирующие по официальным каналам, - потребности в их обработке и оцифровке удовлетворять надо (тоже ведь прогресс: желание, хоть и оставаясь с бумагой, ее оцифровывать!), и ABBYY, судя по живейшему интересу партнеров, проявлявшемуся на турецком семинаре к совместимости интерфейсов с разными программами документооборота, - удовлетворяет их достойно.

О чем говорит и последняя новость: в Китае (уже и в Китае!) открылось отделение ABBYY, - и ее китайское название, первые иероглифы которого (Tai Bi), со слов пресс-релиза, должны "вызывать у носителей языка ассоциации с ощущением совершенства, радости, процветания и уверенности в завтрашнем дне", - я и вынес в заголовок нынешнего "Огорода" двойной протяженности.

Tai Bi Technologies - название компании ABBYY на китайском языке (www.abbyy.cn).