"А.В.Хамадеев. Лекции по курсу Техника и технология средств массовой информации (печатные издания) " - читать интересную книгу автора

Программы, основанные на данном методе, выделяют основные особенности
изображения, такие, как открытые и замкнутые фигуры, диагональные линии,
места пересечений и т.д., и сравнивают полученные результаты с библиотекой
особенностей символов. Этот метод более гибок, чем матричное соответствие,
поскольку может распознавать большее число шрифтов.

Для систем распознавания (OCR) важно не только распознавать текст на
микроуровне (т. е. символы алфавита), но и обрабатывать текст на
макроуровне, т. е. выделять предложения, абзацы, колонки, таблицы, буквицы,
поля, рисунки и т. п. Обработка текста на макроуровне является сложной
семантической задачей и требует семантического и стилевого анализа.

Обычно технологии распознавания символов и текста реализуются в виде
отдельных программ. В настоящее время в основном используются программы
распознавания символов FineReader и CuneiForm.

Речевой ввод текстовой информации. В последние годы все большее
распространение получают технологии речевого ввода информации.

Как известно, любое устное сообщение может быть представлено
последовательностью фонем и пауз между ними. Поэтому распознавание речи
может осуществляться на уровне объединения фонем в слова. Каждое слово при
этом рассматривается как элементарный символ речевого сообщения.
Распознавание слов происходит в памяти ЭВМ путем сравнения их с эталонами,

хранящимися в памяти. Словари эталонов могут насчитывать до нескольких
десятков единиц. Главная трудность в реализации подобных устройств -
распознавание речи, различающейся (при одном и том же содержании) дикцией
человека, интонацией, скоростью произнесения фраз. В настоящее время
наилучшие результаты получены с помощью устройств, которые не проводят сразу
точное сравнение речевого сигнала с моделью, а отыскивают наиболее близкую
по определенному критерию и только затем приближаются к точному
соответствию.

Современные устройства речевого ввода делятся на устройства
распознавания речи и устройства идентификации говорящего. В рассматриваемых
здесь приложениях особый интерес представляют первые. Процедура
распознавания при этом сводится к сравнению сигнала на входе устройства с
эталонами и определению для каждого эталона меры сходства. Обычно в
известных системах в качестве речевого сегмента выбирается слово, так как
для него сравнительно просто определить начало и конец, т. е. границы. В
этом случае объем словаря соответствует количеству распознаваемых слов.

Основная стратегия решения задачи распознавания речи базируется на
заблаговременном формировании информационных описаний речевых сегментов,
которые играют роль эталонов.

Аппаратно-программные средства, в рамках которых реализуются программы
распознавания речи, называются речевыми процессорами или анализаторами.