Основы издательского дела


Соглашения по передаче текста - часть 6


Метод дает возможность работать с материалом, не затрачивая усилий на его набор с клавиатуры, что особенно важно в тех случаях, когда вы получаете авторский текст только в виде распечатки.

Программное обеспечение OРС широко различается по степени "интеллекта", поэтому важно поэкспериментировать с образцами текстового материала, прежде чем приступать к основной работе.

Простейшие программы могут распознавать лишь ограниченное число заданных шрифтов с фиксированными промежутками между словами. Такие программы пытаются подогнать текст под один из соответствующих шаблонов, хранящихся в памяти программы, и не способны распознать текст, который не вписывается ни в один из шаблонов.

Следующая группа программ значительно более полезна, поскольку эти программы могут распознавать тексты, набранные с использованием одного из шрифтов, входящих в стандартный набор, как с фиксированными промежутками, так и пропорциональных, оператор может "научить" программу распознавать и новые, определяемые пользователем шрифты, если это необходимо.

Наконец, существуют программы серии "ICR" (разумное распознавание символов), которые в настоящее время являются стандартом для систем распознавания. Это весьма изощренные программы графического распознавания, которые в ходе работы сравнивают любые поступающие печатные тексты самого разного вида с соответствующим широким набором символов и "графических примитивов" (элементов символа), хранящихся в памяти. Эти системы работают не с фиксированными шаблонами, а с отдельными составляющими элементов шрифта. Достаточно развитые пакеты также предлагают контекстно-чувствительную поддержку для обработки текстов на иностранных языках за счет применения дополнительных правил обнаружения и проверки специфичных для каждого языка сочетаний букв.




Начало  Назад  Вперед



Книжный магазин