Получение текста
Рассмотрим наиболее распространенные методы получения текстового материала.
Ввод с клавиатуры. В случае использования первой и последней из рассмотренных нами систем – прямой ввод наборщиком, с одной стороны, и использование главного компьютера в режиме on-line, с другой стороны – предполагается операция начального ввода текста с собственных терминалов системы.
В этих случаях данные создаются и хранятся в специфическом формате, более удобном для системы, а этап ввода с клавиатуры является первым циклом в стандартной последовательности действий. Весь процесс осуществляется на собственном оборудовании и от начала до конца выполняется на рабочем месте наборщика.
В случае использования оборудования среднего класса – системы НИС и системы off-line – методы ввода текста могут быть гораздо более гибкими. Модульная структура и высокая степень совместимости оборудования для набора, означает, что широкая гамма стандартных устройств, включая традиционные PC с известными программами текстовых процессоров, вполне может использоваться для создания исходного текста.
Аппаратное обеспечение для получения текста с соответствующей программой текстового процессора выбирается с учетом прямой его совместимости с тем аппаратным обеспечением, которое используется для верстки.
Если текст набирается в системе на основе PC, например, то ввод желательно выполнять на стандартном PC в программе Word (возможно использование WordPerfect, Ami Pro, WordStar или некоторых других), и лишь включать характерные коды описания свойств, служащие в качестве прототипов для типографских тэгов, проставляемых на следующем этапе.
Для ввода текста, набираемого на оборудовании Apple Macintosh, используются такие пакеты, как MacWrite или Microsoft Word, либо непосредственно программы верстки типа PageMaker или QuarkXPress.
Вопрос совместимости здесь также весьма важен: для максимальной эффективности аппаратное и программное обеспечение, используемое для создания текста, должны быть непосредственно совместимы с оборудованием и программами, которые будут использоваться на следующих этапах – преобразовании кодов и верстки – иначе "распределенный", модульный принцип набора потеряет свой смысл.
В предыдущем разделе мы рассмотрели наиболее общие способы передачи материала: прямая передача, преобразование носителя, передача по линиям связи и сканирование с последующим распознаванием. В случае, когда система настроена специально для получения текста от определенного источника и вывода его на конкретное устройство, более эффективной является прямая передача, при которой используется специальная программа для автоматической передачи текстового материала в устройство назначения.
Предприятия, работающие с НИС или с автономными системами off-line, достаточно часто для ввода текста используют распределенный принцип организации работы, предоставляя необходимое оборудование надомным работникам, которые затем передают материал на дискетах в основную систему изготовителя.
В случае применения НИС текст необходимо представлять только в стандартных форматах – например, Microsoft Word, на стандартных 3.5-дюймовых дискетах. Изготовитель, используя совместимый комплект оборудования, в данном случае НИС на основе Apple Macintosh, может считать данные с дискеты, а затем верстать материал, например, в PageMaker.
Сканирование с распознаванием. Данные, существующие в форме распечатки, рукописный и машинописный текст, книги – если в этом есть необходимость и позволяют обстоятельства – могут быть введены в систему с помощью сканирования.
Сканеры можно разделить условно на три большие группы, в зависимости от способов получения авторского материала, рассмотренных нами в разделе 5.1. Прежде всего, это системы начального уровня, осуществляющие распознавание текста с помощью шаблонов, и способные распознать лишь ограниченное число шрифтов типа Courier и несколько других популярных принтерных шрифтов. Вторая и третья группы сканеров – более мощные системы разумного распознавания символов – действительно представляют интерес для сканирования книг и другого текста при отсутствии электронных файлов. Но очень важно предварительно осуществить пробное сканирование: если возникнут трудности, может оказаться, что повторный набор обойдется дешевле.
Распознавание голоса. Возможно ли для набора использовать "ввод с голоса"? В исследование и развитие этого направления продолжают вкладываться значительные средства. Как показывают опыты, требуется очень развитое программное обеспечение, которое умело бы воспринимать слова и фразы не только в рамках ограниченного словаря, или фразы со строго определенной структурой, но и допускало бы более свободное использование слов в различных контекстах и умело бы различать тембр голоса, интонации, акцент.