Методическое руководство по OCR


           

то требуется еще немного потрудиться.


Всего- то требуется еще немного потрудиться. И раз считай, и два считай. Не гонись за количеством сканированных книг: сделай немного, но окончательно. Сделай так, чтобы тебе «не было мучительно стыдно за бесцельно прожитые годы». А то, друг, такие, например, как я, не скажут тебе «спасибо», выкачав твою версию.

Вот взял я, например, «Ходжу Насреддина» Л. Соловьева. В середине текста какие-то обрывки, опечаток масса, абзацы хромают. Множество «крышек» (огрехи OCR). За каким хреном, спрашивается, надо было сканировать столь замечательную книгу, если мастер OCR ее только загадил?

Поэтому я с опаской отношусь к электронным версиям классических произведений: там важна буквально каждая запятая, каждый абзац. И нет уверенности в том, что мастер OCR считал все абсолютно точно. Но ты, если уж «делаешь» классику, изволь считывать до каждой точки и запятой. И укажи об этом в своей версии: «Я, такой-то, дескать, считал текст так внимательно, как только мог, я, дескать ручаюсь...» и т.д. Даже если у тебя псевдоним, все равно, при написании этих строк ты почувствуешь, как внутри тебя зашевелилась совесть и давит на твое чувство ответственности.

В идеале для считывания нужны два человека: один читает книгу, называя запятые, точки и т.п., а другой смотрит на экран и проверяет. Хорошо делать подобное семьями, но, думаю, никто не имеет такой возможности. Супруга (или супруг) немедленно скажет: «А пошел ты... Глупостями еще заниматься». И вряд ли поймет она(он) что это — возможность оставить после себя что-то значимое.

Наверное, так делать могут только монахи-компьютерщики в монастырях. Однако и они не достигают идеала. Вот, например, текст Библии. Этот текст из светских библиотек ты можешь использовать только для ознакомления. Не вздумай цитировать и даже ссылаться на стихи внутри глав. Очень много несовпадений с синодальным переводом, который является каноническим (в книгах Библии издатели проверяют каждую запятую, и ошибок там нет). Взял я Библию с православного сайта.

Содержание  Назад  Вперед





Forekc.ru
Рефераты, дипломы, курсовые, выпускные и квалификационные работы, диссертации, учебники, учебные пособия, лекции, методические пособия и рекомендации, программы и курсы обучения, публикации из профильных изданий