Как преобразовать сканированный документ в ворд. Как перевести отсканированный документ в Word

При работе с текстовыми документами очень часто возникает необходимость набирать текст с уже распечатанного документа. Подобная работа не очень приятная и отнимает много времени.

К счастью, сейчас существуют программы, которые позволяют значительно упростить и ускорить решения подобных задач. С помощью этих программ можно быстро перевести отсканированный документ в формат текстового редактора Word и избежать рутинной работы по набору текста.

В данной статье мы продемонстрируем, как это делается на примере программы ABBY Finereader 12 Professional. Если у вас нет именно такой программы, то вы можете заменить ее другой версией ABBY Finereader либо совершенно другой программой от другого разработчика. Например, вы можете использовать программы CuneiForm, Free OCR, Readiris Pro или SimpleOCR.

Шаг № 1. Запускаем ABBY Finereader и открываем отсканированный документ.

Первым делом нужно запустить программу ABBY Finereader. После запуска программы нужно нажать на кнопку «Открыть» на панели инструментов.

После этого появится окно для открытия отсканированного документа. Выберите изображение или несколько изображений и нажмите на кнопку «Открыть».

Кроме этого, вместо использования кнопки «Открыть» вы можете просто перетащить отсканированные изображения в программу ABBY Finereader.

Шаг № 2. Ждем пока ABBY Finereader проанализирует выбранные изображение.

Дальше нужно подождать, пока программа ABBY Finereader проанализирует выбранные вами изображение и распознает на них текст. Время необходимое на анализ зависит от количества выбранных изображений и производительности вашего компьютера.

Когда анализ изображений будет завершен, появится сообщение с кнопкой «Закрыть».

Нажмите на кнопку «Закрыть» и переходите к следующему шагу.

Шаг № 3. Переведите отсканированный документ в формат Word.

После завершения анализа, отсканированный документ можно перевести в формат Word. Для этого в программе ABBY Finereader есть кнопка «Сохранить».

После нажатия на кнопку «Сохранить» появится окно для сохранения отсканированного документа в текстовом формате. При этом вы можете выбрать один из множества текстовых форматов (DOC, DOCX, RTF, ODT, PDF, HTM, TXT, XLS, XLSX, PPTX, CSV, FB2, EPUB, DJVU). Для того чтобы без проблем отредактировать документ в редакторе Word выберите формат «Документ Microsoft Word 97-2003 (*.doc)» либо формат «Документ Microsoft Word (*.docx)».

После сохранения документа в формате Word откроется текстовый редактор, и вы сможете начать редактировать отсканированный документ.

Что делать если нет возможности установить программу?

Если у вас нет возможности установить описанные выше программы, то вы можете воспользоваться онлайн аналогами. Наиболее продвинутым онлайн сервисом такого рода является . Данный сервис позволяет перевести отсканированный документ в формат Word, а также в другие популярные текстовые форматы.

К недостаткам ABBY Finereader Online можно отнести то, что данный онлайн сервис требует регистрации и бесплатно обрабатывает только 10 страниц отсканированного текста. Для обработки большего количества страниц нужно покупать подписку, которая стоит от 5 долларов в месяц.

Текстовый редактор Word от Microsoft Office установлен на большинстве компьютеров пользователей. Это удобная и практичная программа для набора и редактирования любой информации. Досаду вызывает только то, что открыть при помощи такого ПО файлы, отличающиеся форматом от doc, практически невозможно. Когда это необходимо, возникает вопрос: как перевести в «Ворд»? С этой задачей довольно просто справляется ряд программ. Самой популярной из них является Fine Reader. Она за считанные секунды распознает по изображению тексты на различных языках и без труда переведет их в формат doc.

Программа для отсканированных документов № 1

Пользователю нет необходимости иметь под рукой сканер. FineReader - инструмент, при помощи которого каждый легко решит задачу, как отсканированный документ перевести в «Ворд» с флэш-носителя, цифровой камеры или с мобильного телефона. Пользователю достаточно подключить гаджет к компьютеру и запустить программу.

Интерфейс и доступные задачи

После запуска программы монитор компьютера отобразит меню, логично разложенное по командам. FineReader к основным задачам относит:

  • сохранение документа в «Ворд»;
  • конвертацию изображения из формата PDF в doc;
  • просто сканирование и сохранение снимка;
  • создание документа PDF с функцией поиска;
  • перемещение фото в Word.

На этом этапе пользователь может настроить цветовой режим: цветной или монохромный, и языки распознания. Доступны для обработки такие из них, как английский, русский, испанский, итальянский, немецкий. Также пользователь может воспользоваться выбором искусственно созданных языков: эсперанто, интерлингва, ИДО.

Если перед пользователем стоит такая задача, как отсканировать документ, несущий в себе, к примеру, текст медицинского характера, то программа распознает латинский шрифт, после того как будет поставлена галочка в необходимом чекбоксе. Также FineReader видит и формальные языки. Он успешно справляется с распознанием простых химических формул. Пользователь, который часто работает с документами на различных языках, может сэкономить свое время, воспользовавшись функцией их автоматической настройки.

Пример того, как отсканированный документ перевести в «Ворд»

Рассмотрим простейшую задачу. В наличии документ на русском языке, отсканированный и сохраненный на флэш-носителе. Чтобы его перевести в «Ворд»-документ, необходимо:

  1. Запустить программу Abby FineReader.
  2. Вставить накопитель в USB-разъем компьютера.
  3. Выбрать пункт меню «Файл в Word».
  4. В открывшемся окне проводника указать путь к изображению, которое необходимо преобразовать.
  5. Дважды кликнуть правой кнопкой мыши по выбранному файлу.

После всех перечисленных действий программа начинает самостоятельную работу. Окно FineReader при этом разделится на три столбца. В первом из них отобразятся все страницы документа. В расположенном посередине столбце пользователь может видеть, с какой именно на данный момент работает программа. Крайний левый столбец на время процесса распознания остается пустым.

По окончании работы преобразованный документ автоматически открывается в «Ворде». Пользователю остается отредактировать текст в тех местах, где FineReader не смог распознать текст, и сохранить его на своем компьютере или флэш-носителе.

Ошибки

Понятно, что на вопрос, как отсканированный документ перевести в «Ворд», ответ оказался довольно простым. Но все ли так всегда безоблачно? Часто изображения имеют низкое разрешение. И тогда FineReader вместо готового файла в формате doc выдает ошибку. Но нет повода расстраиваться. Многие причины, которые мешают распознанию текста, можно устранить при помощи все того же FineReader. Для этого в программе есть меню команд «Редактировать». Выбрав его, пользователь имеет возможность:

  • изменить разрешение;
  • исправить перекос сканированного изображения;
  • отрегулировать яркость и контрастность;
  • обрезать, разбить на части и повернуть документ и многое другое.

Сканер, документ, FineReader

Говоря о функциональности программы для распознания текста, отдельно хотелось бы сказать о возможности работы с различной оргтехникой и гаджетами. Так, установка FineReader на жесткий диск девайса снимает перед пользователем вопрос - как отсканировать документ на компьютер?

Дело в том, что не всегда хватает одного драйвера устройства для работы какой-либо оргтехники. Сканер не исключение. Как правило, в комплекте с ним прилагается диск с программой, которая и обеспечивает работу с устройством. Но функциональность такого ПО часто ограничена.

FineReader совместим со всеми сканерами известных производителей. Установив его на свой компьютер, пользователь может использовать эту программу в качестве ПО для работы с изображениями. Документы можно просто сканировать и сохранять; задать команду оставлять отснятое изображение сразу в «Ворд»; создавать PDF-файлы. Из них же переводить тексты в текстовой редактор Microsoft Office. В итоге одна небольшая программа с легкостью справляется с такой задачей, как отсканировать документ на компьютер, и может заменить громоздкие графические инструменты, при этом обеспечив бесперебойную работу целого офиса.

Хранить отсканированные документы на жестком диске компьютера или внешнем носителе удобно и безопасно. Однако как внести изменения в страницы, обычно представленные в виде изображения? Нам понадобятся специальные программы, об установке и управлении которыми мы расскажем ниже.

Как отсканировать документ перед редактированием?

Чтобы успешно манипулировать файлом в дальнейшем, важно правильно перевести его в формат “картинки”, а также учесть несколько простых, но полезных нюансов в самом процессе. Для этого:

  • Разгладьте все заломы и складки, чтобы они не отобразились на скане и не привели к трудностям в распознавании букв.
  • Для удобства обращения сохраните файл в формате PDF, JPG или TIFF.
  • PDF-документ можно будет открыть и редактировать программой Adobe Acrobat (или любой другой, предназначенной для подобных целей).
  • Зайдите на сайт компании-создателя сканера, либо поищите фирменную программу на прилагавшемся диске (часто известные бренды имеют собственные приложения для изменения отсканированных страниц).
  • Для последующего использования файла в MS Office 2003 или 2007, установите утилиту Microsoft Office Document Scanning. Она производит конвертацию сканируемого файла автоматически, переводя его сразу в текст (программа не работает с более “свежими” версиями Офиса).
  • Рекомендуется сканировать в черно-белой гамме, а не в цветной – это упрощает анализ текста.
  • TIFF формат лучше всего применять для OCR конвертеров, то есть программ, производящих оптическое распознавание.

Как отредактировать отсканированный документ – работа с OCR-утилитами

Принцип метода Optical Character Recognition - считывание имеющихся на бумаге символов, их последующее сравнение с элементами из собственной базы данных. Таким образом происходит преобразование сплошной картинки в редактируемый текст. Яркие примеры программ, справляющихся с данной задачей – Adobe Acrobat и Evernote. Чтобы внести исправления в имеющийся скан, просто откройте его одним из таких приложений, весь последующий процесс произойдет автоматически. Когда программа закончит распознавание, то предложит пользователю сохранить документ в одном из доступных форматов.


Как отредактировать отсканированный документ PDF

Если отсканированный документ сохранен в файле PDF, мы с легкостью сможем отредактировать его в программе Acrobat DC. Для этого:

  • открываем меню “Инструменты” -> “Редактировать PDF”;
  • программа запускает процесс редактирования, показывая меню подсказок в правом углу сверху;
  • щелкнув на ней и выбрав “Параметры”, можно указать язык распознавания;
  • что внести изменения, просто щелкните на любой строке документа;
  • документ, открытый для редактирования через OCR, сопровождается особой панелью с настройками, размещенной в правой стороне экрана;
  • в разделе “Настройки”, кроме языка, также удобно выбирать отображаемый шрифт, отмечать страницы, которые необходимо редактировать (все или по одной).


Во всемирной сети существует доступная альтернатива устанавливаемым программам-конвертерам. Это онлайновые OCR, которые без труда переведут полученное изображение в любой текстовый формат. К примеру, сайт pdfonline.com позволит за несколько минут из отсканированного PDF-документа сделать обычный файл MS Word.

После завершения поиска документа, можно открыть документ в Word для его изменения. Как это сделать зависит от версии Office, в которой установлены.

Сканирование документа в формате PDF и изменить в Word

Совет: Преобразование лучше всего работает с документами, содержащими преимущественно текст.

    Сканирование документа в соответствии с инструкциями для сканера и сохраните его на своем компьютере как PDF-файл.

    В Word, выберите файл > Открыть .

    Перейдите к нужному PDF-файл на своем компьютере и нажмите кнопку Открыть .

    Появится сообщение о том, что Word будет преобразовать PDF-файла в редактируемый документ Word. Нажмите кнопку ОК .

См. также

Параметр со сканера или камеры для сканирование изображений и документов недоступен в Word 2010. Вместо этого можно использовать сканер для сканирования документа, и сохраните файл на своем компьютере.

Программа Microsoft Office Document Imaging была удалена из Office 2010, однако вы можете установить ее на своем компьютере, используя один из вариантов, описанных в статье Установка приложения MODI для использования совместно с Microsoft Office 2010 .

Прежде чем продолжать

    Найти и открыть изображений документов Microsoft Office для Обработки изображений документа Microsoft Office в меню Пуск Windows.

    В меню Файл выберите команду Открыть .

    Найдите отсканированный документ и нажмите кнопку Открыть .

    После запуска Microsoft Office Document Imaging нажмите клавиши CTRL+A, чтобы выделить весь документ, а затем нажмите клавиши CTRL+C.

    Запустите Microsoft Word.

    На вкладке Файл нажмите кнопку Создать .

    Дважды щелкните элемент Новый документ .

    Нажмите клавиши CTRL+V, чтобы вставить содержимое отсканированного документа в новый файл.

Параметр со сканера или камеры для сканирование изображений и документов недоступен в Microsoft Office Word 2007. Вместо этого можно использовать сканер для сканирования документа, и сохраните файл на своем компьютере.

Шаг 1: Установка Microsoft Office документа обработки изображений

    Завершите работу всех программ.

    Совет: Перед завершением работы всех программ советуем распечатать этот раздел.

    Откройте панель управления: Щелкните правой кнопкой мыши кнопку Пуск и затем выберите пункт Панель управления или введите Панель управления в поле поиска в Windows.

    На панели управления щелкните Программы , а затем - Программы и компоненты .

    Щелкните правой кнопкой мыши название выпуска Microsoft Office установлен, или щелкните правой кнопкой мыши Microsoft Office Word 2007 (в зависимости от того как часть Office или отдельной программы установлен Word) и нажмите кнопку Изменить .

    Выберите Добавить или удалить компоненты , а затем нажмите кнопку Продолжить .

    В разделе Параметры установки щелкните знак "плюс" (+) рядом с компонентом Средства Office .

    Щелкните стрелку рядом с компонентом Microsoft Office Document Imaging , выберите параметр Запускать все с моего компьютера , а затем нажмите кнопку Продолжить .

Шаг 2: Создание документа, который можно редактировать

Отсканируйте документ, следуя инструкциям для сканера.

Прежде чем продолжать , преобразуйте полученный файл в формат TIFF. Для этого можно использовать Paint или другую подобную программу.

Теперь у вас есть документ, который можно редактировать. Не забудьте сохранить новый файл, чтобы не потерять изменения.

Очень многие пользователи, которые работаю с текстовыми документами, нередко нуждаются в копировании какого либо текста, скажем, с бумажного оригинала, чтобы потом вставить его в Word. Это избавляет от набора текста вручную. Ладно, если это один-два листа. А когда страниц десять-двадцать?

Как перевести отсканированный документ в Word

Здесь на помощь приходит сканнер, который умеет распознавать все то, что находится в печатном издании. С его помощью можно перевести документы в самые различные электронные форматы. Если текст очень сложный и написан на иностранном языке, вы можете воспользоваться услугами бюро переводов и заверений в Москве .

Самый простой способ (конечно, если вы не нуждаетесь в редактировании), отсканировать текст (обычно сканнеры по умолчанию предлагают графический режим), а затем скопировать полученный результат и вставить его в Word. Однако, в данном методе есть один существенный недостаток. Редактировать текст в графическом представлении документ не получится. Можно изменить, к примеру, только насыщенность, цветовую гамму, размер всего фрагмента. Но не более.

Для того, чтобы можно было редактировать полученный результат как обычный текст, необходимо изначально задавать распознавание сканируемого объекта именно как текст. Оптимальным вариантом для этого является программное обеспечение типа ABBYY Fine Reader. Это одна из самых «умных» программ для сканирования печатного материала. Вам необходимо просто задать соответствующие настройки и начать сканирование. Результат будет выведен в отдельном окне. Сам же текст можно отредактировать там, а потом, скопировав его, вставить в свой редактор, либо же, сразу же скопировать, затем вставить в Word и уже там производить редактирование. Второй вариант перспективнее, поскольку, в большинстве случаев в Word включена функция автосохранения. Поэтому, если вдруг произойдет какой-либо сбой в системе, вы без труда сможете восстановить последнюю сохраненную копию документа. То же касается случайного удаления или потери файлов. Вам просто не надо будет думать, как восстановить удаленные файлы .

Иногда возникают ситуации, когда в режиме сканирования вы получаете документ формата PDF, который распознается приложениями типа Adobe Reader или подобными ему. Так же, как и графику, документ в формате PDF редактировать в плане текста невозможно. В этом случае вам на помощь придет программа ABBYY PDF Transformer. Открыв в программе соответствующий файл формата PDF, вы в несколько кликов сможете перевести его в любой другой формат, в том числе и в формат Microsoft Word. Необходимо просто выбрать сохранение, указать название файла, в типе документа выбрать Документ Word с указанием расширения DOC (хотя обычно, это и не требуется).

Таким образом, лучше всего задавать сканирование сразу с распознаванием текста. Это не займет ни времени, ни сил. Зато потом, вы сразу же можете приступать к редактированию полученного результата.

Вадим Панькова специально для




Top