Здравствуйте. Сегодня я расскажу, как сканировать текст в документ Word . Зачем это нужно делать? Ответ очевиден, для дальнейшего редактирования текста. Ведь изображение не так просто будет отредактировать. Что лучше использовать, программы или онлайн сервис для перевода сканированного текста в документ Word? Об этом я расскажу ниже в статье.

Для того что бы максимально ускорить и упростить задачу , я искал сайты, на которых онлайн можно конвертировать сканированный документ в формат Word. Для этого мне пришлось сначала сканировать, а затем уже конвертировать. Сразу скажу, что многие сайты ограничивают количество переводов в Word, а что бы не ограничено конвертировать нужно заплатить. Мне удалось найти пару сайтов, которые не ограничено решают эту задачу, но делится не буду, так как конвертировать сканированный текст в Word онлайн оказалось пустой тратой времени. Процент распознания текста очень низкий , проще было бы перепечатать документ с нуля.

В таком случае, если онлайн инструменты на данный момент плохо переводят сканированный документ в Word , то как же сделать это максимально качественно? Читайте об этом дальше в статье, я приведу понятную инструкцию.

Погулив ещё несколько минут, нашел программу, называется ABBYY FineReader Professional. Наверняка Вы уже слышали про неё. Скачал её тут http://nnm-club.me/forum/viewtopic.php?t=851116 , легко устанавливается и отлично работает.

ABBYY FineReader может перевести сканированные документы не только в Word, но и в PDF и многие другие текстовые и журнальные форматы.

Пользоваться ею очень просто. Устанавливаете и запускаете. На мониторе должны увидеть вот такое окно, как ниже не скриншоте.

Тут ничего сложного, интуитивно понятно, что нужно нажать в нашем случае на «Сканировать в Microsoft Word» . Затем увидим окно настроек сканирования, в котором можно ничего не менять.

Поставим программе не простую задачу — сканировать и распознать страницу книги . Кладем книгу или любой другой документ на сканер и нажимаем сканировать. Программа начинает сканирование, а затем должна автоматически распознать документ. Если автоматического распознания не произошло , то нажмите правой кнопкой на сканированный документ и нажмите «Распознать». Ниже на скриншоте видно какой результат получился у меня.

Далее нажимаете на значок Word вверху и документ сохранится в текстовый формат документа Microsoft Word. Разумеется нужно учитывать, что распознанный текст нужно обязательно перечитывать, ведь в любом случае возможны ошибки.

Задавайте вопросы, пишите комментарии. Спасибо за внимание.

Если Вы выбрали быстрый путь написания теоретической главы, о котором мы говорили в параграфе 2.1., вероятней всего Вам не обойтись без сканирования документов. В ином случае, этот пункт можете пропустить и начинать конспектировать материалы найденные в библиотеке .

Перед началом сканирования нужно определиться, что именно Вы хотите использовать при написании работы. А для этого нужно сначала просмотреть имеющуюся литературу и выделить карандашом нужные моменты.

Когда я впервые сканировал статью из журнала для своей первой курсовой, для меня это занятие было невообразимо сложным. В результате нескольких часов работы со сканером и FineReader’ом у меня на выходе вышла бредятина, не поддающаяся редактированию. В итоге пришлось все набирать руками. Чтобы у Вас не случилось подобного, рассмотрим подробнее все технические моменты сканирования.

Для сканирования нам, конечно же, потребуется сканер. Его не обязательно покупать. Можно, например, на время взять на время у товарища. Я пользуюсь сканером CanoScan Lide 60. Это хоть и не самая новая модель, но мне очень нравится этот компактный, быстрый и удобный в работе “девайс”. Если Вы взяли на время сканер, для того чтобы он работал нужно сначала установить программу-драйвер. Драйвера и руководство по установке всегда можно найти на установочном диске, который прилагается к устройству или скачать на сайте у производителя. После установки драйвера, подключите сканнер к компьютеру с помощью соединительного шнура. Теперь можно уже непосредственно приступить к сканированию.

Но сначала немного теории. Вы должны знать, что процесс сканирования состоит из двух этапов:

1. Непосредственно сканирование документа. На этом этапе сканнер как бы фотографирует поверхность сканируемого документа и сохраняет полученное изображение на компьютер в виде обычного файла.jpg .gif или в другом формате;

2. Распознавание документа. Это процесс преобразования текста из изображения сделанного сканером в обычный тест, который потом можно сохранить в Word и редактировать. Распознавание осуществляется без участия сканера, с помощью специальной программы (самая популярная Adobe FineReader). Таким образом, Вы можете сначала отсканировать несколько листов текста и сохранить их в виде изображения и только потом преобразовывать в текст.

Итак, начнем этап первый – сканирование :

– запускаем драйвер сканера: Пуск – Все программы – Canon – ScanGear (название драйвера я указываю для своего сканера). Появится окно драйвера:

– открываем крышку сканера и кладем книгу, журнал или их копию текстом вниз, как можно ровнее по отношению к краям рабочей поверхности сканера:

Здесь очень важно сделать так, чтобы крышка сканера как можно плотнее прижимала сканируемый документ, не допуская попадания внешнего освещения не рабочую поверхность сканера, которая соприкасается с документом;

– выполним необходимые установки в драйвере сканнера. Первым делом нужно установить разрешение, в котором будет отсканирован документ. Разрешение – это показатель, который определяет уровень детализации объекта при сканировании и определяется в точках на дюйм (dpi, или т/д). Чем больше разрешение, тем качественнее получается изображение. Но, при сканировании текстовых документов нет смысла устанавливать максимальное разрешение, поскольку толку от этого будет ноль. Кроме того, сканирование с большим разрешением занимает больше времени. Я рекомендую устанавливать разрешение в пределах 400-500 т/д (dpi). При такой настройке изображения получаются достаточно качественными для хорошего их распознания, а сам процесс сканирования не занимает много времени. Предлагаю посмотреть на скриншот установок моего принтера:


Для начала нужно перейти в “Расширенный режим”. Источником всегда будет “Планшет” (планшетный сканер). Цветной режим лучше установить “Черно-белый” , ведь для сканирования текста нам цвета не нужны, а это уменьшит размер изображений на выходе. Разрешение, как я уже сказал, следует установить 400 т/д . Выходной размер изображения – обязательно “А4” . Теперь можно смело жать на кнопку “Сканировать” . Мой сканер устроен таким образом, что сначала запоминает отсканированные изображения во внутренней памяти, и только при закрытии окна драйвера предлагает сохранить их на компьютер. Мне остается только указать место, куда будут сохранены результаты работы.

У вас должны получаться файлы такого типа:

При увеличении такого изображения должен быть отчетливо виден текст.

Второй этап распознание полученных изображений и их преобразование в текст. Как я уже говорил, для этого понадобится специальная программа – FineReader . Скачайте программу по этой ссылке (32Мб) . Пароль к архиву – сайт . Предложенная мной версия не требует установки (portable). В папке с программой будет множество разных файлов, но Вам нужен только один – FineReader.exe . Двойной клик на этом файле запустит программу на Вашем компьютере.

Эта версия программы достаточно старая. Все скриншоты ниже я делал используя именно её. Если эта версия FineReader у вас не запускается - выберите более новую .

Окно FineReader имеет следующий вид:

После установки языка, на котором напечатаны отсканированные Вами ранее документы, можно начинать распознание. Если в тексте присутствует сразу два языка (например, русский и английский) установку сделайте соответственно.

Чтобы начать распознание нажмите на стрелку справа от первой кнопки Сканировать – а затем – Открыть изображение:

Откроется окно выбора изображений. Откройте папку в которую Вы сохранили отсканированные изображения, нажмите CTRL + A (английское) на клавиатуре и нажмите на кнопку Открыть .

После этого слева в окне FineReader’а появятся эскизы добавленных файлов, по центру – на данный момент выделенный эскиз в увеличенном виде, снизу – еще большее увеличение, а справа результат распознания:

Для примера я взял всего два изображения. На скриншоте выше выделено первое из них, его сейчас и распознаем. Как видите, изображение отсканировано вертикально, чтобы распознать текст снимок нужно сначала развернуть на 90 градусов. Для этого воспользуемся кнопками и . Следующим шагом нужно указать программе, какую именно часть изображения нужно распознать, а также задать тип данных, которые должны получиться на выходе текст, таблица или изображение. Для этого существуют кнопки, соответственно: . Например, если нужно отметить текстовый блок, нажимаем левой кнопкой на , после этого нажимаем левой кнопкой мышки в левом верхнем углу текстового блока и, удерживая левую кнопку, перетягиваем в правый нижний угол. Для примера я полностью подготовил к распознанию одно изображение:

Как видите, все текстовые блоки в примере выше выделены зеленым, а рисунки – красным. Таблицы подготавливаются к распознанию аналогично. Для этого предназначена кнопка . Для того, чтобы перейти к следующему снимку, кликните левой кнопкой мыши на его эскизе слева. Таким образом подготавливаются к распознанию все полученные в результате сканирования изображения. После того, как подготовка изображений завершена, следует выделить их все. Для этого кликните левой кнопкой в пустом месте на панели эскизов (она называется Пакет ) и нажмите Ctrl+A (английское) на клавиатуре. Далее кликните на кнопку и подождите пока FineReader преобразует изображения в текст. После этого можно сохранять полученный текст в Word с помощью кнопки , после нажатия на которую откроется окно . В нем необходимо выбрать формат для сохранения – Microsoft Word, а также поставить отметку чтобы сохранились все страницы:

После нажатия кнопки ОК программа создаст документ Word и вставит в него текст из распознанных страниц в том порядке, в котором они находятся на панели эскизов (Пакет). Полученный документ сразу же сохраните в папку в файловой структуре дипломной работы и можете приступать к редактированию. Как это делается, описано в моем бесплатном курсе .

И последний момент. Эсли Вы сканировали газету или журнал, текст там часто дается в виде колонок (как в рассматриваемом примере выше). Эти колонки в Ворде нужно преобразовать в одну. Выделите текст в виде колонок и выполните команду: Формат – Колонки – Одна – ОК . Только после этого можно ставить Книжную ориентацию в Параметрах страницы, отступы полей, шрифт и т.д.

Как отсканировать документ и распознать его в MS Word

После завершения поиска документа, можно открыть документ в Word для его изменения. Как это сделать зависит от версии Office, в которой установлены.

Сканирование документа в формате PDF и изменить в Word

Совет: Преобразование лучше всего работает с документами, содержащими преимущественно текст.

    Сканирование документа в соответствии с инструкциями для сканера и сохраните его на своем компьютере как PDF-файл.

    В Word, выберите файл > Открыть .

    Перейдите к нужному PDF-файл на своем компьютере и нажмите кнопку Открыть .

    Появится сообщение о том, что Word будет преобразовать PDF-файла в редактируемый документ Word. Нажмите кнопку ОК .

См. также

Параметр со сканера или камеры для сканирование изображений и документов недоступен в Word 2010. Вместо этого можно использовать сканер для сканирования документа, и сохраните файл на своем компьютере.

Программа Microsoft Office Document Imaging была удалена из Office 2010, однако вы можете установить ее на своем компьютере, используя один из вариантов, описанных в статье Установка приложения MODI для использования совместно с Microsoft Office 2010 .

Прежде чем продолжать

    Найти и открыть изображений документов Microsoft Office для Обработки изображений документа Microsoft Office в меню Пуск Windows.

    В меню Файл выберите команду Открыть .

    Найдите отсканированный документ и нажмите кнопку Открыть .

    После запуска Microsoft Office Document Imaging нажмите клавиши CTRL+A, чтобы выделить весь документ, а затем нажмите клавиши CTRL+C.

    Запустите Microsoft Word.

    На вкладке Файл нажмите кнопку Создать .

    Дважды щелкните элемент Новый документ .

    Нажмите клавиши CTRL+V, чтобы вставить содержимое отсканированного документа в новый файл.

Параметр со сканера или камеры для сканирование изображений и документов недоступен в Microsoft Office Word 2007. Вместо этого можно использовать сканер для сканирования документа, и сохраните файл на своем компьютере.

Шаг 1: Установка Microsoft Office документа обработки изображений

    Завершите работу всех программ.

    Совет: Перед завершением работы всех программ советуем распечатать этот раздел.

    Откройте панель управления: Щелкните правой кнопкой мыши кнопку Пуск и затем выберите пункт Панель управления или введите Панель управления в поле поиска в Windows.

    На панели управления щелкните Программы , а затем - Программы и компоненты .

    Щелкните правой кнопкой мыши название выпуска Microsoft Office установлен, или щелкните правой кнопкой мыши Microsoft Office Word 2007 (в зависимости от того как часть Office или отдельной программы установлен Word) и нажмите кнопку Изменить .

    Выберите Добавить или удалить компоненты , а затем нажмите кнопку Продолжить .

    В разделе Параметры установки щелкните знак "плюс" (+) рядом с компонентом Средства Office .

    Щелкните стрелку рядом с компонентом Microsoft Office Document Imaging , выберите параметр Запускать все с моего компьютера , а затем нажмите кнопку Продолжить .

Шаг 2: Создание документа, который можно редактировать

Отсканируйте документ, следуя инструкциям для сканера.

Прежде чем продолжать , преобразуйте полученный файл в формат TIFF. Для этого можно использовать Paint или другую подобную программу.

Теперь у вас есть документ, который можно редактировать. Не забудьте сохранить новый файл, чтобы не потерять изменения.

Очень многие пользователи, которые работаю с текстовыми документами, нередко нуждаются в копировании какого либо текста, скажем, с бумажного оригинала, чтобы потом вставить его в Word. Это избавляет от набора текста вручную. Ладно, если это один-два листа. А когда страниц десять-двадцать?

Как перевести отсканированный документ в Word

Здесь на помощь приходит сканнер, который умеет распознавать все то, что находится в печатном издании. С его помощью можно перевести документы в самые различные электронные форматы. Если текст очень сложный и написан на иностранном языке, вы можете воспользоваться услугами бюро переводов и заверений в Москве .

Самый простой способ (конечно, если вы не нуждаетесь в редактировании), отсканировать текст (обычно сканнеры по умолчанию предлагают графический режим), а затем скопировать полученный результат и вставить его в Word. Однако, в данном методе есть один существенный недостаток. Редактировать текст в графическом представлении документ не получится. Можно изменить, к примеру, только насыщенность, цветовую гамму, размер всего фрагмента. Но не более.

Для того, чтобы можно было редактировать полученный результат как обычный текст, необходимо изначально задавать распознавание сканируемого объекта именно как текст. Оптимальным вариантом для этого является программное обеспечение типа ABBYY Fine Reader. Это одна из самых «умных» программ для сканирования печатного материала. Вам необходимо просто задать соответствующие настройки и начать сканирование. Результат будет выведен в отдельном окне. Сам же текст можно отредактировать там, а потом, скопировав его, вставить в свой редактор, либо же, сразу же скопировать, затем вставить в Word и уже там производить редактирование. Второй вариант перспективнее, поскольку, в большинстве случаев в Word включена функция автосохранения. Поэтому, если вдруг произойдет какой-либо сбой в системе, вы без труда сможете восстановить последнюю сохраненную копию документа. То же касается случайного удаления или потери файлов. Вам просто не надо будет думать, как восстановить удаленные файлы .

Иногда возникают ситуации, когда в режиме сканирования вы получаете документ формата PDF, который распознается приложениями типа Adobe Reader или подобными ему. Так же, как и графику, документ в формате PDF редактировать в плане текста невозможно. В этом случае вам на помощь придет программа ABBYY PDF Transformer. Открыв в программе соответствующий файл формата PDF, вы в несколько кликов сможете перевести его в любой другой формат, в том числе и в формат Microsoft Word. Необходимо просто выбрать сохранение, указать название файла, в типе документа выбрать Документ Word с указанием расширения DOC (хотя обычно, это и не требуется).

Таким образом, лучше всего задавать сканирование сразу с распознаванием текста. Это не займет ни времени, ни сил. Зато потом, вы сразу же можете приступать к редактированию полученного результата.

Вадим Панькова специально для

Работая с официальными документами, зачастую приходится набирать вручную текст, отпечатанный на бумаге. Увы, единых требований к документообороту в Российской Федерации не имеется, и каждая организация использует свои форматы и правила. Чтобы сократить время, потраченное на набор текста, применяются специальные программы и сервисы, «конвертирующие» отсканированные документы в редактируемый для пользователя вариант. К примеру, получив документ в jpg-варианте (картинкой), за считанные минуты можно перевести его в Word-формат, не тратя драгоценное время на ручной набор текста. Как перевести отсканированный документ в Ворд?

Как правило, отсканированные документы публикуются в формате.jpg, .tiff, .bmp и не подлежат редактированию. Если сканер поддерживает конвертирование отсканированных документов в PDF, то данного типа файлы можно отредактировать при помощи любого PDF-редактора, к примеру Acrobat Pro. Но что делать, если требуется отредактировать отсканированный документ в «картиночном» формате?

Именно для этих случаев разработаны программы, распознающие тексты. Одной из популярных софтин в данном сегменте рынка программного обеспечения является ABBYY FineReader. При помощи «файнридера» можно распознавать тексты с любых носителей, будь то картинка с текстом или PDF-файл.

Откройте ABBYY FineReader и перенесите необходимые для распознавания документы в окно программы.

После добавления файлов кликните по кнопке «Распознать все» и дождитесь окончания процесса.

В правой части экрана отобразится распознанный программой ABBYY FineReader текст. Чтобы сохранить весь текст в одном файле, нажмите кнопку «Сохранить» и выберите пункт «Мастер сохранения результатов»

Укажите приложение «Microsoft Word», отметьте триггером пункт «Все страницы» и кликните «ОК».

Программа автоматически экспортирует текст в Word-документ, который можно будет в дальнейшем редактировать.

У вас не установлена данная программа или нет сканера под рукой, а бумажные документы срочно нужно перевести в электронный вариант? На помощь вам придет смартфон на базе Android с установленной программой ABBYY TextGrabber. В роли «сканера» выступает камера смартфона, а «Текстграббер» самостоятельно обработает и распознает сфотографированный камерой текст. Откройте Google Play Market, введите в поиске слова «ABBYY TextGrabber» и установите программу на свой смартфон.

Запустите программу и первым делом выберите язык распознавания. Для этого в нижнем правом углу кликните кнопку «EN». Отметьте галочкой «русский язык» и кликните кнопку «Назад» в интерфейсе смартфона.

Если в нижней области экрана появилась надпись «EN/RU», значит, вы все сделали правильно и можно приступать к «сканированию документов». Кликните на круглую кнопку с иконкой «фотоаппарата».

Наведите камеру на документ и коснитесь иконки значка диафрагмы для фотографирования текста. Если текст видно плохо, то выберите более освещенное место.

Кликните «Готово» для перехода к обрезке фотографии.

Укажите границы снимка и при необходимости разверните его. По окончании кликните «Распознать» в верхней части экрана смартфона и дождитесь распознавания текста.

Готовый текст можно сразу же отредактировать на смартфоне.

В вашем смартфоне установлен офисный редактор? Выделите текст и скопируйте его в буфер обмена. Затем вставьте скопированный текст в новый Word-документ и сохраните его на смартфон. Так как большинство смартфонов на базе Android поддерживают подключение флеш-накопителей, вы можете перенести файл на компьютер и продолжить его редактирование.

Можно ли отсканированный документ перевести в Ворд без использования специальных утилит? Несомненно, но для этого потребуется любое устройство с выходом в интернет, ведь в качестве «распознавателя текста» будет выступать онлайн-сервис.

Среди качественных и бесплатных сервисов распознавания текста лучшим является Free Online OCR Service, доступный по адресу http://www.onlineocr.net . Процесс распознавания текста с отсканированного документа можно разделить на 3 шага. В первую очередь нужно загрузить документ на сайт, нажав кнопку «Select file». Максимальный объем загружаемого файла не должен превышать пяти мегабайт.

По окончании загрузки укажите русский язык и выходной формат документа.

Затем введите код с картинки и кликните кнопку «Convert».

Текст, распознанный онлайн-сервисом, можно скопировать в буфер обмена и вставить в любой документ либо сохранить его на компьютере, кликнув по ссылке «Download Output File».

Зарегистрировавшись на сервисе, пользователь получает более широкие возможности по распознаванию текста: пакетное распознавание, выгрузку документов в ZIP-архиве, неограниченный размер загружаемых файлов и конвертирование в другие форматы документов.

Единственное, что не стоит доверять онлайн-сервисам, – «секретные документы», так как, вполне возможно, отсканированные версии документов хранятся на серверах компании, владельца сервиса.



Эта статья также доступна на следующих языках: Тайский

  • Next

    Огромное Вам СПАСИБО за очень полезную информацию в статье. Очень понятно все изложено. Чувствуется, что проделана большая работа по анализу работы магазина eBay

    • Спасибо вам и другим постоянным читателям моего блога. Без вас у меня не было бы достаточной мотивации, чтобы посвящать много времени ведению этого сайта. У меня мозги так устроены: люблю копнуть вглубь, систематизировать разрозненные данные, пробовать то, что раньше до меня никто не делал, либо не смотрел под таким углом зрения. Жаль, что только нашим соотечественникам из-за кризиса в России отнюдь не до шоппинга на eBay. Покупают на Алиэкспрессе из Китая, так как там в разы дешевле товары (часто в ущерб качеству). Но онлайн-аукционы eBay, Amazon, ETSY легко дадут китайцам фору по ассортименту брендовых вещей, винтажных вещей, ручной работы и разных этнических товаров.

      • Next

        В ваших статьях ценно именно ваше личное отношение и анализ темы. Вы этот блог не бросайте, я сюда часто заглядываю. Нас таких много должно быть. Мне на эл. почту пришло недавно предложение о том, что научат торговать на Амазоне и eBay. И я вспомнила про ваши подробные статьи об этих торг. площ. Перечитала все заново и сделала вывод, что курсы- это лохотрон. Сама на eBay еще ничего не покупала. Я не из России , а из Казахстана (г. Алматы). Но нам тоже лишних трат пока не надо. Желаю вам удачи и берегите себя в азиатских краях.

  • Еще приятно, что попытки eBay по руссификации интерфейса для пользователей из России и стран СНГ, начали приносить плоды. Ведь подавляющая часть граждан стран бывшего СССР не сильна познаниями иностранных языков. Английский язык знают не более 5% населения. Среди молодежи — побольше. Поэтому хотя бы интерфейс на русском языке — это большая помощь для онлайн-шоппинга на этой торговой площадке. Ебей не пошел по пути китайского собрата Алиэкспресс, где совершается машинный (очень корявый и непонятный, местами вызывающий смех) перевод описания товаров. Надеюсь, что на более продвинутом этапе развития искусственного интеллекта станет реальностью качественный машинный перевод с любого языка на любой за считанные доли секунды. Пока имеем вот что (профиль одного из продавцов на ебей с русским интерфейсом, но англоязычным описанием):
    https://uploads.disquscdn.com/images/7a52c9a89108b922159a4fad35de0ab0bee0c8804b9731f56d8a1dc659655d60.png