При работе с текстовым редактором Word у пользователей возникнет необходимость обрабатывать не только созданные ими тексты, но и редактировать отсканированные материалы. К примеру, чтобы избежать ручного ввода текста, письма или другого документа в сканированном виде. Ранее, до появления систем распознавания текста, известных как OCR, такая рутинная задача была очень распространена. Однако сегодня можно воспользоваться не только множеством сторонних приложений, но и встроенными инструментами Windows, включая Microsoft Office. Это оказывается более удобно, так как отпадает необходимость иметь установленное ПО под рукой и зависеть от одного компьютера, что в современном мире имеет большое значение.
Таким образом, у нас есть текст, полученный сканированием, и необходимо интегрировать его в свой документ так, чтобы этот участок текста можно было редактировать. Существует два метода; давайте изучим оба.
Первый путь
Суть заключается в использовании встроенных функций Microsoft Word. Если вставить сканированный элемент без каких-либо манипуляций, он будет восприниматься исключительно как изображение. Основной текст будет обтекать его, а редактировать можно будет лишь размер и степень прозрачности. Это вызывает неудобства, особенно когда необходимо внести изменения всего лишь в пару строк.
Но если вставить этот отсканированный фрагмент как объект Microsoft Image Viewer в Word, то он вставится как обычный, доступный для редактирования текст. Для этого нужно проследить, чтобы файл был с расширением .tiff, а если нет, то воспользоваться Paint, открыв его и перезаписав в нужном формате. После этого в дело вступает специальный компонент платформы Microsoft Office, о котором мы упоминали чуть выше. Именно его вам следует открыть в главном меню. Если его нет, то придётся покопаться в панели управления.


Вам нужно открыть раздел «Установка и удаление программ», затем в появившемся списке найти Office и перейти к выбору его компонентов. Среди них вы обнаружите Image Viewer, который нам нужен для завершения задания. После его установки он будет доступен в главном меню.

После запуска программы, загрузите сканированный файл с помощью перетаскивания или через меню. Убедитесь, что вы дождались завершения процесса, который будет сопровождаться появлением прогресс-бара. Как только распознавание закончится, вы увидите окно с извлечённым текстом. Его можно скопировать в Word для последующей доработки.
Конечно, вы должны учитывать, что распознавание текста, искажённого сканированием, может пройти не идеально, так что стоит провести так называемую «вычитку», то есть отредактировать его, исправляя неправильно распознанные символы. Гораздо хуже дело обстоит с рукописным текстом, вероятность, что его удастся отредактировать, сильно коррелирует с цветом бумаги и чернил, качеством сканирования и, конечно, разборчивостью почерка. Но такая работа достаточно редко проводится с рукописным текстом, обычно всё же речь идёт о напечатанном.

Второй путь
В общем, второй метод в целом аналогичен первому, однако он начинает с использования стороннего программного обеспечения для активации функции распознавания текста и его редактирования, после чего подключается Word. Необходима установленная программа. Возможно, она будет демонстрировать лучшие результаты по сравнению с продуктом от Microsoft, так как создаются и разрабатываются такие приложения специально для этой цели. Разработчики обещают фактическую точность почти в 100% для печатного текста, а для рукописного результаты будут более скромными. Тем не менее, для отделения рекламных обещаний от реальности потребуется провести эмпирическое тестирование.

Программное обеспечение ABBYY FineReader
На самом деле, различия не так уж и значительны. Некоторым пользователям может показаться проще не активировать режим редактирования через комбинацию Microsoft Image Viewer и Microsoft Word, однако в таком случае придется прибегнуть к другой совокупности приложений, а точность распознавания текста для печатных документов останется на consistently высоком уровне.
Поэтому причины платить больше за одну из этих программ, когда есть решение, встроенное в пакет Office — весьма туманны. Другое дело, если вы имеете дело с частными случаями. Например, у вас есть много отсканированных в плохом качестве документов, которые нужно оцифровать и подготовить для режима редактирования.
Тогда узкоспециализированный софт, настроенный под работу с шумом и искажениями в таких изображениях, разумеется, будет предсказуемо лучше. Он точнее обработает лист с символами, корректнее распознает их и передаст в Word для дальнейшей работы. Но таких случаев не так уж много и, как правило, рядовой пользователь с ними не сталкивается. Поэтому для типовых задач этот путь уже практически не используется.

Программа Скан Корректор А4
Особенности корректировки текстовых документов
Однако под редактированием может подразумеваться не только исключительно правка отсканированных документов, но и вообще любая корректура. Начнём с самого простого — удаления символов. Для этого предусмотрены клавиши Backspace и Delete. Первый вариант удаляет символ, стоящий слева от курсора мыши. Второй, соответственно, тот, что находится правее курсора.
Также нам может понадобиться отделить друг от друга отдельные абзацы для повышения общей читабельности. Используем для этой цели клавишу ввода Enter. Если мы хотим выполнить обратную процедуру, то занимаем место в самом начале второго абзаца. Нажатие кнопки Delete пододвинет второй абзац вплотную к предыдущему.
Ещё возникает потребность работать сразу с целым текстовым фрагментом. Например, нам нужно перенести кусок текста в другую часть документа. Для этого мы выделяем его левой кнопкой мышки. После этого делаем один щелчок правой её кнопкой. Из выпавшего перечня действий выбираем «копировать» или «вырезать». Переходим на то место, куда нужно перенести фрагмент.
Клик правой кнопкой мыши — выбираем команду «вставить». Теперь текст переместится на новое место.

Во время набора текста обязательно случаются ошибки, а порой, сразу целая серия. В этой ситуации очень удобно отменить свои действия, чтобы не удалять вручную каждый неверный символ. Этот момент можно значительно упростить, если знать, как действовать. На главной панели вверху нужно найти стрелочку, показывающую обратное направление.
Она может выглядеть по-разному в различных версиях Word. Или же воспользоваться горячей комбинацией клавиш «Ctrl+Z». Происходит отмена последнего набранного символа.
В процессе работы с текстом может понадобиться добавить специальные символы. В редакторе от компании Майкрософт для этого предусмотрена функция «Вставка», где необходимо перейти на вкладку «Символы». Далее нужно просто выбрать нужный символ, и он будет добавлен во весь документ. Также существует возможность заменить одно слово на другое по всему тексту.
Вручную делать это много раз очень долго, однако разработчики Word позаботились и упростили эту задачу. Сначала выбираем комбинацию Ctrl+H. После этого всплывает окошко, в котором нам предлагается выбрать то слово, что подлежит замене. В соседнем окошке указываем новое слово и нажимаем «применить».

Редактор и сам подчеркнёт неправильную орфографию при помощи красной волнистой линии, а грамматические ошибки выделяются зелёной линией. Это существенно облегчает задачу пользователю, которому следует перейти в раздел с названием Рецензирование. После этого переходим во вкладку «Правописание». Редактор сам будет предлагать заменить неправильные слова или те, которых нет в предусмотренном словаре, на правильные.

При редактировании у пользователя появляется широкий выбор изменения шрифтов, которые находятся во вкладке с соответствующим названием. Их создано десятки видов, а некоторые даже в старинных стилях, наподобие готического, однако наиболее популярным является Times New Roman. Для работы выбирают различный размер шрифта, но более востребованными являются №№12 и 14. А готовый шрифт можно сделать жирным, отметить подчеркиванием, сделать курсивом.
Многим, кто работает с большими объёмами текстов по учёбе и работе, приходится делать нумерацию страниц в пределах одного документа. Для того чтобы пронумеровать их, перейдём во вкладку «Вставка», где предусмотрено немало интересных инструментов. Выберем «номер страницы», а затем место, куда будет проставлена нумерация на каждой из страниц документа. В большинстве случаев это бывает внизу посередине. Это основные функции, о которых следует знать начинающему редактору при работе с Word любой версии.

Послесловие
Пакет Office представляет собой широкий набор инструментов для решения самых разнообразных задач. У каждой из входящих в него программ есть своя функциональность, и они дополняют друг друга при выполнении офисных работ. В частности, для редактирования отсканированных документов в Word потребуется программа распознавания, и в пакете она представлена. Такая структура «всё-в-одном» весьма удобна, так как не приходится думать, где найти и как установить сторонний софт, не нужно разбираться с особенностями его интерфейса: есть решения, выполненные в едином стиле. Поэтому Office был и остаётся стандартом де-факто для офисной работы.
Что же касается возможности вставить изображение напрямую в Word и редактировать его прямо оттуда, то пока что такой режим не поддерживается. Однако учитывая тенденции на объединение программ внутри пакета и уход в онлайн (мы имеем в виду Office365), стоит этого вскоре ожидать. Сейчас же нужно будет установить требуемый компонент (если он ещё не был установлен) и работать именно так.
Сканирование и редактирование документов в Word

Узнайте, как сканировать и редактировать документы в Microsoft Word. Наше руководство поможет вам сделать это быстро и легко.
Отсканировав документ, вы можете открыть его в Word для редактирования. Метод зависит от версии Office, установленной на компьютере. Сканирование документа в виде PDF-файла и его редактирование в Word Совет. Преобразование лучше всего подходит для документов, которые в основном состоят из текста.
Просканируйте документ, следуя указаниям вашего сканера, и сохраните его на компьютере в формате PDF. Затем в Word зайдите в меню «Файл»> «Открыть». Найдите в файловой системе папку с вашим PDF-файлом и нажмите «Открыть». Вы увидите уведомление о том, что Word преобразует PDF-документ в редактируемый формат. Нажмите ОК.
Может не быть полного постраничного совпадения преобразованного документа с оригиналом. Например, разрывы строк и страниц могут появляться в другом месте. Дополнительные сведения см. В разделе «Открытие PDF-файлов в Word.
Дополнительные сведения
Параметр «Сканер» или «Камера» для сканирования документов и изображений недоступен в Word 2010. Вместо этого вы можете отсканировать документ с помощью сканера и сохранить файл на свой компьютер.
Работа в Microsoft Office 2010
Шаг 1: Установка Microsoft Office Document Imaging
Microsoft Office Document Imaging был удален из Office 2010, но вы можете установить его на свой компьютер, используя один из вариантов, описанных в разделе Установка MODI для использования с Microsoft Office 2010.
Шаг 2: создание документа, который можно изменить
Отсканируйте документ, следуя инструкциям для вашего сканера.
Прежде чем продолжить Преобразуйте файл, созданный сканером, в формат TIFF. Вы можете преобразовать файл с помощью Paint или другой программы.
Откройте Microsoft Office Document Imaging, выполнив поиск Microsoft Office Document Imaging в меню «Пуск» Windows.
В меню «Файл» выберите «Открыть.
Найдите отсканированный документ и нажмите кнопку «Открыть.
После запуска Microsoft Office Document Imaging нажмите CTRL + A, чтобы выделить весь документ, затем нажмите CTRL + C.
Откройте Microsoft Word.
На вкладке «Файл» нажмите кнопку «Создать.
Дважды щелкните Новый документ.
Нажмите CTRL + V, чтобы вставить содержимое отсканированного документа в новый файл.
Теперь у вас есть документ, который вы можете редактировать. Не забудьте сохранить новый файл, чтобы не потерять свои изменения.
Работа в Microsoft Office Word 2007
Параметр «Сканер» или «Камера» для сканирования документов и изображений недоступен в Microsoft Office Word 2007. Вместо этого вы можете отсканировать документ с помощью сканера и сохранить файл на свой компьютер.
Шаг 1: Установка Microsoft Office Document Imaging
Закройте все программы.
Совет: рекомендуется распечатать этот раздел перед выходом из всех программ.
Откройте панель управления: щелкните правой кнопкой мыши кнопку «Пуск» в Windows и выберите «Панель управления» или введите «Панель управления» в поле поиска Windows .
В Панели управления щелкните «Программы», затем щелкните «Программы и компоненты.
Кликните правой кнопкой мыши по названию установленной версии Microsoft Office или по значку Microsoft Office Word 2007 (в зависимости от того, установлена ли программа Word как часть пакета Office или в качестве отдельного приложения), затем выберите «Изменить».
Выберите «Добавить или удалить компоненты», затем нажмите «Продолжить.
В разделе «Параметры установки» щелкните значок «плюс» (+) рядом с «Инструменты Office.
Щелкните стрелку рядом с Microsoft Office Document Imaging, выберите параметр Запускать все с моего компьютера и нажмите кнопку Продолжить.
Шаг 2: создание документа, который можно изменить
Отсканируйте документ, следуя инструкциям для вашего сканера.
Прежде чем продолжить Преобразуйте файл, созданный сканером, в формат TIFF. Вы можете преобразовать файл с помощью Paint или другой программы.
Откройте Microsoft Office Document Imaging, выполнив поиск Microsoft Office Document Imaging в меню «Пуск» Windows.
В меню «Файл» выберите «Открыть.
Найдите отсканированный документ и нажмите кнопку «Открыть.
После запуска Microsoft Office Document Imaging нажмите CTRL + A, чтобы выделить весь документ, затем нажмите CTRL + C.
Откройте Microsoft Office Word.
Нажмите кнопку Microsoft Office и выберите Создать.
Выберите «Новый документ», а затем «Новый.
Нажмите CTRL + V, чтобы вставить содержимое отсканированного документа в новый файл.
Теперь у вас есть документ, который вы можете редактировать. Не забудьте сохранить новый файл, чтобы не потерять свои изменения.
Как отсканировать документ и распознать его в MS Word
Если вы выбрали быстрый способ написания теоретической главы, о котором мы говорили в пункте 2.1., Скорее всего, вы не сможете не сканировать документы. В противном случае вы можете пропустить этот шаг и начать делать заметки по материалам, найденным в библиотеке.
Перед тем, как начать сканирование, нужно определиться, что именно вы хотите использовать при написании работы. А для этого необходимо предварительно просмотреть имеющуюся литературу и выделить карандашом необходимые моменты. Когда я впервые отсканировал журнальную статью для своей первой курсовой работы, для меня это было невероятно сложно.
В результате нескольких часов работы со сканером и FineReader я обнаружил нередактируемую чушь. В итоге пришлось все набирать руками. Чтобы с вами этого не случилось, рассмотрим подробнее все технические аспекты сканирования.
Для сканирования вам потребуется:
Сканер покупать не нужно. Вы можете, например, одолжить у друга. Я использую сканер CanoScan Lide 60. Хотя это не самая новая модель, мне очень нравится этот компактный, быстрый и простой в использовании «прибор». Если вы одолжили сканер, вы должны сначала установить программу драйвера, чтобы это работало.
Все драйверы и инструкции по их установке находятся на диске, который поставляется вместе с устройством, или могут быть загружены с веб-сайта производителя. После того как драйвер будет установлен, подключите сканер к компьютеру с помощью соответствующего кабеля. Теперь вы готовы приступить к сканированию напрямую.
Но сначала немного теории. Обратите внимание, что процесс сканирования состоит из двух этапов:
1. Отсканируйте документ напрямую. На этом этапе сканер как бы фотографирует поверхность отсканированного документа и сохраняет полученное изображение на компьютере как обычный файл .jpg .gif или другого формата;
2. Подтверждение документа. Это процесс преобразования текста из отсканированного изображения в обычный тест, который затем можно сохранить в Word и отредактировать. Распознавание осуществляется без участия сканера, с помощью специальной программы (самая популярная — Adobe FineReader). Поэтому вы можете сначала отсканировать несколько листов текста и сохранить их как изображение, а только потом преобразовать их в текст.
Итак, приступим к первому шагу — сканированию:
Запускаем драйвер сканера:
Пуск — Все программы — Canon — ScanGear (указываю название драйвера для своего сканера). Появится окно драйвера:

Откройте крышку сканера и поместите книгу. Книгу, журнал или все, что у вас есть, следует класть текстом вниз, как можно более ровно по отношению к краям рабочей поверхности сканера:

Важно убедиться, что крышка сканера максимально плотно прижимает сканируемый документ, не допуская попадания внешнего света на рабочую поверхность сканера, которая соприкасается с документом.
Производим необходимые настройки в драйвере сканера
Первый шаг — установить разрешение, при котором документ будет сканироваться. Разрешение — это показатель, который определяет уровень детализации объекта при сканировании и определяется в точках на дюйм (dpi или dpi). Чем выше разрешение, тем лучше изображение.
При сканировании текстовых документов использование максимального разрешения нецелесообразно, так как это не дает никакой практической пользы. Более того, процесс сканирования на высоком разрешении занимает значительно больше времени. Рекомендую установить разрешение в диапазоне 400-500 dpi. С такими параметрами качество изображений будет удовлетворительным для качественного распознавания, а сам процесс сканирования пройдет быстро. Ознакомьтесь с примером настроек моего сканера:

Для начала вам нужно перейти в «Расширенный режим». Источником всегда будет «Планшетный» (планшетный сканер). Лучше установить цветовой режим «Черно-белый», потому что нам не нужны цвета для сканирования текста, и это уменьшит размер выходных изображений. Разрешение, как я уже сказал, должно быть 400 dpi. Размер выходного изображения обязательно «А4».
Теперь можете смело нажимать кнопку «Сканировать». Мой сканер спроектирован таким образом, что он сначала сохраняет отсканированные изображения во внутренней памяти, и только когда окно драйвера закрыто, он предлагает сохранить их на компьютер. Мне просто нужно указать место, где будут сохранены результаты работы.
У вас должны получиться такие файлы:

Когда это изображение увеличено, текст должен быть хорошо виден.
Второй этап — это распознавание полученных изображений и их преобразование в текст. Как я уже сказал, для этого нужна специальная программа: FineReader. Скачайте программу по этой ссылке (72МБ). Для загрузки щелкните стрелку в правом верхнем углу окна. Распакуйте архив и в папке afr_lrp найдите файл — ABBYY FineReader 12.0.101.exe.
Двойной щелчок по этому файлу запустит установку программы на ваш компьютер. Эта версия программы довольно новая. Все приведенные ниже скриншоты я сделал с использованием более старой версии, поэтому интерфейс программы будет немного отличаться от снимков экрана. Помните об этом при чтении данного руководства.
Окно FineReader выглядит так:

После установки языка, на котором были напечатаны ранее отсканированные документы, можно начинать распознавание. Если текст содержит одновременно два языка (например, русский и английский), установите соответственно.
Чтобы начать распознавание, щелкните стрелку справа от первой кнопки «Сканировать», а затем щелкните «Открыть изображение:

Появится окно для выбора изображения. Перейдите в папку, где хранятся ваши отсканированные изображения, нажмите комбинацию клавиш CTRL + A (на английском языке) и затем нажмите кнопку «Открыть».

Далее миниатюры добавленных файлов появятся слева в окне FineReader, в центре — текущий выбранный эскиз в увеличенном виде, внизу — еще больший масштаб и справа — результат распознавания:

Например, я сделал всего два снимка. На скриншоте выше первый из них выделен, и теперь мы его узнаем. Как видите, изображение сканируется вертикально, чтобы распознать текст, изображение сначала нужно повернуть на 90 градусов. Для этого используйте кнопки
а также
… Следующий шаг — сообщить программе, какую именно часть изображения следует распознать, а также установить тип данных, которые должны выводиться в виде текста, таблицы или изображения. Для этого есть кнопки соответственно: 

… Например, если вам нужно отметить блок текста, щелкните левой кнопкой мыши, затем щелкните левой кнопкой мыши в верхнем левом углу текстового блока и, удерживая левую кнопку, перетащите в правый нижний угол. Например, я полностью подготовил изображение к распознаванию:

Как видите, все текстовые поля в приведенном выше примере выделены зеленым, а изображения — красным. Таблицы готовятся к распознаванию аналогичным образом. Кнопка предназначена для этого. Чтобы перейти к следующему изображению, щелкните левой кнопкой мыши по его миниатюре слева.
Таким образом, все изображения, полученные в результате сканирования, подготавливаются к распознаванию. Когда вы закончите подготовку изображений, вам нужно выбрать их все. Для этого щелкните левой кнопкой мыши пустое место на панели эскизов (называемой «Пакет») и нажмите Ctrl + A (на английском языке) на клавиатуре. Затем нажмите кнопку
и подождите, пока FineReader преобразует изображения в текст. После этого вы можете сохранить полученный текст в Word с помощью кнопки
, после нажатия на которую откроется окно мастера для сохранения результатов. В нем нужно выбрать формат для сохранения — Microsoft Word, а также поставить галочку, чтобы все страницы сохранялись:

После нажатия кнопки ОК программа создаст документ Word и вставит текст с распознанных страниц в том порядке, в котором они отображаются на панели эскизов (Пакет). Сохраните полученный документ в папке в файловой структуре диссертации, и вы можете приступить к его редактированию. Как это сделать, описано в моем бесплатном курсе.
И последний момент. Если вы сканировали газету или журнал, текст часто предоставляется в виде столбцов (как в примере выше). Эти столбцы в Word необходимо преобразовать в один. Выделите текст в виде столбцов и выполните команду: Формат — Столбцы — Один — ОК. Только после этого вы можете установить вертикальную ориентацию в параметрах страницы, полях, шрифте и т.д.




