Как редактировать сканированный документ в Word: пошаговое руководство

При работе с текстовым процессором Word пользователи иногда сталкиваются с необходимостью обработки не только введенного ими (или кем-либо другим) текста, но и редактирования отсканированных материалов. Например, для того чтобы не тратить время на ручное перепечатывание текста, письма или других документов, полученных в формате сканирования. Ранее, до появления систем распознавания, известных как OCR, подобные задачи требовали много времени и усилий. Однако в настоящее время можно воспользоваться не только множеством сторонних приложений, но и встроенными инструментами Windows, в частности, Microsoft Office. Это существенно упрощает процесс, поскольку нет необходимости иметь при себе установленное программное обеспечение или быть привязанным к определенному компьютеру, что в условиях современного мира является значительным преимуществом.

Таким образом, имеется текст, полученный путем сканирования, и необходимо поместить его в свой документ, чтобы впоследствии можно было вносить изменения. Существуют два способа достижения этой цели; давайте рассмотрим оба из них.

Первый путь

Суть заключается в применении встроенных функций Microsoft Word. Если вы просто вставите отсканированный элемент без каких-либо дополнительных манипуляций, он окажется всего лишь изображением. Остальной текст будет обтекать его, а возможность редактирования ограничится только изменением размера и прозрачности. Это может быть особенно неприятно, когда требуется внести правки всего в пару строк.

Но если вставить этот отсканированный фрагмент как объект Microsoft Image Viewer в Word, то он вставится как обычный, доступный для редактирования текст. Для этого нужно проследить, чтобы файл был с расширением .tiff, а если нет, то воспользоваться Paint, открыв его и перезаписав в нужном формате. После этого в дело вступает специальный компонент платформы Microsoft Office, о котором мы упоминали чуть выше. Именно его вам следует открыть в главном меню. Если его нет, то придётся покопаться в панели управления.


Отыщите в ней раздел «Управление программами», затем в открывшемся перечне отыщите Office и перейдите к выбору элементов. В этом списке вы обнаружите Image Viewer, который нам потребуется для выполнения нашей задачи. После его установки он появится в основном меню.

Итак, после того как вы запустите программу, можно открыть сканированный файл с помощью метода перетаскивания (drag’n’drop’) или выбрав соответствующий пункт в меню. Придется немного подождать, так как на экране будет показан индикатор выполнения, который демонстрирует процесс распознавания. Когда все завершится, откроется окно с распознанным текстом, который вы можете скопировать в Word для дальнейшего редактирования.

Конечно, вы должны учитывать, что распознавание текста, искажённого сканированием, может пройти не идеально, так что стоит провести так называемую «вычитку», то есть отредактировать его, исправляя неправильно распознанные символы. Гораздо хуже дело обстоит с рукописным текстом, вероятность, что его удастся отредактировать, сильно коррелирует с цветом бумаги и чернил, качеством сканирования и, конечно, разборчивостью почерка. Но такая работа достаточно редко проводится с рукописным текстом, обычно всё же речь идёт о напечатанном.

Второй путь

Bторой метод аналогичен первому, с той лишь разницей, что для активации режима распознавания текста и его редактирования сначала используется стороннее программное обеспечение, а затем уже Word. Необходимо наличие установленной программы. Возможно, она будет демонстрировать более высокие результаты по сравнению с продуктами Microsoft, поскольку такие программы разрабатываются с учетом специфики задачи. Разработчики обещают практически 100% точность для печатного текста и чуть менее уверенные показатели для рукописного. Однако, чтобы отделить реальные факты от рекламных заявлений, необходимо будет провести эмпирическую проверку.

Программное обеспечение ABBYY FineReader

На деле разница оказывается не такой уж значительной. Да, некоторым пользователям может быть удобно, что нет необходимости активировать режим редактирования текста через комбинацию Microsoft Image Viewer и Microsoft Word, однако для этого потребуется применить другую связку приложений, и точность распознавания символов в печатных документах по-прежнему останется на высоком уровне.

Поэтому причины платить больше за одну из этих программ, когда есть решение, встроенное в пакет Office — весьма туманны. Другое дело, если вы имеете дело с частными случаями. Например, у вас есть много отсканированных в плохом качестве документов, которые нужно оцифровать и подготовить для режима редактирования.

Тогда узкоспециализированный софт, настроенный под работу с шумом и искажениями в таких изображениях, разумеется, будет предсказуемо лучше. Он точнее обработает лист с символами, корректнее распознает их и передаст в Word для дальнейшей работы. Но таких случаев не так уж много и, как правило, рядовой пользователь с ними не сталкивается. Поэтому для типовых задач этот путь уже практически не используется.

Программа Скан Корректор А4

Особенности корректировки текстовых документов

Однако под редактированием может подразумеваться не только исключительно правка отсканированных документов, но и вообще любая корректура. Начнём с самого простого — удаления символов. Для этого предусмотрены клавиши Backspace и Delete. Первый вариант удаляет символ, стоящий слева от курсора мыши. Второй, соответственно, тот, что находится правее курсора.

Также нам может понадобиться отделить друг от друга отдельные абзацы для повышения общей читабельности. Используем для этой цели клавишу ввода Enter. Если мы хотим выполнить обратную процедуру, то занимаем место в самом начале второго абзаца. Нажатие кнопки Delete пододвинет второй абзац вплотную к предыдущему.

Ещё возникает потребность работать сразу с целым текстовым фрагментом. Например, нам нужно перенести кусок текста в другую часть документа. Для этого мы выделяем его левой кнопкой мышки. После этого делаем один щелчок правой её кнопкой. Из выпавшего перечня действий выбираем «копировать» или «вырезать».

Переходим на то место, куда нужно перенести фрагмент. Клик правой кнопкой мыши — выбираем команду «вставить». Теперь текст переместится на новое место.

Во время набора текста обязательно случаются ошибки, а порой, сразу целая серия. В этой ситуации очень удобно отменить свои действия, чтобы не удалять вручную каждый неверный символ. Этот момент можно значительно упростить, если знать, как действовать. На главной панели вверху нужно найти стрелочку, показывающую обратное направление.

Она может выглядеть по-разному в различных версиях Word. Или же воспользоваться горячей комбинацией клавиш «Ctrl+Z». Происходит отмена последнего набранного символа.

Иногда требуется добавление специальных символов в текст. В редакторе от Майкрософт для этого существует функция «Вставка», в которой нужно перейти на вкладку «Символы». Затем достаточно выбрать нужный символ, и он автоматически будет добавлен во весь документ. Кроме того, можно заменить определённое слово на другое в тексте целиком.

Вручную делать это много раз очень долго, однако разработчики Word позаботились и упростили эту задачу. Сначала выбираем комбинацию Ctrl+H. После этого всплывает окошко, в котором нам предлагается выбрать то слово, что подлежит замене. В соседнем окошке указываем новое слово и нажимаем «применить».

Редактор и сам подчеркнёт неправильную орфографию при помощи красной волнистой линии, а грамматические ошибки выделяются зелёной линией. Это существенно облегчает задачу пользователю, которому следует перейти в раздел с названием Рецензирование. После этого переходим во вкладку «Правописание». Редактор сам будет предлагать заменить неправильные слова или те, которых нет в предусмотренном словаре, на правильные.

При редактировании у пользователя появляется широкий выбор изменения шрифтов, которые находятся во вкладке с соответствующим названием. Их создано десятки видов, а некоторые даже в старинных стилях, наподобие готического, однако наиболее популярным является Times New Roman. Для работы выбирают различный размер шрифта, но более востребованными являются №№12 и 14. А готовый шрифт можно сделать жирным, отметить подчеркиванием, сделать курсивом.

Многим, кто работает с большими объёмами текстов по учёбе и работе, приходится делать нумерацию страниц в пределах одного документа. Для того чтобы пронумеровать их, перейдём во вкладку «Вставка», где предусмотрено немало интересных инструментов. Выберем «номер страницы», а затем место, куда будет проставлена нумерация на каждой из страниц документа. В большинстве случаев это бывает внизу посередине. Это основные функции, о которых следует знать начинающему редактору при работе с Word любой версии.

Послесловие

Пакет Office представляет собой широкий набор инструментов для решения самых разнообразных задач. У каждой из входящих в него программ есть своя функциональность, и они дополняют друг друга при выполнении офисных работ. В частности, для редактирования отсканированных документов в Word потребуется программа распознавания, и в пакете она представлена. Такая структура «всё-в-одном» весьма удобна, так как не приходится думать, где найти и как установить сторонний софт, не нужно разбираться с особенностями его интерфейса: есть решения, выполненные в едином стиле. Поэтому Office был и остаётся стандартом де-факто для офисной работы.

Что же касается возможности вставить изображение напрямую в Word и редактировать его прямо оттуда, то пока что такой режим не поддерживается. Однако учитывая тенденции на объединение программ внутри пакета и уход в онлайн (мы имеем в виду Office365), стоит этого вскоре ожидать. Сейчас же нужно будет установить требуемый компонент (если он ещё не был установлен) и работать именно так.

Сканирование и редактирование документов в Word

Узнайте, как сканировать и редактировать документы в Microsoft Word. Наше руководство поможет вам сделать это быстро и легко.

Отсканировав документ, вы можете открыть его в Word для редактирования. Метод зависит от версии Office, установленной на компьютере. Сканирование документа в виде PDF-файла и его редактирование в Word Совет. Преобразование лучше всего подходит для документов, которые в основном состоят из текста.

Сначала выполните сканирование документа в соответствии с указаниями вашего сканера и сохраните его на компьютер в формате PDF. Затем в Word зайдите в меню «Файл»> «Открыть». Найдите на своем компьютере папку, где сохранён файл PDF, и нажмите кнопку «Открыть». После этого появится уведомление, что Word преобразует PDF-документ в редактируемый файл Word. Нажмите ОК.

Может не быть полного постраничного совпадения преобразованного документа с оригиналом. Например, разрывы строк и страниц могут появляться в другом месте. Дополнительные сведения см. В разделе «Открытие PDF-файлов в Word.

Дополнительные сведения

Параметр «Сканер» или «Камера» для сканирования документов и изображений недоступен в Word 2010. Вместо этого вы можете отсканировать документ с помощью сканера и сохранить файл на свой компьютер.

Работа в Microsoft Office 2010

Шаг 1: Установка Microsoft Office Document Imaging

Microsoft Office Document Imaging был удален из Office 2010, но вы можете установить его на свой компьютер, используя один из вариантов, описанных в разделе Установка MODI для использования с Microsoft Office 2010.

Шаг 2: создание документа, который можно изменить

Отсканируйте документ, следуя инструкциям для вашего сканера.

Прежде чем продолжить Преобразуйте файл, созданный сканером, в формат TIFF. Вы можете преобразовать файл с помощью Paint или другой программы.

Откройте Microsoft Office Document Imaging, выполнив поиск Microsoft Office Document Imaging в меню «Пуск» Windows.

В меню «Файл» выберите «Открыть.

Найдите отсканированный документ и нажмите кнопку «Открыть.

После запуска Microsoft Office Document Imaging нажмите CTRL + A, чтобы выделить весь документ, затем нажмите CTRL + C.

Откройте Microsoft Word.

На вкладке «Файл» нажмите кнопку «Создать.

Дважды щелкните Новый документ.

Нажмите CTRL + V, чтобы вставить содержимое отсканированного документа в новый файл.

Теперь у вас есть документ, который вы можете редактировать. Не забудьте сохранить новый файл, чтобы не потерять свои изменения.

Работа в Microsoft Office Word 2007

Параметр «Сканер» или «Камера» для сканирования документов и изображений недоступен в Microsoft Office Word 2007. Вместо этого вы можете отсканировать документ с помощью сканера и сохранить файл на свой компьютер.

Шаг 1: Установка Microsoft Office Document Imaging

Закройте все программы.

Совет: рекомендуется распечатать этот раздел перед выходом из всех программ.

Откройте панель управления: щелкните правой кнопкой мыши кнопку «Пуск» в Windows и выберите «Панель управления» или введите «Панель управления» в поле поиска Windows .

В Панели управления щелкните «Программы», затем щелкните «Программы и компоненты.

Кликните правой кнопкой мыши на название установленной версии Microsoft Office или на Microsoft Office Word 2007 (в зависимости от того, установлен ли Word в комплекте с офисом или как отдельное приложение), после чего выберите «Изменить».

Выберите «Добавить или удалить компоненты», затем нажмите «Продолжить.

В разделе «Параметры установки» щелкните значок «плюс» (+) рядом с «Инструменты Office.

Щелкните стрелку рядом с Microsoft Office Document Imaging, выберите параметр Запускать все с моего компьютера и нажмите кнопку Продолжить.

Шаг 2: создание документа, который можно изменить

Отсканируйте документ, следуя инструкциям для вашего сканера.

Прежде чем продолжить Преобразуйте файл, созданный сканером, в формат TIFF. Вы можете преобразовать файл с помощью Paint или другой программы.

Откройте Microsoft Office Document Imaging, выполнив поиск Microsoft Office Document Imaging в меню «Пуск» Windows.

В меню «Файл» выберите «Открыть.

Найдите отсканированный документ и нажмите кнопку «Открыть.

После запуска Microsoft Office Document Imaging нажмите CTRL + A, чтобы выделить весь документ, затем нажмите CTRL + C.

Откройте программу Microsoft Office Word.

Нажмите кнопку Microsoft Office и выберите Создать.

Выберите «Новый документ», а затем «Новый.

Нажмите CTRL + V, чтобы вставить содержимое отсканированного документа в новый файл.

Теперь у вас есть документ, который вы можете редактировать. Не забудьте сохранить новый файл, чтобы не потерять свои изменения.

Как отсканировать документ и распознать его в MS Word

Если вы выбрали быстрый способ написания теоретической главы, о котором мы говорили в пункте 2.1., Скорее всего, вы не сможете не сканировать документы. В противном случае вы можете пропустить этот шаг и начать делать заметки по материалам, найденным в библиотеке.

Перед тем, как начать сканирование, нужно определиться, что именно вы хотите использовать при написании работы. А для этого необходимо предварительно просмотреть имеющуюся литературу и выделить карандашом необходимые моменты. Когда я впервые отсканировал журнальную статью для своей первой курсовой работы, для меня это было невероятно сложно.

В результате нескольких часов работы со сканером и FineReader я обнаружил нередактируемую чушь. В итоге пришлось все набирать руками. Чтобы с вами этого не случилось, рассмотрим подробнее все технические аспекты сканирования.

Для сканирования вам потребуется:

  • Книга или журнал для сканирования
  • Компьютер с установленным FineReader
  • Сканер качества
  • Сканер покупать не нужно. Вы можете, например, одолжить у друга. Я использую сканер CanoScan Lide 60. Хотя это не самая новая модель, мне очень нравится этот компактный, быстрый и простой в использовании «прибор». Если вы одолжили сканер, вы должны сначала установить программу драйвера, чтобы это работало.

    Драйвера и инструкции по их установке обычно находятся на диске, который поставляется вместе с устройством, или доступны для загрузки на сайте производителя. После установки драйвера подключите сканер к ПК с использованием кабеля. Теперь можно приступать к процессу сканирования напрямую.

    Но сначала немного теории. Обратите внимание, что процесс сканирования состоит из двух этапов:

    1. Отсканируйте документ напрямую. На этом этапе сканер как бы фотографирует поверхность отсканированного документа и сохраняет полученное изображение на компьютере как обычный файл .jpg .gif или другого формата;

    2. Подтверждение документа. Это процесс преобразования текста из отсканированного изображения в обычный тест, который затем можно сохранить в Word и отредактировать. Распознавание осуществляется без участия сканера, с помощью специальной программы (самая популярная — Adobe FineReader). Поэтому вы можете сначала отсканировать несколько листов текста и сохранить их как изображение, а только потом преобразовать их в текст.

    Итак, приступим к первому шагу — сканированию:

    Запускаем драйвер сканера:

    Пуск — Все программы — Canon — ScanGear (указываю название драйвера для своего сканера). Появится окно драйвера:

    Откройте крышку сканера и поместите книгу. Книгу, журнал или все, что у вас есть, следует класть текстом вниз, как можно более ровно по отношению к краям рабочей поверхности сканера:

    Важно убедиться, что крышка сканера максимально плотно прижимает сканируемый документ, не допуская попадания внешнего света на рабочую поверхность сканера, которая соприкасается с документом.

    Производим необходимые настройки в драйвере сканера

    Первый шаг — установить разрешение, при котором документ будет сканироваться. Разрешение — это показатель, который определяет уровень детализации объекта при сканировании и определяется в точках на дюйм (dpi или dpi). Чем выше разрешение, тем лучше изображение.

    Однако при сканировании текстовых документов устанавливать максимальное разрешение нецелесообразно, поскольку это не приведет к значительному улучшению результатов. Также следует учитывать, что процесс сканирования на более высоком разрешении требует значительно больше времени. Рекомендую задать разрешение в диапазоне 400-500 dpi. Эта настройка обеспечивает достаточно высокое качество изображений для эффективного распознавания, а сам процесс сканирования проходит быстро. Ознакомьтесь с экранным снимком с конфигурациями моего сканера:

    Для начала вам нужно перейти в «Расширенный режим». Источником всегда будет «Планшетный» (планшетный сканер). Лучше установить цветовой режим «Черно-белый», потому что нам не нужны цвета для сканирования текста, и это уменьшит размер выходных изображений. Разрешение, как я уже сказал, должно быть 400 dpi. Размер выходного изображения обязательно «А4».

    Теперь можете смело нажимать кнопку «Сканировать». Мой сканер спроектирован таким образом, что он сначала сохраняет отсканированные изображения во внутренней памяти, и только когда окно драйвера закрыто, он предлагает сохранить их на компьютер. Мне просто нужно указать место, где будут сохранены результаты работы.

    У вас должны получиться такие файлы:

    Когда это изображение увеличено, текст должен быть хорошо виден.

    Второй этап — это распознавание полученных изображений и их преобразование в текст. Как я уже сказал, для этого нужна специальная программа: FineReader. Скачайте программу по этой ссылке (72МБ). Для загрузки щелкните стрелку в правом верхнем углу окна. Распакуйте архив и в папке afr_lrp найдите файл — ABBYY FineReader 12.0.101.exe.

    Двойной щелчок по этому файлу запустит установку программы на ваш компьютер. Эта версия программы довольно новая. Все приведенные ниже скриншоты я сделал с использованием более старой версии, поэтому интерфейс программы будет немного отличаться от снимков экрана. Помните об этом при чтении данного руководства.

    Окно FineReader выглядит так:

    После установки языка, на котором были напечатаны ранее отсканированные документы, можно начинать распознавание. Если текст содержит одновременно два языка (например, русский и английский), установите соответственно.

    Чтобы начать распознавание, щелкните стрелку справа от первой кнопки «Сканировать», а затем щелкните «Открыть изображение:

    Появится диалоговое окно для выбора изображения. Перейдите в папку с сохранёнными отсканированными изображениями, нажмите клавиши CTRL + A (на английском) на клавиатуре и затем нажмите кнопку «Открыть».

    Далее миниатюры добавленных файлов появятся слева в окне FineReader, в центре — текущий выбранный эскиз в увеличенном виде, внизу — еще больший масштаб и справа — результат распознавания:

    Например, я сделал всего два снимка. На скриншоте выше первый из них выделен, и теперь мы его узнаем. Как видите, изображение сканируется вертикально, чтобы распознать текст, изображение сначала нужно повернуть на 90 градусов. Для этого используйте кнопки а также … Следующий шаг — сообщить программе, какую именно часть изображения следует распознать, а также установить тип данных, которые должны выводиться в виде текста, таблицы или изображения. Для этого есть кнопки соответственно: … Например, если вам нужно отметить блок текста, щелкните левой кнопкой мыши, затем щелкните левой кнопкой мыши в верхнем левом углу текстового блока и, удерживая левую кнопку, перетащите в правый нижний угол. Например, я полностью подготовил изображение к распознаванию:

    Как видите, все текстовые поля в приведенном выше примере выделены зеленым, а изображения — красным. Таблицы готовятся к распознаванию аналогичным образом. Кнопка предназначена для этого. Чтобы перейти к следующему изображению, щелкните левой кнопкой мыши по его миниатюре слева.

    Таким образом, все изображения, полученные в результате сканирования, подготавливаются к распознаванию. Когда вы закончите подготовку изображений, вам нужно выбрать их все. Для этого щелкните левой кнопкой мыши пустое место на панели эскизов (называемой «Пакет») и нажмите Ctrl + A (на английском языке) на клавиатуре. Затем нажмите кнопку и подождите, пока FineReader преобразует изображения в текст. После этого вы можете сохранить полученный текст в Word с помощью кнопки , после нажатия на которую откроется окно мастера для сохранения результатов. В нем нужно выбрать формат для сохранения — Microsoft Word, а также поставить галочку, чтобы все страницы сохранялись:

    После нажатия кнопки ОК программа создаст документ Word и вставит текст с распознанных страниц в том порядке, в котором они отображаются на панели эскизов (Пакет). Сохраните полученный документ в папке в файловой структуре диссертации, и вы можете приступить к его редактированию. Как это сделать, описано в моем бесплатном курсе.

    И последний момент. Если вы сканировали газету или журнал, текст часто предоставляется в виде столбцов (как в примере выше). Эти столбцы в Word необходимо преобразовать в один. Выделите текст в виде столбцов и выполните команду: Формат — Столбцы — Один — ОК. Только после этого вы можете установить вертикальную ориентацию в параметрах страницы, полях, шрифте и т.д.

    Оцените статью
    InternetDoc.ru
    Добавить комментарий