Способы раскодирования текста в Word: Полное руководство

Что делать, если вместо текста иероглифы (в Word, браузере или текстовом документе)

Вероятно, каждый пользователь компьютера хотя бы раз сталкивался с такой ситуацией: вы заходите на веб-сайт или открываете документ Microsoft Word, а вместо привычного текста видите непонятные знаки (различные «крякозабры», незнакомые буквы, цифры и так далее (как на изображении слева…)).

А что если этот документ с непонятными символами не так уж важен, но его нужно прочитать? Мне часто поступают вопросы и просьбы о помощи в распознавании таких текстов. В этой краткой статье я собираюсь обсудить самые распространенные причины появления иероглифов и, конечно, способы их устранения.

Иероглифы в текстовых файлах (.txt)

Наиболее распространенная проблема заключается в том, что текстовый файл (чаще всего в формате txt, но Возможны форматы: php, css, info и прочие) может быть сохранен в различных кодировках.

Кодировка — это набор символов, необходимый для полной гарантии того, что текст написан определенным алфавитом (включая цифры и специальные символы). Подробнее об этом здесь: https://ru.wikipedia.org/wiki/CharacterSet

В большинстве случаев наблюдается следующая ситуация: файл открывается с некорректной кодировкой, что приводит к путанице, и вместо оригинальных символов отображаются другие. На экране возникают различные непонятные знаки (см. рис. 1)…

На мой взгляд, оптимальный вариант — это установка продвинутого текстового редактора, такого как Notepad++ или Bred 3.

Если вместо текста иероглифы в Microsoft Word

Первое, на что нужно обратить внимание, это формат файла. Дело в том, что начиная с Word 2007 появился новый формат — «docx» (раньше был просто «doc»). Файлы более новых форматов обычно не открываются в «старом» Word, но иногда случается так, что эти «новые» файлы открываются в старой программе.

Просто зайдите в свойства файла и перейдите на вкладку «Подробности» (как показано на рисунке 5). Там вы сможете определить формат файла (в примере на рисунке 5 файл имеет формат «txt»).

Если у вас файл формата docx и вы используете версию Word ниже 2007 года, вам нужно обновить Word до версии 2007 или более поздней (например, 2010, 2013, 2016).

Также при попытке открыть файл имейте в виду, что (обычно эта опция активна по умолчанию, если только у вас не очень нестандартная сборка): Word снова запросит, в какой кодировке необходимо открыть файл (это проявляется в виде сообщения с любыми «намеками» на возможные проблемы с открытием, см. рисунок 5).

В большинстве случаев Word автоматически определяет нужную кодировку, но текст не всегда читается. Вам нужно установить ползунок на желаемую кодировку, когда текст читаем. Иногда приходится буквально угадывать, куда был сохранен файл, чтобы его прочитать.

Сменить кодировку в браузере

Когда браузер неправильно определяет кодировку веб-страницы, вы увидите точно такие же иероглифы (см рис. 8).

Чтобы исправить отображение сайта: смените кодировку. Делается это в настройках браузера:

  • Google Chrome: параметры (значок вверху справа)/дополнительные параметры/кодировка/windows-1251 (или UTF-8);
  • Firefox: левая кнопка ALT (если у вас выключена верхняя панель), далее вид страницы/кодировка/выбрать нужную (чаще всего Windows-1251 или UTF-8);
  • Опера: Опера (красный значок в левом верхнем углу)/страница/кодировка/выбираем нужную.
  • Notepad +++

    Самый простой способ открыть документ Блокнота с квадратами вместо букв — использовать стороннее программное обеспечение. Блокнот+++ популярен. Это тот же Блокнот, но с дополнительными функциями. Он имеет следующие преимущества:

  • Свободно распространяется;
  • Как и в Word, в нем есть кнопка для отмены последнего действия;
  • Поддерживает одновременную работу с несколькими файлами;
  • Позволяет изменить или выбрать шифрование.
  • Автоматически завершает тексты;
  • Поддержка плагинов.
  • Чтобы преобразовать иероглифы вместо русских букв, откройте документ Блокнота в этой программе. В ленте меню вверху найдите вкладку Кодировки. Нажмите здесь. Откроется меню со списком всех ваших типов. Не всегда очевидно, какой тип шифрования использовался, поэтому попробуйте несколько, чтобы выбрать правильный для перекодирования.

    Выделите предыдущий текст.

    По мере применения кодировок символы в документе могут изменяться (щелчок меню) или оставаться неизменными. В результате после применения определенного текст станет читабельным.

    Word

    Иногда кодировка появляется и в документах Word. Иногда причиной появления искаженных символов в Word является то, что на вашем компьютере установлен старый Word (до 2007 года), а документ был создан в более поздних версиях программного обеспечения. В большинстве случаев эти «новые» файлы просто не открываются в старой версии, но иногда они открываются со странной кодировкой.

    Чтобы понять, так ли это, посмотрите в свойствах файла, какой у него формат. «Новые» документы имеют формат docx. Невозможно преобразовать файл Word в прежний формат. Обновление лучше устанавливать в MS Word. Изменить формат текстового документа на читаемый несложно.

  • Еще до открытия файла программа «понимает», что с ним проблема. Когда вы дважды щелкните по нему, Word откроет окно с вопросом, в какой кодировке открыть файл. Чтобы изменить кодировку текста в Word, следуйте алгоритму;
  • Попробуйте кодировку, предложенную программой;
  • Если это не работает, щелкните предложенные типы один за другим;
  • Попробуйте изменить типы кодировки и алфавит, типы кириллицы;
  • Как только текст станет читаемым, нажмите OK.
  • Иногда возникает другая проблема. Вы работаете в Word или Блокноте и замечаете, что вместо букв вы печатаете цифры. Эта ситуация связана с режимом Num Lock и может возникать на некоторых ноутбуках. Ознакомьтесь с вашей клавиатурой. Если кнопки с правой стороны, помимо букв, содержат также цифры, а вверху находится кнопка num lock, это означает, что ваш ноутбук поддерживает данный режим, и вы могли его случайно активировать.

    Чтобы отключить, нажмите кнопку Num Look или Fn + F11. Набор цифр прекратится, буквы появятся в обычном виде.

    Иероглифы в браузере

    Иногда, когда вы открываете страницу в браузере, вы видите зашифрованный текст. Это квадратики вместо букв в Опере, непонятные символы в Хроме и т.д. Причина — нарушение кодировки в браузере. Сбои бывают редко и виноваты разработчики. Но вы можете устранить неисправность самостоятельно.

    Если у вас Chrome, пройдите по пути Настройки — Инструменты — Шифрование. Наведите на него курсор, откроется меню с кодировками. Если он установлен на Автоматически, пожалуйста, измените его на Windows 1251. Если установлен другой параметр, замените его на Windows 1251.

    Если это не помогло открыть, пожалуйста, установите его на «Авто» или попробуйте кодировать по одному.В Опере нужно зайти в главное меню в верхней части окна и оттуда в Настройки. Нажмите «Веб-сайты» и найдите раздел «Показать». Нажмите «Настройки шрифта» и в нижней части открывшегося окна найдите флажок. В нем выберите Windows 1251. Это универсальная настройка для отображения русских шрифтов, независимо от того, какой браузер используется.

    В Firefox пройдите по пути Главное меню браузера — Настройки — Контент — Дополнительно. Что касается Opera, то в чекбоксе внизу открывшегося окна выберите нужную кодировку.

    Что делать, если в документе «Word» открываются иероглифы

    Первое, что нам нужно проверить, это расширение файла, который мы открываем. Если это документ «Word», он может быть представлен в двух форматах: «doc» и «docx». Расширение «doc» связано с программой «Word» версии 2007, а «docx», соответственно, используется в «Word 2007/2010/2013/2016».

    Если вы откроете файл с расширением «docx» в более ранней версии Word, то увидите эти еще непонятные иероглифы. То есть новые файлы не совместимы со старой версией текстового редактора. И что делать в этом случае? Просто установите новую версию 2007 года.

    Если вам нужно проверить, какое расширение имеет тот или иной документ «Ворд», щелкните по нему правой кнопкой мыши, перейдите в контекстное меню на «Свойства» и в открывшемся окне на вкладке «Подробности» обратите внимание на имя файла:

    Узнать расширение файла

    При открытии незнакомого документа программа Word (лицензионная версия) должна запрашивать, в какой кодировке необходимо отобразить текст:

    Word должен спросить, в какой кодировке должен быть текст

    Обычно кодировка определяется автоматически, но возможны исключения. Если программа просит выбрать кодировку, могут возникнуть проблемы. Дело в том, что иногда вам придется бить «методом тыка», хотя по умолчанию вам придется выбрать «Windows (по умолчанию)», если вы не открываете какой-то странный документ:

    Выберите кодировку вручную

    Выбор и изменение кодировки в Microsoft Word

    MS Word заслужено является самым популярным текстовым редактором. Следовательно, чаще всего можно столкнуться с документами в формате именно этой программы. Все, что может в них отличаться, это лишь версия Ворда и формат файла (DOC или DOCX). Однако, не смотря на общность, с открытием некоторых документов могут возникнуть проблемы.

    Одно дело, если вордовский файл не открывается вовсе или запускается в режиме ограниченной функциональности, и совсем другое, когда он открывается, но большинство, а то и все символы в документе являются нечитабельными. То есть, вместо привычной и понятной кириллицы или латиницы, отображаются какие-то непонятные знаки (квадраты, точки, вопросительные знаки).

    Если и вы столкнулись с аналогичной проблемой, вероятнее всего, виною тому неправильная кодировка файла, точнее, его текстового содержимого. В этой статье мы расскажем о том, как изменить кодировку текста в Word, тем самым сделав его пригодным для чтения. К слову, изменение кодировки может понадобиться еще и для того, чтобы сделать документ нечитабельным или, так сказать, чтобы “конвертировать” кодировку для дальнейшего использования текстового содержимого документа Ворд в других программах.

    Обратите внимание: Стандарты текстовой кодировки могут варьироваться в зависимости от страны. Например, файл, который создал пользователь в Азии и сохранил в региональной кодировке, может не отображаться правильно у пользователя в России, который использует стандартную кириллицу в своем ПК и Word.

    Что такое кодировка

    Вся информация, которая отображается на экране компьютера в текстовом виде, на самом деле хранится в файле Ворд в виде числовых значений. Эти значения преобразовываются программой в отображаемые знаки, для чего и используется кодировка.

    Кодировка — схема нумерации, в которой каждому текстовому символу из набора соответствует числовое значение. Сама же кодировка может содержать буквы, цифры, а также другие знаки и символы. Отдельно стоит сказать о том, что в разных языках довольно часто используются различные наборы символов, именно поэтому многие кодировки предназначены исключительно для отображения символов конкретных языков.

    Выбор кодировки при открытии файла

    Если текстовое содержимое файла отображается некорректно, например, с квадратами, вопросительными знаками и другими символами, значит, MS Word не удалось определить его кодировку. Для устранения этой проблемы необходимо указать правильную (подходящую) кодировку для декодирования (отображения) текста.

  • Откройте меню “Файл” (кнопка “MS Office” ранее).
  • Откройте раздел “Параметры” и выберите в нем пункт “Дополнительно”.
  • Прокрутите содержимое окна вниз, пока не найдете раздел “Общие”. Установите галочку напротив пункта “Подтверждать преобразование формата файла при открытии”. Нажмите “ОК” для закрытия окна.
  • Замечание: Установка галочки на данный параметр приведет к тому, что каждый раз, когда вы откроете в Ворде файл в формате, отличающемся от DOC, DOCX, DOCM, DOT, DOTM, DOTX, будет появляться диалоговое окно “Преобразование файла”. Если вы регулярно работаете с документами других форматов и при этом не нуждаетесь в изменении их кодировки, уберите эту галочку в настройках программы.

  • Закройте файл, а затем снова откройте его.
  • В разделе “Преобразование файла” выберите пункт “Кодированный текст”.
  • В открывшемся диалоговом окне “Преобразование файла” установите маркер напротив параметра “Другая”. Выберите необходимую кодировку из списка.
  • Рекомендация: В разделе “Образец” можно ознакомиться с тем, как текст будет отображаться в различных кодировках.

    Выбрав подходящую кодировку, примените ее. Теперь текстовое содержимое документа будет корректно отображаться.

    В случае, если весь текст, кодировку для которого вы выбираете, выглядит практически одинаков (например, в виде квадратов, точек, знаков вопроса), вероятнее всего, на вашем компьютере не установлен шрифт, используемый в документе, который вы пытаетесь открыть. О том, как установить сторонний шрифт в MS Word, вы можете прочесть в нашей статье.

    Выбор кодировки при сохранении файла

    Если вы не указываете (не выбираете) кодировку файла MS Word при сохранении, он автоматически сохраняется в кодировке Юникод, чего в большинстве случаев предостаточно. Данный тип кодировки поддерживает большую часть знаков и большинство языков.

    В случае, если созданный в Ворде документ вы (или кто-то другой) планируете открывать в другой программе, не поддерживающей Юникод, вы всегда можете выбрать необходимую кодировку и сохранить файл именно в ней. Так, к примеру, на компьютере с русифицированной операционной системой вполне можно создать документ на традиционном китайском с применением Юникода.

    Проблема лишь в том, что в случае, если данный документ будет открываться в программе, поддерживающей китайский, но не поддерживающей Юникод, куда правильнее будет сохранить файл в другой кодировке, например, “Китайская традиционная (Big5)”. В таком случае текстовое содержимое документа при открытии его в любой программе с поддержкой китайского языка, будет отображаться корректно.

    Замечание: Учитывая, что Юникод является наиболее распространённым и широким стандартом среди кодировок, при сохранении текстов в других кодировках может возникнуть некорректное, неполное или даже отсутствие отображения определённых файлов. На этапе выбора кодировки при сохранении файла символы и знаки, которые не поддерживаются, выделяются красным цветом, а также появляется уведомление с объяснением причины.

  • Откройте файл, кодировку которого вам необходимо изменить.
  • Откройте меню “Файл” (кнопка “MS Office” ранее) и выберите пункт “Сохранить как”. Если это необходимо, задайте имя файла.
  • В разделе “Тип файла” выберите параметр “Обычный текст”.
  • Нажмите кнопку “Сохранить”. Перед вами появится окно “Преобразование файла».
  • Выполните одно из следующих действий: >
  • Для использования стандартной кодировки, установленной по умолчанию, установите маркер напротив параметра “Windows (по умолчанию)”;
  • Для выбора кодировки “MS-DOS” установите маркер напротив соответствующего пункта;
  • Для выбора любой другой кодировки, установите маркер напротив пункта “Другая”, окно с перечнем доступных кодировок станет активным, после чего вы сможете выбрать необходимую кодировку в списке.

  • Примечание: Если при выборе той или иной (“Другой”) кодировки вы видите сообщение “Текст, выделенный красным, невозможно правильно сохранить в выбранной кодировке”, выберите другую кодировку (иначе содержимое файла будет отображаться некорректно) или же установите галочку напротив параметра “разрешить подстановку знаков”.

    Если подстановка знаков разрешена, все те знаки, которые отобразить в выбранной кодировке невозможно, будут автоматически заменены на эквивалентные им символы. Например, многоточие может быть заменено на три точки, а угловые кавычки — на прямые.

    На этом, собственно, и все, теперь вы знаете, как в Word сменить кодировку, а также знаете о том, как ее подобрать, если содержимое документа отображается некорректно.

    Удаление иероглифов в Microsoft Word

    Научитесь удалять иероглифы в Microsoft Word для улучшения читаемости текста. Этот курс поможет вам повысить эффективность работы с текстовыми документами.

    Вместо текста, иероглифов, квадратов и крякозабры (в браузере, Word, тексте, окне Windows)… Это происходит потому, что текст на странице написан в той же кодировке (подробнее об этом из Википедии) и браузер пытается открыть его в другом.

    Как убрать кодировку текста в ворде?

    вы имеете возможность задать кодировку, которая будет применяться для отображения (декодирования) текста.

    1. Щелкните вкладку Файл.
    2. Щелкните кнопку Параметры.
    3. Щелкните кнопку Advanced.
    4. Перейдите в раздел Общие и установите флажок Подтверждать преобразование формата файла при открытии. …
    5. Закройте и снова откройте файл.

    Как изменить иероглифы в ворде?

    Чтобы изменить кодировку документа Word, когда никакой метод не помогает, вам необходимо сделать следующее: откройте этот документ, затем Файл — Сохранить как — Тип файла (в этом поле выберите формат Обычный текст * .Txt и нажмите Сохранить, тогда откроется окно с кодировкой.

    Почему при копировании текста из PDF иероглифы?

    Это все равно, что пытаться скопировать текст с обычного фото, сделанного на вашем смартфоне… В этом случае текст должен распознаваться специальной программой, например ABBYY FineReader.

    Почему документ Word открывается иероглифами?

    Чаще всего Word автоматически определяет нужную кодировку, но текст не всегда читается… Word — файл в порядке (кодировка правильная)! Изменение кодировки в браузере Когда браузер неправильно определяет кодировку веб-страницы, вы увидите точно такие же иероглифы (см.

    Какую выбрать кириллицу в ворде?

    После открытия файла в Word (или в Word) выберите меню «Файл»; Нажмите «Сохранить как…» и укажите, где разместить документ с правильной кодировкой; Введите имя и нажмите кнопку «Сохранить»; В открывшемся окне атрибутов установите необходимую кодировку (наиболее универсальная — «Юникод»).

    Как изменить формат текста в ворде?

    Форматирование текста в Microsoft Word

  • Выделите текст, который хотите выделить.
  • На вкладке Главная щелкните стрелку Цвет выделения текста. Появится раскрывающееся меню с возможными вариантами цвета.
  • Укажите желаемый цвет выделения. Выбранный текст в документе будет выделен.
  • Как поменять кириллицу на латиницу в ворде?

    В текстовом поле введите русский текст, выберите нужные параметры и нажмите кнопку «Перевести на латынь». Чтобы отменить последнее действие, используйте кнопку «Отменить передачу».

    Как изменить код текста в ворде?

    Затем для шифрования пользователь должен открыть нужный файл Word, перейти на вкладку «Файл», в разделе «Информация» выбрать пункт «Безопасность документа» и подпункт «Зашифровать с помощью пароля». Далее в появившемся окне нужно ввести пароль, затем подтвердить его.

    Как открыть файл формата PDF в Word?

  • Выберите Файл> Открыть.
  • Найдите файл PDF и откройте его (для этого вам может потребоваться нажать кнопку «Обзор» и найти файл в папке).
  • Появится предупреждение о том, что копия файла PDF будет создана и преобразована в поддерживаемый формат. Это не меняет исходный файл PDF. Щелкните ОК.
  • Как изменить Юникод в Windows 10?

    Просмотр региональных настроек для Windows

  • Щелкните Пуск, затем щелкните Панель управления
  • Нажмите Часы, язык и регион
  • Windows 10, Windows 8: щелкните Регион …
  • Щелкните вкладку Администрирование …
  • В разделе «Язык для программ, не поддерживающих Юникод» щелкните «Изменить язык системы» и выберите нужный язык.
  • Нажмите ОК
  • Как исправить иероглифы в программе?

    Итак, чтобы исправить иероглифы, вам следует перейти в панель управления / группу «Часы, язык и регион» / Изменить формат даты, время и число, затем выбрать вкладку «Дополнительно» и выбрать русский или украинский для программ, которые не поддерживают Юникод. После этого остается только перезагрузить систему.

    Как включить кириллицу в Windows 10?

    На клавиатуре нажмите клавиши Win + R, введите regedit и нажмите Enter, чтобы открыть редактор реестра. Затем прокрутите вправо до конца раздела и дважды кликните на параметр ACP. Установите значение 1251 (кодировка для кириллицы), нажмите OK и закройте редактор реестра.

    Как поменять кодировку в Word

    Когда человек работает с программой MS Word, ему редко приходится вникать в нюансы кодирования. Но как только вам нужно поделиться документом с коллегами, есть вероятность, что отправленный пользователем файл может просто не быть прочитан получателем. Происходит это из-за несовпадения настроек и особенно кодировок в разных версиях программы.

    Что представляет собой кодировка и от чего она зависит?

    Для каждого региона кодировка может значительно отличаться. Чтобы понять кодировку, вам необходимо знать, что информация в текстовом документе хранится в виде некоторых числовых значений. Персональный компьютер автономно преобразует числа в текст, используя алгоритм единственного кодирования. Для стран СНГ используется кодировка файлов с названием «Кириллица», а для других регионов, например, Западной Европы, используется «Западная Европа (Windows)». Если текстовый документ был сохранен в кириллической кодировке и открыт в западноевропейском формате, символы будут отображаться совершенно некорректно, представляя бессмысленный набор символов.

    Чтобы избежать недоразумений и облегчить работу, разработчики ввели специальную уникальную кодировку для всех алфавитов — «Unicode». Этот общепринятый стандарт кодирования содержит почти все символы большинства письменных языков нашей планеты. Более того, он преобладает в Интернете, где такое объединение так необходимо для охвата большего числа пользователей и удовлетворения их потребностей.

    «Word 2013» работает только на основе Unicode, что позволяет обмениваться текстовыми файлами без использования сторонних программ и правильных кодировок в настройках. Но часто пользователи сталкиваются с ситуацией, когда при открытии, казалось бы, простого файла вместо текста отображаются только символы. В этом случае Word неправильно определил существующую исходную кодировку текста.

    Ссылка! Некоторые кодировки применимы к определенным языкам. Кодировка «Shift JIS» была разработана специально для японского, «EUC-KR» для корейского и «ISO-2022» и «EUC» для китайского».

    Изменение кодировки текста в «Word 2013»

    Первый способ изменения кодировки в «Word»

    Шаг 1. Запустите текстовый документ и откройте вкладку «Файл».

    Шаг 2. Перейдите в меню настроек «Параметры».

    Шаг 3. Выберите пункт «Дополнительно» и перейдите в раздел «Общие».


    Этап 4. Включите опцию в колонке «Подтверждать изменение формата файла при запуске», кликнув по соответствующему полю.

    Шаг 5. Сохраните изменения и закройте текстовый документ.

    Шаг 6. Снова запустите нужный файл. Перед пользователем появится окно «Преобразование файла», в котором необходимо выбрать пункт «Закодированный текст» и сохранить изменения, нажав «ОК».

    Шаг 7. Появится еще одна область, в которой нужно выбрать пункт кодировки «Другая» и выбрать подходящую из списка. Поле «Пример» поможет пользователю выбрать необходимую кодировку, изменения отображены в тексте. Выбрав подходящий, сохраняем изменения кнопкой «ОК».

    Второй способ изменения кодировки в «Word»

  • Запускаем файл, кодировку текста которого необходимо сделать.
  • Перейдите на вкладку «Файл».
  • Оцените статью
    InternetDoc.ru
    Добавить комментарий