Как редактировать метаданные файла Word: пошаговое руководство

HackWare.ru

Этичный хакинг и тестирование на проникновение, информационная безопасность

Main Menu

Как посмотреть метаданные файлов MS Word. Как удалить и редактировать метаданные Word

Метаданные в файлах Word

В файле MS Word и вообще во всех офисных документах MS Office содержится множество метаданных.


Если нужно извлечь метаданные из файлов MS Word без открытия файла в редакторе Word, то можно воспользоваться специальными утилитами.

При этом популярный инструмент mat, который используется для показа и очистки метаданных, работает с файлами MS Word не очень хорошо:

На самом деле, мало что понятно и показанная информация кажется скорее мусором. Но полезные данные имеются, это строки:

docProps/core.xml: harmful content docProps/app.xml: harmful content

В них говориться, что файлы docProps/core.xml и docProps/app.xml содержат потенциально пагубное содержимое. Но самих данных с помощью этой программы мы увидеть не можем.

То программа просто напишет, что не может обработать этот файл:

Имеется ещё одна версия mat2. Попробуем её:

Здесь всё намного лучше, выведены почти все метаданные файла.

Теперь метаданные отлично извлекутся:

Как сделать выводимую в mat2 информацию более читаемой

Можно заметить, что вывод команды mat2 преимущественно состоит из строк, не несущих особой смысловой нагрузки:

create_system: Weird

Выводимая информация станет намного более ясной для восприятия, если мы просто уберём показ этих строк:

Что показывает mat2

Программа mat2 выводит название узлов XML файлов, которые имеют говорящие имена. А именно:

  • AppVersion — версия приложения
  • Application — приложение
  • Characters — всего символов
  • CharactersWithSpaces — всего символов с пробелами
  • DocSecurity — безопасность документа
  • HyperlinksChanged — ссылки изменены
  • Lines — всего строк в документе
  • LinksUpToDate — ссылки обновлены
  • Pages — всего страниц в документе
  • Paragraphs — всего параграфов в документе
  • ScaleCrop — масштабирование/обрезка
  • SharedDoc — совместный документ
  • Template — используемый шаблон
  • TitlesOfParts — имена частей
  • TotalTime — общее время правки
  • Words — всего слов в документе
  • cp:lastModifiedBy — кем последний раз изменён документ
  • cp:lastPrinted — дата последней печати документа
  • cp:revision — всего редакций документа (количество правок и сохранений)
  • dc:creator — кем документ создан

Как посмотреть метаданные документов MS Office без дополнительных программ

Медиафайлы при распаковке находятся в папке /word/media/.

Программа mat2 не смогла найти в изображении метаданных:

mat2 -s file3/word/media/image1.jpeg No metadata found

Программа mat также ничего не нашла:

mat -d file3/word/media/image1.jpeg [+] File file3/word/media/image1.jpeg : No harmful metadata found

Видимо, при вставке изображений в документы Word, они пересохраняются программой и при этом все метаданные теряются. Но их хотя бы можно просто открыть и посмотреть:

Метаданные документа содержаться в файлах docProps/core.xml и docProps/app.xml. Я открыл их в IDE NetBeans и для удобства чтения выбрал опцию форматирования документа, поскольку в начальном виде весь документ записан в одну строку, трудную для восприятия.

Файл docProps/core.xml:

Файл docProps/app.xml:

В файле core.xml имеются даты создания и изменения, которые не выводит даже программа mat2. Возможно, есть ещё какие-то поля, которые невозможно увидеть кроме как открыв эти файлы.

В каком файле Word содержаться макросы

Информация о макросах записана в файл /word/vbaData.xml, а сами макросы сохранены в /word/vbaProject.bin — этот файл является бинарным.

В каком файле Word записан текст документа

Текст документа сохраняется в файл /word/document.xml. В этом документе используется особая разметка на основе открывающихся и закрывающихся тегов и их свойствах.

Как очистить метаданные файла MS Word

Очистить метаданные документов MS Office, в том числе Word, можно прямо в самой программе для редактирования. Далее показано на примере Word.

В меню нажмите Файл:

Далее во вкладке Сведения найдите кнопку Поиск проблем и в выпадающем меню выберите Инспектор документов:

Если документ не сохранён, то перед анализом будет предложено сохранить его.

Нажмите кнопку Проверить:

Обратите внимание на пункт Свойства документа и персональные данные — при желании, нажмите кнопку Удалить всё:

Удаление метаданных офисных файлов в Linux

Программа mat вроде бы как успешно удаляет метаданные из файла:

Об этом говорит вывод:

Но полученный файл невозможно открыть ни в одной программе…

Программа mat2 успешно справилась с задачей и удалила все метаданные:

Кстати, таким образом можно не только удалять, но и спуфить (подменять) метаданные офисных документов:

Обратите внимание на даты создания, изменения, печати и номер редакции:

Много лет назад аналогичный «разбор» и «сборку» файлов я делал даже на PHP (я редактировал содержимое файлов Word для целей обхода Антиплагиата) — рабочие файлы Word получались при упаковке их с помощью класса ZipArchive при использовании метода сжатия по умолчанию.

Заключение

Метаданные могут содержать важную информацию, вплоть до ФИО автора документа, поэтому им нужно уделять особое внимание.

В плане показа и очистки метаданных из документов MS Office такими инструментами как mat и mat2, то первая их не показывает и портит файл при очистке, вторая их показывает, и успешно очищает файл.

Самый простой способ очистить метаданные в документе Word и в других офисных программах — сделать это прямо в соответствущем редакторе MS Office.

В следующей статье мы будем разбираться с метаданными файла LibreOffice.

  • Время создания, доступа и изменения файла: что это, как их узнать и изменить. Как найти файлы по их времени создания, изменения или последнему открытию
  • Как просмотреть или отредактировать метаданные pdf или изображениях из командной строки Linux
  • Как удалить метаданные файла на Linux
  • Insiderer (мощная программа по извлечению всей возможной метаинформации)
  • mat (набор инструментов анализа/удаления метаданных)
  • Геолокация фотографий по GPS меткам в метаданных (онлайн сервис)
  • mat2: новая версия программы для удаления метаданных
  • Массовый поиск геотэгов на сайтах и в локальном хранилище

Связанные статьи:

  • Метаданные файлов LibreOffice: извлечение, удаление и редактирование (100%)
  • Время создания, доступа и изменения файла: что это, как их узнать и изменить. Как найти файлы по их времени создания, изменения или последнему открытию (66.3%)
  • Как пользоваться Kali Linux в WSL (подсистеме Windows для Linux): подборка лучших программ (ч. 2) (63.2%)
  • Программа для удаления деликатной информации из документа (58.3%)
  • Как пользоваться Whonix (операционная система для анонимности, приватности и безопасности) (56.7%)
  • Расшифровка хранимых в Windows паролей с помощью mimikatz и DPAPI (RANDOM — 0.2%)

факультете информационной безопасности от GeekBrains? Комплексная годовая программа практического обучения с охватом всех основных тем, а также с дополнительными курсами в подарок. По итогам обучения выдаётся свидетельство установленного образца и сертификат. По этой ссылке специальная скидка на любые факультеты и курсы!

Как изменить метаданные файла ворд

Спонсор хостинга сайта:

Внимание! Материалы сайта не являются руководством к действию. Автор не несет ответственности за Ваши действия.

Учимся списывать или Пара слов о метаданных и уроках информатики

Во многих школах ученикам приходится делать практические и проектные работы по информатике, зачастую в формате текстовых документов Word, таблиц Excel или презентаций PowerPoint. Наверняка у каждого второго школьника в подобной ситуации возникает желание списать (вернее, скачать) такую работу, однако опытный учитель ИКТ без труда узнает о таком. Если что, я тебе этого не рассказывал, но вот в этой статье речь как раз о том, как обмануть «училку».

Да, конечно, нужно помнить, что все эти способы фактически являются нарушением правил, так что если учитель все-таки узнает об этом, наша авторская коллегия не несет никакой ответственности.

Способ №1. ППР – Проще пареной репы

Некоторые учителя смотрят только на содержимое файла, хотя буквально под носом лежит информация, по которой можно определить наверняка, что две работы фактически являются двумя копиями одного и того же файла. Если это твой случай, то можно вообще не париться – просто поменяй некоторые слова на синонимы и передвинь картинки и таблицы.

Да, не забудь проверить, соответствует ли эта работа условиям, названным учителем (например, тип/цвет/размер шрифта, поля и прочее). Хорошим тоном считается соответствие ГОСТу (на 01.09.2019 актуален ГОСТ Р 7.0.97-2016, однако многие учителя все еще придерживаются устаревшего ГОСТ Р 6.30-2003). Некоторые учителя считают это обязательным, поэтому стоит разобраться в правилах оформления документа. В лучшем случае – похвалят, в худшем – не снизят оценку.

Способ №2. Если все плохо

Если твой учитель информатики долго работает в школе и знает, как еще можно проверить авторство, то придется дочитать статью до конца.

Во всех документах Microsoft Office помимо видимого содержимого есть еще много всякой служебной информации, как то: автор, дата/время создания, дата/время последнего сохранения, длительность редактирования. Эта информация называется метаданными. Запомни это слово, чтобы потом похвастаться большим лексиконом перед друзьями.

Возьмем учебный пример: черновик одной из предыдущих статей и назовем его Дубишкин-ПР1.docx – документ Microsoft Word 2010. Теперь я поделюсь им со своим другом, Ивановым, и с подругой Сидоровой. Таким образом, у учителя среди прочих окажутся три работы: Дубишкин-ПР1, Иванов-ПР1, Сидорова-ПР1.

Первое, что может сразу насторожить, это одинаковая дата последнего изменения. Чтобы этого избежать, Иванов и Сидорова перед отправкой работы учителю внесли незначительные изменения.

Но если учитель сравнит свойства этих файлов, он увидит, что файл был создан одним и тем же пользователем в один и тот же момент времени. Подозрительно, правда?

В том же окне (Свойства файла) есть интересная надпись – Удаление свойств и личной информации. Иванов решил ей воспользоваться и вот, что он получил:

Да, имена пользователей удалились, но дата создания и дата последнего сохранения осталась. Да и пустое поле «Кем сохранён» весьма настораживает.

Но Сидорова поступила умнее – дочитала статью до конца. И это было весьма правильно, ведь у нас припрятаны еще два рояля в кустах

Способ №2.1

Самый простой вариант – создать новый файл такого же типа (docx) и скопировать в него все содержимое чужой работы. Хвала небесам, история копирования из других документов не сохраняется в области служебной информации. Заодно хорошо бы вспомнить, что к оформлению работы наверняка предъявляются какие-либо требования (например, соответствие государственным стандартам ГОСТ). Если вдруг возникнут проблемы, можно перейти к более сложному, но и более интересному способу.

Способ №2.2. Для самых умных и самых наглых

Оказывается, любой docx-документ – это простой zip-архив, который просто назван иначе. То есть, изменив расширение файла с docx на zip, мы получим доступ к метаданным файла.

В архиве нас интересует файл core.xml, находящийся в папке docProps. Если открыть его с помощью блокнота, перед тобой предстанет файл, содержащий те самые проклятые свойства, которые не дают нам жизни.


После редактирования файла, файлы нужно слова объединить в zip-архив и изменить расширение обратно на docx. Где исправить общее время редактирования, я не нашел, поэтому теперь можно открыть документ в Word, исправить какое-нибудь одно слово и подождать некоторое время. Затем исправить слово обратно и сохранить документ. Profit!

После проведения всех махинаций не забудь сравнить свою работу с первоисточником так, как я показал на примере работ Дубишкина, Иванова и Сидоровой.

Способ №3

В Сети существуют источники, где можно найти специально испорченный файл. Опытный учитель наверняка заподозрит неладное, но иногда этот способ может позволить отсрочить сдачу работы.

Изменение имени автора в документе Microsoft Word

Каждый раз, когда вы создаете новый текстовый документ в MS Word, программа автоматически устанавливает для него ряд свойств, в числе которых и имя автора. Свойство “Автор” создается на основе сведений о пользователе, которые отображаются в окне “Параметры” (ранее “Параметры Word”). Кроме того, доступные сведения о пользователе — это также источник имени и инициалов, которые будут отображаться в иборьбых и комментариях.

Примечание: В новых документах имя, которое отображается в качестве свойства “Автор” (показано в сведениях о документе), берется из раздела “Имя пользователя” (окно “Параметры”).

Изменение свойства “Автор” в новом документе

  1. Нажмите кнопку “Файл” (“Microsoft Office” ранее).
  2. Откройте раздел “Параметры”.
  3. В появившемся окне в категории “Общие” (ранее “Основные”) в разделе “Личная настройка Microsoft Office” задайте необходимое имя пользователя. Если это потребуется, измените инициалы.
  4. Нажмите “ОК”, чтобы закрыть диалоговое окно и принять изменения.

Изменение свойства “Автор” в существующем документе

  1. Откройте раздел “Файл” (ранее “Microsoft Office”) и нажмите кнопку “Свойства”.

Примечание: Если вы используете устаревшую версию программы, в разделе “MS Office” сначала нужно выбрать пункт “Подготовить”, а затем уже перейти в “Свойства”.

Совет: Рекомендуем обновить Word, воспользовавшись нашей инструкцией.

Урок: Как обновить Ворд

Примечание: Если вы измените раздел свойств “Автор” в существующем документе в области сведений о нем, это не повлияет на сведения о пользователе, которые отображаются в меню “Файл”, разделе “Параметры” и на панели быстрого доступа.

Вот, собственно, и все, теперь вы знаете, как изменить имя автора в новом или уже существующем документе Microsoft Word.

Оцените статью
InternetDoc.ru
Добавить комментарий