Какие форматы файлов созданы исключительно в MS Word 2007 и 2010

Форматы файлов и их неполная совместимость — это самая больная тема, связанная с офисными пакетами. Очень многие, если не большинство проблем пользователей выглядят примерно так: «Мне пришел тут файл, а он показывается неправильно! Что делать?»

Вначале разберемся с ситуацией.

Будем считать, что исторически первыми распространенными форматами документов Office были проприетарные форматы Microsoft: DOC для Word, XLS для Excel, PPT для PowerPoint (не будем углубляться в то, что было раньше). Для простоты будем называть их форматами Office 2003.

Форматы Office 2003 были не совсем удобны по нескольким причинам:

  • это — проприетарные форматы, защищенные патентами Microsoft. Соответственно, при создании своего приложения, которое использовало бы эти форматы, вполне могли возникнуть юридические проблемы;
  • сложность и слабая документированность этих форматов. В DOC и XLS предусмотрена своя файловая система, и каждая новая версия Office добавляла новые компоненты в формат, которые Microsoft документировать не спешила. Кроме того, в этом формате были реализованы явно неудачные решения, такие, как технология «Fast Save » из Office 2003 , которая приводила к неконтролируемому распуханию файлов;
  • привязка к конкретным приложениям (то есть Word, Excel и PowerPoint): в DOC/XLS/PPT встречались прямые привязки к структурам соответствующих приложений Microsoft;
  • неполная обратная совместимость: если вы создали файл в Office 2003, то совершенно необязательно, что Office 97 его отобразит правильно. Поэтому как только на предприятии у части сотрудников появлялась новая версия Office, приходилось обновлять Office у всех остальных.

Фактически форматы XLS/DOC/PPT стали эффективным средством борьбы против конкурентов Microsoft Office.

Как ответ на проблему, компанией Sun Microsystems (которая владела OpenOffice) при поддержке консорциума OASIS ( IBM, Novell, Oracle и другие) в начале 2000-х годов был разработан открытый стандарт OpenDocument ( ODT/ODS/ODP и прочие форматы файлов). В 2006 году он был принят как стандарт ISO/IEC 26300, в 2010 году он был принят как стандарт ГОСТ Р ИСО/МЭК 26300—2010, а также был утвержден в качестве государственного стандарта несколькими десятками стран (включая весь Европейский Союз).

Формат OpenDocument оказался очень удачным по сравнению с Office 2003. Ф изически документ OpenDocument — это ZIP- архив, в котором лежат файлы XML и некоторые двоичные файлы (например, изображения). Структура проста, прозрачна и за счет ZIP- сжатия экономит много места на диске по сравнению с DOC/XLS/PPT.

Microsoft осознал происходящее и создал свой «аналог» OpenDocument — формат O ffice Open XML (сокращенно OOXML), который сейчас используется для DOCX, XLSX, PPTX и т. п. (с некоторыми оговорками, но о них ниже). Структурно формат оказался похожим на OpenDocument: файлы OOXML представляют из себя ZIP- архив, в который упакованы файлы XML и двоичные файлы.

А дальше Microsoft с большими скандалами и не с первого раза продвинул свой формат в виде стандарта ISO 29500:2008. При этом организация ISO пришлось наступить на горло собственным принципам, согласно которым не рекомендуется на одну и ту же сущность (в данном случае форматы офисных файлов) иметь два конкурирующих стандарта. Про прочие мелочи, такие, как наличие у Microsoft патентов США на форматы OOXML и возможность юридического преследования любой организации, которая, по мнению Microsoft , нарушит условия лицензионного соглашения, просто промолчим: политика есть политика.

Заметим также, что, вообще говоря, документы современных версий Microsoft Office не соответствуют собственному стандарту Microsoft OOXML. Microsoft поделила формат на две части: «strict» (строг ий OOXML ) и «transitional» (переходный). Переходный формат отличается тем, что в нем есть множество XML- тегов, которые не соответствуют стандарту ( Microsoft объясняет, что они необходимы для обратной совместимости). Как работают с этим тегами приложения Microsoft Office — знает только Microsoft. Вы можете сохранить документ Office в строгом соответствии со стандартом ISO 29500 на OOXML , но для этого придется выбрать специальный формат файла (см. рис.)

Как вы, наверное, догадываетесь, все приложения Microsoft Office по умолчанию сохраняют документы в нестандартном transitional формате, но формально DOCX/XLSX/PPTX стандартизированы.

Поддержка форматов файлов

Таким образом, в настоящее время на рынке фактически осталось три формата офисных документов:

  1. Исторический формат Office 97-2003 ( DOC, XLS, PPT)
  2. Формат Open Document (ODT, ODS, ODP ), поддерживаемый ISO, ГОСТ и государственными органами самых разных стран, включая Россию и Евросоюз
  3. Формат Office Open XML (DOCX, XLSX, PPTX ), который формально стандартизирован, но реально приложения Microsoft сохраняют документы не в соответствии с разработанным ими же стандартом ISO.

Практически все офисные пакеты поддерживают сохранение документов во всех трех форматах. Но разница в том, какой формат является для офисного пакета родным (native). С ф айлом в родном формате по понятным причинам работа происходит намного быстрее и эффективнее. При открытии файла в неродном формате этот файл вначале переконвертируется в родной формат, а при сохранении происходит обратное действие, что требует дополнительного расхода ресурсов. Кроме того, в «неродных форматах» чаще всего поддерживается не весь функционал.

Форматы OpenDocument (ODT, ODS, ODP) являются родными только для LibreOffice/OpenOffice (из распространенных офисных пакетов). Соответственно, с документами по ГОСТ наиболее эффективно будет работать LibreOffice.

Для всех остальных распространенных офисных пакетов, которые здесь рассматриваются ( Microsoft Office, WPS Office, OnlyOffice/ Р7 Офис, Мой Офис) родными форматами являются форматы Office Open XML (DOCX, XLSX, PPTX). Сразу оговоримся, что реально для Microsoft Office родным является его внутренний двоичный формат (в Excel его можно увидеть, если сохранить книгу в формате XLSB), и этот формат наиболее эффективен, но про эти тонкости расскажем чуть позже.

Для Р7 Офис и Мой Офис, которые продвигаются по программе импортозамещения, выбор в качестве родного формата спорного майкрософтовского OOXML вместо ГОСТовского и технически более удачного и стандартизированного OpenDocument представляется достаточно спорным решением. Разработчики обосновывают это тем, что в организациях накоплен большой объем документов в форматах DOCX/XLSX, и для более быстрой работы с ними и был сделан такой выбор. Тут решать им, но рано или поздно отвязываться от форматов Microsoft, на мой взгляд, все-таки придется.

Word 2010 и Word 2007 оказались не полностью совместимы по формату файлов

В разных источниках, в том числе на официальном сайте компании Microsoft, появились сообщения, которые свидетельствуют о серьезной несовместимости форматов между двумя самыми свежими версиями популярного текстового редактора Microsoft Office Word – 2007 и 2010. Как стало известно, при открытии файлов, созданных с помощью Word 2010, в версии Word 2007 на другой машине в документе могут случайным образом исчезать пробелы.

Для иборьбы ситуации сама компания Microsoft предлагает два способа, оба из которых не отличаются изяществом – поменять принтер по умолчанию на виртуальный принтер Adobe PDF или использовать более старый формат Word 2003 для обмена документами между машинами. Обнаруженная несовместимость форматов может оказать огромное негативное влияние на репутацию всего офисного пакета от Microsoft.

Многие годы организации всего мира использовали формат .DOC, а теперь и формат .DOCX для хранения массы внутренних и публичных документов. Хотя формат DOC/DOCX является фактически общепринятым стандартом для текстовых документов, он явно не обеспечивает должной безопасности, если при переносе с одной машины на другую возникают такие искажения в форматировании.

Для быстрого обхода обнаруженной ошибки техническая поддержка Microsoft предлагает, например, задать в качестве принтера по умолчанию виртуальный принтер Adobe PDF (печать в файл формата PDF) на всех машинах, между которыми будет осуществляться обмен документами, если на этих машинах установлены разные версии Word. В среде Windows 7 этот параметр задается для всей системы в целом через панель управления.

Для удобства пользователей компания Microsoft даже опубликовала специальный видеоролик, где показана смена принтера по умолчанию в системе Windows 7 – для других версий Windows операция выполняется аналогичным образом. Кроме смены принтера по умолчанию, можно вообще отказаться от новых возможностей, которые обеспечивает новый формат файлов на базе стандарта XML, принятый в последних версиях Office 2007/2010.

Вы можете задать в качестве формата файлов по умолчанию формат Microsoft Office Word 2003 (.DOC), зайдя в меню Файл/Параметры/Расширенные. Включить старый формат файлов по умолчанию для всех вновь создаваемых файлов, выбрав значение «Все новые файлы» в первом выпадающем списке и пункт «Microsoft Office Word 2003» во втором.

Понятно, что далеко не все организации согласятся вдруг отказаться от XML-формата, принятого в Office 2007/2010, ведь этот формат обеспечивает удобную индексацию документов по всей корпоративной сети. С другой стороны, обнаруженная несовместимость достаточно серьезна, чтобы считать ее незначительной недоработкой в общепринятом формате. Как бы то ни было, найденный дефект в последних версиях редактора Word является лишним поводом задуматься, является ли пакет MS Office лучшим выбором для работы с документами на крупных предприятиях? Конечно, пакеты Word, Excel, PowerPoint, Access и другие приложения Office еще много лет будут задавать тон в корпоративных сетях, но их монополия уже не будет такой непоколебимой, поскольку корпоративным заказчикам явно не понравится быть заложником у одной корпорации. По материалам сайта CNET.

Источник: Mail.ru

Рекомендуйте новость коллегам:

читать всем! стоит ознакомиться не интересно 8 человек проголосовало

Вопросы и ответы в сфере it технологий и настройке ПК

Форматы документов Microsoft Word — от старого DOC до нового DOCX

Документ Microsoft Word представляет собой файл с расширением doc или docx. До 90-х годов XX века расширение doc использовалось для текстовых файлов, которые не содержат разметки. И сейчас можно убедиться, что файл такого типа легко создать с помощью, например, программы «Блокнот».

Правда, он не будет иметь богатого форматирования, но легко открывается программой Ворд, в которой набранному в блокноте тексту можно придать более оформленный вид. Когда корпорация Майкрософт выпустила программу Ворд, разработчики решили использовать в ней расширение doc. К настоящему времени этот текстовый редактор является самым популярным в мире, поэтому файл с расширением doc ассоциируют с этим программным продуктом и называют просто «вордовский формат».

Что такое формат?

Современные форматы «вордовских» документов

Даже бесплатные современные редакторы документов умеют корректно работать с DOCX

Даже бесплатные современные редакторы документов умеют корректно работать с DOCX

Кроме того, сложности могут возникнуть даже при использовании разных версий офисного пакета Майкрософт. Дело в том, что начиная с версии Word 2007 года документ по умолчанию сохраняется с расширением не doc, а docx. Поэтому если установлен пакет офиса, выпущенный ранее, то необходима конвертация для устаревших версий. Конверторы для обеспечения совместимости предлагаются самой компанией Майкрософт (Microsoft Office Compatibility Pack), так что обычно при открытии docx, например, в версии Ворд 2003, сложностей не возникает, но при этом может потеряться часть данных форматирования и возможностей редактирования.

Компания Майкрософт была вынуждена пойти на изменение формата Word под давлением международных организаций, которые требовали подвести его под какие-либо стандарты. Был выбран вариант, основанный на языке разметки XML, который часто используется в документах интернет. Документ с расширением docx имеет некоторые преимущества перед устаревшим форматом, в частности, меньший вес, что имеет значение при передаче документа через интернет. Поэтому при ограниченных скоростях передачи данных пользователям имеет смысл использовать более современный формат Word.

Отблагодари меня, поделись ссылкой с друзьями в социальных сетях:

Оцените статью
InternetDoc.ru
Добавить комментарий