Как преобразовать XML-файл в хорошо оформленный

В этой статье объясняется, как писать правильно сформированные XML показав пример. Информационный бюллетень Web Writer написан с использованием формы XML; мы называем это AML или О языке разметки. Хотя это рабочий документ, он не является правильно сформированным или действительным XML-документом.

Хорошо сформированный

Для создания правильно сформированного XML-документа существуют определенные правила:

  • Объявление XML должно быть первым в каждом документе.
  • Комментарии в теге недопустимы. Комментарии не могут содержать два дефиса подряд, кроме начала и конца комментария.
  • Теги должны иметь закрывающий тег или, например, быть закрытыми внутри самого одноэлементного тега.
  • Все атрибуты тегов должны быть заключены в кавычки, желательно в двойные кавычки, если сам атрибут не содержит двойных кавычек.
  • Каждый XML-документ должен содержать один элемент, полностью содержащий все остальные элементы.

Есть только две проблемы с документом, которые делают его некорректным:

  • Первое, что нужно документу AML, - это декларация XML.
  • instagram viewer
  • Другая проблема заключается в том, что ни один элемент полностью не охватывает все остальные элементы. Чтобы исправить это, мы добавим внешний элемент контейнера:

Внесение этих двух простых изменений (и обеспечение того, чтобы все элементы содержали только CDATA) превратит неправильно сформированный документ в правильно сформированный документ.

Допустимый XML-документ проверяется на соответствие определению типа документа (DTD) или XML-схеме. Это набор правил, созданных разработчиком или организацией по стандартизации, которые определяют семантику XML-документа. Они сообщают компьютеру, что делать с разметкой.

В случае Язык разметки, поскольку это не стандартный язык XML, такой как XHTML или SMIL, DTD будет создан разработчиком. Это DTD, скорее всего, будет на том же сервере, что и XML-документ, и на него будет ссылка в верхней части документа.

Прежде чем вы начнете разрабатывать DTD или схему для своих документов, вы должны понять, что XML-документ просто из-за того, что он правильно сформирован, является самоописывающим и, следовательно, не требует DTD.

Например, в нашем правильно оформленном документе AML есть следующие теги:

Если вы знакомы с информационным бюллетенем Web Writer, вы можете узнать различные разделы информационного бюллетеня. Это упрощает создание новых XML-документов с использованием того же стандартного формата. Мы всегда помещаем в тег полный заголовок и URL первого раздела в теге.

DTD

Если вам необходимо написать действительный XML-документ для использования данных или их обработки, вы должны включить его в свой документ с помощью тега. В этом теге вы определяете базовый тег XML в документе и расположение DTD (обычно веб-URI).

Например:

Одна хорошая вещь в объявлениях DTD заключается в том, что вы можете объявить, что DTD является локальным для системы, в которой XML-документ находится с «СИСТЕМОЙ». Вы также можете указать общедоступное DTD, например, с документом HTML 4.0:

Когда вы используете оба, вы указываете документу использовать определенное DTD (общедоступный идентификатор) и где его найти (системный идентификатор).

Наконец, вы можете включить внутренний DTD прямо в документ в теге DOCTYPE. Например (это не полный DTD для документа AML):

Схема XML

Чтобы создать действительный XML-документ, вы также можете использовать документ XML-схемы для определения вашего XML. Схема XML - это XML-документ, описывающий XML-документы. Узнайте, как написать схему.

Примечание

Недостаточно просто указать на DTD или XML-схему. XML, который находится в документе, должен соответствовать правилам в DTD или схеме. Использование проверяющего синтаксического анализатора - простой способ проверить, соответствует ли ваш XML правилам DTD. Вы можете найти множество таких парсеров в Интернете.

instagram story viewer