В этой статье объясняется, как писать правильно сформированные XML показав пример. Информационный бюллетень Web Writer написан с использованием формы XML; мы называем это AML или О языке разметки. Хотя это рабочий документ, он не является правильно сформированным или действительным XML-документом.
Хорошо сформированный
Для создания правильно сформированного XML-документа существуют определенные правила:
- Объявление XML должно быть первым в каждом документе.
- Комментарии в теге недопустимы. Комментарии не могут содержать два дефиса подряд, кроме начала и конца комментария.
- Теги должны иметь закрывающий тег или, например, быть закрытыми внутри самого одноэлементного тега.
- Все атрибуты тегов должны быть заключены в кавычки, желательно в двойные кавычки, если сам атрибут не содержит двойных кавычек.
- Каждый XML-документ должен содержать один элемент, полностью содержащий все остальные элементы.
Есть только две проблемы с документом, которые делают его некорректным:
- Первое, что нужно документу AML, - это декларация XML.
- Другая проблема заключается в том, что ни один элемент полностью не охватывает все остальные элементы. Чтобы исправить это, мы добавим внешний элемент контейнера:
Внесение этих двух простых изменений (и обеспечение того, чтобы все элементы содержали только CDATA) превратит неправильно сформированный документ в правильно сформированный документ.
Допустимый XML-документ проверяется на соответствие определению типа документа (DTD) или XML-схеме. Это набор правил, созданных разработчиком или организацией по стандартизации, которые определяют семантику XML-документа. Они сообщают компьютеру, что делать с разметкой.
В случае Язык разметки, поскольку это не стандартный язык XML, такой как XHTML или SMIL, DTD будет создан разработчиком. Это DTD, скорее всего, будет на том же сервере, что и XML-документ, и на него будет ссылка в верхней части документа.
Прежде чем вы начнете разрабатывать DTD или схему для своих документов, вы должны понять, что XML-документ просто из-за того, что он правильно сформирован, является самоописывающим и, следовательно, не требует DTD.
Например, в нашем правильно оформленном документе AML есть следующие теги:
Если вы знакомы с информационным бюллетенем Web Writer, вы можете узнать различные разделы информационного бюллетеня. Это упрощает создание новых XML-документов с использованием того же стандартного формата. Мы всегда помещаем в тег полный заголовок и URL первого раздела в теге.
DTD
Если вам необходимо написать действительный XML-документ для использования данных или их обработки, вы должны включить его в свой документ с помощью тега. В этом теге вы определяете базовый тег XML в документе и расположение DTD (обычно веб-URI).
Например:
Одна хорошая вещь в объявлениях DTD заключается в том, что вы можете объявить, что DTD является локальным для системы, в которой XML-документ находится с «СИСТЕМОЙ». Вы также можете указать общедоступное DTD, например, с документом HTML 4.0:
Когда вы используете оба, вы указываете документу использовать определенное DTD (общедоступный идентификатор) и где его найти (системный идентификатор).
Наконец, вы можете включить внутренний DTD прямо в документ в теге DOCTYPE. Например (это не полный DTD для документа AML):
Схема XML
Чтобы создать действительный XML-документ, вы также можете использовать документ XML-схемы для определения вашего XML. Схема XML - это XML-документ, описывающий XML-документы. Узнайте, как написать схему.
Примечание
Недостаточно просто указать на DTD или XML-схему. XML, который находится в документе, должен соответствовать правилам в DTD или схеме. Использование проверяющего синтаксического анализатора - простой способ проверить, соответствует ли ваш XML правилам DTD. Вы можете найти множество таких парсеров в Интернете.