До введения HTML5, установка кодировки символов в документе с элементом требует, чтобы вы написали несколько многословную строку, показанную ниже. Это элементы Meta Charset, если вы использовали HTML4 на своей веб-странице:
Что важно отметить в этом коде, так это кавычки, которые вы видите вокруг содержание атрибут: содержание ="текст / html; кодировка = iso-8859-1". Как и все атрибуты HTML, эти кавычки определяют значение атрибута, указывая, что вся строка текст / html; кодировка = iso-8959-1 это содержание этого элемента. Это правильный HTML, и именно так должна была быть написана эта строка. К тому же он громоздкий, длинный и некрасивый! Это также не то, что вы, вероятно, припомните!
В большинстве случаев веб-разработчикам приходилось копировать и вставлять этот код с одного сайта на любой новый, который они разрабатывали, потому что написание этого с нуля требовало многого.
HTML5 убирает лишние "вещи"
HTML5 не только добавил некоторые новые элементы в язык, но и значительно упростил большую часть синтаксиса HTML, включая элемент Meta Charset. С HTML5 вы можете добавить свою кодировку символов с гораздо более легким для запоминания синтаксисом для
МЕТА элемент, который вы видите ниже:Сравните этот упрощенный синтаксис с тем, что мы написали в начале этой статьи, старым синтаксисом, используемым для HTML4, и вы увидите, насколько проще писать и запоминать версию HTML5. Вместо того, чтобы копировать и вставлять это с существующего сайта в любой новый, над которым вы работали, это абсолютно то, что вы, как интерфейсный веб-разработчик, должны помнить. Эта экономия времени может быть небольшой, но если учесть другие области синтаксиса, упрощенные в HTML5, экономия действительно увеличивается!
Всегда включайте кодировку символов
Вы всегда должны включать кодировку символов для своих веб-страниц, даже если вы никогда не собираетесь использовать какие-либо специальные символы. Если вы не включите кодировку символов, ваш сайт станет уязвимым для атаки межсайтового скриптинга с использованием UTF-7.
В этом сценарии злоумышленник видит, что на вашем сайте не определена кодировка символов, поэтому он обманом заставляет браузер думать, что кодировка символов страницы - UTF-7. Затем злоумышленник внедряет скрипты в кодировке UTF-7 на веб-страницу, и ваш сайт взламывается. Это проблематично для всех, от вашей компании до посетителей. Хорошая новость заключается в том, что этой простой проблемы можно избежать - не забудьте добавить кодировку символов на все свои веб-страницы.
Куда добавить кодировку символов
Кодировка символов для веб-страницы должна быть первой строкой вашего HTML-кода.
элемент. Это гарантирует, что браузер знает, что такое кодировка символов, прежде чем он сделает что-либо еще на странице, кроме определения doctype и идентификации того, что это страница HTML. Ваш HTML должен читать:
...
Использование заголовков HTTP для дополнительной безопасности
Вы также можете указать кодировку символов в заголовках HTTP. Это даже более безопасно, чем добавление его на страницу HTML, но вам потребуется доступ к конфигурациям сервера или .htaccess. файлы, что означает, что вам может потребоваться работать с поставщиком услуг хостинга вашего веб-сайта, чтобы получить такой доступ, или попросить их внести изменения для ты. Доступ - это проблема. Само изменение простое, поэтому любой хостинг-провайдер сможет относительно легко внести это изменение за вас.
Если вы используете Apache, вы можете установить набор символов по умолчанию для всего вашего сайта, добавив: AddDefaultCharset UTF-8 к вашему корню .htaccess файл. Набор символов Apache по умолчанию: ISO-8859-1.