Проблемы с кодировкой
Новичок в делах веб-мастеринга может столкнуться с трудностями при работе с кодировками документов. Однако если обстоятельно изучить вопрос, можно легко избежать каких-либо казусов.
В Рунете используются в основном следующие кодировки: UTF-8, windows-1251, koi8-r. Последние две являются кириллическими, т. е. они содержат набор символов латиницы и кириллических символов. Кодировка UTF-8 позволяет создавать страницы сайта, содержащие символы любых языков. Секрет в том, что в UTF-8 символы занимают 2 байта, а не 1, как в других кодировках.
В настоящее время большинство CMS используют кодировку UTF-8. Редактирование файлов в UTF-8 обычно не вызывает трудностей, но они, все же, бывают. Например, если вы работаете в ОС Windows, а для редактирования файлов PHP-скриптов используете текстовый редактор Notepad или некоторые другие. Дело в том, что такой редактор сохраяет файлы, добавляя в начало лишний символ – сигнатуру BOM. В результате модификации с помощью такого редактора, скажем, скриптов популярного движка блогов Wordpress, вы получите при обращению к своему сайтв ошибку: «cannot modify header information». Справиться с проблемой помогают специальные программы, типа utf8-bom-remover. Но более грамотный способ – использовать альтернативные редакторы, например Notepad++, в которых можно сохранять файлы в любых кодировках, в т.ч. в UTF-8 без bom.
