Tак уж сложилось, что в русский текст может кодироваться различно...... |
Наиболее логически правильная кодировка, на мой взгляд, это
KOI-8. В основе ее лежит ASCII с добавлением единицы в седьмой бит, причем строчные буквы
латиницы и кириллицы меняются местами. Например,
латинская буква "A" имеет шестнадцатеричный код 0x41, код же русской буквы
"а" в KOI-8 будет равен: 0x41 OR 0x80 = 0xC1. Если в кодах текста на наи KOI-8 обнулить
бит, то получим довольно читабельный текст на латинице, например, фраза "Как
дела, приятель" после такой обработки обнуления будет выгладеть как "kAK
DELA, PRIQTELX". Приведенный на данном сайте Русский Notepad имеет подобную
функцию "обнуления".
Традиционно KOI-8 доминирует в IRC, News Group'ах.
Другая кодировка, широкоиспользуемая особенно в WWW это windows-1251,
она используется в 16-разрядной Windows и по организации очень напоминает
систему кодировки русских символов Macintosh, коды маленьких букв вообще
совпадают. Кто у кого содрал я не знаю, мне кажется, что Microsoft. Идея
кодировок проста - коды возрастают в алфавитном порядке, как и в ASCII.
Впрочем та же идея была использована ранее в кодироке DOS и ISO-8859-5.
Шестнадцатеричные коды Windows-1251 Шестнадцатеричные коды Macintosh Еще одна кодировка, практически малоиспользуемая. В принципе можно продолжать и продолжать. А вот это совершенно новая система, когда каждый символ кодируется 16 разрядным словом, с одной стороны удобно: каждому национальному алфавиту выделено свое кодовое пространство, с другой дополнительная путанница при перекодировках. |