Кодировка

Символы в компьютере.

 

Первой кодировкой символов в компьютере была ASCII (аскаяй) -- осталась базовой, но в ней нет русских букв.

В аскаяй один символ кодируется одним байтом (число от 0 до 256).

 

Далее консорциум UNICODE дал номера всем буквам во всём мире, предложив UNICODE-кодировку.

В UNICODE один символ кодируется двумя байтами (число от 0 до 65535).

 

До UNICODE была WINDOWS-1257.

В этой кодировке были русские буквы.

WINDOWS-1257 = взяли аскаяй + русские буквы в том же байте.

Также для других языков, например WINDOWS-1252 и так далее.

 

После UNICODE появился формат обмена и хранения информации в UNICODE-кодировке: формат UTF-8 -- некий способ запаковать информацию в файл или в интернет (во многих программах компьютеров стоит по умолчанию). В этом формате английские буквы занимают 1 байт, русские 2 байта, французские, например, тоже 2 байта.

 

Например, если пришло письмо с непонятными символами, то скорее всего это почтовая программа не разобралась с кодировкой в данном письме (применила не ту). Если это MS Outlook, то с помощью Actions --> Other Actions --> Encoding можно выбрать такую кодировку, которая верно с_интерпретирует символы в письме.

 



© 2020 | Анна Петросян | pashelp@yandex.ru