Кодировка |
Символы в компьютере.
Первой кодировкой символов в компьютере была ASCII (аскаяй) -- осталась базовой, но в ней нет русских букв. В аскаяй один символ кодируется одним байтом (число от 0 до 256).
Далее консорциум UNICODE дал номера всем буквам во всём мире, предложив UNICODE-кодировку. В UNICODE один символ кодируется двумя байтами (число от 0 до 65535).
До UNICODE была WINDOWS-1257. В этой кодировке были русские буквы. WINDOWS-1257 = взяли аскаяй + русские буквы в том же байте. Также для других языков, например WINDOWS-1252 и так далее.
После UNICODE появился формат обмена и хранения информации в UNICODE-кодировке: формат UTF-8 -- некий способ запаковать информацию в файл или в интернет (во многих программах компьютеров стоит по умолчанию). В этом формате английские буквы занимают 1 байт, русские 2 байта, французские, например, тоже 2 байта.
Например, если пришло письмо с непонятными символами, то скорее всего это почтовая программа не разобралась с кодировкой в данном письме (применила не ту). Если это MS Outlook, то с помощью Actions --> Other Actions --> Encoding можно выбрать такую кодировку, которая верно с_интерпретирует символы в письме.
|