Кодировка

Модератор: Модераторы разделов

sergio
Сообщения: 436
Статус: Интересующийся новичок
ОС: Debian GNU/Linux 4 & 5

Re: Кодировка

Сообщение sergio »

чар есть один "символ из машинного набора символов" и синоним "машинного байта", который на расхожих платформах состоит из 8 бит и эквавалентен одному абстрактному байту (октету). wchar_t есть тип, способный отобразить любой символ из полного, расширенного набора символов, поддерживаемого данной платформой (строгое определение см. в стандарте). Для GNU/Linux wchar_t имеет размер 32бит т.е. 4 чара, используется юникод в представлении (для i386) UTF-32LE ака UCS-4-но-с-платформенным-порядком-байт. Обычные строки char используют ASCII кодировку из 96 или скольки там букв, либо однобайтную расширенную до 220+ букв, совместимую с аски, либо ЮТФ-8 также совместимый с аски. Но в последнем "буква" может быть представлено последовательностью символов (в значении буква), а каждый символ (в значении буква) состоит из одного, двух, трех или более октетов (байт, символов которые чар).
Debian GNU/Linux 4 -- AMD Athlon64 3000+ / Asus 7600GS -- Gnome
Debian GNU/Linux 5 -- Dell (Vostro) 500 (Celeron M560 / iGM965) -- Gnome
Спасибо сказали: