Кодировки вообщем и utf8 в частности. (Обсуждается переход на utf8)

Любые разговоры которые хоть как-то связаны с тематикой форума

Модератор: Модераторы разделов

ugoday
Сообщения: 16

Кодировки вообщем и utf8 в частности.

Сообщение ugoday »

2Ай-ай-ай

>Добавляем возможность безболезненного выбора кодировки (UTF-8, koi-8, cp1251);

Восьмибитные кодировки - пережитки страшного прошлого. Сейчас нет _ни одной_ причины в поддержке их существования ( исключая может быть старые терминалы). Было бы хорошо если б дистростроители договорились и запретили их нафиг.
Увидешь биллгейца - не убивай его, он мой!
Спасибо сказали:
Аватара пользователя
Ай-ай-ай
Сообщения: 257
Контактная информация:

Re: Кодировки вообщем и utf8 в частности.

Сообщение Ай-ай-ай »

“Пришел порутчик Ржевский и все опошлил.”

1.“>Добавляем возможность безболезненного выбора кодировки (UTF-8, koi-8, cp1251);

Восьмибитные кодировки - пережитки страшного прошлого. Сейчас нет _ни одной_ причины в поддержке их существования ( исключая может быть старые терминалы). Было бы хорошо если б дистростроители договорились и запретили их нафиг. ”

Ну alv еще тебе уши промоет насчет “koi8 is dead” ... От себя отвечу, что Mandrake нестабильно ведет себя с UTF-8 ... а ASP вообще базируется на cp1251 ... Неужели все настолько тупые и только ЮгАдАй у нас умный ...
"Я не червонец, чтобы нравиться всем!"
(с) Костя Кинчев ...
--------------------
Mandrake 10.1 PowerPack+; kernel 2.6.8.1; KDE 3.4.1
--------------------
"Пешу как хачу!" ... "Руки прочь от падонкафф!"
--------------------
http://www.livejournal.com/~_oparish_/
Спасибо сказали:
Аватара пользователя
alv
Бывший модератор
Сообщения: 7274
Статус: Пенсионер в законе
ОС: Cintu
Контактная информация:

Re: Кодировки вообщем и utf8 в частности.

Сообщение alv »

2ugoday
Интересно, а каким образом 8-битная кодировка может запретить мне писать в одном тексте на русском и эсперанто? Или эсперансисты уже от латинской графики отказались? Нужно спросить - у меня на работе одна девушка есть эсперансистка:-)
Вот на русском и древнеегипетском - пожалуй, запретит, но я древнеегипетского все равно не знаю:-)
Спасибо сказали:
Аватара пользователя
t.t
Бывший модератор
Сообщения: 7390
Статус: думающий о вечном
ОС: Debian, LMDE

Re: Кодировки вообщем и utf8 в частности.

Сообщение t.t »

(alv @ Tuesday, 10 August 2004, 10:20) писал(а):Вот на русском и древнеегипетском - пожалуй, запретит, но я древнеегипетского все равно не знаю:-)
Насчёт эсперанто ugoday пожалуй таки не прав, но про древнеегипетский -- это ты перегибаешь. Тот же французский+русский/украинский -- уже 8 бит не хватит.
P.S. Это я не к тому, что всё должно быть юникодное.
¡иɯʎdʞ ин ʞɐʞ 'ɐнɔɐdʞǝdu qнεиж
Спасибо сказали:
Аватара пользователя
alv
Бывший модератор
Сообщения: 7274
Статус: Пенсионер в законе
ОС: Cintu
Контактная информация:

Re: Кодировки вообщем и utf8 в частности.

Сообщение alv »

(t.t @ Tuesday, 10 August 2004, 10:55) писал(а):
(alv @ Tuesday, 10 August 2004, 10:20) писал(а):Вот на русском и древнеегипетском - пожалуй, запретит, но я древнеегипетского все равно не знаю:-)
Насчёт эсперанто ugoday пожалуй таки не прав, но про древнеегипетский -- это ты перегибаешь. Тот же французский+русский/украинский -- уже 8 бит не хватит.
P.S. Это я не к тому, что всё должно быть юникодное.



Французский + рус/укр (без английского) - ИМХО решаемо, с аглицким - похуже будет. А код "г с чубом" с чем совпадает?

И вообще, я не против UTF - если нужно больше трех языков, это единственный выход. Но если трех хватает (английский, русский, русский матерный) - то без нее вполне обойтись можно.
Спасибо сказали:
Аватара пользователя
t.t
Бывший модератор
Сообщения: 7390
Статус: думающий о вечном
ОС: Debian, LMDE

Re: Кодировки вообщем и utf8 в частности.

Сообщение t.t »

(alv @ Tuesday, 10 August 2004, 11:55) писал(а):Французский + рус/укр (без английского) - ИМХО решаемо, с аглицким - похуже будет.
Честно говоря не совсем понял. Французский алфавит ведь включает в себя английский, так что какая может быть разница с точки зрения кодировки?
(alv @ Tuesday, 10 August 2004, 11:55) писал(а):А код "г с чубом" с чем совпадает?
Код заглавного в koi8-u -- с буквой "ое" в iso-8859-15 и 16 (а в первой исо этой буквы и вовсе нет), которая как раз используется во французском, строчного -- со знаком евро в тех же кодировках.

Да дело не только (и не столько) в украинском, т.к. кроме "г с чубом" (которая, кстати, не так уж часто нужна) остальные три спецефичные именно для украинского буквы -- i, i с двумя точками и "е" (которое э наоборот) -- в исошных кодировках соответствуют редкоиспользуемым значкам. Но все акцентированные французские буквы в любой кодировке (и iso-8859-*, и даже 125?) соответствуют koi-каким русским буквам. Так что единственно как решаемо -- это изобретением собственной кодировки и перекодированием налету.
¡иɯʎdʞ ин ʞɐʞ 'ɐнɔɐdʞǝdu qнεиж
Спасибо сказали:
ugoday
Сообщения: 16

Re: Кодировки вообщем и utf8 в частности.

Сообщение ugoday »

(alv @ Tuesday, 10 August 2004, 11:20) писал(а):Дистрибутив мечты - Archlinux, пересобранный собственноручно

2ugoday
Интересно, а каким образом 8-битная кодировка может запретить мне писать в одном тексте на русском и эсперанто? Или эсперансисты уже от латинской графики отказались? Нужно спросить - у меня на работе одна девушка есть эсперансистка:-)
Вот на русском и древнеегипетском - пожалуй, запретит, но я древнеегипетского все равно не знаю:-)


В esperanto есть символы, которых нет в латинском алфавите. Это c^ (ч), g^(джь), h^ (х), j^ (ж), s^ (ш), u^ (у краткое). Так что 8-битные кодировки - маст дай. И всё таки хочется услышать доводы сторнников зоопарка руских кодировок. Зачем этот бардак нужен? Довод, что мол пока что не весь софт с юникодом хорошо работает, отметается как несерьёзный. Как только юникод введут повсеместно, отдельные прикладные софтинки сразу исправят. Imho.
Увидешь биллгейца - не убивай его, он мой!
Спасибо сказали:
Аватара пользователя
Ай-ай-ай
Сообщения: 257
Контактная информация:

Re: Кодировки вообщем и utf8 в частности.

Сообщение Ай-ай-ай »

Увы, но давайте ближе к фактам ...
Помните первое правило сисадмина: “Работает – не трогай.”
Если с КОЕЙ у меня в МДК все нормально, то зачем мне ставить UTF? Когда все перейдут, перейду сам ...
Мне не надо египетского, эсперанто и ... даже немецкого ...
Мне вполе хватает перечисленных alv-ом: английского, русского и русского матерного ...
"Я не червонец, чтобы нравиться всем!"
(с) Костя Кинчев ...
--------------------
Mandrake 10.1 PowerPack+; kernel 2.6.8.1; KDE 3.4.1
--------------------
"Пешу как хачу!" ... "Руки прочь от падонкафф!"
--------------------
http://www.livejournal.com/~_oparish_/
Спасибо сказали:
Аватара пользователя
alv
Бывший модератор
Сообщения: 7274
Статус: Пенсионер в законе
ОС: Cintu
Контактная информация:

Re: Кодировки вообщем и utf8 в частности.

Сообщение alv »

(ugoday @ Tuesday, 10 August 2004, 13:00) писал(а):В esperanto есть символы, которых нет в латинском алфавите. Это c^ (ч), g^(джь), h^ (х), j^ (ж), s^ (ш), u^ (у краткое). Так что 8-битные кодировки - маст дай. И всё таки хочется услышать доводы сторнников зоопарка руских кодировок. Зачем этот бардак нужен? Довод, что мол пока что не весь софт с юникодом хорошо работает, отметается как несерьёзный. Как только юникод введут повсеместно, отдельные прикладные софтинки сразу исправят. Imho.

На счет эсперанто - понял, не учел (за незнанием).

А сторонников зоопарка русских кодировок нет. Я всегда выступал за koi (при всех ее многочисленных недостатках) именно потому, что (ИМХО) лучше один плохой стандарт, чем два хороших (и тем более четыре очень хороших). Как только UTF станет таким одним стандартом - так все дружно на нее и побежим:-).

Хотя, если уж совсем глубоко копать, то юникод - тоже не панацея от всех бед. Ибо, в отличие от эсперанто, его не профессиональные лингвисты придумывали:-)
Спасибо сказали:
Аватара пользователя
t.t
Бывший модератор
Сообщения: 7390
Статус: думающий о вечном
ОС: Debian, LMDE

Re: Кодировки вообщем и utf8 в частности.

Сообщение t.t »

2 ugoday Насчёт всех ваших предыдущих споров с Ай-ай-аем не возражу, несмотря на неуважительную форму, т.к. по всем пунктам согласен; а вот насчёт юникода проясните: вы что, хотите юникодную локаль?
¡иɯʎdʞ ин ʞɐʞ 'ɐнɔɐdʞǝdu qнεиж
Спасибо сказали:
ugoday
Сообщения: 16

Re: Кодировки вообщем и utf8 в частности.

Сообщение ugoday »

2t.t

Верно, я хочу ru_RU.UTF-8 Более того, я хочу чтобы юникод задавил все остальные кодировки нафиг. Я сегодня Inferno скачал, и поставил. (Если кто не знает, это новая ось от Белл Лабс. Целиком основана на юникоде). И сразу после установки я могу читать (и читаю) юникодные текстовые файлы на руском языке. Это удобно.

2alv

>А сторонников зоопарка русских кодировок нет.

Конечно, просто разные люди, считают стандартной разные кодировки :(.

Кроме того, зоопарк 8 битных кодировок также вреден. Вот мне например что делать? Какую локаль мне поставить, чтобы работать и с руским, и с эсперанто? Как мне общаться с внешним миром? На каждый чих автоперекодировщик ставить? Неудобно это. Повторяю, проблемы с 8 битными кодировками принципиальные, а с юникодом - технические.

>Как только UTF станет таким одним стандартом - так все дружно на нее и >побежим:-).

Вы не находите, что здесь есть небольшое логическое противоречие? ;)

2Ай-ай-ай

>Помните первое правило сисадмина: “Работает – не трогай.”

Всё таки интересно, что вы делаете под юниксами.
P.S. Первое правило сисадмина - это "лежащий на столе диск с данными, выгляди точно также как диск без данных"

>Не выучил я эсперанто

Очень жаль. Изумительный по красоте и изяществу язык. К тому же учится за несколько недель. Еслиб юниксовая документаци была на эсперанто, это было бы здорово.

>Насчет кодировок ... это сложилось исторически

Стало быть научно-технический прогресс вы отрицаете?

> Мне вполне хватает 3-х

Зачем? Какая _ПОЛЬЗА_ от этого бардака? Вред очевиден, а вот польза.
Увидешь биллгейца - не убивай его, он мой!
Спасибо сказали:
Аватара пользователя
deisler
Сообщения: 250

Re: Кодировки вообщем и utf8 в частности.

Сообщение deisler »

Практически полностью поддерживаю ugoday
Всех благ.
Спасибо сказали:
snake
Бывший модератор
Сообщения: 677
Контактная информация:

Re: Кодировки вообщем и utf8 в частности.

Сообщение snake »

(ugoday) писал(а):И всё таки хочется услышать доводы сторнников зоопарка руских кодировок. Зачем этот бардак нужен?

Прежде чем добиваться аргументов огласите весь список русского 8-битного "зоопарка" пжалуста! Загибаю пальцы: koi, cp866 (она же alt), cp1251 и... и..., пожалуй, все!!! всякие разные ископаемые древности вроде альтернативной гостовской или болгарской кодировок в расчет не берем (реально ли их сейчас встретить?) экзотику вроде iso-что-то-там посылаем тем же лесом по той же причине, и что имеем в сухом остатке? Одну кодировку исконно (или очень близко к исконно) используемую для кирилицы и два пораждения микромягкой конторы (cp866 и cp1251) один из которых уже почти отошел в историю.
(ugoday) писал(а):Довод, что мол пока что не весь софт с юникодом хорошо работает, отметается как несерьёзный. Как только юникод введут повсеместно, отдельные прикладные софтинки сразу исправят. Imho.

Ну нет уж, пусть сначала исправят то, чем я пользуюсь, а уж потом так и быть -- я подумаю, хотя и ни чего не обещаю.

Вы лучше приведите доводы в пользу юникода... Возможность совмещать французкий с нижегородским в одной служебной записке и приправлять все это изриченями тов. Мао на языке оригинала для меня (и еще 98% населения) никакой ценности не представляет.
В реальности все не так, как на самом деле...
JabberID: zmeyk@jabber.ru
Спасибо сказали:
Аватара пользователя
alv
Бывший модератор
Сообщения: 7274
Статус: Пенсионер в законе
ОС: Cintu
Контактная информация:

Re: Кодировки вообщем и utf8 в частности.

Сообщение alv »

2ugoday

по пунктам:

1)Верно, я хочу ru_RU.UTF-8 Более того, я хочу чтобы юникод задавил все остальные кодировки нафиг.

Так и флаг Вам (и Вашим единомышленникам) в руки. Давите все iso, koi, alt, cp1251 - а мы, как прихлебные плюралисты, с удовольствием к Вам (победителям) присоеднимся. Как только задавите. И не говорите мне, что тут "логическое противоречие": во-первых, истинным пост-советским пох...ам все эти противоречия пох..., а во вторым - см. далее.

Оффтопик: вспомнилось из времен перестройки: Что общего между Познером и Донахью? - То, что им все ПонаХью:-)

2) Я сегодня Inferno скачал, и поставил. (Если кто не знает, это новая ось от Белл Лабс. Целиком основана на юникоде). И сразу после установки я могу читать (и читаю) юникодные текстовые файлы на руском языке.

Inferno - а) ОСь не такая уж и новая (года три ей точно есть), б) не совсем ОСь, а в)строго говоря, совсем не ОСь, а скорее ближе к виртуальной машине (ОСь - это Plan9). И юникод, насколько я понимаю, делался не для того, чтобы русский текст в юникоде же читать, а чтобы читать его в _любых_ кодировках. А вот с этим-то в Inferno и есть некоторый напряг (на ныне называемом что-то по этому поводу было, не тобой ли Тихон - tt - пощено?). Я же в своем KDE при ретроградной локали koi8 спокойно читаю письма в любой кодировке (уже перестал обращать внимание, в какой именно), веб-страницы, тексты в kate могу поправить при необходимости что в cp1251, что в utf. Вот это и есть постепенное, спокойное, без мастдаев и форев, задавливание.

3) "Как только UTF станет таким одним стандартом - так все дружно на нее и >побежим:-)." (это из меня) - Вы не находите, что здесь есть небольшое логическое противоречие?

Как было сказано выше - с противоречиями мы обходимся, как Познер с Донахью. Это во-первых. А если по существу... Я человек не очень молодой, и на моей памяти стандартов всяких сменилось... что Познеров. Было время, когда слово "черт" нужно было писать обязательно через _о_, потом - пренепременнейше через _е_, а там еще временами и е с точками вклинивалось (то самое, которое tt защищает). И что же, Вы думаете, что я все брошу и побегу ставить себе локаль utf8 только потому, что все решили, будто это прогрессивно? Нет уж, я подожду, пока Вы все остальные кодировки (с локалями) действительно задавите:-)


4)"Не выучил я эсперанто" (это из Ай-яй-яя). - Очень жаль. Изумительный по красоте и изяществу язык. К тому же учится за несколько недель. Еслиб юниксовая документаци была на эсперанто, это было бы здорово.

Кто ж спорит - логичный язык, очень аналитичный, с учетом ошибок прошлого (прям как юникод:-)). Чай не зря его профессор-лингвист выдумал. И если бы вся техдокументация на нем писалась - было бы человечеству счастье (как если бы у нас в 30-х последовали призыву резинового Полыхаева о поголовном переводе делопроизводства на латинский алфавит). Да вот одного профессор не учел: не будут на нем люди никогда разговаривать. А будут они говорить на том языке, на котором первую сказочку от бабушки услышали, пусть и архаичный он, и флективный (или, хуже того, полисинтетический), и нормы правописания с фонетикой уже полтысячелетия не бьются (а то и тысячу лет, как в аглицком). А если уж придется чужой язык учить, ради дела какого - так язык тех, кто в этом деле превзошел (в компьютерном - аглицкий, в парфюмерном - французский, ну а ругаться все по русски будут).

Аналогии не просматриваете?

5) "Насчет кодировок ... это сложилось исторически" (это кажется тоже из Ай-яй-яя). - Стало быть научно-технический прогресс вы отрицаете?

Вынужден сознаться, что именно научно-технический (и всякий другой) прогресс я отвергаю категорически. К тому у меня есть масса оснований, среди которых - а) некоторые познания в истории, и б) четверть века жизни в условиях, которые нынче принято называть экстремальными. Но вдаваться в это не буду - чистый оффтопик (как-нибудь в мемуарах напишу).
А вот "сложилось исторически" - аргумент совершенно железный, и ни один разумный человек без (очень) везких оснований исторически склавшееся менять не должен (оно ведь не просто так склалось-то). Был один такой, Вами поминаемый, т.н. вождь - ну что получилось? Нехорошо получилось, до сих пор разгребаем.
Спасибо сказали:
Аватара пользователя
alv
Бывший модератор
Сообщения: 7274
Статус: Пенсионер в законе
ОС: Cintu
Контактная информация:

Re: Кодировки вообщем и utf8 в частности.

Сообщение alv »

2Snake

Будучи согласен с Вами по существу, не могу не остановиться на некоторых деталях,

(snake @ Tuesday, 10 August 2004, 20:00) писал(а):
(ugoday) писал(а):И всё таки хочется услышать доводы сторнников зоопарка руских кодировок. Зачем этот бардак нужен?

Прежде чем добиваться аргументов огласите весь список русского 8-битного "зоопарка" пжалуста! Загибаю пальцы: koi, cp866 (она же alt), cp1251 и... и..., пожалуй, все!!! всякие разные ископаемые древности вроде альтернативной гостовской или болгарской кодировок в расчет не берем (реально ли их сейчас встретить?) экзотику вроде iso-что-то-там посылаем тем же лесом по той же причине, и что имеем в сухом остатке?


Кодировка ГОСТ - это и есть iso8859-5 (видимо, по старой советской привычке объявили достижением творческого гения советского народа то, что первым скоммуниздили); альтернативная кодировка (не гостированная!) - это cp866 или, точнее, ibm866, то есть та, где символы псевдографики занимали точно те же позиции, что в базовой ibm437 (по понятным причинам, во времена коммандера Нортона она и главенствовала, и к мелгко-мяшким отношение имела косвенное). Маковских кодировок было - три как минимум (или все же 4?). Так что имел место быть зоопарк, имел. Правда, в полном соответствии с Вашим тезисом (и концепцией товарища Дарвина), большинство его обитателей благополучно вымерло, как динозавры (но не cp866 - электронная версия проектов РФФИ по сей день именно в ней должна подаваться).

(snake @ Tuesday, 10 August 2004, 20:00) писал(а):
(ugoday) писал(а):Довод, что мол пока что не весь софт с юникодом хорошо работает, отметается как несерьёзный. Как только юникод введут повсеместно, отдельные прикладные софтинки сразу исправят. Imho.

Ну нет уж, пусть сначала исправят то, чем я пользуюсь, а уж потом так и быть -- я подумаю, хотя и ни чего не обещаю.



А вот тут - согласен полностью. По моему скромному мнению, не я существую для внедрения прогрессивной кодировки, а кодировка прогрессиная призвана облегчить мою работу. Пока - не замечаю. Разве что пользы - потрахаться денек-другой с прикручиванием utf-локали (с негарантированным результатом), а потом написать статью в Ап (или еще куда) под названием "Как я трахался с utf-8", получить авторский гонорар, а деньги пропить на очередном слете POSIX'ивистов. Положительных эмоций - будет, а вот на счет облегчения работы...

(snake @ Tuesday, 10 August 2004, 20:00) писал(а):Вы лучше приведите доводы в пользу юникода... Возможность совмещать французкий с нижегородским в одной служебной записке и приправлять все это изриченями тов. Мао на языке оригинала для меня (и еще 98% населения) никакой ценности не представляет.


Браво! Именно цитатами Великого Кормчего в оригинале я бы эту статью и оснастил. Да вот, увы, языка ихонного тоже не выучил.

А это уже - к моему предыдущему скорее посту:

(ugoday) писал(а):Довод, что мол пока что не весь софт с юникодом хорошо работает, отметается как несерьёзный. Как только юникод введут повсеместно, отдельные прикладные софтинки сразу исправят. Imho.


А как введут? Указом партии и правительства? И кто исправит? Энтузиасты- ЗК? (забайкальские комсомольцы, то есть).

"Если в локали koi кто-то работает - значит, это кому-то нужно" ((С) Почти по нему, Антуану)


(mani13 @ Tuesday, 10 August 2004, 20:43) писал(а):Эх... ща вы тут посидите-посидите и вам будет пора сюда: А давайте свой дистрибутив сделаем?
и будет вам мечта, но это так отход от темы... попозже напишу про свою мечту :)


А то не делали? Плавали, знаем-с. Теперь пусть другие нашу сказку былью делают:-)


(Aleks_Pingvin @ Tuesday, 10 August 2004, 20:50) писал(а):А мне вот мечтать осталось мало. Дистрибутив моей мечты скоро появится - это Linux XP Home Edition.


И будет в нем чистый юникод, один только юникод и ничего, кроме юникода...
Спасибо сказали:
Аватара пользователя
Ай-ай-ай
Сообщения: 257
Контактная информация:

Re: Кодировки вообщем и utf8 в частности.

Сообщение Ай-ай-ай »

>“Всё таки интересно, что вы делаете под юниксами.”

Извините, Вам не угодил ... Срочно стираю. Вот только щас допишу. И PM все экстеншены стираю нафикк.

>”Очень жаль. Изумительный по красоте и изяществу язык. К тому же учится за несколько недель. Еслиб юниксовая документаци была на эсперанто, это было бы здорово.”

А кто спорит? ...

>”Стало быть научно-технический прогресс вы отрицаете?”

Нет ... просто не гонюсь за всем новым.

>”Зачем? Какая _ПОЛЬЗА_ от этого бардака? Вред очевиден, а вот польза.”

Вам вред очевиден, мне - нет ... Если бы меня что то не устраивало, то давно бы переделал ...
Вот ну в упор не замечаю для себя пользы. В Mandrake koi8-r ... два языка – русский и английский (переключается через Shift+Alt) ... В XP – cp1251 ... два языка – русский и английский (переключается через Shift+Alt) ... В SuSE – UTF8 ... два языка – русский и английский (переключается через Shift+Alt) ...
Где вред и где польза?
"Я не червонец, чтобы нравиться всем!"
(с) Костя Кинчев ...
--------------------
Mandrake 10.1 PowerPack+; kernel 2.6.8.1; KDE 3.4.1
--------------------
"Пешу как хачу!" ... "Руки прочь от падонкафф!"
--------------------
http://www.livejournal.com/~_oparish_/
Спасибо сказали:
ugoday
Сообщения: 16

Re: Кодировки вообщем и utf8 в частности.

Сообщение ugoday »

Ну чтож, уже совсем другой разговор пошёл.
2snake
>весь список русского 8-битного "зоопарка"

Мне известно 14 штук только руских кодировок:koi8-r,cp866,iso-8859-5,cp1251 - встречаются часто, особенно последняя, к сожалению, alt-fido, mac -доминируют в своих заповедниках, ebcdic, koi7 -лично видел пару раз, osn, sort, moshkov, dkoi, cp500, ascii - в прямом виде ниразу не видел, кодировка sort, судя по названию, присутствует где-то во внутренних представляниях. А так они уже вымерли, поскорей бы сдохли и остальные.

Да кстати, для меня зоопарк - это больше одной кодировки.

>Вы лучше приведите доводы в пользу юникода.

Польза в том, что если есть юникод, то всё остальное просто не нужно. Ведь он отменяет не только 14 руских кодировок, но и кучу национальных кодировок других языковых групп. Плюс возможность совмещения разноязыкого текста в одном документе (кроме английского, есть и другие иностранные языки). И не говорите мне что это надо малому количеству людей. Всё равно общение этих людей с внешним миром, и внешнего мира с ними порождает проблемы. Зачем нам лишние проблемы? Мы прибьём их введением юникода на уровне кодировки.

В конце-концов, как поступить лично мне, если я хочу писать и на руском, и на эсперанто? Выход один - юникод, значит, у меня будут проблемы в общении с вами, а у вас - со мной.

Тем и хорош юникод, что он разом уничтожает все проблемы, связанные с кодировками.

>Ну нет уж, пусть сначала исправят то, чем я пользуюсь, а уж потом так и быть -- я >подумаю, хотя и ни чего не обещаю

Ежели не секрет, что такого вы используете, что совершенно не может работать с юникодом, и абсолютно незаменимо?

2alv
>И не говорите мне, что тут "логическое противоречие": во-первых, истинным >пост-советским пох...ам все эти противоречия пох...

Тоже офтопик.
Сталину докладывают, что появилась новая политическая группировка - пофигисты.
Отловили одного, допрашивают:
-Вот скажите, раз вы - пофигисты, значит вам всё пофигу?
-Пофигу.
-И Страна Советов пофигу?
-Пофигу.
-И Рабоче-Крестьянстская власть пофигу?
-Пофигу.
-И работа пофигу?
-Пофигу.
-И зарплата пофигу?
-Нет.
-Но это же противоречит всей вашей жизненной позиции.
-А мне это пофигу.

>Inferno - а) ОСь не такая уж и новая (года три ей точно есть), б) не совсем ОСь, а >в)строго говоря, совсем не ОСь, а скорее ближе к виртуальной машине (ОСь - это >Plan9).
Инферно на год моложе явы. Так что вполне новая. Впрочем здесь слово "новый " употреблялось скорее в смысле, "не изученный". Это именно ось, которая содержит виртуальную машину, на которой выполняются приложения. Plan9 - это лаб. разработка, на основе которой была созадана Инферно. И в этом смысле она равноправна другим осям. Вообще в man intro сказано.
Inferno is virtuallised operating system, that can run natively across wide range of processor acrchitecture or hosted on a wide range of operating system.

>И юникод, насколько я понимаю, делался не для того, чтобы русский текст в >юникоде же читать, а чтобы читать его в _любых_ кодировках.

Как вы это представляете технически? Тогда уж лучше, чтобы было так. Чел. пишет сообщение по английски, сохраняет его в юникодной локали, а я, открыв его, вижу литературный перевод на руский. Вот это было бы здорово. Только быстрее английский выучить, чем такого счастья дождаться. :(

>Я же в своем KDE при ретроградной локали koi8 спокойно читаю письма в любой >кодировке (уже перестал обращать внимание, в какой именно), веб-страницы, >тексты в kate могу поправить при необходимости что в cp1251, что в utf.

Это устранение последствий, тогда как юникод устранияет причину. Также прошу обратить внимание на то, что эти перикодировки должны присутствовать в каждой программе, что усложняет код, тогда как юникод, устраняет проблемы раз и навсегда, на уровне кодировки.

>Нет уж, я подожду, пока Вы все остальные кодировки

Тоже позиция, однако я рад, что есть люди, думающие иначе.

>не будут на нем люди никогда разговаривать.

Никогда не говори никогда. Эсперанто как ГПЛ, он вирусен. Если человек знает эсперанто, значит его дети, точно его знают, плюс вероятность изучения эсперанто его знакомыми резко повышается. Сейчас эсперантистов, по разным оценкам 1 - 5 миллионов, т. е. за сто лет численность эсперантистов увеличилась в миллион раз. Численность людей на земле увеличивается медленне. (гораздо медленнее) Значит настанет, тот день когда все земляне заговорят на эсперанто.

>А если уж придется чужой язык учить

Вот только за 5 недель вы выучите эсперанто гораздо лучше чем английский за 5 лет.
Попробуйте и убедитесь сами.

>А вот "сложилось исторически" - аргумент совершенно железный

Ржавый этот аргумент у вас. Если где-то он и имеет смысл, то не в it-индустрии. Давным давно (лет 20 назад), были одни машинки. Сейчас гораздо более другие. И сейчас 8 битные кодировки - такой же архаизм, как прикладное программирование на ассембелере.

2all
Кино "Горец" смотели? В конце останется только один. И это будет юникод! ;)
Увидешь биллгейца - не убивай его, он мой!
Спасибо сказали:
ugoday
Сообщения: 16

Re: Кодировки вообщем и utf8 в частности.

Сообщение ugoday »

>Нет ... просто не гонюсь за всем новым.

А за _всем_ и не надо. Но лучшее взять всё таки стоит.

>Вам вред очевиден, мне - нет ...

Давайте так.
1. Удобнне всего было бы, если бы была, только одна кодировка.
2. Из того, что есть сейчас, на роль единственной кодировки лучше всех подходит юникод.

>Вот ну в упор не замечаю для себя пользы. В Mandrake koi8-r ... два языка – >русский и английский (переключается через Shift+Alt) ... В XP – cp1251 ... два >языка – русский и английский (переключается через Shift+Alt) ... В SuSE – UTF8 ... >два языка – русский и английский (переключается через Shift+Alt) ...
>Где вред и где польза?

Есть у меня диск с mp3. В нём теги с cp866, есть другой mp3 диск, там теги в ср1251. И как вы мне предлагаете с этим справляться? Все проигрыватели учить с этим бардаком работать? Мне делать больше нечего?
Увидешь биллгейца - не убивай его, он мой!
Спасибо сказали:
Аватара пользователя
Ай-ай-ай
Сообщения: 257
Контактная информация:

Re: Кодировки вообщем и utf8 в частности.

Сообщение Ай-ай-ай »

>”А за _всем_ и не надо. Но лучшее взять всё таки стоит.”

Да берите ... кто против. Другое дело, что из присутствующих здесь берете вы один.

>”Давайте так.
1. Удобнне всего было бы, если бы была, только одна кодировка.
2. Из того, что есть сейчас, на роль единственной кодировки лучше всех подходит юникод.”

Все согласны десять раз ... Она удобнее ... Она лучше всех ... Топчите другие кодировки ... Плюйте в них ... Размазывайте по асфальту ...
Мы потом ... Мы после Вас ...

Есть предложение переименовать вас из “ugoday” в “utf-day” [читается как “утээф – дай!”] ... Чтобы все знали, с кем они имеют дело. :) Мне представляется прикольная картина ... У вас дома обои в комнате состоят из бесконечно повторявшихся 3-х букв “u”, “t”, “f” ... И на заборах, где дети пишут “rap – кал” вы приходите ночью ... зачёркиваете слово “rap” и пишите ненавистное “koi8” ... :) ... Может вы и жену (если есть) так ласково называете – “Утээфушка моя” ...
Фанатизм сейчас лечат ... :) ...

>“Есть у меня диск с mp3. В нём теги с cp866, есть другой mp3 диск, там теги в ср1251. И как вы мне предлагаете с этим справляться? Все проигрыватели учить с этим бардаком работать? Мне делать больше нечего?”

Вот с ними у меня проблем нет ... А вот если кодировка будет [внимание произносится магическое слово] в utf ... еще черт знает, что будет ...
"Я не червонец, чтобы нравиться всем!"
(с) Костя Кинчев ...
--------------------
Mandrake 10.1 PowerPack+; kernel 2.6.8.1; KDE 3.4.1
--------------------
"Пешу как хачу!" ... "Руки прочь от падонкафф!"
--------------------
http://www.livejournal.com/~_oparish_/
Спасибо сказали:
snake
Бывший модератор
Сообщения: 677
Контактная информация:

Re: Кодировки вообщем и utf8 в частности.

Сообщение snake »

("ugoday") писал(а):Мне известно 14 штук только руских кодировок:koi8-r,cp866,iso-8859-5,cp1251 - встречаются часто, особенно последняя, к сожалению...


Ну это далеко не 14, к тому же, как заметил alv, iso-8859-5 и cp866 это почти одно и то же. К тому же проблема 3-х кодировок (koi, alt, win) давным давно и успешно решена и практически все грабли убраны с дороги или помечены флажками -- сам видел как люди чисто гуманитарного склада сознания бодро определяли по внешнему виду крякозяб из какой кодировки в какую надо конвертировать (и это лет 6 назад!) а уж с широким и повсеместным распостранением тегом META и надобность в таком мозгоблудии отпала уже очень давно. Так что все известные мне проблемы с кодировками порождает одна единственная -- utf! т.е. та которая по идее должна эти проблемы решать, но благими намериниями... сами знаете.

("ugoday") писал(а):koi7 -лично видел пару раз


yes, yes, yes!!! -- я прослезился! именно с нее, родимой, я и начинал общение с компом на русском языке... лет этак надцать назад, с тех пор не сталкивался, как давно это было! Потом был нормальный и всем понятный koi-8... Потом всякие девиации вроде 866 и 1251 (причем одновременно и вперемешку). Теперь опять возвратился на koi8 с редкими столкновениями с cp1251 и сз866 в которые и из которых я тексты в случае надобности перекодирую (на лету) и ничуть этим не напрягаюсь.

("ugoday") писал(а):osn, sort, moshkov, dkoi, cp500, ascii - в прямом виде ниразу не видел...


Вот-вот, не видели а уже в "зоопарк", а критерием истины являеться что? -- Практика! Так что я тоже могу тут наперечислять всяких разных кодировок и что с того? Нет батенька, реально руских кодировок 3 -- koi, alt, win и точка! К тому же все они занимают свои определенные ниши, и люди давно и успешно научились с ними бороться. К слову сказать ваша alt-fido и никакая не кодировка вовсе, это просто cp866, где русская "Н" заменена на латинскую "H" -- ограничения досовского софта и никакими юникодами тут положение не исправишь.

("ugoday") писал(а):Польза в том, что если есть юникод, то всё остальное просто не нужно. Ведь он отменяет не только 14 руских кодировок, но и кучу национальных кодировок других языковых групп. Плюс возможность совмещения разноязыкого текста в одном документе (кроме английского, есть и другие иностранные языки).


Вы читали что я написал? Не катит это аргумент! Совсем, абсолютно и никак!!! Не окупают ваши преемущества привносимый гиморой и точка.

("ugoday") писал(а):И не говорите мне что это надо малому количеству людей.


Говорил говорю и буду говорить! Ну не видел я еще ни одного человека, кто писал бы документы больше чем на одном языке, даже в немецком при помощи новой граматике обходяться без умлаутов и долгих s, чисто латинским алфавитом.

("ugoday") писал(а):В конце-концов, как поступить лично мне, если я хочу писать и на руском, и на эсперанто? Выход один - юникод, значит, у меня будут проблемы в общении с вами, а у вас - со мной.


А никак не поступать, если хотите что бы вас поняли люди до которых вы хотите донести свою мысль, то пишите на том языке, который они понимают иначе действительно -- "у меня будут проблемы в общении с вами, а у вас - со мной".


Теперь еще раз повторю: для 98% (даже, думаю, 99,9%) людей ненужно, не нужно, НЕНУЖНО писать более чем на двух (в практике -- на одном) языках одновременно!!! И если эта возможность единственное преемущество utf перед всем остальным -- в печку такую кодировку!! Вы меня не убедили -- нет у юникода преемуществ, которые бы окупили сложности перехода на него!
В реальности все не так, как на самом деле...
JabberID: zmeyk@jabber.ru
Спасибо сказали:
Аватара пользователя
Ай-ай-ай
Сообщения: 257
Контактная информация:

Re: Кодировки вообщем и utf8 в частности.

Сообщение Ай-ай-ай »

Проснулся только что ...
Знаете, это похоже был вещий сон ...
Мне во сне снилось, что я с кем-то по аське болтаю ... Не помню под какой системой, помню только что использовал Gaim ...
И тут я вспомнил про главную проблему utf ... - я не могу использовать Gaim в Windows совместно с русскими буквами потому что клиент полностью юникодный ... И если для никсов есть патч и даже целый сайт посвященный проблеме русских букв в Gaim, то для винды этого ничего нет ... Вот – главный и ощутимый для меня вред юникода ...

Я знаю, вы (утф-дай) опять будете винить в этот Винду и БГ ... но мы же знаем кто виноват на самом деле ....
"Я не червонец, чтобы нравиться всем!"
(с) Костя Кинчев ...
--------------------
Mandrake 10.1 PowerPack+; kernel 2.6.8.1; KDE 3.4.1
--------------------
"Пешу как хачу!" ... "Руки прочь от падонкафф!"
--------------------
http://www.livejournal.com/~_oparish_/
Спасибо сказали:
ugoday
Сообщения: 16

Re: Кодировки вообщем и utf8 в частности.

Сообщение ugoday »

2Ай-ай-ай

>Все согласны десять раз ... Она удобнее ...

Подведём итоги,
Ваше мнения - ну, может быть, в отдалённом будущем юникод и победит остальные кодировки, но конкретно сейчас переходить на него бессмысленно.
Моё мнение - нет, нет, нет, мы хотим сегодня, нет,нет, нет, мы хотим сейчас.
Имхо, если чему-то (8 битным кодировкам) суждено сдохнуть, надо помочь ему в этом. Жить в эпоху перемен некомфортно, поэтому пусть всё закончится побыстрее. Кстати, если бы юникод восторжестовал уже сейчас, мы бы даже слово такое - "кодировка" не знали, за ненадобностью.

2snake
>сам видел как люди чисто гуманитарного склада сознания бодро определяли по >внешнему виду крякозяб из какой кодировки в какую надо конвертировать

Зачем нужны крякозябры? Зачем? Кстати, ваш пример говорит о том, что крякозябры встречаются часто. И вообще вы тут рассказываете как вы успешно боретесь за зоопарком кодировок, и как у вас замечательно документы туда-сюда перекодируются. Сказочники, блин. Золотые мальчики, с железными яйцами и стальным анусом. А теперь зайдите в форумы (особенно там где новички тусуются). Один из самых частых вопросов это что-то вроде:
-АААА, хэээлп, люди, я - новичок, почему у меня на дистетах крякозябры, и на виндовых разделах - крякозябры, и в иксах - крякозябры, и в самбе крякозябры. И вообще нафиг мне ваш линукс.

Ну и нафига это всё надо? Юникод уничтожает болезнь, перекодировщики борются с симптомами.

>реально руских кодировок 3 -- koi, alt, win и точка!

А нужна только одна -- utf и точка!

>Не окупают ваши преемущества привносимый гиморой и точка.

Это каким таким гимором? Если он так велик, то перечислите реальные примеры проблем. Что то вроде:
1. Вова Путин пользовался кои8-р, и было ему щастье.
2. Боря Березовский пользовался ср1251, и было ему не счастье, но он успел свалить в англию.
3. Ходорковский пользовался юникодом, и что с ним произошло - сами знаете.

Примеры гимороя в студию, а то какая-то философия получается.

>Говорил говорю и буду говорить!

Говорил, говорю и говорить буду, что на всей земле должна быть только одна кодировка. Это юникод.
Кстати пару софтинок пропатчить в миллион раз проше, чем переделывать грамматику всех языков, использующих расширения латинского алфавита.

>Ну не видел я еще ни одного человека, кто писал бы документы больше чем на >одном языке

Вы таких людей не видели? А они есть!

>то пишите на том языке, который они понимают

Про это никто ниразу не возражает, а вот какую локаль мне использовать? Подскажите, о великий гуру, поучите дурака уму-разуму. А то я выхода, кроме как юникод, не вижу.

>Теперь еще раз повторю: для 98% (даже, думаю, 99,9%)

Даже так. С точностью до десятых долей процента. У вас есть результаты стат. исследований, или вы просто так языком чешете?

>в печку такую кодировку!!

В Белл Лабс с вами не согласны, это раз. Доля юникода, среди других кодировок неуклонно растёт, это два. Жить в эпоху перемен я не хочу, это три. Пусть быстрее восторжествует одна (не одна для руского языка, а одна для всех языков) кодировка, это четыре. Эта кодировка называется юникод, это пять.

>Я знаю, вы (утф-дай) опять будете винить в этот Винду и БГ ... но мы же знаем кто >виноват на самом деле

Кто?

Кстати в досе вы с юникодом вообще сдохнете. Говно этот юникод, в печку его.

Не БГ, а BG.

Против БГ, я ничег не имею.
Увидешь биллгейца - не убивай его, он мой!
Спасибо сказали:
Аватара пользователя
alv
Бывший модератор
Сообщения: 7274
Статус: Пенсионер в законе
ОС: Cintu
Контактная информация:

Re: Кодировки вообщем и utf8 в частности.

Сообщение alv »

Ребята, пора про юникод (в этом трейде) завязывать.

А на счет кухарок - вы все забываете, что добавил к словам товарища Ленина товарищ Бухарин. А добавил он: У нас любая кухарка сможет управлять государством... под наблюдением комиссара"

Аналогичный случай - с юникодом. Да и вообще с линуксом
Спасибо сказали:
Аватара пользователя
Ай-ай-ай
Сообщения: 257
Контактная информация:

Re: Кодировки вообщем и utf8 в частности.

Сообщение Ай-ай-ай »

>”Подведём итоги,
Ваше мнения - ну, может быть, в отдалённом будущем юникод и победит остальные кодировки, но конкретно сейчас переходить на него бессмысленно.
Моё мнение - нет, нет, нет, мы хотим сегодня, нет,нет, нет, мы хотим сейчас.
Имхо, если чему-то (8 битным кодировкам) суждено сдохнуть, надо помочь ему в этом. Жить в эпоху перемен некомфортно, поэтому пусть всё закончится побыстрее. Кстати, если бы юникод восторжестовал уже сейчас, мы бы даже слово такое - "кодировка" не знали, за ненадобностью.”

Ай-ай-ай ...

>”Верите ли, я могу усилием воли регулировать уровень своего фанатизма.”

Ай-ай-ай ... не верю ...

>”Замкнутый круг, вы утверждаете, что от зоопарка восьмибиток мало вреда, а я утверждаю, что от них нет пользы.”

... Точка кипения давно прошла ...

>”Замкнутый круг, вы утверждаете, что от зоопарка восьмибиток мало вреда, а я утверждаю, что от них нет пользы.”

... Реклама про “Досю” (какое-то компьютерное название) ... “А если нет разницы, то зачем платить больше.”

>”Кстати в досе вы с юникодом вообще сдохнете. Говно этот юникод, в печку его.”

Точно ... После Ваших постов – из принципа до Логхорна переходить на него не буду ...

>”Против БГ, я ничег не имею.”

Хоть на этом спасибо ...
"Я не червонец, чтобы нравиться всем!"
(с) Костя Кинчев ...
--------------------
Mandrake 10.1 PowerPack+; kernel 2.6.8.1; KDE 3.4.1
--------------------
"Пешу как хачу!" ... "Руки прочь от падонкафф!"
--------------------
http://www.livejournal.com/~_oparish_/
Спасибо сказали:
Аватара пользователя
t.t
Бывший модератор
Сообщения: 7390
Статус: думающий о вечном
ОС: Debian, LMDE

Re: Кодировки вообщем и utf8 в частности.

Сообщение t.t »

2snake: Я вцелом с вами согласен, кроме этого места:
(snake @ Wednesday, 11 August 2004, 1:16) писал(а):Теперь еще раз повторю: для 98% (даже, думаю, 99,9%) людей ненужно, не нужно, НЕНУЖНО писать более чем на двух (в практике -- на одном) языках одновременно!!!
Статистика исключительно по вашим знакомым? А я по своим приведу статистику, можно? Не менее чем 60% людей нужно писать на двух языках (а 5% -- не меньше чем на трёх, не считая английского), один из которых -- французский или чешский, а другой -- один из кирилических славянских. Такую пару ни одна 8-битная кодировка не поддерживает. Это я к чему? И то, и другое -- демагогия.

2Ай-ай-ай: Я тебе уже когда-то намёкивал на твоё главное задлуждение: "всё прогрессивное человечество == Ай-ай-ай". Почти всё, что ты пишешь здесь, нужно оценивать только со скидкой на это заблуждение (иначе "такая фигня получается...").

2ugoday: Просто дышать надо глыбше, а с людЯми быть мяхше. Юникод -- это, конечно, хорошо (по всем остальным пунктам я с вами скорее согласен), но мне ваше отношение напоминает один проект календаря: недели по пять дней, месяцы по шесть недель. Удобно? Да. Но почему-то до сих пор не ввели, хотя проекту лет двадцать, не меньше.
¡иɯʎdʞ ин ʞɐʞ 'ɐнɔɐdʞǝdu qнεиж
Спасибо сказали:
Аватара пользователя
Shurik
Сообщения: 415
ОС: Mandriva 2010.2

Re: Кодировки вообщем и utf8 в частности.

Сообщение Shurik »

На этом форуме уже кто-то приводил пример того, что не все люди пользуются ХР. Далеко не все. Создал я документ в UTF-8 и решил глянуть - что-же на работе его прочитать сможет? А на работе в конторе стоят Р-166ММХ+16-32MBt оперативки. Соответственно Винда 95 и Винда 98 (на тех машинах, которые маленько помощнее, типа P-233+64MBt оперативки. Стоит там офис-95, БЭСТ, Пенсионные и Налоговые программы. И столкнулся я с такой штукой - не читает ничего этот UTF-8, нема такой кодировке в DOS_е, нема в Офис-95. Вот я и задумался - великое и светлое будущее UTF-8 - это конечно-же хорошо, а вот как быть таким вот бухгалтерам и прочим работникам? Худо-бедно, но тот-же документ в koi8-r Офис-95 читает без каких-либо напрягов. Про cp866 и cp1251 я уж скромно промолчу. Это всё читается.
Уважаемый радетель за UTF-8, что Вы предлагаете делать в таких конторах, как моя?
Спасибо сказали:
ugoday
Сообщения: 16

Re: Кодировки вообщем и utf8 в частности.

Сообщение ugoday »

2Ай-ай-ай
>После Ваших постов – из принципа до Логхорна переходить на него не буду ...

Вы поступаете как ребёнок, который собирается назло маме отморозить уши. Да кстати, а как длиннорог выйдет, таки перейдёте на юникод?
Увидешь биллгейца - не убивай его, он мой!
Спасибо сказали:
ugoday
Сообщения: 16

Re: Кодировки вообщем и utf8 в частности.

Сообщение ugoday »

2Shurik

Про кодировки. Господа, похоже вы меня не поняли. Я не призываю немедленно сжечь все восьмибитные кодировки, а их сторонников посадить на кол. У нас тема какая? Дистриб мечты, вот я и мечтаю, как было бы здорово, что бы всё было юникодное, мы бы тогда даже слов таких не знали "кодировка" и "крякозябры", а раз есть такие слова, значит есть и проблемы с кодировками и крякозябрами. Надеюсь с такой постановкой вопроса никто не спорит?

Кстати XP я тоже не использую. И когда длиннорог выйдет, тоже его скорее всего использовать не буду.
Увидешь биллгейца - не убивай его, он мой!
Спасибо сказали:
Аватара пользователя
Shurik
Сообщения: 415
ОС: Mandriva 2010.2

Re: Кодировки вообщем и utf8 в частности.

Сообщение Shurik »

to ugoday

Так, минуточку - что значит - хочу-не хочу? У меня был конкретный вопрос - что делать на РАБОТЕ с этой самой UTF-8? Сейчас вот ребята с LinuxXP просто фанатеют от UTF-8 и пытаются протолкнуть её в своих дистрибутивах. Ок! Они имеют своё мнение, они проталкивают эту кодировку. Правда, лично я, вообще сообразить не могу - как они собираются поступать с обычными офисными документами - сдачей отчётов в Пенсионный, Налоговую и т.п.
Я понимаю, что эсперанто - это наверное круто, только вот я не думаю, как осчастливить всё человечество разом, а думаю - с какими-же трудностями придётся столкнутся обычному человеку с этой UTF-8? В самой обычной конторе. С самыми обычными БЭСТами, 1С, ПНФ и прочим. Может уже есть какое-то решение, а я просто о нём не знаю?
Спасибо сказали:
ugoday
Сообщения: 16

Re: Кодировки вообщем и utf8 в частности.

Сообщение ugoday »

Что делать? Очевидно пользоваться перекодировкой. К сожалению древние оси ещё требуют таких извращений. Но это проблема этих древних осей, а не как не юникода.
Увидешь биллгейца - не убивай его, он мой!
Спасибо сказали:
Ответить