Флейм о (не)?нужности юникода (Отрезано от "Символы й, ё в ФС")

Любые разговоры которые хоть как-то связаны с тематикой форума

Модератор: Модераторы разделов

liaonau
Сообщения: 390
ОС: gentoo

Re: Флейм о (не)?нужности юникода

Сообщение liaonau »

eddy писал(а):
13.08.2014 00:46
Мне на это глубоко насрать!

Это не аргумент в пользу определенных кодировок, просто признание своей маргинальности и оторванности от современного мира.
eddy писал(а):
13.08.2014 00:46
Советую для начала strlen посчитать. Потом на grep -i посмотреть, ну и вообще так помалу в сях попробовать что-нибудь сделать с текстом. Это невозможно сделать без велосипедов и костылей!

Естественно, раз нет поддержки юникода языком, надо использовать библиотеки. Ваши проблемы. Причем абсолютно надуманные, исходящие из решения забивать гвозди микроскопом — использовать для обработки текста язык, в котором даже нет строкового типа данных. libicu или хотя бы glib с g_utf8_strlen и всего-то. Что не так с grep? grep работает с utf8.

Даже не интересно, я думал, что может быть увижу хорошие аргументы, а не как обычно — истерику из-за «неосиляторства».
Спасибо сказали:
NickLion
Сообщения: 3408
Статус: аватар-невидимка
ОС: openSUSE Tumbleweed x86_64

Re: Флейм о (не)?нужности юникода

Сообщение NickLion »

Да уже было ясно, что аргументация гипотетического жителя США/Британии, что ничего кроме ASCII не нужно, совпадает с аргументацией eddy. Видимо, его идеал — разброд и шатание кодировок для каждой страны. А китайцы с японцами таки вынуждены будут Юникод использовать (им, как ни крути, 255 символов не хватит). При этом плюсы однобайтовой кодировки иллюзорны.

eddy, а почему Вы радеете за KOI8-R? Ведь эта кодировка более костыльна по сравнению с Win1251. Посмотрите на реализацию strcmp в случае KOI8-R — это костыль сплошной.
Спасибо сказали:
Аватара пользователя
eddy
Сообщения: 3321
Статус: Красный глаз тролля
ОС: ArchLinux
Контактная информация:

Re: Флейм о (не)?нужности юникода

Сообщение eddy »

liaonau писал(а):
13.08.2014 03:05
Это не аргумент

обалденный аргумент!
liaonau писал(а):
13.08.2014 03:05
раз нет поддержки юникода языком, надо использовать библиотеки

Которые на порядок-другой тормозней работают! И нафиг мне это извращение нужно? Тьфу!
liaonau писал(а):
13.08.2014 03:05
язык, в котором даже нет строкового типа данных

Этот тип данных нужен только "маргиналам".
NickLion писал(а):
13.08.2014 06:53
А китайцы с японцами

Давным-давно уже должны были на нормальный алфавит перейти и выкинуть свои сраные иероглифы!
NickLion писал(а):
13.08.2014 06:53
а почему Вы радеете за KOI8-R?

Привык. К сожалению, когда я понял, что CP866 было бы правильней, уже слишком сильно в КОИ-8 влип. Так что теперь у меня везде КОИ-8.

P.S. Если и перейду на хрюникод в системе, то только после линуксокапца (который уже через 3-5 лет наступит, судя по темпам) и перехода на BSD. Т.к. думаю, что BSD тоже сильно опустится за это время. Лишь бы там всякие пульсы-шмульсы с systemd не появились. А то ведь придется ориентацию менять...
RTFM
-------
KOI8-R - патриотичная кодировка Изображение
Спасибо сказали:
Аватара пользователя
Hephaestus
Сообщения: 3729
Статус: Многоуважаемый джинн...
ОС: Slackware64-14.1/14.2
Контактная информация:

Re: Флейм о (не)?нужности юникода

Сообщение Hephaestus »

eddy писал(а):
12.08.2014 19:10
Тады уж вообще ничего не читается без перекодировки...
Ну, по сути, да.
Пришлите текст на русском в KOI8-R какому-нибудь америкосу, который кроме ASCII в жизни ничего не видел.
Он на эту KOI8-R будет смотреть так же, как Вы на Юникод.
И скажет, мол, убивать надо за KOI8-R!
А Вы попробуйте ему объяснить, что KOI8-R - это очень нужная штука.

eddy писал(а):
12.08.2014 19:10
Нет, для них есть pdf.
pdf на всякий случай - это итог обработки PS-файла. А PS - это язык описания печатных страниц.
То, что тексты бывают предназначены не только для печати, объяснять надо? Или и так понятно?

eddy писал(а):
12.08.2014 19:10
А в plain text нефиг совать разные языки. Зачем? Словарик сделать в виде txt файла?
Хотя бы. Почему нет? В том же Sword есть возможность добавлять словари всякие разные. Как бы, само собой разумеется, что словарь содержит внутри себя несколько языков. И хотя там не формат txt, но по сути там plain text.

eddy писал(а):
12.08.2014 19:10
Что вам надо обрабатывать? Зачем там что-то обрабатывать?
А если надо обрабатывать — это вам к БД бинарным.
Попробуйте, пожалуйста, запихать в бинарную БД данные для русско-иврито-греческого словаря, которые изначально доступны только... В чём? В pdf?. Или в чём Вы там предлагаете?
Пускай скрипят мои конечности.
Я - повелитель бесконечности...
Мой блог
Спасибо сказали:
azsx
Сообщения: 3684
ОС: calculate linux, debian, ubuntu

Re: Флейм о (не)?нужности юникода

Сообщение azsx »

Если и перейду на хрюникод в системе, то только после линуксокапца (который уже через 3-5 лет наступит, судя по темпам) и перехода на BSD

ага?
Спасибо сказали:
Аватара пользователя
alv
Бывший модератор
Сообщения: 7275
Статус: Пенсионер в законе
ОС: Cintu
Контактная информация:

Re: Флейм о (не)?нужности юникода

Сообщение alv »

eddy писал(а):
11.08.2014 15:32
Кстати, по-человечески проблему можно было бы решить раз и навсегда: перевести абсолютно все страны мира на латинницу! Без какого бы то ни было рода умляутов и прочей фигни!

В ответ на наглое бесчинство бухгалтера Кукушкинда о предосталении ему внеочередного отпуска мы, геркулесовцы, как один человек, ответим: поголовным переходом на сою... поголовным переводом делопроизводства на латинский алфавит... поголовным вступлением в общество "Долой рутину с оперных подмостков"..., а также всем, что потребуется впредь.
Полыхаев

NickLion писал(а):
13.08.2014 06:53
А китайцы с японцами таки вынуждены будут Юникод использовать (им, как ни крути, 255 символов не хватит).

увы, китайцам с японцами и примкнувшими корейцами не хватает и юникода

eddy писал(а):
13.08.2014 08:52
Давным-давно уже должны были на нормальный алфавит перейти и выкинуть свои сраные иероглифы!

Изучайте автомат Калашникова.
А то придут китайцы и заставят изучать их сраные иероглифы
PS кстати, их больше - так что, может, это европейцам выкинуть свою сраную латиницу?
Спасибо сказали:
NickLion
Сообщения: 3408
Статус: аватар-невидимка
ОС: openSUSE Tumbleweed x86_64

Re: Флейм о (не)?нужности юникода

Сообщение NickLion »

alv писал(а):
13.08.2014 10:22
увы, китайцам с японцами и примкнувшими корейцами не хватает и юникода

По знакоместам им всего хватает. Даже при условии сохранения совместимости с UTF-16 — это более 1 млн знакомест. А то, что консорциум обижает и не выделил всё, что надо — это да, надо помечать текст правильно, но, кажется, эта проблема характерна не только для CJK.
Спасибо сказали:
Аватара пользователя
Bizdelnick
Модератор
Сообщения: 20793
Статус: nulla salus bello
ОС: Debian GNU/Linux

Re: Флейм о (не)?нужности юникода

Сообщение Bizdelnick »

eddy писал(а):
13.08.2014 00:46
А зачем из него текст копировать?

Если так рассуждать - зачем вообще тексты нужны? Ну их на фиг, без них проще жить.

eddy писал(а):
13.08.2014 00:46
И почему это не получается? Если cmap использовать, то и кодировка нормальная будет. А если не использовать, то iconv все исправит.

Да пофиг на кодировку. Если текст в два столбца - то как?

eddy писал(а):
13.08.2014 00:46
Советую для начала strlen посчитать. Потом на grep -i посмотреть, ну и вообще так помалу в сях попробовать что-нибудь сделать с текстом. Это невозможно сделать без велосипедов и костылей!

Это проблема сей, а не кодировки. И отчасти она решена в C99.
Пишите правильно:
в консоли
вку́пе (с чем-либо)
в общем
вообще
в течение (часа)
новичок
нюанс
по умолчанию
приемлемо
проблема
пробовать
трафик
Спасибо сказали:
Аватара пользователя
eddy
Сообщения: 3321
Статус: Красный глаз тролля
ОС: ArchLinux
Контактная информация:

Re: Флейм о (не)?нужности юникода

Сообщение eddy »

alv писал(а):
13.08.2014 10:22
PS кстати, их больше - так что, может, это европейцам выкинуть свою сраную латиницу?

Их больше, но с принципом Оккама они таки тоже знакомы!
Bizdelnick писал(а):
13.08.2014 10:45
Если текст в два столбца - то как?

Сначала из одного скопировать, потом из другого. Только ничего у вас, скорее всего, не получится: в pdf же не только текст, но и формулы, картинки и т.п. При копировании получится фигня.
Bizdelnick писал(а):
13.08.2014 10:45
Это проблема сей

В С никаких проблем уже давным-давно нет!
RTFM
-------
KOI8-R - патриотичная кодировка Изображение
Спасибо сказали:
Аватара пользователя
Bizdelnick
Модератор
Сообщения: 20793
Статус: nulla salus bello
ОС: Debian GNU/Linux

Re: Флейм о (не)?нужности юникода

Сообщение Bizdelnick »

eddy писал(а):
13.08.2014 10:55
При копировании получится фигня.

О чём и речь.

eddy писал(а):
13.08.2014 10:55
В С никаких проблем уже давным-давно нет!

Да ну? Даже неопределённое поведение - не проблема?
Пишите правильно:
в консоли
вку́пе (с чем-либо)
в общем
вообще
в течение (часа)
новичок
нюанс
по умолчанию
приемлемо
проблема
пробовать
трафик
Спасибо сказали:
Аватара пользователя
jashaw5
Сообщения: 68

Re: Флейм о (не)?нужности юникода

Сообщение jashaw5 »

alv писал(а):
13.08.2014 10:22
NickLion писал(а):
13.08.2014 06:53
А китайцы с японцами таки вынуждены будут Юникод использовать (им, как ни крути, 255 символов не хватит).

увы, китайцам с японцами и примкнувшими корейцами не хватает и юникода
eddy писал(а):
13.08.2014 08:52
Давным-давно уже должны были на нормальный алфавит перейти и выкинуть свои сраные иероглифы!

Изучайте автомат Калашникова.
А то придут китайцы и заставят изучать их сраные иероглифы
PS кстати, их больше - так что, может, это европейцам выкинуть свою сраную латиницу?

В корейском алфавите всего 24 буквы, очень простых и логичных в написании. Так что 255 символов хватит.

Русский форум. Задаёшь вопрос, потом тебе долго рассказывают, какой ты м-к.
Спасибо сказали:
NickLion
Сообщения: 3408
Статус: аватар-невидимка
ОС: openSUSE Tumbleweed x86_64

Re: Флейм о (не)?нужности юникода

Сообщение NickLion »

jashaw5 писал(а):
13.08.2014 11:03
В корейском алфавите всего 24 буквы, очень простых и логичных в написании. Так что 255 символов хватит.

Это хангыль, а есть ещё и ханча. Как и в японском, есть слоговые хираганда и катакана, а также кандзи.
Спасибо сказали:
Аватара пользователя
eddy
Сообщения: 3321
Статус: Красный глаз тролля
ОС: ArchLinux
Контактная информация:

Re: Флейм о (не)?нужности юникода

Сообщение eddy »

Bizdelnick писал(а):
13.08.2014 10:58
Даже неопределённое поведение - не проблема?

Неопределенное поведение — проблема погромиста, который это поведение создает.
RTFM
-------
KOI8-R - патриотичная кодировка Изображение
Спасибо сказали:
Аватара пользователя
Bizdelnick
Модератор
Сообщения: 20793
Статус: nulla salus bello
ОС: Debian GNU/Linux

Re: Флейм о (не)?нужности юникода

Сообщение Bizdelnick »

eddy писал(а):
13.08.2014 13:58
Неопределенное поведение — проблема погромиста

Если с одним языком у программиста возникает некая проблема, а с другим - нет, то это проблема именно языка.
Пишите правильно:
в консоли
вку́пе (с чем-либо)
в общем
вообще
в течение (часа)
новичок
нюанс
по умолчанию
приемлемо
проблема
пробовать
трафик
Спасибо сказали:
liaonau
Сообщения: 390
ОС: gentoo

Re: Флейм о (не)?нужности юникода

Сообщение liaonau »

eddy писал(а):
13.08.2014 10:55
Их больше, но с принципом Оккама они таки тоже знакомы!

Vam nado byt' posledovatel'nym v svoih utverzhdenijah i pisat' translitom, ne ispol'zuja jetu sranuju kirillicu.
Спасибо сказали:
NickLion
Сообщения: 3408
Статус: аватар-невидимка
ОС: openSUSE Tumbleweed x86_64

Re: Флейм о (не)?нужности юникода

Сообщение NickLion »

liaonau, alv уже упоминал проект латинизации.
Идите дальше. Один алфавит, один язык. А то даже во всяких немецких есть ß (одна буква), которые при переводе в верхний регистр в SS (две буквы) превращается.

Английский или эсперанто. Наверное английский — по факту гораздо более распространён. И без диакритики.
Спасибо сказали:
Аватара пользователя
alv
Бывший модератор
Сообщения: 7275
Статус: Пенсионер в законе
ОС: Cintu
Контактная информация:

Re: Флейм о (не)?нужности юникода

Сообщение alv »

NickLion писал(а):
13.08.2014 10:32
По знакоместам им всего хватает.

вроде бы с учётом различия начертаний иероглифов - не хватает
А начертания - это такой же элемент ихней культуры

eddy писал(а):
13.08.2014 10:55
Их больше, но с принципом Оккама они таки тоже знакомы!

а у них и логика не аристотелева, так что дедушка Оккам им по... боку

NickLion писал(а):
13.08.2014 11:57
Это хангыль, а есть ещё и ханча. Как и в японском, есть слоговые хираганда и катакана, а также кандзи.

да, иероглифику даже Великий Вождь, Уважаемый Главнокомандующий, Маршал Ким Ир Сен не отменил окончательно.
Хотя и пытался.
Что при Дорогом Руководителе было - не знаю, меня там уже не было.

jashaw5 писал(а):
13.08.2014 11:03
В корейском алфавите всего 24 буквы, очень простых и логичных в написании. Так что 255 символов хватит.

Да, их поцреотическая исконно чучхуёвая ОС (по секрету скажу, что это была DOS 3.3) действительно обходилась 256 символами...
Спасибо сказали:
Аватара пользователя
Hephaestus
Сообщения: 3729
Статус: Многоуважаемый джинн...
ОС: Slackware64-14.1/14.2
Контактная информация:

Re: Флейм о (не)?нужности юникода

Сообщение Hephaestus »

alv писал(а):
13.08.2014 15:35
вроде бы с учётом различия начертаний иероглифов - не хватает
Даже UTF-32 не хватит? А сколько же им надо?
Хотя вика глаголит, что японская, китайская и корейская письменность представлены в Юникоде.
Примечаний насчет полноты представления вроде как нету.
Пускай скрипят мои конечности.
Я - повелитель бесконечности...
Мой блог
Спасибо сказали:
NickLion
Сообщения: 3408
Статус: аватар-невидимка
ОС: openSUSE Tumbleweed x86_64

Re: Флейм о (не)?нужности юникода

Сообщение NickLion »

alv писал(а):
13.08.2014 15:35
вроде бы с учётом различия начертаний иероглифов - не хватает
А начертания - это такой же элемент ихней культуры

Сейчас около 110000 символов зарезервировано. Т.е. около 10% от общего числа знакомест. Пусть там часть (<5%) зарезервировано для частного использования. Всё равно ещё в 5 раз больше иероглифов спокойно можно внести.
Для различий написания одного CJK иероглифа в китайской, японской или корейской традиции следует использовать возможности OTF и задание языка. Что аналгично для некоторых других букв, как подсказывает википедия одна и та же кириллическая буква "т" или "ш" в русском и сербском курсивах должна отличаться.
Спасибо сказали:
Аватара пользователя
Bizdelnick
Модератор
Сообщения: 20793
Статус: nulla salus bello
ОС: Debian GNU/Linux

Re: Флейм о (не)?нужности юникода

Сообщение Bizdelnick »

Hephaestus писал(а):
13.08.2014 15:49
Даже UTF-32 не хватит?

UTF-8 хватит для всего, если убрать идиотское ограничение на число байт (как сделано, в частности, в Perl).
Пишите правильно:
в консоли
вку́пе (с чем-либо)
в общем
вообще
в течение (часа)
новичок
нюанс
по умолчанию
приемлемо
проблема
пробовать
трафик
Спасибо сказали:
NickLion
Сообщения: 3408
Статус: аватар-невидимка
ОС: openSUSE Tumbleweed x86_64

Re: Флейм о (не)?нужности юникода

Сообщение NickLion »

Hephaestus писал(а):
13.08.2014 15:49
Даже UTF-32 не хватит?

Сам Юникод запрещает коды больше 0x10FFFF. Это максимальное представимое в UTF-16. Да, UTF-8 и UTF-32 способны хранить больше, но по крайней мере пока им не разрешено это хранить.

Bizdelnick писал(а):
13.08.2014 16:07
UTF-8 хватит для всего

Кстати, да. UTF-32 ограничен 232, а UTF-8 совсем не ограничен.
Спасибо сказали:
Аватара пользователя
Bizdelnick
Модератор
Сообщения: 20793
Статус: nulla salus bello
ОС: Debian GNU/Linux

Re: Флейм о (не)?нужности юникода

Сообщение Bizdelnick »

NickLion писал(а):
13.08.2014 16:10
UTF-8 совсем не ограничен

Сейчас он искусственно ограничен 6 байтами.
Пишите правильно:
в консоли
вку́пе (с чем-либо)
в общем
вообще
в течение (часа)
новичок
нюанс
по умолчанию
приемлемо
проблема
пробовать
трафик
Спасибо сказали:
NickLion
Сообщения: 3408
Статус: аватар-невидимка
ОС: openSUSE Tumbleweed x86_64

Re: Флейм о (не)?нужности юникода

Сообщение NickLion »

Bizdelnick писал(а):
13.08.2014 16:12
NickLion писал(а):
13.08.2014 16:10
UTF-8 совсем не ограничен

Сейчас он искусственно ограничен 6 байтами.

Стандартом Юникода даже 4.
Спасибо сказали:
Аватара пользователя
eddy
Сообщения: 3321
Статус: Красный глаз тролля
ОС: ArchLinux
Контактная информация:

Re: Флейм о (не)?нужности юникода

Сообщение eddy »

Bizdelnick писал(а):
13.08.2014 14:07
Если с одним языком у программиста возникает некая проблема, а с другим - нет, то это проблема именно языка.

Ничуть не возникает! Нет языков программирования кроме компилируемых, и С — пророк их! ☺
RTFM
-------
KOI8-R - патриотичная кодировка Изображение
Спасибо сказали:
NickLion
Сообщения: 3408
Статус: аватар-невидимка
ОС: openSUSE Tumbleweed x86_64

Re: Флейм о (не)?нужности юникода

Сообщение NickLion »

eddy писал(а):
13.08.2014 19:20
Ничуть не возникает! Нет языков программирования кроме компилируемых, и С — пророк их! ☺

Что же Вы тогда systemd не поддерживаете. Как раз же со скриптовых языков на C перешли. ;)

PS а у меня systemd просто работает и никаких проблем

PPS сейчас один флейм в другой перейдёт
Спасибо сказали:
Аватара пользователя
Bizdelnick
Модератор
Сообщения: 20793
Статус: nulla salus bello
ОС: Debian GNU/Linux

Re: Флейм о (не)?нужности юникода

Сообщение Bizdelnick »

eddy писал(а):
13.08.2014 19:20
Ничуть не возникает!

Лично у Вас? А Вы попробовали собирать свои поделки каким-нибудь компилятором, отличным от того, что использовали при разработке? Или нет компиляторов кроме gcc?
Пишите правильно:
в консоли
вку́пе (с чем-либо)
в общем
вообще
в течение (часа)
новичок
нюанс
по умолчанию
приемлемо
проблема
пробовать
трафик
Спасибо сказали:
Аватара пользователя
eddy
Сообщения: 3321
Статус: Красный глаз тролля
ОС: ArchLinux
Контактная информация:

Re: Флейм о (не)?нужности юникода

Сообщение eddy »

Bizdelnick писал(а):
14.08.2014 08:26
Или нет компиляторов кроме gcc?

Нет компиляторов кроме gcc.
Для МК приходится еще sdcc использовать. Матерюсь, но что поделать? Не поддерживает, к сожалению, gcc 8-битные архитектуры.

А какие еще компиляторы предложите для ПК? clang? Не знаю, не пробовал. Возможно, он будет хорош, но когда это будет? А больше ведь и нет никаких...
RTFM
-------
KOI8-R - патриотичная кодировка Изображение
Спасибо сказали:
Аватара пользователя
Bizdelnick
Модератор
Сообщения: 20793
Статус: nulla salus bello
ОС: Debian GNU/Linux

Re: Флейм о (не)?нужности юникода

Сообщение Bizdelnick »

eddy писал(а):
14.08.2014 11:39
Не поддерживает, к сожалению, gcc 8-битные архитектуры.

Не перестаю удивляться тому, сколь безапелляцинно Вы порете чушь.
Пишите правильно:
в консоли
вку́пе (с чем-либо)
в общем
вообще
в течение (часа)
новичок
нюанс
по умолчанию
приемлемо
проблема
пробовать
трафик
Спасибо сказали:
Аватара пользователя
eddy
Сообщения: 3321
Статус: Красный глаз тролля
ОС: ArchLinux
Контактная информация:

Re: Флейм о (не)?нужности юникода

Сообщение eddy »

Bizdelnick писал(а):
14.08.2014 11:49
eddy писал(а):
14.08.2014 11:39
Не поддерживает, к сожалению, gcc 8-битные архитектуры.

Не перестаю удивляться тому, сколь безапелляцинно Вы порете чушь.

ОК, скажу так: gcc не поддерживает многие нужные мне 8-битные архитектуры (когда-то это были PIC'и, теперь STM8 и иже с ними).
RTFM
-------
KOI8-R - патриотичная кодировка Изображение
Спасибо сказали:
Vexhin
Сообщения: 78
ОС: Ubuntu 20.04 MATE

Re: Флейм о (не)?нужности юникода

Сообщение Vexhin »

alv писал(а):
13.08.2014 15:35
вроде бы с учётом различия начертаний иероглифов - не хватает
А начертания - это такой же элемент ихней культуры


А через разные шрифты реализовать нельзя? Или иероглифы в разных начертаниях должны умещаться в plain text?

eddy, не слишком ли много восклицательных знаков? Лозунги, всё же, не аргумент, хотя и обалденны.
Спасибо сказали:
Ответить