Перекодировка текста (можно просто ответить)

Для новичков как вообще в Linux, так и в конкретной теме, к которой относится вопрос.

Модератор: Bizdelnick

Аватара пользователя
[Marsel]
Сообщения: 53
ОС: Gentoo

Перекодировка текста

Сообщение [Marsel] »

Суть проблемы...
Имеется текст в какой-либо кодировке... пусть будет koi8-r
Нужно получить из этого текста текст в кодировке, допустим, cp1251

Вопрос:какие стандартные средства для этого имеются(а я знаю что они имеются, тока не помню от куда я об этом знаю, да и еслиб знал не спрашивал бы) :)
... у волков ведь не как у людей - в одиночку спасаться не смей...
AMD64 Notebook
Спасибо сказали:
Аватара пользователя
[Marsel]
Сообщения: 53
ОС: Gentoo

Re: Перекодировка текста

Сообщение [Marsel] »

Всегда удивляюсь таким ответам...
Неужели так сложно сказать, если знаешь, ведь все равно зашел... наверника больше времени потратил на то чтобы эту картинку вставить...

И кстати даже не смешную...

ЗЫ
Юзаю я гугл конечно... но вот лезть туда из-за одной команды не стал... вопрос то пустяковый ;)

[Marsel] добавил в 31.08.2005 05:36

решение стандартными средствами:

Код: Выделить всё

iconv -f866 -tKOI8-R -o<outfile> infile


из 1251 в кои...
iconv входит в состав глибс....
... у волков ведь не как у людей - в одиночку спасаться не смей...
AMD64 Notebook
Спасибо сказали:
Аватара пользователя
alv
Бывший модератор
Сообщения: 7275
Статус: Пенсионер в законе
ОС: Cintu

Re: Перекодировка текста

Сообщение alv »

([Marsel] @ Среда, 31 Августа 2005, 4:36) писал(а):решение стандартными средствами:

Код: Выделить всё

iconv -f866 -tKOI8-R -o<outfile> infile



плюс recode, rusconv, d1489 и еще несколько
плюс любой текстовый редактор под KDE (kwrite, kate, quanta) содержит встроенный перекодировщик
плюс mc (точнее, mcedit) позволяет читать тексты в разных кодировках
Спасибо сказали:
Аватара пользователя
Cap. J2A
Сообщения: 300

Re: Перекодировка текста

Сообщение Cap. J2A »

([Marsel] @ Среда, 31 Августа 2005, 8:36) писал(а):решение стандартными средствами:

Код: Выделить всё

iconv -f866 -tKOI8-R -o<outfile> infile

из 1251 в кои...
iconv входит в состав глибс....

Если по пути встретиться знак №, которого нет в koi8, то процесс перекодировки прервётся. Уж много времени пользуюсь konwert, №->No
Debian GNU/Linux 3.1 2.6.12-1-k7 на AXP1700+/nF2/Radeon 9600 (debsmart)
Debian GNU/Linux 3.1 2.6.15.1 на hp compaq nx9020 (moby)
:Wq
E492: Not an editor command: Wq
Спасибо сказали:
Аватара пользователя
alv
Бывший модератор
Сообщения: 7275
Статус: Пенсионер в законе
ОС: Cintu

Re: Перекодировка текста

Сообщение alv »

(Cap. J2A @ Среда, 31 Августа 2005, 7:29) писал(а):Если по пути встретиться знак №, которого нет в koi8
или любой другой символ, которого нет в каноническом чарсете KOI8 - en dash, em dash, парные кавычки и т.д.
Спасибо сказали:
Аватара пользователя
t.t
Бывший модератор
Сообщения: 7390
Статус: думающий о вечном
ОС: Debian, LMDE

Re: Перекодировка текста

Сообщение t.t »

(Cap. J2A @ Среда, 31 Августа 2005, 7:29) писал(а):Если по пути встретиться знак №, которого нет в koi8, то процесс перекодировки прервётся.
(alv @ Среда, 31 Августа 2005, 7:32) писал(а):или любой другой символ, которого нет в каноническом чарсете KOI8 - en dash, em dash, парные кавычки и т.д.
Именно поэтому я давно отказался от iconv и...
(Cap. J2A @ Среда, 31 Августа 2005, 7:29) писал(а):Уж много времени пользуюсь konwert
который, кроме прочего, нормально конвертит в/из юникод, опять же в отличие от.
¡иɯʎdʞ ин ʞɐʞ 'ɐнɔɐdʞǝdu qнεиж
Спасибо сказали:
Аватара пользователя
xorader
Сообщения: 1030
Статус: собирающий миры
ОС: Debian

Re: Перекодировка текста

Сообщение xorader »

лет пять назад написал http://public.ttknn.net/~xor/archive/convert.c
до сих пор порой юзаю :)

а по поводу вылета на незнакомый символ у iconv'а: есть такая опция "-c" :thumbsup:
Molchanov Alexander (aka Xor)
*offtopic* - ololo!
Спасибо сказали:
Аватара пользователя
alv
Бывший модератор
Сообщения: 7275
Статус: Пенсионер в законе
ОС: Cintu

Re: Перекодировка текста

Сообщение alv »

(xorader @ Среда, 31 Августа 2005, 14:26) писал(а):а по поводу вылета на незнакомый символ у iconv'а:  есть такая опция "-c"  :thumbsup:

и действительно - спасибо Вам и тете Мане :-)
Спасибо сказали:
Аватара пользователя
madskull
Сообщения: 1019
Статус: Экс-металлюга

Re: Перекодировка текста

Сообщение madskull »

(xorader @ Среда, 31 Августа 2005, 14:26) писал(а):лет пять назад написал http://public.ttknn.net/~xor/archive/convert.c
до сих пор порой юзаю :)

а по поводу вылета на незнакомый символ у iconv'а:  есть такая опция "-c"  :thumbsup:

Которая все равно не всегда срабатывает :(
ArchLinux / IceWM
Спасибо сказали:
Аватара пользователя
[Marsel]
Сообщения: 53
ОС: Gentoo

Re: Перекодировка текста

Сообщение [Marsel] »

Огромнейшее спасибо... честно сказать после первого ответа (гугл... гугл) думал искать все самому и все это пробовать.... спасибо что избавили от лишних проб и ошибок....

а то что есть в кде это-то я знаю... надо было консольное... не стоит пока никаких иксов у меня...

Еще раз пасибо
... у волков ведь не как у людей - в одиночку спасаться не смей...
AMD64 Notebook
Спасибо сказали:
Аватара пользователя
Bolverk
Бывший модератор
Сообщения: 1571
ОС: Cygwin

Re: Перекодировка текста

Сообщение Bolverk »

Чтобы iconv не вылетал с ошибкой, есть -r и еще что-то, вроде -m.
Спасибо сказали:
Аватара пользователя
t.t
Бывший модератор
Сообщения: 7390
Статус: думающий о вечном
ОС: Debian, LMDE

Re: Перекодировка текста

Сообщение t.t »

(Bolverk @ Четверг, 01 Сентября 2005, 14:37) писал(а):Чтобы iconv не вылетал с ошибкой, есть -r и еще что-то, вроде -m.
Что всё же не заставит его корректно работать с юникодом.
¡иɯʎdʞ ин ʞɐʞ 'ɐнɔɐdʞǝdu qнεиж
Спасибо сказали:
Аватара пользователя
Bolverk
Бывший модератор
Сообщения: 1571
ОС: Cygwin

Re: Перекодировка текста

Сообщение Bolverk »

(t.t @ Четверг, 01 Сентября 2005, 21:07) писал(а):Что всё же не заставит его корректно работать с юникодом.

Ты имешь в виду тексты с "нестандартными" символами из разных языков? Нет, конечно.
Спасибо сказали: