Как перекодировать текст, чтобы был читаемым?

Для новичков как вообще в Linux, так и в конкретной теме, к которой относится вопрос.

Модератор: Bizdelnick

apvs
Сообщения: 52

Как перекодировать текст, чтобы был читаемым?

Сообщение apvs »

В гуглогруппах часто попадаются собщения типа такого https://groups.google.com/forum/message/raw...B8/a-vncEgR0RMJ
Как это перекодировать в читаемый вид?

https://www.artlebedev.ru/tools/decoder/ не расшифровал текст.

Пробовал iconv со всякими параметрами, тоже не получилось.
Спасибо сказали:
Аватара пользователя
s.xbatob
Сообщения: 1139
ОС: Fedora

Re: Как перекодировать текст, чтобы был читаемым?

Сообщение s.xbatob »

Оно в UTF8! Только перекодировано из неверной кодировки. Ещё и письмо оформлено неверно: в заголовках не должно быть ничего кроме ASCII.
Если очень нужно, то можно поэкспериментировать: перекодировать из utf8 в одну из кириллических, а результат из другой кириллической в utf8
Как вы понимаете, мне это совсем не нужно, Я вообще сомневаюсь, что те, кто пользуются до сих пор пользуются любительскими технологиями прошлого века, напишут что-то полезное. :D
Спасибо сказали:
Kopilov
Сообщения: 957
ОС: [K]Ubuntu, Debian

Re: Как перекодировать текст, чтобы был читаемым?

Сообщение Kopilov »

"любительские технологии прошлого века" -- это гуглогруппы или то, что генерирует в них такие письма?
Спасибо сказали:
Аватара пользователя
bormant
Сообщения: 1354

Re: Как перекодировать текст, чтобы был читаемым?

Сообщение bormant »

То, что по ссылке -- уже никак не перекодировать, информация уже потеряна (если только raw мифический и каким-либо образом удастся получить что-либо, кроме набора из \xEF\xBF\xBD -- это в UTF-8 кодовая точка FFFD -- символ заменитель, который обычно отображают, когда исходное не удалось перекодировать в целевое).
Спасибо сказали:
Аватара пользователя
Bizdelnick
Модератор
Сообщения: 21432
Статус: nulla salus bello
ОС: Debian GNU/Linux

Re: Как перекодировать текст, чтобы был читаемым?

Сообщение Bizdelnick »

$

Код: Выделить всё

$ curl https://groups.google.com/forum/message/raw?msg=fido7.ru.linux/h25wrSvyEB8/a-vncEgR0RMJ | enca -L ru
  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100  2924    0  2924    0     0   2614      0 --:--:--  0:00:01 --:--:--  2615
Universal transformation format 8 bits; UTF-8
  CRLF line terminators
  Doubly-encoded to UTF-8 from ISO-8859-5
$

Пишите правильно:
в консоли
вку́пе (с чем-либо)
в общем
вообще
в течение (часа)
новичок
нюанс
по умолчанию
приемлемо
проблема
пробовать
трафик
Спасибо сказали:
Аватара пользователя
bormant
Сообщения: 1354

Re: Как перекодировать текст, чтобы был читаемым?

Сообщение bormant »

Bizdelnick писал(а):
06.12.2015 13:27
Doubly-encoded to UTF-8 from ISO-8859-5
К сожалению, это могло касаться только строки
Subject: Среда для многократного тестирования
но не самого текста сообщения.
Спасибо сказали:
Аватара пользователя
s.xbatob
Сообщения: 1139
ОС: Fedora

Re: Как перекодировать текст, чтобы был читаемым?

Сообщение s.xbatob »

Kopilov писал(а):
06.12.2015 12:44
"любительские технологии прошлого века" -- это гуглогруппы или то, что генерирует в них такие письма?

FIDO! Я думал он давно умер.
Спасибо сказали:
Аватара пользователя
Bizdelnick
Модератор
Сообщения: 21432
Статус: nulla salus bello
ОС: Debian GNU/Linux

Re: Как перекодировать текст, чтобы был читаемым?

Сообщение Bizdelnick »

bormant писал(а):
06.12.2015 14:17
Bizdelnick писал(а):
06.12.2015 13:27
Doubly-encoded to UTF-8 from ISO-8859-5
К сожалению, это могло касаться только строки
Subject: Среда для многократного тестирования
но не самого текста сообщения.

$

Код: Выделить всё

$ curl https://groups.google.com/forum/message/raw?msg=fido7.ru.linux/h25wrSvyEB8/a-vncEgR0RMJ | tail | enca -L ru
  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100  2924    0  2924    0     0   2641      0 --:--:--  0:00:01 --:--:--  2643
Universal transformation format 8 bits; UTF-8
  CRLF line terminators
  Doubly-encoded to UTF-8 from ISO-8859-5
$

Впрочем, не утверждаю, что это правильно.
Пишите правильно:
в консоли
вку́пе (с чем-либо)
в общем
вообще
в течение (часа)
новичок
нюанс
по умолчанию
приемлемо
проблема
пробовать
трафик
Спасибо сказали: