Кодировка в текстовых редакторах

Knoppix

Модераторы: Warderer, Модераторы разделов

listasitem
Сообщения: 144
ОС: Debian Lenny 5

Кодировка в текстовых редакторах

Сообщение listasitem »

Практически все текстовые редакторы не хотят добровольно показывать 1251. Это можно вылечить?
Использую Debian Lenny 5 - счастлив, чего и вам искренне желаю!
Спасибо сказали:
KernelPanic
Бывший модератор
Сообщения: 2060
Статус: Brain Атаке
ОС: Debian squeeze/sid/exp

Re: Кодировка в текстовых редакторах

Сообщение KernelPanic »

У Вас системная локаль, скорее всего, ru_RU.UTF-8, так чего же Вы от текстовых редакторов хотите? Можете через настройки менять каждый раз кодировку в редакторах (большинство поддерживают) или переконфигурировать локаль на cp1251 (что, на мой взгляд, сомнительное занятие, хотя это глубокое имхо) - решать Вам.
Спасибо сказали:
Аватара пользователя
rm_
Сообщения: 3340
Статус: It's the GNU Age
ОС: Debian

Re: Кодировка в текстовых редакторах

Сообщение rm_ »

Практически все текстовые редакторы не хотят добровольно показывать 1251. Это можно вылечить?

Попробуйте для начала менее расплывчато выражаться. Пояснить, что значит "добровольно показывать", и что в Вашем понимании "вылечить".

В большинстве текстовых редакторов кодировку можно выбрать в окне открытия файла, а в некоторых - и указать в командной строке, если редактор запускается сразу со списком файлов, которые ему нужно открыть:

$ gedit --help
Usage:
gedit [OPTION...] [FILE...] - Edit text files

Help Options:
-?, --help Show help options
--help-all Show all help options
--help-gtk Show GTK+ Options
--help-bonobo-activation Show Bonobo Activation options
--help-gnome Show GNOME options
--help-gnome-session Show session management options

Application Options:
--encoding=ENCODING Set the character encoding to be used to open the files listed on the command line
--new-window Create a new toplevel window in an existing instance of gedit
--new-document Create a new document in an existing instance of gedit
--display=DISPLAY X display to use

Можно сделать скрипт, к примеру "gedit-win", в котором прописать "gedit --encoding=windows-1251 $*", затем добавить в файловый менеджер пользовательскую команду для запуска этого скрипта применительно к выделенным файлам (к примеру, в Thunar это можно сделать через "Edit > Configure custom actions").

Более "прямое" и долгосрочное решение проблемы - перекодировать все используемые текстовые файлы в кодировку UTF-8, например с помощью iconv.
Спасибо сказали:
Аватара пользователя
Delirious Stranger
Сообщения: 340
Статус: кофейник
ОС: Funtoo + Calculate

Re: Кодировка в текстовых редакторах

Сообщение Delirious Stranger »

Leafpad попробуйте. у него автоопределение кодировки есть
Если счастье когда-нибудь не оставит тебя - оно к тебе больше никогда не придет. © О. Радус
Спасибо сказали:
Аватара пользователя
strangeman
Сообщения: 160
Статус: заблудившийся биоробот
ОС: Ubuntu 12.04, Debian 6

Re: Кодировка в текстовых редакторах

Сообщение strangeman »

Delirious Stranger писал(а):
19.06.2009 02:41
Leafpad попробуйте. у него автоопределение кодировки есть


А к нему автоподсветку синтаксиса никак не прикрутить? Маловат у него функционал, к сожалению. :(
Спасибо сказали:
Аватара пользователя
Delirious Stranger
Сообщения: 340
Статус: кофейник
ОС: Funtoo + Calculate

Re: Кодировка в текстовых редакторах

Сообщение Delirious Stranger »

насколько мне известно - нет.
но есть еще вариант. использовать enconv из пакета enca(автоматом определяет кодировку исходную) для конвертации в UTF, а редактор уже использовать любой удобный. я обычно конвертирую в UTF
Если счастье когда-нибудь не оставит тебя - оно к тебе больше никогда не придет. © О. Радус
Спасибо сказали:
Doublespace
Сообщения: 275
ОС: Debian Lenny,Squeeze,Centos

Re: Кодировка в текстовых редакторах

Сообщение Doublespace »

Стандартный KWrite Сервис-кодировка. Автоподсветка синтаксиса там есть.
Спасибо сказали:
Аватара пользователя
Rootlexx
Бывший модератор
Сообщения: 4471
Статус: GNU generation
ОС: Debian GNU/Linux

Re: Кодировка в текстовых редакторах

Сообщение Rootlexx »

Для GEdit.
Спасибо сказали:
Аватара пользователя
tolstik
Сообщения: 63
ОС: Debian Sid, Ubuntu 10.04

Re: Кодировка в текстовых редакторах

Сообщение tolstik »

В продолжение темы задам вопрос. Вот в случае тегов для mp3 есть способы их перевести в utf-8, а есть ли способы чтобы все txt перевести в utf-8?
Спасибо сказали:
Аватара пользователя
Aectann
Бывший модератор
Сообщения: 3491
Статус: ...
ОС: OS X, GNU_и_не_только/Linux

Re: Кодировка в текстовых редакторах

Сообщение Aectann »

tolstik писал(а):
20.06.2009 17:15
В продолжение темы задам вопрос. Вот в случае тегов для mp3 есть способы их перевести в utf-8, а есть ли способы чтобы все txt перевести в utf-8?

Код: Выделить всё

iconv -f CP1251 -t UTF-8 file_in_CP1251.txt > file_in_UTF-8.txt
My god... it's full of stars!...
Спасибо сказали:
MMouXe
Сообщения: 252

Re: Кодировка в текстовых редакторах

Сообщение MMouXe »

listasitem писал(а):
19.06.2009 00:20
Практически все текстовые редакторы не хотят добровольно показывать 1251. Это можно вылечить?
Если у вас GNOME и вы пользуетесь стандартным Gedit, выполните данную настройку:
По умолчанию текстовые файлы в gedit открываются в кодировке KOI8-R. Это неудобно, поскольку большинство файлов обычно имеют кодировку Windows-1251. Для смены кодировки по умолчанию:
-запускаем gconf-editor
-переходим к параметрам gedit /apps/gedit-2/preferences/encodings/
-открываем двойным кликом ключ auto_detected
-перемещаем кодировку Windows-1251 на второе место сверху (после системной кодировки).

tolstik писал(а):
20.06.2009 17:15
а есть ли способы чтобы все txt перевести в utf-8?
Может что пригодится:
-Перекодировка имен файлов:
convmv -f cp1251 -t utf8 1/*.*
-Анализ кодировки файла:
enca ACCEPT.htm
-Единичное преобразование кодировки файла:
iconv -f WINDOWS-1251 ACCEPT.htm -t UTF-8 -o ACCEPT.html
recode windows-1251..UTF-8 < ACCEPT.htm > ACCEPT.html
enconv -x utf8 < ACCEPT.htm > ACCEPT.html
без копирования (с перезаписью исходных файлов):
iconv -f WINDOWS-1251 ACCEPT.htm -t UTF-8
recode windows-1251..UTF-8 ACCEPT.htm
enconv -x utf8 ACCEPT.htm (автоматически определяет кодировку, пакет enca)
-Пакетное преобразование большого кол-ва файлов:
enconv -x utf8 *.htm
Спасибо сказали: