[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [Fwd: NEW charset!!! Было: Re: KOI8]



Hi!
Повторюсь. Я считаю, что любое изменение status quo с charset'ами
недопустимо. Особенно сейчас, когда уже явно начался (хоть и медлено)
переход на Unicode.
Говорю я это не из абстрактных соображений, а потому, что мне пришлось в
последнее время заниматься локализацией в различных дистрибутивах Linux
и, помимо чудовищной неразберихи в России, это вызывает не меньшую
неразбериху у разработчиков пакетов/дистрибутивов, что мы здесь все
время обсуждаем.
Позволю себе несколько замечаний по тексту.



> 
> Следующие предложение:
> > Переходить на 1251. По крайней мере в тех приложениях, в которых нужен
> > EURO. Это не так сложно, но требует создания небольшой группы
> > единомышленников, которые будут патчить все библиотки, работающие с
> > кодировками. Если заодно добавить 1250, то восточноевропейцы будут нам
> > благодарны. Криков будет много, так как это шаг по пути свободы выбора,
> > а не по Unix way.
> Я уже прошел, мне еще 5 лет назад хотелось избавиться от кои8 в пользу 1251,
> казалось что будет здорово. Но опыт показал, что уйти с кои8 затруднительно:
> первая же проблема убила во мне желание, нет нормальных терминальных программ
> умеющих обрабатывающих символ '0xFF' (я в 1251), может с тех пор что и
> поменялось, но проблема осталось. 
Если поменялось, то какие проблемы остались? Давайте перечислим
проблемы. Не проще ли лечить их?
>А держать несколько кодировок явно
> неудобно.
> 
> Мы пошли путем похожим на 1251 - взяли буквы от 'koi8 with yo', a остальное
> от WinANSI + добавили еще несколько символов. Вообщем ни какой Америки.

Вот это "with yo" мне непонятно. Имеется в виду "Ё" ? Но это не "yo", а
"io" и в KOI8-R она есть. Если ее нет в некоторых шрифтах, то это
проблема шрифтов, а не KOI8-R.

> Более того, известные мне шрифты (как зеркало charset-a -))) - сделаны так же,
> только нет 0x80-0x9F. Да же старые cronyx содержали символы из Latin1,
> пока их не удалил ache, не добавив при этом свою псевдографику.
> И получается, что koi8-r не существует, а все используют нечто похожее на то,
> что я назвал koi8-1. И на самом деле мертвый чарсет - это koi8-r!!! Было бы
> замечательно, если бы появился  charset koi8-r:1999 который бы реально
> отображал положение дел. И это было бы разумно: сохранить имя koi8-r, но я
> очень сомневаюсь что автор koi8-r согласится :-(((((.

Не понимаю. Символы псевдографики были добавлены по вполне понятной
причине: для поддержки библиотек типа ncurses. И charset KOI8-R
существует и еще как существует, -- сколько людей пользуется этмии
символами! Если мы от этого отказываемся (что, честно говоря, не вполне
удобно), то почему бы не перейти на 1251? Я понимаю претензии к KOI8-R,
связанные с сугубым "национализмом" этого charset. Но в koi8-1 эта
ситуация сохраняется. Ради чего все это? Ради нескольких кавычек и
родного "параграфа"? Не важнее ли сохранить псевдографику, которая
используется действительно широко? Если Вам надо набирать тексты (а для
чего еще?), то в TeX нет проблем с кавычками!

> 
> Я надеюсь что сообщество поможет мне в этом, поддержит обсуждение. Я полагаю
> что новый чарсет уже назрел. И сейчас, обсуждая locale в GLIB2.1, речь идет,
> не об koi8-r, а об 'koi8 with yo'. Может кто распивая пиво с ache убедит его
> внести изменения в koi8-r.

Если бы я понял, зачем нужны предлагаемые Вами изменения и убедился, что
они настолько необходимы, что нужно ради них вносить еще бОльшую
путаницу в наши кодировки, то с удовольствием поинтересовался бы мнением
ache. 
Rgrds, Алексей.