[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[Fwd: sort & locale]






Alexander Voropay wrote:

> >> Опять же, есть некая неопределенность POSIX : sort потребляет
> >> stdin, который есть просто поток байтов. Каких байтов ? В какой
> >> кодировке ? ISO ? KOI ? А если это UNICODE в UTF-8 или вообще
> >> в UCS-2 ?
> >
> >Интересный вопрос. Принадлежность символов к определенному алфавиту (не
> >кодировке!) _должна_ быть известна при вводе! При вводе посредством xkb
> >(правильном) это известно.
>
>  Что имеется в виду под термином "алфавит" ? Атрибут текста "language" ?
> Или Character Set ?

Алфавит (в данном контексте) - набор специфических символов Это заведомо не
Character Set в смысле POSIX (KOI8-R, например, содержит латинский алфавит) и
не атрибут _текста_. Алфавит определяется перечислением и, возможно (но не в
нашем случае), правилами порождения.
Один из вариантов такого определения - keysymdef.h из Xlib. Cyrillic_Ghe не
принадлежит какому либо Charset, он может интерпретироваться как элемент
Charset только в контексте locale. Кстати, описание locale имеет дело именно с
алфавитами (или одним большим алфавитом), но не с charset и, тем более, не с
аттрибутом текста.


>
>
>  В принципе, свое видение проблемы я изложил в
> http://www.sensi.org/~alec/locale/locale_io.html
>
>  Это такая мягкая критика POSIX (и UNIX/DOS/WIN вообще) с их идеей
> файла (хранилища данных) - как плоской последовательности байтов.
> Никаких тебе ЕА и ресурсных вилок. И ввести их _нельзя_, т.к. разрушится
> идея stdin/stdout .

Отлично!

>
>
>  Кстати, в HTTP видна некая борьба старых plain идей с
> современными требованиями : я имею в виду механизмы
> handhake по контенту/языку/transfer-encoding-у.

Как в этой связи Вы относитесь к russian apache?

>
>
> >> Ошибочная locale появилась в glibc из RedHat 5.x .
> >
> >Александр, а в locale где ошибка? Не в названии, а в самой locale ru_RU?
>
>  Ошибка в locale ru_RU в названии месяцев, вернее в разных падежах.
> Января;Февраля;Март;Апреля;Май;Июня;Июля;Августа;Сентября;Октября;Ноября;Дек
> абря
>
>  IMHO, надо все первести в именительный.

Согласен, но я бы назвал это не ошибкой, а сомнительным решением :-)

>
>
> ===================
> comment_char %
> escape_char  /
> repertoiremap mnemonic.ds
> %
> % Russian Language Locale for Russia
> % Source: RAP
> % Address: Sankt Jo//rgens Alle 8
> %    DK-1615 Ko//benhavn V, Danmark
> % Contact: Keld Simonsen
> % Email: Keld.Simonsen@dkuug.dk
> % Tel: +45 - 31226543
> % Fax: +45 - 33256543
> % Language: ru
> % Territory: RU
> % Revision: 4.3
> % Date: 1996-10-15
> % Application: general
> % Users: general
> % Repertoiremap: mnemonic.ds
> % Charset: ISO-8859-5
> % Distribution and use is free, also
> % for commercial purposes.
> ...
> LC_TIME
> ...
> mon     "<JA><n=><v=><a=><r=><ja>";/
>         "<F=><e=><v=><r=><a=><l=><ja>";/
>         "<M=><a=><r=><t=>";/
>         "<A=><p=><r=><e=><l=><ja>";/
>         "<M=><a=><j=>";/
>         "<I=><ju><n=><ja>";/
>         "<I=><ju><l=><ja>";/
>         "<A=><v=><g=><u=><s=><t=><a=>";/
>         "<S=><e=><n=><t=><ja><b=><r=><ja>";/
>         "<O=><k=><t=><ja><b=><r=><ja>";/
>         "<N=><o=><ja><b=><r=><ja>";/
>         "<D=><e=><k=><a=><b=><r=><ja>"
> ...
>
> --
>

Rgrds, Алексей.