[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Fw: sort & locale



Alexander Voropay wrote:

> Hi!
>
> >С удивлением обнаружил, что sort из стандартного GNU textutils 1.22
> >написан без учета locale, и похоже, что никто и не думает это исправлять.
>
> Дело в том, что если пользоваться стандартными функциями
> сортировки libc (которые используют locale), то получается разница
> в скорости примерно в 6 (!!!) раз. Тот же sort из BSD сделан
> "по-хакерски" и пользуется внутренностями структур runtime
> libc для категории COLLATE.
>
> Опять же, есть некая неопределенность POSIX : sort потребляет
> stdin, который есть просто поток байтов. Каких байтов ? В какой
> кодировке ? ISO ? KOI ? А если это UNICODE в UTF-8 или вообще
> в UCS-2 ?

Интересный вопрос. Принадлежность символов к определенному алфавиту (не
кодировке!) _должна_ быть известна при вводе! При вводе посредством xkb
(правильном) это известно.


> Можно, конечно, пользоваться LANG= .
>
> >И еще. Ниужели никого не смущает следующая locale, которая кочует из
> >дистрибутива в дистрибутив?
> >Кому "жаловаться"? Разработчикам glibc 2? Откуда вообще взялась
> >эта "грамотная" локаль?
>
> Жаловаться надо To: Ulrich Drepper <drepper@cygnus.com>
> автору glibc. А он в свою очередь берет ее из материалов WG15
> ftp://dkuug.dk/i18n/WG15-collection/   Данную коллецию ведет
> Keld Simonsen <keld@dkuug.dk> .
>
> Ошибочная locale появилась в glibc из RedHat 5.x .

Александр, а в locale где ошибка? Не в названии, а в самой locale ru_RU?

>
>

AEN.