dict-* vs locale

Tomasz Pala gotar w polanet.pl
Nie, 23 Lis 2003, 13:13:39 CET


On Sun, Nov 23, 2003 at 12:13:56 +0100, Jakub Bogusz wrote:

> Tu jest problem podobny do pythona i postgresql-a - dictfmt wymaga
> obsługi przez glibc lokalizacji używanej dla słownika... (przeważnie
> en_*, ale nie wszędzie, np. dalf wymaga ru_RU.KOI8-R)

Tak zrobiłem pakiet, ale to jest niezgodne ze standardem, który określa
dwie możliwości: 7 bitów lub unikod (o ile dobrze pamiętam i od tamtego
czasu nic się nie zmieniło - mógłby to ktoś jeszcze sprawdzić, chwilowo
ja mam czasu, a po coś opcję wyboru kodowania dodano). Tym bardziej, że
z tak wygenerowanym indeksem dictd nie ruszy uruchomiony inaczej, niż z
odpowiednim locale, co oznacza, że nie ma szans na uruchomienie serwera
z kilkoma różnie sformatowanymi słownikami. Na dysku mam jeszcze >300MB
słowników do zrobienia i za bardzo nie wiem, jak sobie z tym poradzić -
przekonwertowanie tego na UTF-8 oznaczałoby dwukrotny rozrost objętości
danych, co przełoży się na wzrost zajętości pamięci i wydajność serwera
również na tym mocno ucierpi. A osobna sprawa to sam proces rekodowania
- iconv z niezrozumiałych dla mnie powodów odmawia współpracy na dobrym
znaku KOI8-[RU], znajdującym się na określonej pozycji, dlatego robiłem
to perlem.

-- 
GoTaR <priv0.onet.pl->gotar>                                     USA sux
http://www.pld-linux.org/Members/gotar/     http://vfmg.sourceforge.net/
http://mops.uci.agh.edu.pl/~gotar/        http://informatica.agh.edu.pl/



Więcej informacji o liście dyskusyjnej pld-devel-pl