SOURCES: monodoc.desktop (NEW) - desktop file
Andrzej Krzysztofowicz
ankry w green.mif.pg.gda.pl
Nie, 29 Lut 2004, 07:35:36 CET
=?iso-8859-2?Q?Pawe=B3?= Sakowski wrote:
>
> > Jakichs? Nietrudno sie domyslic jakich.
> > Zreszta wystarczy sobie sprobowac ustawic LANG=pl_PL w jaks z-UTF-izowanym
> > RH/Fedorze, sprobowac polaczyc sie z dowolnym _innym_ systemem wspierajacym
> > standardowe locale pl_PL (w iso-8859-2)
> ^^^^^^^^^^^
> Wolę określenie "klasyczne".
>
> > i stwierdzic, ze polowa rzeczy nie
> > dziala jak powinna pomimo poprawnej konfiguracji.
> > W dsuga strone jest podobnie.
>
> Zgoda, w tej sytuacji można się spodziewać problemów. Ale powodem
> problemów nie jest to, że ktoś sobie ustawił lokale według uznania.
> Powodem jest to, że na dzień dzisiejszy połowa programów pod Linuxem
> zakłada utopijną sytuację, że istnieje wzajemnie jednoznaczne
> odwzorowanie pomiędzy ciągami oktetów i ciągami znaków. Nic bardziej
> mylnego.
>
> Przykłady: SSH/Telnet przesyłają w te i wewte oktety, nie znaki. W
> protokole FTP nazwa plików jest de facto ciągiem oktetów. Gdyby ktoś
Jezeli tak jest, to trzeba nad tym przejsc do porzadku dziannego dopoki sie
nie wprowadzi rozszerzenia "standardow".
> chciał ściągnąć sobie FTP-em plik Paweł.txt to co ma wysłać serwerowi?
> RECV Pawe\xc5\x82.txt? RECV Pawe\xb3.txt? Nie wiadomo.
Problem w tym, ze czesto to, co chcemy ogladac to SA ciagi bajtow, dla
ktorych pojecie kodowania nie ma sensu.
I wkurza mnie, ze jesli sobie zazycze pod RH:
less -f /bin/bash
to less probuje dane _interpretowac_ jako UTF (jeslis taki ekspert, to
powiedz, co nalezy ustawic, zeby tego _nie robil_ (chce widziec
niezinterpretowane znaki)). Terminal, ktorego uzywam nie wspiera UTF.
Albo jeszcze lepiej:
# less -fr /bin/zsh
Segmentation fault
Podobnie w X-ach, ktore lokalnie nie wspieraja UTF. Wprowadzajac nowe
standardy trzeba zakladac jakas forme zgodnosci wstecz. Inaczej taki
standard mozna OKDR.
> Twórcy języków programowania mają swój wkład w mylenie pojęć "bajt" i
> "znak". W C/C++ pod nazwą char ukrył się typ liczby całkowitej
> 8-bitowej. W Javie niewiele lepiej: liczba całkowita 16-bitowa.
> strlen(const char*) zwraca liczbę, która może mieć niewiele wspólnego z
> długością ciągu znaków. Tak powstaje cała masa programów które nie
> umieją współpracować z użytkownikami znającymi ponad 256 znaków.
Ale nie mozna w tym momencie nadinterpretowac i zakladac, ze "string" =
"ciag znakow".
> Kończę, bo zaraz w depresję popadnę. Tym niemniej, widać powolną
> tendencję do normalizacji: GTK+2 jest w stanie przetwarzać pełną paletę
> znaków unikodowych. Format plików XML zawiera deklarację kodowania
> pliku, w przeciwieństwie do HTML-a (spóźnione dokładanie nagłówków HTTP
> się nie liczy).
--
=======================================================================
Andrzej M. Krzysztofowicz ankry w mif.pg.gda.pl
phone (48)(58) 347 14 61
Faculty of Applied Phys. & Math., Gdansk University of Technology
Więcej informacji o liście dyskusyjnej pld-devel-pl