kodowania opisów
Paweł Sakowski
saq w pld-linux.org
Czw, 16 Gru 2004, 20:01:10 CET
On Thu, 2004-12-16 at 19:50 +0100, Jakub Bogusz wrote:
> Hm, standard jest, tyle że przewidziany dla całych plików.
Owszem. Tylko, że dla przykładu:
> 0 string \357\273\277 Unicode text, UTF-8
Daje w ISO 8859-2 prawidłowego stringa "ďťż"
> 0 string \377\376 Unicode text, UTF-16, little-endian
A ten: "˙ţ"
Nie wnikając w to, czy te stringi mają praktyczne zastosowanie w jakimś
języku, BOMy nie dają jednoznacznej informacji o kodowaniu -- co
najwyżej pewną heurystykę. A heurystyka raczej nie ma tu zastosowania
skoro chcemy uzyskać właśnie jednoznaczność interpretacji opisów.
--
Paweł Sakowski <saq w pld-linux.org>
PLD Linux Distribution
Więcej informacji o liście dyskusyjnej pld-devel-pl